b3909

github-actions released this 12 Oct 06:40

11ac980

llama : improve infill support and special token detection (#9798)

* llama : improve infill support

ggml-ci

* llama : add more FIM token strings

ggml-ci

* server : update prompt on slot restore (#9800)

* gguf : deprecate old FIM token KVs

Assets 22

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

b3909