B1565 #16

Nexesenex · 2023-11-26T01:56:35Z

No description provided.

* Update README.md to use PATH for Windows ROCm * Update README.md * Update README.md

llama_token_eos(const struct llama_model *) is currently getting struct llama_context type variable context as a parameter.

* ggml-cuda : support stablelm rope * remove unused freq_base kernel parameter * add n_dims parameter to llm_build_k_shift, default to n_rot via overload * llama : fix llm_build_k_shift args --------- Co-authored-by: Georgi Gerganov <[email protected]>

* Add openai-compatible POST /v1/chat/completions API endpoint to server example * fix code style * Update server README.md * Improve server README.md * Fix server.cpp code style according to review * server : some style changes * server : indentation * server : enable special tokens during tokenization by default * server : minor code style * server : change random string generator * straightforward /v1/models endpoint --------- Co-authored-by: kir-gadjello <[email protected]> Co-authored-by: Tobi Lütke <[email protected]>

…4189)

* reserve space for codepoints * improvement for the appended 0

* Use mmap in torch load, prefer .bin files when loading * Revert .bin > .safetensors preference

jammm and others added 10 commits November 24, 2023 09:52

readme : use PATH for Windows ROCm (#4195)

b35f3d0

* Update README.md to use PATH for Windows ROCm * Update README.md * Update README.md

main.swift : fix eos checking (#4197)

2568a4b

llama_token_eos(const struct llama_model *) is currently getting struct llama_context type variable context as a parameter.

convert : fix tensors using grad in some models (#4173)

189d684

llama : set metal log callback correctly (#4204)

e9c13ff

readme : update hot topics

04814e7

Update docs for yarn_ext_factor <0.0 as unspecified instead of NaN (#…

3014b54

…4189)

llama : grammar reserve space in decode_utf8 (#4210)

f837c3a

* reserve space for codepoints * improvement for the appended 0

scripts : Use mmap in torch load (#4202)

1ddb52e

* Use mmap in torch load, prefer .bin files when loading * Revert .bin > .safetensors preference

Nexesenex merged commit 24e8996 into Nexesenex:master_experimental Nov 26, 2023
31 of 36 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

B1565 #16

B1565 #16

Nexesenex commented Nov 26, 2023

B1565 #16

B1565 #16

Conversation

Nexesenex commented Nov 26, 2023