Revert "[SYCL] fallback mmvq" #9579

qnixsynapse · 2024-09-21T14:35:37Z

Reverts #9088;

Seems to cause a performance regression in some quantized models by never using the mmvq path.

cc: @airMeng @NeoZhangJianyu

This reverts commit 50addec.

Revert "[SYCL] fallback mmvq (ggerganov#9088)"

33b6929

This reverts commit 50addec.

github-actions bot added ggml changes relating to the ggml tensor library for machine learning SYCL https://en.wikipedia.org/wiki/SYCL - GPU programming language labels Sep 21, 2024

airMeng approved these changes Sep 23, 2024

View reviewed changes

airMeng merged commit e62e978 into ggerganov:master Sep 23, 2024
53 checks passed

qnixsynapse deleted the revert-9088-sycl-fallback-mmvq branch September 23, 2024 04:03

airMeng mentioned this pull request Oct 10, 2024

Bug: [SYCL] crash since b-3805 #9612

Closed

dsx1986 pushed a commit to dsx1986/llama.cpp that referenced this pull request Oct 29, 2024

Revert "[SYCL] fallback mmvq (ggerganov#9088)" (ggerganov#9579)

b1eae97

This reverts commit 50addec.

arthw pushed a commit to arthw/llama.cpp that referenced this pull request Nov 15, 2024

Revert "[SYCL] fallback mmvq (ggerganov#9088)" (ggerganov#9579)

be3fc48

This reverts commit 50addec.

arthw pushed a commit to arthw/llama.cpp that referenced this pull request Nov 18, 2024

Revert "[SYCL] fallback mmvq (ggerganov#9088)" (ggerganov#9579)

45b9f19

This reverts commit 50addec.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Revert "[SYCL] fallback mmvq" #9579

Revert "[SYCL] fallback mmvq" #9579

qnixsynapse commented Sep 21, 2024

Revert "[SYCL] fallback mmvq" #9579

Revert "[SYCL] fallback mmvq" #9579

Conversation

qnixsynapse commented Sep 21, 2024