unexpected output when inference Qwen-7B-Chat-10-12 with 1024-128 in_out_pairs using transformer_int4_gpu api #9351

WeiguangHan · 2023-11-03T09:00:37Z

@hkvision The output was about 41 which didn't meet expectations when I tested the Qwen-7B-Chat-10-1t model with 1024-128 in_out_pairs using transformer_int4_gpu api. Please have a look.

Env

bigdl-core-xe-2.4.0b20231102
bigdl-llm-2.4.0b20231102
intel-extension-for-pytorch-2.0.110+xpu
torch-2.0.1a0+cxx11.abi
torchvision-0.15.2a0+cxx11.abi

hkvision · 2023-11-03T09:29:00Z

@qiuxin2012 Is it also due to the input prompt?

qiuxin2012 · 2023-11-06T00:39:16Z

@qiuxin2012 Is it also due to the input prompt?

Maybe, you can try some new input prompts.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

unexpected output when inference Qwen-7B-Chat-10-12 with 1024-128 in_out_pairs using transformer_int4_gpu api #9351

unexpected output when inference Qwen-7B-Chat-10-12 with 1024-128 in_out_pairs using transformer_int4_gpu api #9351

WeiguangHan commented Nov 3, 2023

hkvision commented Nov 3, 2023

qiuxin2012 commented Nov 6, 2023

unexpected output when inference Qwen-7B-Chat-10-12 with 1024-128 in_out_pairs using transformer_int4_gpu api #9351

unexpected output when inference Qwen-7B-Chat-10-12 with 1024-128 in_out_pairs using transformer_int4_gpu api #9351

Comments

WeiguangHan commented Nov 3, 2023

Env

hkvision commented Nov 3, 2023

qiuxin2012 commented Nov 6, 2023