如果您在x86/arm/riscv平台安装了PCIe加速卡(如SC系列加速卡),可以直接使用它作为开发环境和运行环境。您需要安装libsophon,具体步骤可参考x86-pcie平台的开发和运行环境搭建或arm-pcie平台的开发和运行环境搭建或riscv-pcie平台的开发和运行环境搭建。
C++程序运行前需要编译可执行文件,可以直接在PCIe平台上编译程序:
mkdir build && cd build
cmake .. && make
cd ..
编译完成后,会在cpp目录下生成chatglm2.pcie。
可执行程序默认有一套参数,请注意根据实际情况进行传参,具体参数说明如下:
usage:./chatglm2.pcie [params]
--bmodel (value:../models/BM1684X/chatglm2-6b.bmodel)
bmodel file path
--token (value:../models/BM1684X/tokenizer.model)
token file path
--dev_id (value:0)
TPU device id
--help (value:0)
print help information.
./chatglm2.pcie --bmodel ../models/BM1684X/chatglm2-6b_f16.bmodel --token ../models/BM1684X/tokenizer.model --dev_id 0
如果您使用SoC平台(目前可支持SE7),刷机后在/opt/sophon/
下已经预装了相应的libsophon运行库包,可直接使用它作为运行环境。通常还需要一台x86主机作为开发环境,用于交叉编译C++程序。
通常在x86主机上交叉编译程序,您需要在x86主机上使用SOPHON SDK搭建交叉编译环境,将程序所依赖的头文件和库文件打包至soc-sdk目录中,具体请参考交叉编译环境搭建。本例程主要依赖libsophon运行库包。
交叉编译环境搭建好后,使用交叉编译工具链编译生成可执行文件:
mkdir build && cd build
#请根据实际情况修改-DSDK的路径,需使用绝对路径。
cmake -DTARGET_ARCH=soc -DSDK=/path/sdk-soc ..
make
cd ..
编译完成后,会在cpp目录下生成chatglm2.soc。
对于SoC平台,需将交叉编译生成的可执行文件及所需的模型、测试数据拷贝到SoC平台中测试。测试参数与PCIE是一致的。
./chatglm2.soc --bmodel ../models/BM1684X/chatglm2-6b_f16.bmodel --token ../models/BM1684X/tokenizer.model --dev_id 0
在读入模型后会显示"Question:",然后输入就可以了。模型的回答会出现在"Answer"中。结束对话请输入"exit"。
如果您使用SoC平台(目前可支持SE7),刷机后在/opt/sophon/
下已经预装了相应的libsophon运行库包,可直接使用它作为运行环境。如果将其作为开发环境,需要进入/home/linaro/bsp-debs
路径下,安装开发包。
sudo dpkg -i sophon-soc-libsophon-dev_x.y.z_arm64.deb
本例程主要依赖libsophon运行库包,在SOC平台上安装好开发环境后,使用下面的命令编译生成可执行文件:
mkdir build && cd build
cmake -DTARGET_ARCH=soc_base ..
make
cd ..
编译完成后,会在cpp目录下生成chatglm2.soc。
对于SoC平台,测试参数与PCIE是一致的。
./chatglm2.soc --bmodel ../models/BM1684X/chatglm2-6b_f16.bmodel --token ../models/BM1684X/tokenizer.model --dev_id 0
在读入模型后会显示"Question:",然后输入就可以了。模型的回答会出现在"Answer"中。结束对话请输入"exit"。