/model/predict 接口 该接口主要用来执行低延迟的预测任务,比如大模型推理等。 详细使用文档: https://docs.byzer.org/#/byzer-lang/zh-cn/byzer-llm/api