-
Notifications
You must be signed in to change notification settings - Fork 46
Description
模型:XiYanSQL-QwenCoder-7B-2504
启动命令:
docker run -d -p 8008:8000 --runtime nvidia --gpus all --ipc=host --name XiYanSQL -v /models:/root/.cache/models --env VLLM_USE_MODELSCOPE=False --env VLLM_ALLOW_RUNTIME_LORA_UPDATING=True --env CUDA_VISIBLE_DEVICES=0,1 vllm/vllm-openai:0.8.5 --served-model-name XiYanSQL --model /root/.cache/models/XiYanSQL-QwenCoder-7B-2504 --tensor-parallel-size=2 --enable-auto-tool-choice --tool-call-parser hermes --no-enable-chunked-prefill --gpu_memory_utilization=0.85 --max_model_len=15200 --dtype=half
其中VLLM_USE_MODELSCOPE False 和True都试了一样的报错。
使用cherry studio配置XiYanSQL,并且在提问窗口输入如下内容报错:
你是一个 SQL 助手,请根据以下内容生成 MySQL 风格的 SQL 查询语句:
数据库结构:
CREATE TABLE users (
id INT PRIMARY KEY,
name VARCHAR(50),
email VARCHAR(100)
);
问题:
写一个查询用户id的SQL
证据(如果有):
请只输出 SQL 语句,不要任何解释。
报错内容

{
"message": "InputPreprocessor.preprocess() got an unexpected keyword argument 'tokenization_kwargs'",
"error": {
"object": "error",
"message": "InputPreprocessor.preprocess() got an unexpected keyword argument 'tokenization_kwargs'",
"type": "BadRequestError",
"param": null,
"code": 400
},
"code": 400,
"param": null,
"type": "BadRequestError"
}