模型常见问题
适用于:对话模型(LLM)、向量模型(Embedding)、工具调用(Tools/Function Call)、以及索引/构建向量相关问题。
排查原则:先用最小请求直连模型服务验证(确认模型本身没问题)→ 再排查网关/代理 → 最后排查业务侧参数与超时。
1. 最小化请求验证(必做)
1.1 对话模型:Chat Completions
请求示例:
说明:
BASE_URL请填写平台管理中配置的 Base URL
curl <BASE_URL>/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <API_KEY>" \
-d '{
"model": "<MODEL_NAME>",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": false
}'