FAQ Library

AI API 接入问题库

问题库负责回答通用疑问;具体工具配置已经拆成独立教程页,方便 Dify、FastGPT、Cursor、Cline 等搜索入口单独承接。

Base URL 与 SDK

Base URL 应该填写什么?

OpenAI compatible 接口填写 https://api.aliapi.me/v1。不要漏掉 /v1,否则部分 SDK 会找不到 chat completions 路径。

OpenAI SDK 需要改哪些地方?

保留 messages、model、temperature、stream 等请求结构,只替换 apiKey 和 baseURL。模型名称按模型目录页面填写。

自研 Node.js 和 Python 应用都能接吗?

可以。只要 SDK 或 HTTP 客户端支持自定义 Base URL,就可以用同一套鉴权方式接入。

一个项目可以配置多个模型吗?

可以。建议在控制台按项目管理 Key,在应用侧按任务选择模型,后续再通过路由策略统一管理。

错误码与超时

401 Unauthorized 怎么处理?

检查 API Key 是否正确、是否带 Bearer 前缀、Key 是否被停用,以及请求是否发送到正确 Base URL。

403 Forbidden 是什么原因?

通常与项目权限、模型权限或渠道权限有关。先确认当前 Key 是否允许调用该模型。

404 model not found 怎么处理?

多数情况下是模型名称写错或当前渠道暂未开放该模型。请回到模型目录复制模型名称。

429 Too Many Requests 是什么原因?

通常是频率限制、额度不足、并发过高或上游模型限流。建议查看调用日志并增加重试退避。

请求超时怎么办?

检查网络、模型响应时间、请求体大小和客户端 timeout 设置。长上下文、视觉任务和 Agent 多轮调用通常需要更长超时时间。

模型选择

通用对话应该选什么模型?

优先选择速度稳定、成本可控的模型,例如 OpenAI、Qwen、豆包或 DeepSeek,再根据效果切换到更强模型。

代码任务应该选什么模型?

代码审查、Agent 和复杂重构可优先评估 Claude、OpenAI 和 DeepSeek。轻量脚本生成可以选择低成本模型。

长文档和知识库应该选什么模型?

长上下文任务可评估 Moonshot、Claude、Gemini 和 Qwen。RAG 场景还要单独选择 Embedding 模型。

视觉理解应该选什么模型?

选择支持图片输入的多模态模型,例如 Gemini、OpenAI、Qwen VL 或豆包多模态,并注意图片大小和费用。

Token 与费用

Token 怎么计算?

通常包括输入 Token 和输出 Token。长文本、图片、多轮对话、工具调用和 RAG 上下文都会增加消耗。

如何控制项目额度?

为不同项目、环境和工具创建独立 Key,并设置额度上限、并发限制和异常调用暂停策略。

为什么同样问题费用不一样?

不同模型单价不同;同一模型下,上下文长度、输出长度、是否携带历史消息也会影响 Token。

如何发现异常消耗?

在控制台按 Key、模型、状态码和时间段查看日志,重点关注重复请求、失败重试和 Agent 连续调用。

工具接入教程