Base URL 应该怎么配置？

在支持 OpenAI compatible API 的 SDK 或工具里，把 Base URL 设置为 https://api.aliapi.me/v1，并使用 aliapi.me 提供的 API Key。

429 错误怎么处理？

429 通常与频率限制、额度不足或并发过高有关。建议检查项目额度、调用日志、重试策略和模型限流。

Dify 怎么接入模型 API？

Dify 应查看独立教程页，按 OpenAI compatible 方式填写 Base URL、API Key 和模型名称。

FAQ Library

AI API 接入问题库

问题库负责回答通用疑问；具体工具配置已经拆成独立教程页，方便 Dify、FastGPT、Cursor、Cline 等搜索入口单独承接。

Base URL 接入教程中心

Base URL 与 SDK

Base URL 应该填写什么？

OpenAI compatible 接口填写 https://api.aliapi.me/v1。不要漏掉 /v1，否则部分 SDK 会找不到 chat completions 路径。

OpenAI SDK 需要改哪些地方？

保留 messages、model、temperature、stream 等请求结构，只替换 apiKey 和 baseURL。模型名称按模型目录页面填写。

自研 Node.js 和 Python 应用都能接吗？

可以。只要 SDK 或 HTTP 客户端支持自定义 Base URL，就可以用同一套鉴权方式接入。

一个项目可以配置多个模型吗？

可以。建议在控制台按项目管理 Key，在应用侧按任务选择模型，后续再通过路由策略统一管理。

错误码与超时

401 Unauthorized 怎么处理？

检查 API Key 是否正确、是否带 Bearer 前缀、Key 是否被停用，以及请求是否发送到正确 Base URL。

403 Forbidden 是什么原因？

通常与项目权限、模型权限或渠道权限有关。先确认当前 Key 是否允许调用该模型。

404 model not found 怎么处理？

多数情况下是模型名称写错或当前渠道暂未开放该模型。请回到模型目录复制模型名称。

429 Too Many Requests 是什么原因？

通常是频率限制、额度不足、并发过高或上游模型限流。建议查看调用日志并增加重试退避。

请求超时怎么办？

检查网络、模型响应时间、请求体大小和客户端 timeout 设置。长上下文、视觉任务和 Agent 多轮调用通常需要更长超时时间。

模型选择

通用对话应该选什么模型？

优先选择速度稳定、成本可控的模型，例如 OpenAI、Qwen、豆包或 DeepSeek，再根据效果切换到更强模型。

代码任务应该选什么模型？

代码审查、Agent 和复杂重构可优先评估 Claude、OpenAI 和 DeepSeek。轻量脚本生成可以选择低成本模型。

长文档和知识库应该选什么模型？

长上下文任务可评估 Moonshot、Claude、Gemini 和 Qwen。RAG 场景还要单独选择 Embedding 模型。

视觉理解应该选什么模型？

选择支持图片输入的多模态模型，例如 Gemini、OpenAI、Qwen VL 或豆包多模态，并注意图片大小和费用。

Token 与费用

Token 怎么计算？

通常包括输入 Token 和输出 Token。长文本、图片、多轮对话、工具调用和 RAG 上下文都会增加消耗。

如何控制项目额度？

为不同项目、环境和工具创建独立 Key，并设置额度上限、并发限制和异常调用暂停策略。

为什么同样问题费用不一样？

不同模型单价不同；同一模型下，上下文长度、输出长度、是否携带历史消息也会影响 Token。

如何发现异常消耗？

在控制台按 Key、模型、状态码和时间段查看日志，重点关注重复请求、失败重试和 Agent 连续调用。

工具接入教程

Dify 接入教程OpenAI compatible 供应商、Base URL、API Key、模型名称和测试连接。FastGPT 接入教程对话模型、Embedding、知识库配置和额度排查。Cursor 接入教程自定义模型、代码助手、模型名称和响应慢排查。Cline 接入教程代码 Agent、上下文、额度上限和多轮调用日志。LangChain 接入教程ChatOpenAI、Embedding、RAG、Agent 和自研应用配置。Cherry Studio 接入教程桌面客户端、自定义供应商、多模型会话和测试连接。