国产大模型 API 基础 —— 课程笔记
视频 1:国产大模型 API 概述
核心主题
- 在 OpenAI 之外,越来越多的国产大模型正在崛起
- 如何通过 API 与国产大模型进行对话
什么是 API?
API 定义了两个程序之间如何使用「请求」和「响应」进行通讯。可以通俗理解为:API 是程序如何与服务对话的说明书,而这个说明书的具体规则由大模型服务商制定。例如:
- GPT 模型的 API 由 OpenAI 定义
- 通义模型的 API 由阿里云定义
- 文心模型的 API 由百度定义
三个好消息
现代大模型 API 非常相似
- 基本不涉及大的逻辑改动
- GPT 模型的常用参数也适用于大多数其他大模型(参数名可能有细微差别)
部分国产厂商直接兼容 OpenAI API 格式
- 阿里云等厂商直接兼容了 OpenAI 的 API 接口规范
- 可以直接使用 OpenAI 的 Python SDK(
openai库)去调用包括通义在内的很多国产大模型
LangChain 是大模型应用的通用框架
- 不管是 GPT、文心、Claude 还是通义,都可以被抽象为
Chat Model(聊天模型) - 基本上只需要修改代码中的模型名称,就能完成模型的切换
- 上手 LangChain 之前,建议先了解如何调用兼容 OpenAI 接口规范的国产大模型
- 不管是 GPT、文心、Claude 还是通义,都可以被抽象为
视频 2:DeepSeek 模型的 API 调用
获取 API Key 流程
- 访问 DeepSeek API 文档官网(platform.deepseek.com/api-docs/)
- 点击右上角切换为中文,点击「Apply for API」
- 有账号直接登录,没有则点击「立即注册」按指引完成
- 登录后进入 DeepSeek 控制台,左侧选择API Keys→ 「创建 API key」
- 给 Key 命名后点击创建,一定要点击复制,关闭后无法再次查看
- API 是收费的,需充值后才能调用
发送第一个请求
fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.getenv("DEEPSEEK_API_KEY"),# 推荐存入环境变量base_url="https://api.deepseek.com"# 决定请求发送到哪个服务器)response=client.chat.completions.create(model="deepseek-chat",messages=[{"role":"user","content":"你好"}])print(response.choices[0].message.content)关键参数
| 参数 | 说明 |
|---|---|
api_key | 从 DeepSeek 获取的密钥,推荐存入环境变量(如DEEPSEEK_API_KEY) |
base_url | 决定客户端请求的目标服务器地址,可自由选择发给 OpenAI、DeepSeek、中转服务器或自己的服务器 |
DeepSeek 模型
| 模型名称 | 类型 | 特点 |
|---|---|---|
deepseek-chat | 聊天模型 | 标准对话 |
deepseek-reasoner | 推理模型 | 输出前先输出思维链,提升准确性 |
视频 3:阿里云通义模型的 API 调用
获取 API Key 流程
- 访问阿里云官网(aliyun.com),登录或注册账号
- 点击右上角「控制台」,在搜索框输入「灵积」
- 点击「模型服务灵积」进入大模型服务平台
- 首次使用需先开通服务:点击「未开通」→「立即开通」
- 回到控制台,点击左侧「API Key 管理」→ 创建新的 API Key
- 一定要点击复制,关闭后无法再次查看
发送第一个请求
fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.getenv("DASHSCOPE_API_KEY"),base_url="https://dashscope.aliyuncs.com/compatible-mode/v1")response=client.chat.completions.create(model="qwen-turbo",messages=[{"role":"user","content":"你好"}])print(response.choices[0].message.content)通义千问模型选择
| 模型名称 | 特点 |
|---|---|
qwen-turbo | 生成速度最快 |
qwen-plus | 速度与效果平衡 |
qwen-max | 参数最大,回答最聪明 |
总结对比
| 维度 | DeepSeek | 阿里云通义千问 |
|---|---|---|
| 平台 | DeepSeek 官网 | 阿里云 → 灵积(DashScope) |
| 兼容性 | 兼容 OpenAI 接口 | 兼容 OpenAI 接口 |
| Python SDK | openai库 | openai库 |
| API Key 获取 | 官网控制台 → API Keys | 阿里云控制台 → 灵积 → API Key 管理 |
| Base URL | https://api.deepseek.com | https://dashscope.aliyuncs.com/compatible-mode/v1 |
| 代表模型 | deepseek-chat、deepseek-reasoner | qwen-turbo、qwen-plus、qwen-max |
| 特色 | Reasoner 支持思维链推理 | Turbo/Plus/Max 三种定位 |
核心要点
- 国产大模型 API 大多兼容 OpenAI 接口格式,切换成本极低
- 切换模型只需修改三个参数:
api_key、base_url、model - API Key 务必存入环境变量,不要硬编码在代码中
- LangChain 等框架可以进一步统一不同模型的调用方式,只需改模型名即可完成切换
