当前位置: 首页 > news >正文

国产大模型 API 基础 —— 课程笔记

视频 1:国产大模型 API 概述

核心主题

  • 在 OpenAI 之外,越来越多的国产大模型正在崛起
  • 如何通过 API 与国产大模型进行对话

什么是 API?

API 定义了两个程序之间如何使用「请求」和「响应」进行通讯。可以通俗理解为:API 是程序如何与服务对话的说明书,而这个说明书的具体规则由大模型服务商制定。例如:

  • GPT 模型的 API 由 OpenAI 定义
  • 通义模型的 API 由阿里云定义
  • 文心模型的 API 由百度定义

三个好消息

  1. 现代大模型 API 非常相似

    • 基本不涉及大的逻辑改动
    • GPT 模型的常用参数也适用于大多数其他大模型(参数名可能有细微差别)
  2. 部分国产厂商直接兼容 OpenAI API 格式

    • 阿里云等厂商直接兼容了 OpenAI 的 API 接口规范
    • 可以直接使用 OpenAI 的 Python SDK(openai库)去调用包括通义在内的很多国产大模型
  3. LangChain 是大模型应用的通用框架

    • 不管是 GPT、文心、Claude 还是通义,都可以被抽象为Chat Model(聊天模型)
    • 基本上只需要修改代码中的模型名称,就能完成模型的切换
    • 上手 LangChain 之前,建议先了解如何调用兼容 OpenAI 接口规范的国产大模型

视频 2:DeepSeek 模型的 API 调用

获取 API Key 流程

  1. 访问 DeepSeek API 文档官网(platform.deepseek.com/api-docs/)
  2. 点击右上角切换为中文,点击「Apply for API」
  3. 有账号直接登录,没有则点击「立即注册」按指引完成
  4. 登录后进入 DeepSeek 控制台,左侧选择API Keys→ 「创建 API key」
  5. 给 Key 命名后点击创建,一定要点击复制,关闭后无法再次查看
  6. API 是收费的,需充值后才能调用

发送第一个请求

fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.getenv("DEEPSEEK_API_KEY"),# 推荐存入环境变量base_url="https://api.deepseek.com"# 决定请求发送到哪个服务器)response=client.chat.completions.create(model="deepseek-chat",messages=[{"role":"user","content":"你好"}])print(response.choices[0].message.content)

关键参数

参数说明
api_key从 DeepSeek 获取的密钥,推荐存入环境变量(如DEEPSEEK_API_KEY
base_url决定客户端请求的目标服务器地址,可自由选择发给 OpenAI、DeepSeek、中转服务器或自己的服务器

DeepSeek 模型

模型名称类型特点
deepseek-chat聊天模型标准对话
deepseek-reasoner推理模型输出前先输出思维链,提升准确性

视频 3:阿里云通义模型的 API 调用

获取 API Key 流程

  1. 访问阿里云官网(aliyun.com),登录或注册账号
  2. 点击右上角「控制台」,在搜索框输入「灵积
  3. 点击「模型服务灵积」进入大模型服务平台
  4. 首次使用需先开通服务:点击「未开通」→「立即开通」
  5. 回到控制台,点击左侧「API Key 管理」→ 创建新的 API Key
  6. 一定要点击复制,关闭后无法再次查看

发送第一个请求

fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.getenv("DASHSCOPE_API_KEY"),base_url="https://dashscope.aliyuncs.com/compatible-mode/v1")response=client.chat.completions.create(model="qwen-turbo",messages=[{"role":"user","content":"你好"}])print(response.choices[0].message.content)

通义千问模型选择

模型名称特点
qwen-turbo生成速度最快
qwen-plus速度与效果平衡
qwen-max参数最大,回答最聪明

总结对比

维度DeepSeek阿里云通义千问
平台DeepSeek 官网阿里云 → 灵积(DashScope)
兼容性兼容 OpenAI 接口兼容 OpenAI 接口
Python SDKopenaiopenai
API Key 获取官网控制台 → API Keys阿里云控制台 → 灵积 → API Key 管理
Base URLhttps://api.deepseek.comhttps://dashscope.aliyuncs.com/compatible-mode/v1
代表模型deepseek-chatdeepseek-reasonerqwen-turboqwen-plusqwen-max
特色Reasoner 支持思维链推理Turbo/Plus/Max 三种定位

核心要点

  • 国产大模型 API 大多兼容 OpenAI 接口格式,切换成本极低
  • 切换模型只需修改三个参数:api_keybase_urlmodel
  • API Key 务必存入环境变量,不要硬编码在代码中
  • LangChain 等框架可以进一步统一不同模型的调用方式,只需改模型名即可完成切换
http://www.cnnetsun.cn/news/2731055.html

相关文章:

  • 当一个AI编程助手在TCL深度上岗,工程师的活儿变了
  • 终极指南:如何用Attu轻松管理你的Milvus向量数据库
  • 从0到1搭建企业内训平台:教育培训系统源码开发实践
  • 璞华易研PLM-食品研发ROI持续走低:数字化如何破解“低投入、低产出”困局?
  • ICASSP 2018微软语音技术前沿:从鲁棒识别到神经合成的全链条解析
  • Rhino Compute技术架构解析:构建云端几何计算引擎的完整指南
  • Topit:如何彻底告别Mac多窗口切换烦恼?终极窗口置顶解决方案
  • NCMDump终极指南:三步轻松解密网易云音乐NCM格式文件
  • 三步搞定顽固窗口:WindowResizer 终极窗口尺寸强制调整指南
  • IO流知识点笔记
  • 16通道PXIe高速串口卡RS422总线/RS485总线
  • 一文解读:多模态大语言模型综述,建议收藏!
  • OpenCV实战:基于SIFT特征匹配的实时物体检测与定位
  • GitHub爆火装机工具Ventoy,一个U盘搞定所有系统安装
  • 海外直播拍卖订单履约难点:跨境链路协同与流程优化
  • Alphabet计划募集800亿美元为AI基础设施扩张提供资金
  • C# 在 VisionPro 机器视觉中的图形绘制实战详解
  • Agent智能体开发框架:工业数据AI处理与数据知识治理的工
  • AI产品落地:从大模型幻觉治理到商业回本指标设计
  • 好靶场题目
  • 旗舰模型 vs 轻量模型,性能与性价比全面对比
  • AI报告审核成检测机构新标配,IACheck助力果蔬检测报告一次合格率大幅提升
  • 露天矿车辆管理平台物联网方案
  • KDiff3终极指南:如何快速掌握免费文件比较与合并工具
  • 别再一报显存不足就调小batch size!Windows笔记本上这个隐藏设置能让你的模型先跑起来
  • 开源AUV框架MVP:低成本模块化水下机器人开发方案
  • 终极指南:免费解锁QQ音乐加密文件,qmcdump解码工具完整使用教程
  • 如何通过ComfyUI插件生态系统构建专业级AI图像工作流
  • 通达信缠论插件:3分钟实现自动画中枢的终极解决方案
  • 旧蓝牙音箱改造无线充电器:DIY桌面娱乐中心全攻略