当前位置: 首页 > news >正文

HoRain云--大语言模型基础(LLM)

🎬 HoRain 云小助手:个人主页

⛺️生活的理想,就是为了理想的生活!


⛳️ 推荐

前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!忍不住分享一下给大家。点击跳转到网站。

目录

⛳️ 推荐

核心工作原理:Transformer 架构简析

如何与 LLM 交互:Prompt 工程入门

基本原则

LLM 的常见应用场景

API 调用与参数设置

基础 API 调用

1. 安装必要的库

实例

DeepSeek

核心配置参数:

实例

阿里百炼

使用方式

非流式调用示例

实例

流式调用示例

实例

主流大语言模型


大语言模型(Large Language Model,简称 LLM)是 AI Agent 的大脑,理解它是构建智能 Agent 的基础。

大语言模型之所以能与你对话、写文章、编程,本质上是它在根据你给出的文本(提示),一个字一个字地猜出最合理的下文。

简单来说,大语言模型是一个经过海量文本数据训练的深度学习模型,它能够理解和生成人类语言。大语言模型通过分析互联网上的海量文本,学习语言的统计规律,当收到输入时,根据学到的规律生成最合理的续写。

我们可以把大语言模型想象成一个极其用功、记忆力超群的学生

它的"大"主要体现在两个方面:

下图展示了 LLM 逐词生成文本的过程——它每次只预测一个词,然后将这个新词纳入输入,继续预测下一个词,如此循环直到生成完整回答:

尽管 LLM 很强大,但它也有明确的局限性:

能力说明局限性
知识截止训练数据有截止日期无法获知训练后的新信息
数学计算能做简单计算复杂计算容易出错
实时信息需要外部工具辅助本身无法获取实时数据
事实准确性可能生成错误信息需要事实核查
长文本处理上下文长度有限制超长文本会丢失信息
逻辑一致性可能前后矛盾需要仔细设计和验证

重要提醒:LLM 不是全知全能的,它本质上是基于统计的模式匹配系统。理解它的局限性,才能更好地利用它的能力。


核心工作原理:Transformer 架构简析

LLM 的惊人能力,离不开其底层核心技术——Transformer 架构。不需要深究复杂的数学原理,但可以理解它的核心思想。

想象你要写一篇关于太阳系的文章:

Transformer 的工作方式与此类似,它的核心流程分为三个阶段:

  1. 输入处理:你的话被拆分成词或字(Token),并转换成计算机能理解的数字(向量)。
  2. 理解上下文(核心)自注意力机制(Self-Attention)开始工作。它让模型在处理句子中每一个词时,都能权衡句子中所有其他词的重要性。这个过程是并行的,速度极快。
  3. 生成与循环:模型基于对所有词的理解,计算出概率分布,预测下一个最可能出现的词。选中并输出这个词后,将其作为新的输入,重复整个过程,直到生成完整回答。

自注意力机制是 Transformer 最关键的创新。以句子"苹果的手机它的电池很大"为例,当模型处理它这个词时,自注意力机制会帮助模型判断它与苹果和手机高度相关。下图展示了这一过程中的注意力权重分布:

苹果手机它电池很大「它」(查询词,已高亮)对各词的注意力权重高权重中权重低权重弧线越粗、颜色越深,表示模型越关注该词

正是这种能并行处理深度理解全局上下文的能力,使得基于 Transformer 的 LLM 在语言任务上远超以往技术(如 RNN)。


如何与 LLM 交互:Prompt 工程入门

Prompt(提示词)是你给 LLM 的输入,它告诉模型你想要什么,就像给助理下达指令——指令越清晰,结果越好。Prompt 的质量直接决定了回答的质量。

一个好的 Prompt 通常由以下四个部分组成:

上下文角色与背景+指令明确任务目标+示例(可选)范例与反例+格式要求输出格式与长度四个模块共同构成一条清晰、完整的提示词

基本原则

LLM 的常见应用场景

场景类别具体示例说明
内容创作与编辑撰写邮件、报告、博客;续写故事;润色文案;翻译不同风格文本快速生成草稿,提供灵感和多种表达方式
信息检索与总结快速阅读长文档并提炼核心观点;基于知识库的问答比传统搜索更"理解"问题,能进行归纳和整合
编程辅助解释代码、生成代码片段、调试错误、重构代码、编写测试用例充当全天候的编程伙伴,极大提升开发效率
对话与客服智能聊天机器人、个性化导师、角色扮演提供拟人化、上下文连贯的交互体验
逻辑推理与分析解数学题、进行基础逻辑推理、分析数据趋势、制定计划在限定领域内展示出令人惊讶的推理能力

API 调用与参数设置

要构建 AI Agent,你需要学会如何通过 API 调用 LLM。

本章节我们以 OpenAI API 为例,介绍基本的调用方法。

openai 是一个强大的 Python 库,用于与 OpenAI 的一系列模型和服务进行交互,详细内容参考:Python OpenAI。

开源地址:https://github.com/openai/openai-python

基础 API 调用

1. 安装必要的库
pip install openai

然后需要去 OpenAI 官网注册账号,并在 API 密钥页面生成一个 API Key。

实例

import os
from openai import OpenAI

client = OpenAI(
# This is the default and can be omitted
api_key="你申请的 API key",
)

response = client.responses.create(
model="gpt-4o",
instructions="You are a coding assistant that talks like a pirate.",
input="How do I check if a Python object is an instance of a class?",
)

print(response.output_text)

我们国内目前访问 openai 还是有点麻烦,国内很多也支持 openai,比如 DeepSeek、阿里的千问。

DeepSeek

DeepSeek API 完全兼容 OpenAI 的 API 格式,只需修改少量配置,即可直接使用 OpenAI SDK 或兼容工具访问 DeepSeek API。

核心配置参数:
参数取值/说明
base_url必填,固定值:https://api.deepseek.com(也可填https://api.deepseek.com/v1,仅为兼容OpenAI,v1与模型版本无关)
api_key必填,需先在 DeepSeek 官网申请专属 API Key(申请地址:https://platform.deepseek.com/)
model必填,
  • deepseek-v4-flash:对应 DeepSeek 的非思考模式,响应速度快,适合常规问答;
  • deepseek-v4-pro:对应 DeepSeek 的思考模式,推理能力更强,适合复杂问题求解。

实例

import os
from openai import OpenAI

# 初始化客户端(核心配置:替换为你的API Key)
client = OpenAI(
api_key=os.environ.get('DEEPSEEK_API_KEY'), # 推荐通过环境变量配置,也可直接写死(不推荐)
base_url="https://api.deepseek.com" # DeepSeek 固定域名
)

# 调用对话API
try:
response = client.chat.completions.create(
model="deepseek-v4-flash", # 指定模型,可选 deepseek-v4-flash / deepseek-v4-pro
messages=[
{"role": "system", "content": "You are a helpful assistant"}, # 系统角色定义
{"role": "user", "content": "Hello"}, # 用户提问
],
stream=False # 非流式输出(一次性返回完整结果)
)
# 打印回复内容
print("回复结果:", response.choices[0].message.content)
except Exception as e:
print("调用失败:", str(e))

阿里百炼

阿里云百炼的通义千问模型支持 OpenAI 兼容接口,您只需调整 API Key、BASE_URL 和模型名称,即可将原有 OpenAI 代码迁移至阿里云百炼服务使用。

我们需要开通阿里云百炼模型服务并获得 API-KEY。

我们可以先使用阿里云主账号访问百炼模型服务平台:https://bailian.console.aliyun.com/,然后点击右上角登录,登录成功后点击右上角的齿轮⚙️图标,选择 API key,然后复制 API key,如果没有也可以创建 API key:

开通阿里云百炼不会产生费用,仅模型调用(超出免费额度后)、模型部署、模型调优会产生相应计费。

现在要使用 API,都需要按 token 来计费,还好都不贵,我们可以先购买个最便宜的包:阿里云百炼大模型服务平台。

也可以直接使用百炼与方舟的 Coding Plan 套餐:https://www.runoob.com/claude-code/coding-plan.html。


使用方式

接下来我们使用 OpenAI SDK 访问百炼服务上的通义千问模型。

非流式调用示例

实例

from openai import OpenAI
import os

def get_response():
client = OpenAI(
api_key="sk-xxx", # 请用阿里云百炼 API Key
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1", # 填写DashScope SDK的base_url
)
completion = client.chat.completions.create(
model="qwen-plus", # 此处以qwen-plus为例,可按需更换模型名称。模型列表:https://help.aliyun.com/zh/model-studio/getting-started/models
messages=[{'role': 'system', 'content': 'You are a helpful assistant.'},
{'role': 'user', 'content': '你是谁?'}]
)
# json 数据
#print(completion.model_dump_json())
print(completion.choices[0].message.content)

if __name__ == '__main__':
get_response()

运行代码可以获得以下结果:

我是通义千问,阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。我可以帮助你回答问题、创作文字,比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等,还能表达观点,玩游戏等。如果你有任何问题或需要帮助,欢迎随时告诉我!

流式调用示例

实例

from openai import OpenAI

def get_response():
client = OpenAI(
api_key="sk-xxx",
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
model="qwen-plus",
messages=[
{'role': 'system', 'content': 'You are a helpful assistant.'},
{'role': 'user', 'content': '你是谁?'}
],
stream=True,
stream_options={"include_usage": True}
)

for chunk in completion:
# chunk 里可能没有 choices 或 delta
if hasattr(chunk, "choices") and len(chunk.choices) > 0:
choice = chunk.choices[0]
if hasattr(choice, "delta") and hasattr(choice.delta, "content"):
print(choice.delta.content, end='', flush=True)

if __name__ == '__main__':
get_response()

运行代码可以获得以下结果:

我是通义千问,阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。我可以帮助你回答问题、创作文字,比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等,还能表达观点,玩游戏等。如果你有任何问题或需要帮助,欢迎随时告诉我!

主流大语言模型

以下是主流大语言模型的官网与 API 文档地址整理:

模型名称所属公司/组织官网API文档地址
GPT系列 (GPT-5.2/GPT-4o)OpenAIhttps://openai.com/https://platform.openai.com/docs/api-reference
Claude系列 (Opus 4.6/Sonnet 4.5)Anthropichttps://www.anthropic.com/https://docs.anthropic.com/claude/reference/getting-started-with-the-api
Gemini系列 (Gemini 3 Pro/Flash)Googlehttps://deepmind.google/technologies/gemini/https://docs.gemini.com/rest-api/
通义千问 (Qwen 3.0系列)阿里巴巴https://www.qianwen.com/https://help.aliyun.com/zh/dashscope/developer-reference/api-details
文心一言 (ERNIE 5.0系列)百度https://yiyan.baidu.com/https://qianfan.cloud.baidu.com/docs/
智谱清言 (GLM-4.7系列)智谱AIhttps://chatglm.cn/https://open.bigmodel.cn/dev/api
Kimi (Moonshot K2.5系列)月之暗面https://kimi.moonshot.cn/https://platform.moonshot.cn/docs/api/chat
讯飞星火大模型科大讯飞https://xinghuo.xfyun.cn/https://www.xfyun.cn/doc/spark/Web.html
DeepSeek系列DeepSeekhttps://www.deepseek.com/https://api-docs.deepseek.com/
Llama系列 (Llama 3.1/Llama 4)Metahttps://www.llama.com/https://www.llama.com/docs/overview/
Grok系列 (Grok 4.1)xAIhttps://x.ai/https://docs.x.ai/overview
MiniMax (M2.1系列)MiniMaxhttps://www.minimaxi.com/https://api.minimax.chat/docs/api/
百川智能 (Baichuan 3系列)百川智能https://www.baichuan-ai.com/https://platform.baichuan-ai.com/docs/api
Ollama (本地部署模型)Ollamahttps://ollama.com/https://github.com/ollama/ollama/blob/main/docs/api.md
豆包大模型字节跳动https://www.doubao.com/https://www.volcengine.com/docs/82379/1399008?lang=zh

❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

http://www.cnnetsun.cn/news/2508494.html

相关文章:

  • 如何快速掌握Diablo Edit2:3步完成暗黑2角色定制与游戏体验优化
  • 华中科技大学等:当机器人“记性不好“,它怎么知道下一步该干嘛?
  • 竞品动态实时监控与关键信号识别,落地方法详解:2026年大模型Agent实操指南
  • 别再问同事了!ANSYS Help文档的5个隐藏用法,帮你省下80%的求助时间
  • 北航毕业论文LaTeX模板:告别格式烦恼的终极解决方案
  • QKeyMapper:解放你的操作自由,Windows键鼠手柄全能映射方案
  • 告别手动造数据:用VectorCAST/C++给你的C/C++代码做个自动化单元测试(附实战Demo)
  • Taotoken官方折扣与Token套餐带来的成本优势感知
  • 从vector到deque:用C++20 assign函数,统一你的STL容器初始化与重置操作
  • QMCDecode终极指南:快速解密QQ音乐加密格式的免费工具
  • 别再手动算UV了!Unity Shader中TRANSFORM_TEX宏的隐藏用法与性能优化
  • QQ音乐格式转换终极指南:如何3步将.qmc文件转为MP3/FLAC
  • FreeMove:Windows磁盘空间终极优化方案,轻松释放C盘数十GB空间
  • 原创丨一个会“记住你“的 AI 智能体是怎么造出来的:拆解Hermes Agent
  • Kubernetes组件详解【20260522】004篇-扩容版005
  • 告别低效编程:在PyCharm 2024.1中配置Baidu Comate的保姆级教程(含快捷键设置)
  • 告别卡顿和黑屏:用VNC+SSH远程玩转树莓派4B的完整配置(含Raspberry Pi OS Bookworm换源)
  • 从.vmx文件到主机服务:一次搞定Kali Linux虚拟机连接安卓手机(Nexus 5X实战)
  • Claude Code 用户如何通过 Taotoken 解决 API 访问不稳定问题
  • 通过 curl 命令直接测试 Taotoken 聊天补全接口的配置方法
  • BarrageGrab:15+平台直播弹幕一体化采集方案,毫秒级延迟的WebSocket直连技术
  • 为内部知识库问答系统集成Taotoken多模型增强回答质量与覆盖度
  • 用STC15F104W单片机DIY一个无线遥控器(315MHz/433MHz模块+NEC协议)
  • 端侧AI算力瓶颈解析与优势企业全景研究:从资源约束到效能突破
  • 机器学习加速分子动力学模拟:物理约束代理模型在纳米颗粒合成中的应用
  • ADSP-21593音频开发实战:用CCES 2.11.1搞定TDM 4进8出与GPIO联动(附工程避坑)
  • 5G传输块大小(TBS)计算原理与网络性能优化实战
  • 银行客户流失预测:Keras全连接网络实战与业务建模方法论
  • 手把手调试 Apollo 变道逻辑:如何用 LaneChangeDecider 的 IsClearToChangeLane 函数判断安全变道时机
  • UE5性能优化实战:从RenderDoc截图到GPU瓶颈定位,手把手教你分析并解决卡顿