当前位置: 首页 > news >正文

模型初始化常用参数设置

模型初始化参数

    • temperature 参数练习
    • max_tokens 参数练习

在LangChain中,Model Class 和init_chat_model初始化模型共同的参数及解释。
API参考文档:
https://docs.langchain.org.cn/oss/python/langchain/models#parameters

temperature 参数使用场景选择:
0.0-0.3:需要一致性、准确性的任务(数学计算、数据提取、分类、代码生成)
0.5-0.7:平衡创造性和一致性(聊天、问答)
0.8-1.5:创造性任务(写作、头脑风暴)
1.5-2.0:高度创造性(诗歌、故事创作)


.env文件

#从DeepSeek官网获取的配置信息DEEPSEEK_API_KEY=sk-31c9440dxxxxxfb91eeec513XXXXX DEEPSEEK_BASE_URL=https://api.deepseek.com

temperature 参数练习


代码如下

# 模型初始化的参数使用情况# temperature# 在langChain中, Model Class和init_chat_model初始化模型共同的参数和解释# API文档:https://docs.langchain.org.cn/oss/python/langchain/models#parameters# model :使用的特定提供商的模型名称(必需)。比如:openai:gpt-4o、groq:gemma2-9b-it# model_provider:模型提供商名称# api_key :API 密钥。如果不提供,会从环境变量中读取(如DEEPSEEK_API_KEY )# base_url :大模型供应商API请求地址。# temperature : 控制输出随机性,范围 0.0-2.0,温度越高输出越随机。- 0.0 :最确定性,输出几乎不 - 1.0 :平衡创造性和一致性- 2.0 :最随机,最有创造性# max_tokens: 限制模型输出的最大 token 数量# timeout :float 超时时间(秒),超时未响应,请求会被取消。# max_retries:请求失败(如网络问题、速率限制)时的最大重试次数# temperature 参数根据使用场景选择:# 0.0-0.3:需要一致性、准确性的任务(数学计算、数据提取、分类、代码生成)# 0.5-0.7:平衡创造性和一致性(聊天、问答)# 0.8-1.5:创造性任务(写作、头脑风暴)# 1.5-2.0:高度创造性(诗歌、故事创作)fromlangchain.chat_modelsimportinit_chat_modelimportosfromdotenvimportload_dotenv# 加载配置文件load_dotenv(override=True)DEEPSEEK_API_KEY=os.getenv("DEEPSEEK_API_KEY")DEEPSEEK_BASE_URL=os.getenv("DEEPSEEK_BASE_URL")# 获取大模型model=init_chat_model(model="deepseek-v4-flash",model_provider="deepseek",temperature=1.5,api_key=DEEPSEEK_API_KEY,base_url=DEEPSEEK_BASE_URL,)#向模型发送单条数据foriinrange(3):response=model.invoke("帮我写一首易青娥的歌词")print(response.content)

max_tokens 参数练习

Token是什么?
基本单位 : 大模型通过分词器(Tokenizer)将文本拆分后的最小语义单元是token(相当于自然语言中
的词或字)。不同的模型采用不同的 分词算法 (如BPE、WordPiece),因此同一段文本在不同模型中
的Token数量可能不同。
收费依据 :大语言模型通常也是以token的数量作为其计量(或收费)的依据。
1个中文Token≈1-1.8个汉字,1个英文Token≈3-4个字符
Token与字符转化的可视化工具:
OpenAI提供:https://platform.openai.com/tokenizer
百度智能云提供:https://console.bce.baidu.com/support/#/tokenizer

代码如下

# 模型初始化的参数使用情况# Token:基本单位 : 大模型通过分词器(Tokenizer)将文本拆分后的最小语义单元是token(相当于自然语言中的词或字)。不同的模型采用不同的 分词算法 (如BPE、WordPiece),因此同一段文本在不同模型中的Token数量可能不同。# 收费依据 :大语言模型通常也是以token的数量作为其计量(或收费)的依据。 1个中文Token≈1-1.8个汉字,1个英文Token≈3-4个字符# Token与字符转化的可视化工具:OpenAI提供:https://platform.openai.com/tokenizer ,百度智能云提供:https://console.bce.baidu.com/support/#/tokenizer# max_tokens: 限制模型输出的最大 token 数量fromlangchain.chat_modelsimportinit_chat_modelimportosfromdotenvimportload_dotenv# 加载配置文件load_dotenv(override=True)DEEPSEEK_API_KEY=os.getenv("DEEPSEEK_API_KEY")DEEPSEEK_BASE_URL=os.getenv("DEEPSEEK_BASE_URL")# 获取大模型model=init_chat_model(model="deepseek-v4-flash",model_provider="deepseek",# temperature=1.5,max_tokens=10,api_key=DEEPSEEK_API_KEY,base_url=DEEPSEEK_BASE_URL,)#向模型发送单条数据response=model.invoke("学首歌")print(response)
http://www.cnnetsun.cn/news/3051673.html

相关文章:

  • 大数据本科生不考研,靠项目能进优质企业吗?
  • 老旧安卓电视直播优化终极指南:如何用MyTV-Android让低端设备流畅播放
  • 非结构化数据服务模型训练的处理方式
  • 【Springboot毕设全套源码+文档】基于springboot智能垃圾分类系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • Lua学习笔记:库函数
  • 2026闭眼入!5款AI论文工具亲测,摆脱无效加班,初稿质量效率翻倍
  • Adobe GenP 3.0完整教程:免费解锁Adobe CC全系列软件的终极指南
  • 免费音乐解锁工具:3分钟掌握跨平台音乐解密完整指南
  • 如何用SetDPI轻松解决Windows多显示器DPI缩放难题?
  • 基于pytest的接口自动化测试框架:从设计到实战
  • Go语言实现后量子密码算法Kyber与Dilithium:原理、挑战与工程实践
  • FastAdmin框架存储型XSS漏洞深度剖析与安全加固实战
  • 总结 6.28
  • rust 学习 多线程3
  • 接口自动化测试脚本生成Agent Skill
  • 渗透测试实战入门:从零到精通DC-1靶场攻防全流程解析
  • 终极指南:如何让Navicat Mac版实现永久免费试用
  • 实战深度解析:Unitree RL GYM如何实现机器人策略的多仿真环境无缝迁移
  • Ryujinx:C构建的任天堂Switch模拟器技术解析与应用指南
  • 、微信读书、知乎装进 Obsidian:我基于llm-wiki知识中枢搭建实录
  • 单层 ?? 的含义是:左边为 null 则取右边。
  • GHelper:为华硕笔记本量身打造的轻量级控制工具
  • 图片太大怎么缩小
  • FastCut 大更新:第一个能让 Codex / ZCode 直接操刀的浏览器剪辑台
  • Kindle漫画转换终极指南:让你的电子阅读器变身漫画图书馆
  • 【毕业设计】基于 SpringBoot 的餐厅订单统计与菜品管理系统 中小型餐厅订单业务管理平台设计与实现(源码+文档+远程调试,全bao定制等)
  • 从零搭建:基于UWB与MiniFly的室内无人机协同定位系统
  • 免费查AIGC网站推荐:中英文AIGC痕迹一键检测
  • 藏在决策背后的“人性密码”:为什么石油巨头对新科技既爱又怕
  • 如何快速掌握NDS游戏文件编辑器:Tinke的完整使用指南