当前位置：首页 > news >正文

LLMIndex的使用

news 2026/6/13 21:59:59

在大语言模型（LLM）快速发展的今天，如何让模型基于我们自己的私有知识进行准确回答，成为了一个关键问题。检索增强生成（Retrieval-Augmented Generation, RAG）正是解决这一问题的有效范式。本文将通过一段完整的 Python 代码，带你使用LangChain框架构建一个本地 RAG 系统，并借此介绍 LLM 应用开发中的核心组件——虽然标题提到“LLMIndex”，但实际在 LangChain 生态中，我们更常使用 FAISS、Chroma 等向量数据库来实现类似功能（注：LLMIndex 是 LlamaIndex 项目的核心概念，而本文使用的是 LangChain）。

📌说明：本文示例基于LangChain + 本地运行的 Qwen 模型（通过http://127.0.0.1:1234/v1提供 OpenAI 兼容 API），适合希望在本地部署私有知识问答系统的开发者。

一、准备工作

pipinstalllangchain langchain-community langchain-openai python-dotenv faiss-cpu

同时，你需要：

一个本地运行的大模型服务（如 LM Studio、Ollama 或 vLLM），并开启 OpenAI 兼容 API（端口 1234）。
一份名为knowledge.txt的文本知识库文件（UTF-8 编码）。
在.env文件中配置OPENAI_API_KEY（即使使用本地模型，LangChain 仍要求提供 API Key，可设为任意字符串，如sk-local）。

二、代码解析：构建 RAG 流程

1. 加载环境变量与文档

load_dotenv()api_key=os.getenv("OPENAI_API_KEY")loader=TextLoader("knowledge.txt",encoding="utf-8")documents=loader.load()

这里我们使用TextLoader读取本地知识文件。LangChain 支持多种格式（PDF、Word、网页等），可根据需求替换加载器。

2. 文本分块（Chunking）

text_splitter=RecursiveCharacterTextSplitter(chunk_size=300,chunk_overlap=50)texts=text_splitter.split_documents(documents)

由于 LLM 有上下文长度限制，需将长文档切分为小段。RecursiveCharacterTextSplitter按字符递归分割，保留语义连贯性，chunk_overlap避免信息割裂。

3. 向量化与向量存储

embeddings=OpenAIEmbeddings(model="text-embedding-qwen3-embedding-0.6b",api_key=api_key,base_url="http://127.0.0.1:1234/v1")vectorstore=FAISS.from_documents(texts,embeddings)

关键点来了！我们使用本地嵌入模型（如 Qwen Embedding）将文本转换为向量，并存入FAISS（Facebook 开源的高效相似性搜索库）。这一步相当于构建了“知识索引”——类似于 LlamaIndex 中的VectorStoreIndex。

4. 配置本地大语言模型

llm=ChatOpenAI(model='qwen2.5-7b-instruct-1m',api_key=api_key,base_url="http://127.0.0.1:1234/v1")

通过 OpenAI 兼容接口调用本地 Qwen 模型，无需联网，保障数据隐私。

5. 构建 RAG 链

retriever=vectorstore.as_retriever(search_kwargs={"k":3})template="""使用以下上下文片段来回答问题。 如果你不知道答案，就说你不知道，不要编造答案。 {context} 问题: {question} 有用的回答:"""prompt=ChatPromptTemplate.from_template(template)defformat_docs(docs):return"\n\n".join(doc.page_contentfordocindocs)qa_chain=({"context":retriever|format_docs,"question":RunnablePassthrough()}|prompt|llm|StrOutputParser())

这是 LangChain 的精髓：声明式链式编程。

retriever从向量库中找出最相关的 3 个文本块；
format_docs将检索结果拼接成字符串；
prompt注入上下文和问题；
llm生成答案；
StrOutputParser提取纯文本。

整个流程清晰、模块化，易于调试和扩展。

6. 提问与输出

query="LangChain 支持哪些功能？"result=qa_chain.invoke(query)print("问题：",query)print("回答：",result)

系统会自动检索knowledge.txt中相关内容，并基于上下文生成精准回答。

三、为什么不用 LlamaIndex？

你可能会问：既然提到了 “LLMIndex”，为什么不直接用 LlamaIndex？

LlamaIndex更专注于数据索引与查询优化，适合复杂知识图谱、多模态索引等场景；
LangChain则是一个通用 LLM 应用框架，强调链式组合、工具集成（如 Agent、Memory）。

两者并非互斥，甚至可以结合使用。但在简单 RAG 场景下，LangChain + FAISS 已足够高效。

查看全文

http://www.cnnetsun.cn/news/183380.html

网易云NCM解密终极指南：3种简单方法快速转换音乐文件

终极音乐解密工具：快速转换网易云NCM加密格式

联想拯救者工具箱：解锁笔记本隐藏性能的智能管家

如何安全使用AO3镜像？新手终极入门指南

如何在Win10工控机上完成STLink驱动下载

猫抓浏览器扩展：3步轻松捕获网页视频资源的终极指南

写论文软件哪个好？实测 10 款后，这款凭 “学术安全感” 赢麻了！[特殊字符]

拯救者工具箱终极指南：小白也能轻松掌握的隐藏性能优化技巧

如何实现智能内容解锁？终极免费阅读解决方案

基于LabVIEW与Matlab script绘制电机、控制器、系统效率MAP图

ServiceWorker 的生命周期包含6种核心状态

网易云NCM文件终极解密：从加密音乐到自由播放的完整方案

Betaflight与F4/F7飞控硬件兼容性：核心要点

猫抓Cat-Catch资源嗅探工具完整教程：从新手到高手

猫抓Cat-Catch：新手必学的网页视频下载全攻略

Expo CLI常用命令详解：完整指南

RePKG终极指南：5分钟掌握Wallpaper Engine资源提取与转换

超星网课助手完整操作指南：告别手动刷课烦恼

联想拯救者工具箱功能解析：7大特色功能深度探索与实践指南

逆向工程深度解析：Wallpaper Engine资源格式完全解密指南

【大模型开发效率提升10倍】：Open-AutoGLM开源实战指南

拯救者工具箱：三步解锁联想笔记本隐藏性能的终极指南

Elasticsearch动态映射实践：手把手配置JSON自动识别

智慧树学习插件：自动化播放技术深度解析与实战指南

Bypass Paywalls Clean技术深度解析：解锁信息自由的全新维度

RePKG终极指南：快速掌握数据包解析与纹理格式转换技术

大麦抢票神器：DamaiHelper全自动解决方案深度解析

Bypass Paywalls Clean完整教程：轻松突破付费内容限制

如何免费访问受限内容：面向普通用户的解决方案

碧蓝航线Alas脚本终极指南：5步实现游戏自动化，彻底告别手动操作