当前位置: 首页 > news >正文

实测一个本地知识库:自动学习电脑里的几百个文件,一键导出总结报告!

你好,我是郭震

很多人电脑里其实有大量资料:PDF、Word、Excel、会议纪要、项目文档、论文、合同等。

但真正要用的时候,问题就来了:文件太多,根本不知道答案藏在哪个文档里。

尤其是电脑里有上千、上万个文件时,传统搜索基本就不够用了。

有类似痛点的朋友,可以看看这篇文章。

1 效果展示

如下图所示,学习了我电脑的1万多PDF、Word等文档:

学习完成后还能看到文字+图片,支持多模态学习:

结合学习到你的文件以图文形式回答,是一个更懂你的AI,支持云端和本地双模式,如下图所示:

自动结合左侧学习到的电脑文件,图+文回答你的提问:

外文文献也能全面检索分析,如下图所示:

回答带有完整的引用源,点击下图中间引用小方块,一键定位到左侧文件段落,对文件中公式也支持,如下图所示:

支持深度研究模式:

为了让回答更专业,四大专业预设模式:通用模式、法律模式、医学模式和科研模式。

如下图所示,用户可以根据当前的任务场景自由切换:

另外,还支持多个知识库间联合回答问题:

支持多个知识库的搬家导出、NAS文件移动拷贝等:

2 知识库实测

这个知识库叫做:DeepLocals,个人比较喜欢的本地知识库,也一直在用。

最近一周,我又实测了它的几个功能。

1)实测了它的Quiz生成智能体:

一键对知识库中资料生成练习题:

并带有完整的解析及参考文档哪个段落:

这个智能体可以更好帮我学会思考,可以通过练习题快速熟悉重点内容。

2)还实测了有一个Flash学习卡片智能体,这个也挺有意思:

生成选中资料的复习卡片:

它可以把 PDF、Word、Excel 里的重点知识,自动变成可反复记忆的学习卡片,特别适合考前复习、培训学习和知识点巩固。

3)实测了新支持的工作邮件的上传学习,如下所示EML:

把我工作的邮件,写公众号的素材一起导入到里面:

更多功能实测,我会在接下来公众号文章分享。

3 知识库简介


知识库可以简单理解为:给 AI 配了一个“外部资料库”。

这个资料库里可以放很多内容,比如 PDF、Word 文档、网页、FAQ、产品手册、数据库记录、代码仓库、会议纪要、客服话术等。

它的工作流程大概是这样:

系统会先把这些资料拆成一个个小片段,再把每个片段转换成向量,存进向量数据库里。

当用户提问时,系统不会只依赖大模型自己的记忆,而是会先从知识库里检索出最相关的资料片段,再把这些内容交给大模型,让它基于原始资料来回答问题。

这样做的好处是:AI 回答时有资料依据,不容易胡编;同时也能处理企业、个人电脑里那些大模型原本不知道的私有知识,如下图所示:

最后总结一下

本文实测了一个本地知识库工具:DeepLocals,它更像是给电脑文件装了一个“AI 大脑”。能从很多个本地文件里帮你找答案、做总结、生成报告。

我比较喜欢的一点是,它的回答不是凭空生成,而是带有完整引用来源,可以回到原文段落核对

如果你电脑里资料很多,经常遇到“找不到、看不完、整理不动”的问题,这类本地知识库工具确实值得试试。

全文1590字,31图,如果你觉得这篇文章对你有帮助,也欢迎给我一个三连击:点赞、转发和在看;如果可以,再帮我点一个⭐️。谢谢你看到这里,我们下篇再见。

http://www.cnnetsun.cn/news/2641200.html

相关文章:

  • STM32F103C8T6+DHT11温湿度采集实战:手把手教你用HAL库和CubeMX搞定单总线通信
  • 别再只盯着AUC了!用Python手把手教你绘制ROC与PR曲线(附sklearn代码)
  • 告别刻录盘!用UltraISO软碟通给老旧电脑制作Windows 7 U盘启动盘保姆级教程
  • 如何彻底卸载微软Edge浏览器?EdgeRemover专业工具详解
  • ARM嵌入式平台Nginx移植与负载均衡实战:基于Yocto与OKMX6ULx
  • 终极英雄联盟国服换肤指南:R3nzSkin免费解锁全皮肤体验
  • 告别Steam限制!WorkshopDL让你轻松下载1000+游戏模组
  • 从点灯到通信:基于STM32F103和FreeRTOS,手把手教你实现任务间消息队列与信号量
  • 前端架构模式对比:选择适合你的架构方案
  • 如何解决MAA异常问题:5步诊断与恢复实战指南
  • 游戏鼠标微动开关更换全攻略:从工具准备到焊接实操
  • 新手别乱买!2024年穿越机遥控器选购避坑指南(从RadioMaster到FrSky)
  • 极域电子教室破解工具终极指南:3分钟解除课堂控制限制
  • 高校成绩预测实战包:联邦学习多算法PyTorch实现+Streamlit交互看板+真实/模拟双数据集
  • 别再只盯着复现了:从CVE-2021-21351看XStream 1.4.15黑名单机制的“破窗”与修复实战
  • 宇树科技IPO临近,资本盛宴背后能否在“大脑”之争中突围?
  • 临床太忙没时间读文献?我靠这4招搞定
  • Keil µVision生成Intel HEX文件的方法与原理
  • Java 程序员第 40 阶段02:从零搭建 Java 大模型完整项目,开发环境搭建与工程初始化
  • 基于TEC模块的自发热耳罩DIY:热电效应原理与嵌入式加热实践
  • 基于ResNet50的轻量级垃圾分类识别工程:含训练、推理与迁移配置全流程
  • 谷歌排名突然下降是什么原因?老站长教你1小时找准病因
  • 谷歌排名突然下降是什么原因?教你3步清理别人发的垃圾外链
  • 基于ARM单板机与Leap Motion的DIY混合现实头显开发全流程解析
  • 歌词滚动姬:5分钟制作专业LRC歌词的终极免费工具
  • WarcraftHelper完整指南:三步让魔兽争霸3在现代电脑完美运行
  • Matlab版Sobol敏感度分析工具包:含采样、计算、可视化与多场景测试示例
  • 3分钟掌握DeepL Chrome翻译插件:免费高效的专业翻译解决方案
  • Lindy课程管理自动化部署倒计时:教育部新评估标准下,未完成自动化改造的院校将失去2025年教改专项申报资格
  • 【Lindy预订管理自动化实战指南】:20年酒店系统架构师亲授,3步实现零错误自动订房与动态库存同步