当前位置: 首页 > news >正文

Fara-微软电脑助手模型本地实践

微软推出的 Fara 系列模型,是一个专为电脑操作设计的 AI 智能体。它不同于只能聊天的传统 AI,Fara 能像人一样看屏幕、使用鼠标和键盘,直接在电脑上帮你完成各种网页任务。

Fara-7B 仅有 70亿(7B)参数,设计极其精巧,能直接在个人设备上本地运行,无需依赖云端服务器。这带来了两大优势:极低延迟(处理速度快)和 隐私保护(所有数据留在本地)

虽然体积小巧,但性能毫不妥协。在网页任务基准测试 WebVoyager 中,Fara-7B 取得了 73.5% 的成功率,超越了作为智能体配置时的 GPT-4o(65.1%)。效率也同样出色,平均仅用 16步 完成任务,优于同类模型需要的 41步

模型下载

首先我们需要先下载模型。国内我是去modelscope找和下载。地址如下:

Fara-7B

不过由于本人的电脑显卡内存不够,只有8G。最后选择的是8位的量化版本。相关链接如下:

microsoft_Fara-7B-GGUF

microsoft_Fara-7B-Q8_0.gguf

mmproj-microsoft_Fara-7B-bf16.gguf

CUDA环境安装

本人用的是windows操作系统,需要用到WSL2。安装方式网上挺多的,可自行搜索。

WSL安装好后,在安装个ubantu镜像,找个相对新点的。接着需要安装cuda环境。

查看显卡支持的CUDA版本。输入下述命令:

nvidia-smi

接下来进入ubantu,安装PyTorch。由于PyTorch没有13.1。我选了最解决的13.0。

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu130#执行下述指令验证python -c "import torchprint('='*20, 'PyTorch 安装验证', '='*20)# 1. 检查导入与版本print(f'[1/4]PyTorch 版本:{torch.__version__}')# 2. 检查 CUDA 支持cuda_available = torch.cuda.is_available()print(f'[2/4]CUDA 是否可用:{cuda_available}')print('='*57)"

接下来安装nvcc

wget https://developer.download.nvidia.com/compute/cuda/13.0.1/local_installers/cuda-repo-ubuntu2404-13-0-local_13.0.1-580.82.07-1_amd64.debsudo dpkg -i cuda-repo-ubuntu2404-13-0-local_13.0.1-580.82.07-1_amd64.debsudo cp /var/cuda-repo-ubuntu2404-13-0-local/cuda-*-keyring.gpg /usr/share/keyrings/sudo apt updatesudo apt install cuda-toolkit-13-0 -y# 永久添加 PATHecho 'export PATH=/usr/local/cuda-13.0/bin:$PATH' >> ~/.bashrcecho 'export LD_LIBRARY_PATH=/usr/local/cuda-13.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrcsource ~/.bashrc# 验证nvcc --version

模型引擎安装

由于我用的模型是GGUF格式的,vllm不行,得用llama.cpp

./build/bin/llama-server命令可以启动一个openAI接口格式的Web服务。

-m参数用于指定使用的文本类大模型,-mmproj 参数用于指定多模态大模型。

git clone https://github.com/ggerganov/llama.cppcdllama.cppmkdir-p build&&cdbuildcmake..-DGGML_CUDA=ONcmake --build.--config Release -j$(nproc)cd~/llama.cpp./build/bin/llama-server\--host0.0.0.0\--port5000\-m{你的模型目录}/microsoft_Fara-7B-Q8_0.gguf\--mmproj{你的模型目录}/mmproj-microsoft_Fara-7B-bf16.gguf\--n-gpu-layers30\--ctx-size8192

跑起来后8G直接干满。

客户端安装

使用的客户端是官方推荐的magentic-lite

安装命令如下:

#安装uv(如果没有的话)curl -LsSf https://astral.sh/uv/install.sh | sh# Create a project directorymkdir magentic-lite && cd magentic-lite# Create and activate a virtual environmentuv venv --python=3.12 --seed .venvsource .venv/bin/activate# Install the latest 0.2.x release from PyPIuv pip install "magentic_ui>=0.2.0"

安装后,根据提示配置下大模型接口的web服务就好。默认是http://localhost:5000/v1。

效果图如下,还是有点慢:

http://www.cnnetsun.cn/news/2778517.html

相关文章:

  • 智能汽车AI工具整合不是选型问题,而是时间窗口问题:2024Q3起ECU算力认证新规倒逼重构的4大技术支点
  • 炉石传说macOS智能助手:HSTracker让新手快速成为数据分析大师
  • 3分钟掌握Windows安卓应用安装:告别臃肿模拟器的轻量级解决方案
  • Cesium for Unity 完整指南:5个核心技巧构建地理空间3D应用
  • 二维坐标数据上KMeans、KMeans++、BIRCH与KNN聚类效果直观对比实现包
  • 如何3分钟破解百度网盘限速:免费工具实现全速下载终极指南
  • Pandas多维聚合实战:金融风控中的高效分组与聚合技巧
  • Python周刊2026W21 | Python 3.15.0 Beta 1发布、Python 3.14.5发布、Pyrefly v1.0发布、PEP 788定稿、PEP 830/813推迟至3.16
  • Mac百度网盘SVIP完整解决方案:突破限速瓶颈的终极实践手册
  • 【文档+源码】基于springboot+vue学生答题练习在线平台 -学习资料分享
  • 终极Windows驱动清理指南:DriverStore Explorer轻松释放20GB+空间
  • 保姆级教程:用Python的NumPy库3步搞定线性代数里的‘极大无关组’
  • 编程语言什么是c语言
  • 10分钟掌握喜马拉雅下载器:高效批量下载VIP音频完整指南
  • Python玩转游戏辅助?聊聊pyautogui实现自动操作的原理与边界
  • 从零到实战:用Java HashMap和Collections玩转文本词频统计(附完整源码)
  • 机械原理课设MATLAB实操包:四杆+凸轮+牛头刨床三套可运行仿真模型
  • 实在Agent的下单和部署流程复杂吗?2026全流程解析:从分钟级交付到企业级AI智能体规模化落地
  • 告别重复造轮子:快马一键生成jupyter notebook高效数据分析模板
  • 计算机毕业设计之django基于django的学生兼职平台系统
  • 【计算机毕业设计案例】基于微信小程序的医院预约挂号系统基于springboot+微信小程序的在线预约挂号系统(程序+文档+讲解+定制)
  • 终极开源抖音无水印下载器:3个技术挑战与创新解决方案
  • 从0到99.2%会话续写率:我们用137次A/B测试重构Gemini上下文保鲜机制(含全部OpenTelemetry trace ID)
  • 基于 Harmony 6.0 应用的用药提醒与记录系统首页实现
  • 新手福音:通过快马AI生成DevC++详细注释代码,轻松入门C++编程
  • 解决低分辨率媒体文件困扰:Waifu2x-Extension-GUI完全使用指南
  • 2026全场景实操指南与底层逻辑拆解
  • 目标检测框回归的‘进化史’:从IOU到CIOU,看CV大佬们如何一步步解决边界框的‘贴合’难题
  • PHP周刊2026W21 | PHP 基金会成立生态安全团队、Laravel 13.9.0 新增 HTML 密码规则属性、Twig 3.25.0 发布、Symfony 8.1 原生 DeepClon…
  • Andrej Karpathy 入局 Anthropic:从 AI 布道者到安全守门人的技术深意