当前位置：首页 > news >正文

【2026】记录在windows编译llama.cpp步骤，AMD CPU本地部署千问3.5本地大模型，内存占用低

news 2026/6/3 18:45:42

前言

我的电脑是AMD的+32G内存，没有GPU，偏要玩一玩千问3.5本地大语言模型，github上下载的llama安装包，无法使用，只有自己编译试试了。注意我是编译CPU版本的，你有GPU这篇别看了。
以下是我的CPU型号:

1. 下载CMAKE

官网下载地址

或者下载我上传的，注意这是64位
链接：https://pan.quark.cn/s/57d6d1f65309
提取码：cYQk

2. 下载VS2022

VS2022官网下载地址
或者下载我上传的
链接：https://pan.quark.cn/s/57d6d1f65309
提取码：cYQk

勾上这个安装就行

安装后重启电脑

3. 下载大语言模型Qwen3.5-0.8（可选）

我垃圾电脑CPU选择0.8B量化小模型试试，你可以选择别的大一点的模型，也可以选择0.8B的其他量化版本
Qwen3.5-0.8B官网下载地址

或者下载我上传的
链接：https://pan.quark.cn/s/57d6d1f65309
提取码：cYQk

4. 拉取llama代码&编译

打开开始菜单，找到vs2022的专用powershell，单击打开

执行如下命令,注意我是编译CPU版本的，你有GPU这篇别看了

gitclonegitclone https://github.com/ggml-org/llama.cpp.git--depth=1cdllama.cppmkdirbuildcdbuild cmake..-G"Visual Studio 17 2022"-Ax64-DLLAMA_CURL=OFF cmake--build.--configRelease

编译完后进入目录

cdbincdRelasels

执行

llama-cli--help

可以看到打印就算是安装成功了

跑Qwen3.5-0.8B试试

.\llama-cli.exe-m你的路径\Qwen3.5-0.8B-Q4_K_M.gguf-c4096

-c 4096代表4k上下文，千问3.5-0.8B最大是支持256k,改成

.\llama-cli.exe-mD:\model\Qwen3.5-0.8B-Q4_K_M.gguf-c262144

实测跑起来了速度还行，37 token / s

内存使用情况，还不错内存只用了12G左右，CPU用了70%。

查看全文

http://www.cnnetsun.cn/news/2468930.html

终极CAD数据解放方案：深度解析LibreDWG开源DWG转换工具实战指南

ARM架构错误异常处理机制解析与实践

k8s-elk日志分析组件学习

ThinkPHP8多应用实战：手把手教你用PHPStudy配置admin和index双站点（附伪静态规则）

别再手动输API密钥了！Windows/macOS/Linux三平台一键配置OpenAI环境变量（附永久/临时方案）

Sunshine游戏串流终极指南：免费开源打造你的家庭游戏云

DLSS Swapper：免费开源的游戏性能优化终极解决方案

RunAsTI技术深度解析：Windows最高权限获取实战指南

完全离线的实时语音识别工具：TMSpeech隐私保护解决方案

从《模拟城市》到AnyLogic：游戏设计思维如何帮你轻松玩转行人仿真建模？

硬件调试革命：AMD Ryzen深度优化终极指南

别再折腾了！Windows 10/11 下用 MiKTeX + VS Code 搞定 LaTeX 中文环境（保姆级避坑）

VM新BS配置IPSAN图片留存期

C#玩转蓝牙开发：用BluetoothLEAdvertisementWatcher监听BLE广播（附完整代码）

智慧树刷课终极指南：用Autovisor自动化工具解放你的学习时间

Unraid SMB共享权限设置详解：从‘公开’到‘私有’，如何为家人和项目分配不同访问权限？

告别恼人的deprecated警告！深入修改usb_cam源码解决ROS中UVC摄像头的像素格式提示

3步找出Windows热键冲突：热键侦探完整使用指南

华为MetaERP 官方切换公告、IFS 财经变革权威资料、孟晚舟公开讲话，逐条核对

ArcMap新手必看：手把手教你给‘无家可归’的图层安个‘家’（Define Projection保姆级教程）

Taotoken的稳定直连让长时间运行的AI应用更省心

百考通AI智能聚类文献，告别碎片化罗列

告别卡顿！用Sunshine打造私人游戏串流服务器的完整指南

Sunshine终极指南：8步搭建个人游戏串流服务器的完整教程

2025-2026论文降AI工具怎么选？实用测评避坑指南

OpenSpec 介绍与使用：让 AI 编程从“聊天驱动”变成“规格驱动”

不止 ChatGPT：2026 年我真正每天都在用的 5 个 AI 工具

Keil C51大内存模式配置与8051代码空间优化

Windows单机游戏修改不求人：手把手教你用Cheat Engine锁定血量与资源

无王无帝定乾坤，来自田间第一人田间悟道成大道

前言

1. 下载CMAKE

2. 下载VS2022

3. 下载大语言模型Qwen3.5-0.8（可选）

4. 拉取llama代码&编译

相关文章：