当前位置: 首页 > news >正文

Open-AutoGLM保姆级安装指南,连电脑小白都学会了

Open-AutoGLM保姆级安装指南,连电脑小白都学会了

1. 这不是科幻,是今天就能用上的手机AI助手

你有没有过这样的时刻:
想在小红书搜个菜谱,结果点错三次App;
想给爸妈远程教怎么视频通话,电话里说了十分钟他们还是找不到按钮;
做电商运营,每天要手动刷几十个商品页面、截图比价、复制粘贴发朋友圈……

这些事,现在一句话就能让AI帮你做完。

Open-AutoGLM 就是这样一个“会看、会想、会动手”的手机智能助理——它不只听你说话,还能真正“看见”你手机屏幕上的每一个按钮、每一段文字,再像真人一样点击、滑动、输入、切换App,把你的自然语言指令变成一连串精准操作。

更关键的是:它开源、免费、能本地跑,所有数据都在你自己的电脑和手机里,不用上传云端,隐私有保障。

这篇指南,就是专为“从来没配过ADB”“看到命令行就手抖”“连Python是什么都不确定”的朋友写的。
不讲原理,不堆参数,不甩术语。
只说:第一步点哪里,第二步输什么,第三步看到什么就说明成功了。
全程截图式指引,连手机设置里的“开发者选项”藏在哪一页,都给你标清楚。

2. 安装前,先确认三样东西(5分钟搞定)

别急着敲代码。先花5分钟,确认这三样东西你手边都有——缺一样,后面全卡住。

2.1 你的电脑:Windows 或 Mac 都行

  • Windows 10/11(推荐)
  • macOS 12+(M1/M2芯片更顺)
  • ❌ 不需要Linux,也不需要服务器,普通笔记本完全够用
  • 小提示:内存建议8GB以上,但4GB也能勉强跑起来(就是慢一点,耐心等)

2.2 你的安卓手机:真机优先,7.0以上系统

  • 真机一部(华为、小米、OPPO、vivo、三星都支持)
  • Android 7.0(Nougat)及以上(2016年后的主流机型基本都满足)
  • ❌ 模拟器不推荐(兼容性差,容易黑屏或点不动)
  • 怎么查自己手机版本?

设置 → 关于手机 → 软件信息 → Android版本

2.3 一个“能连手机的工具”:ADB(我们叫它“手机遥控器”)

它不是软件,而是一组命令行小工具,作用就一个:让你的电脑能“摸到”手机。
好消息是:它不用安装,解压就能用,而且我们给你打包好了最简版。
点击下载 ADB精简版(Windows)
点击下载 ADB精简版(Mac)

注意:别去官网下完整Android SDK,那有2GB,全是用不到的东西。我们只要里面3个文件:adb.exe(Win)或adb(Mac)、AdbWinApi.dllAdbWinUsbApi.dll(Win专属)。

3. 手机设置:三步打开“被遥控权限”(图文对照)

这一步最容易卡住。很多人卡在“开发者选项”找不见。别慌,我们按手机品牌分步说:

3.1 开启“开发者模式”(所有品牌通用)

品牌路径(像导航一样跟着点)关键提示
华为/荣耀设置 → 关于手机 → 版本号(连点7次)点第7下时,屏幕会弹出“您已进入开发者模式”
小米/Redmi设置 → 我的设备 → 全部参数 → MIUI版本(连点7次)弹窗提示“您已处于开发者模式”
OPPO/一加设置 → 关于手机 → 版本号(连点7次)提示“已开启开发者选项”
vivo/iQOO设置 → 系统管理/更多设置 → 关于手机 → Funtouch OS/iQOO UI版本(连点7次)出现“开发者模式已开启”

成功标志:回到“设置”首页,你能看到新多出一个菜单叫“开发者选项”

3.2 开启“USB调试”(必须开!否则电脑认不出手机)

  • 进入设置 → 开发者选项
  • 往下翻,找到“USB调试”,把它打开(开关变蓝)
  • 弹出提示框时,点“确定”

成功标志:下次用USB线连电脑,手机会弹出“允许USB调试吗?”的询问框(第一次连才弹,以后不再弹)。

3.3 安装并启用“ADB Keyboard”(让AI能替你打字)

这是最关键的一步。没有它,AI能点按钮,但没法输文字(比如搜“美食”、输密码)。

点击下载 ADB Keyboard APK(安卓安装包)

安装步骤:

  1. 下载后,用手机浏览器打开这个.apk文件,点“安装”(如果提示“禁止安装未知来源”,去设置 → 安全 → 未知来源应用安装 → 允许当前浏览器
  2. 安装完成后,去设置 → 语言与输入法 → 虚拟键盘 → 当前键盘
  3. 把默认输入法,切换成 “ADB Keyboard”(名字可能显示为“ADB Keyboard”或“ADB Input”)

成功标志:当你用USB连上电脑,在电脑命令行输入adb shell input text "hello",手机屏幕上会立刻出现“hello”——说明键盘通了。

4. 电脑配置:三步让ADB“认路”(无脑操作)

现在电脑有了ADB工具,手机也开了权限,但电脑还不知道“去哪找ADB”。我们要告诉它路径。

4.1 解压ADB到固定位置(推荐桌面,好找)

  • 把你下载的platform-tools-latest-xxx.zip解压
  • 解压后得到一个文件夹,名叫platform-tools
  • 把整个文件夹拖到桌面(路径就变成:C:\Users\你的用户名\Desktop\platform-tools/Users/你的用户名/Desktop/platform-tools

4.2 告诉电脑“ADB在这儿”(Windows版)

  1. Win + R,输入sysdm.cpl,回车 → 打开“系统属性”
  2. 点“高级”选项卡 → 点右下角“环境变量”
  3. 在“系统变量”区域,找到并双击“Path”
  4. 点“新建” → 粘贴你刚放ADB的路径(例如:C:\Users\张三\Desktop\platform-tools
  5. 点“确定”保存所有窗口

验证是否成功:

  • 打开一个新的命令提示符(Win+R → 输入cmd→ 回车)
  • 输入adb version,回车
  • 如果看到类似Android Debug Bridge version 1.0.41的文字,就成功了!

4.3 告诉电脑“ADB在这儿”(Mac版)

  1. 打开终端(应用程序 → 实用工具 → 终端)
  2. 输入以下命令(把路径换成你自己的):
echo 'export PATH=$PATH:/Users/你的用户名/Desktop/platform-tools' >> ~/.zshrc source ~/.zshrc
  1. 输入adb version回车,看到版本号即成功。

5. 安装Open-AutoGLM:三行命令,零报错

现在,真正的主角登场。我们用最稳妥的方式安装,避开90%的新手坑。

5.1 下载代码(就像下载一个Word文档)

打开命令行(Windows用CMD/PowerShell,Mac用终端),逐行复制粘贴执行

# 第一步:下载整个项目(别怕,只有2MB) git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM

如果提示git: command not found,说明你没装Git。
Windows点这里下载Git|Mac点这里下载Git
安装时,全部点“下一步”,直到完成。装完重启命令行。

5.2 安装依赖(自动下载所有需要的“零件”)

# 第二步:创建独立环境(防冲突,强烈推荐!) python -m venv venv # Windows用户: venv\Scripts\activate # Mac用户: source venv/bin/activate # 第三步:安装所有依赖(耐心等1-2分钟) pip install -r requirements.txt pip install -e .

成功标志:最后一行显示Successfully installed ...,且没有红色报错。

常见问题:

  • ERROR: Could not find a version that satisfies...→ 网络问题,多试几次,或换国内源:
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
  • ModuleNotFoundError: No module named 'torch'→ 说明PyTorch没装好,运行:
    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

5.3 连接手机(让电脑“摸到”手机)

用USB线把手机连到电脑。
在命令行里输入:

adb devices

正确返回应该是:

List of devices attached ABC123456789 device

如果显示unauthorized,请看手机——它正弹着“允许USB调试吗?”的框,点“允许”。
如果显示空,检查:USB线是否完好?手机是否在“文件传输”模式(不是“仅充电”)?

6. 启动AI:一句话让它开始干活(附真实案例)

现在,一切就绪。我们来跑第一个任务:让AI打开微信,给“文件传输助手”发一句“你好”。

6.1 最简启动命令(复制就能用)

在刚才的命令行窗口(确保还在Open-AutoGLM目录下,且虚拟环境已激活),输入:

python main.py \ --device-id ABC123456789 \ --base-url https://api.zhipuai.com/v1 \ --model "autoglm-phone-9b" \ "打开微信,给文件传输助手发消息:你好"

替换说明:

  • ABC123456789→ 替换成你adb devices显示出来的那一串字母数字(就是你的设备ID)
  • https://api.zhipuai.com/v1→ 这是智谱官方API地址,无需申请密钥,直接可用(限流但够测试)
  • 最后那句中文,就是你给AI下的指令,可以随便改,比如:“打开抖音,搜‘AI教程’,点第一个视频”

6.2 你会看到什么?(真实过程描述)

按下回车后,屏幕会快速滚动,你将看到:

  1. 📸 截图中...→ AI正在截取你手机当前屏幕
  2. 👀 理解界面中...→ 视觉模型在分析这张图,识别出“微信图标”“搜索框”“聊天列表”
  3. 🧠 规划动作:点击微信图标→ AI决定下一步该点哪
  4. 🖱 执行:点击坐标 (200, 450)→ 真实点击发生,手机屏幕会闪一下
  5. 任务完成!共执行3步,耗时12.4秒

成功标志:你的手机上,微信真的打开了,并且“文件传输助手”的对话框里,出现了“你好”两个字。

6.3 更多实用指令(直接复制,改改就能用)

"打开小红书,搜索‘空气炸锅食谱’,保存前三条笔记的图片" "打开淘宝,搜‘无线耳机’,按销量排序,截图价格最低的商品详情页" "打开设置,把Wi-Fi关掉,再打开蓝牙" "打开相机,拍一张照片,保存到相册"

小技巧:指令越具体越好。“打开微信”比“用微信”成功率高;“给文件传输助手发消息”比“发消息”更明确。

7. 常见问题急救包(90%的问题,这里都有答案)

问题现象可能原因一键解决
adb devices显示?????????? no permissionsUSB调试未授权拔掉USB线,关手机再开,重连,点“允许”
运行main.py报错ConnectionRefusedError模型服务地址错了--base-url改成https://api.zhipuai.com/v1(官方API最稳)
AI点了半天,手机没反应ADB Keyboard没启用去手机“设置→语言与输入法→当前键盘”,确认选的是“ADB Keyboard”
指令执行一半卡住,没后续网络慢或模型响应延迟加参数--max-steps 10限制最多执行10步,避免死循环
中文乱码、显示方块终端编码问题(Windows常见)在CMD窗口标题栏右键 → 属性 → 字体 → 改成“Lucida Console”或“Consolas”

终极保底方案:如果所有都试过还不行,直接用交互模式,一步步看AI在想什么:

python main.py --interactive --device-id ABC123456789 --base-url https://api.zhipuai.com/v1

然后你手动输入指令,它会把每一步截图、理解、规划的过程都打印出来,方便你定位卡在哪。

8. 你已经会了,接下来可以玩点大的

恭喜你,完成了从零到一的跨越。现在,你拥有的不是一个工具,而是一个能听懂人话、看得清屏幕、下得了手的AI搭档。

你可以马上试试这些:

  • 帮爸妈:语音说“帮我挂明天上午协和医院的号”,AI自动打开挂号App操作
  • 做运营:一句“把今天公众号文章发到小红书和微博”,AI自动跨平台发布
  • 抢优惠:设定“当iPhone 15 Pro价格低于7000时,自动下单”,AI24小时盯盘
  • 学开发:用python scripts/check_deployment_cn.py测试部署是否健康,像工程师一样排查

Open-AutoGLM 的魅力,不在于它多炫酷,而在于它足够“笨”——它不会猜测你的意图,只会老老实实执行你交代的每一步。而这,恰恰是自动化最可靠的样子。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

http://www.cnnetsun.cn/news/845833.html

相关文章:

  • 如何用蚂蚁森林智能助手实现能量自动收取?5步打造专属自动化方案
  • 7个革命性技巧:用Happy Island Designer实现岛屿梦想的创新方法
  • 3步搞定高效歌词提取:从多平台管理到批量保存的全流程指南
  • 探索Minecraft光影包:打造电影级游戏画面的视觉革命
  • 如何高效管理多平台歌词?3分钟解锁163MusicLyrics的全部技能
  • 高效提取B站字幕全攻略:从新手到专家的字幕处理技术指南
  • 3分钟拯救混乱歌词库:这款歌词下载神器如何让音乐体验升舱?
  • Z-Image-ComfyUI一键启动脚本解析:/root目录操作指南
  • 探索Minecraft光影技术:从像素世界到视觉盛宴的蜕变
  • Qwen-Turbo-BF16惊艳案例分享:雨夜赛博街景生成全过程与光影细节解析
  • HY-Motion 1.0智能助手:基于文本指令的康复训练动作定制化服务
  • QwQ-32B开源大模型实操:ollama部署+LangChain集成+RAG增强教程
  • coze-loop商业应用:SaaS产品内嵌AI代码建议功能开发指南
  • 突破24帧限制:AI补帧技术如何让动态图像实现60帧丝滑体验
  • MedGemma 1.5效果实录:从‘TSH升高’出发,经甲状腺功能轴推演至诊疗建议
  • HY-Motion 1.0多场景落地:影视预演、VR交互、元宇宙数字人
  • MedGemma 1.5基础教程:如何读懂<thought>标签并验证医学回答可靠性
  • SeqGPT-560M部署教程:Prometheus+Grafana监控GPU利用率/请求QPS/错误率
  • 一个人就是一支配音团队?IndexTTS 2.0太强了
  • 使用Python操作HBase:happybase库实战教程,数据分析人员必备
  • GLM-4.7-Flash实战教程:RAG增强检索+BM25+Embedding混合排序优化
  • GPEN性能调优实践,节省显存还能提速
  • GLM-4.6V-Flash-WEB开箱即用,AI安防项目省心又高效
  • 开发者必看:Hunyuan-MT-7B一键启动.sh脚本使用全解析
  • RexUniNLU实战案例:工业设备维修日志分析(故障现象+原因+解决方案抽取)
  • 提升Minecraft游戏画质的视觉优化指南:让方块世界焕发电影级光彩
  • AI补帧技术突破:让动态图像焕发丝滑新体验
  • Chandra OCR详细步骤:vLLM模型分片加载策略,解决单卡显存不足问题
  • 突破地理限制:WeWorkHook革新远程办公位置服务解决方案
  • SteamAutoCrack:解除Steam DRM保护的高效工具实用指南