当前位置：首页 > news >正文

Open-AutoGLM新手入门：无需Root，三步搭建手机AI智能助理

news 2026/3/27 2:23:30

Open-AutoGLM新手入门：无需Root，三步搭建手机AI智能助理

最近，一款能听懂人话、自动帮你操作手机的AI助理火了。想象一下，你只需要对手机说一句“帮我订一张明天去上海的火车票”，它就能自己打开购票App，搜索车次，选择座位，最后等你确认支付。这听起来像是科幻电影里的场景，但现在，借助智谱开源的Open-AutoGLM项目，你完全可以在自己的安卓手机上实现它。

今天，我就带你从零开始，只用三步，把你的普通安卓手机变成一个能听会做的AI智能助理。整个过程不需要Root权限，也不需要复杂的编程知识，跟着做就能搞定。

1. 准备工作：连接你的手机与电脑

要让AI控制你的手机，首先得在手机和电脑之间建立一条“指挥通道”。这条通道就是ADB（Android Debug Bridge），一个谷歌官方提供的调试工具。

1.1 在电脑上安装ADB工具

ADB工具就像是一个翻译官，负责把电脑上的指令翻译成手机能听懂的命令。

对于Windows用户：

前往安卓开发者官网，下载最新的platform-tools压缩包。
解压到你喜欢的目录，比如C:\platform-tools。
将这个目录的路径添加到系统的环境变量Path中。
打开命令提示符（CMD）或PowerShell，输入adb version并回车。如果能看到版本号信息，恭喜你，安装成功了。

对于macOS用户：打开终端（Terminal），使用Homebrew安装是最简单的方式：

brew install android-platform-tools

安装完成后，同样在终端输入adb version验证。

1.2 在手机上开启调试模式

现在，我们需要让手机准备好接收指令。

开启开发者选项：进入手机的“设置” > “关于手机”，连续点击“版本号”7次，直到出现“您已处于开发者模式”的提示。
开启USB调试：返回“设置”，找到新出现的“开发者选项”或“系统开发者选项”，进入后开启“USB调试”开关。
安装ADB键盘：这是一个关键步骤。AI需要通过它来在手机上输入文字。从GitHub下载ADBKeyboard.apk文件并安装到手机。安装后，在“设置” > “系统” > “语言与输入法”中，将默认键盘切换到“ADB键盘”。

完成以上步骤后，用USB数据线将手机连接到电脑。此时手机会弹出“允许USB调试吗？”的提示，勾选“始终允许”并点击“确定”。

在电脑终端输入adb devices，你应该能看到你的设备ID，后面跟着device字样。这表明连接成功。

2. 部署AI大脑：获取Open-AutoGLM控制端

连接建立后，我们需要把“AI大脑”——也就是控制程序，部署到电脑上。这里我们使用智谱官方提供的云端模型API，省去本地部署大模型的麻烦。

2.1 获取智谱AI的API密钥

Open-AutoGLM需要调用智谱的视觉语言模型来理解手机屏幕。你需要一个API密钥。

访问智谱AI开放平台，注册并登录。
进入“个人中心”或“项目管理”，找到“API密钥”管理页面。
点击“创建新的API密钥”，复制生成的一长串字符（如sk-xxxxxxxxxxxxxx）并妥善保存。这就是你调用模型的通行证。

2.2 下载并配置控制端代码

“AI大脑”的代码是开源的，我们把它下载到电脑上。

打开电脑终端，执行以下命令：

# 1. 克隆开源仓库到本地 git clone https://github.com/zai-org/Open-AutoGLM # 进入项目文件夹 cd Open-AutoGLM # 2. 安装项目所需的Python依赖包 pip install -r requirements.txt # 以可编辑模式安装，方便后续更新 pip install -e .

等待安装完成，你的电脑上就拥有了指挥AI行动的所有程序。

3. 发号施令：让AI开始工作

万事俱备，只欠指令。现在，让我们给AI下达第一个任务。

在终端中，确保你位于Open-AutoGLM目录下，然后运行以下命令（请替换为你自己的信息）：

python main.py \ --base-url https://open.bigmodel.cn/api/paas/v4 \ --model "autoglm-phone" \ --apikey "你的智谱API密钥" \ "打开美团，帮我找一家评分4.5以上的川菜馆"

命令参数解释：

--base-url: 指定智谱AI API的服务地址，固定为上述地址。
--model: 指定使用的模型名称，这里就是手机智能助理专用模型autoglm-phone。
--apikey: 填入你在第二步中获取的API密钥。
最后的引号内容：这就是你用自然语言下达的指令，想让它做什么，直接说出来。

运行命令后，你会看到终端开始输出日志。同时，你的手机会自动亮屏、解锁（如果设置了锁屏密码，首次需要手动输入），然后AI开始“操作”：

理解指令：AI模型会分析“打开美团，找川菜馆，评分要高于4.5”这个指令。
感知屏幕：通过ADB截图，获取当前手机屏幕画面。
规划行动：判断需要先点击“美团”图标，进入后点击搜索框，输入“川菜”，再从结果中筛选高评分店铺。
执行操作：通过ADB模拟点击、滑动、输入等操作，一步步完成任务。

你会看到手机像被一个隐形的手指操控，自动完成所有点击和搜索，最终将筛选好的店铺列表呈现在你面前。

3.1 更多玩法与高级技巧

掌握了基础操作，你可以玩出更多花样：

1. 复杂任务串联：AI可以处理多步复杂指令。例如：

python main.py ... "先打开微信，找到张三的聊天框，问他‘晚上一起吃饭吗？’，然后打开高德地图，搜索公司附近的电影院。"

它会依次执行这两个独立任务。

2. 无线连接（摆脱数据线）：如果你觉得连着数据线不方便，可以启用无线ADB调试。

先用USB线连接手机和电脑，在终端输入：adb tcpip 5555
断开USB线，在手机设置中查看手机的IP地址（通常在WLAN设置里）。
在电脑终端输入：adb connect 手机IP地址:5555（例如adb connect 192.168.1.100:5555）
连接成功后，后续运行命令时，--device-id参数就可以使用这个IP地址了。

3. 使用Python脚本精细控制：除了命令行，你还可以用Python编程的方式与AI交互，实现更灵活的控制，比如循环任务、条件判断等。

from phone_agent.adb import ADBConnection from phone_agent.agent import PhoneAgent # 连接你的手机（USB或无线） conn = ADBConnection() conn.connect("你的设备ID或IP") # 创建AI代理 agent = PhoneAgent(connection=conn, model_name="autoglm-phone", api_key="你的密钥") # 执行任务 result = agent.run("打开小红书，收藏一篇关于露营装备的攻略") print(f"任务结果：{result}")