Open-AutoGLM项目学习
Open-AutoGLM是一个面向自动化自然语言处理任务的开源框架,专为简化大语言模型(LLM)在实际业务场景中的部署与调优而设计。其核心机制融合了提示工程自动化、动态上下文优化与轻量化推理引擎,使开发者无需深入模型内部结构即可实现高效的任务适配。
核心设计理念
自动化提示工程:AutoGLM 能根据输入任务自动构造最优提示(Prompt),减少人工干预。
模型感知调度:系统可识别当前任务类型(如分类、摘要、问答),动态选择最适合的 GLM 子模型与参数配置。
上下文自适应:在多轮交互中持续追踪语义上下文,保障生成结果的一致性与连贯性。
该框架采用模块化分层设计,主要包括:
提示生成器(Prompt Generator):基于任务语义自动生成最优提示模板;
反馈闭环引擎(Feedback Loop Engine):通过少量标注数据持续优化输出质量;
推理调度器(Inference Scheduler):支持本地与云端混合部署,动态分配计算资源。
数据流设计:
输入请求 → 意图识别 → 任务路由 → 模型执行 → 结果评估 → 输出返回
工作流程示例
用户提交原始文本后,AutoGLM 按照以下顺序执行:
- 任务识别:分析输入意图并归类至预定义任务体系
- 提示生成:基于任务类型构建结构化 Prompt 模板
- 模型调用:调度对应 GLM 实例进行推理
- 后处理输出:对生成结果进行格式化与敏感信息过滤
Open-AutoGLM项目启动
Open-AutoGLM项目是清华大学计算机系的智谱AI于2025年12月9日发布的开源的、通过AI“看屏幕”模拟人类操作的手机端的智能体框架,依托于通用语言模型。
Open-AutoGLM 项目GitHub代码仓库:https://github.com/zai-org/Open-AutoGLM
阅读readme文件
可以使用Claude Code,配置GLM Coding Plan后,输入以下提示词,快速部署本项目。
访问文档,为我安装 AutoGLM https://raw.githubusercontent.com/zai-org/Open-AutoGLM/refs/heads/main/README.md或者有对应不同手机类型的安装步骤:
1.Python 环境:建议使用 Python 3.10 及以上版本。
2.配置 ADB
对于 Android 设备 - 使用 ADB
ADB 全称是 Android Debug Bridge(安卓调试桥),AI 需要通过 ADB 发送模拟操作的指令,如点击、滑动和启动应用。ADB 会执行adb shell screencap命令截取手机屏幕并将图片传回电脑,供 AI 分析;安装ADB Keyboard可进行中文自动输入。
adb devices验证电脑和手机通过 ADB 建立起稳定连接;
ADB的安装:
(1)在电脑上安装 Google 官方的Platform Tools包并按照要求配置环境变量,之后便可在终端使用adb命令了。
(2)在手机上开启“开发者选项”和“USB 调试”。第一次连接电脑时,手机屏幕上会弹出授权请求,点击“允许”。
(3)下载 ADB Keyboard安装包,并在手机中进行安装。 安装完成后需要在手机系统设置中到 设置-输入法 或者 设置-键盘列表 中启用 ADB Keyboard 才能生效。
3. 启动模型服务
可以选择自行部署模型服务,或使用第三方模型服务商。
(1)智谱 BigModel
- 文档:https://docs.bigmodel.cn/cn/api/introduction
- --base-url:https://open.bigmodel.cn/api/paas/v4
- --model:autoglm-phone
- --apikey: 在智谱平台申请你的 API Key
16d753e917694330ad1a2cc35fcd60ac.Rs0DDAoe5lhTn9sv
(2)ModelScope(魔搭社区)
- 文档:https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B
- --base-url:https://api-inference.modelscope.cn/v1
- --model:ZhipuAI/AutoGLM-Phone-9B
- --apikey: 在 ModelScope 平台申请你的 API Key
# 使用智谱 BigModel python main.py --base-url(模型服务地址) https://open.bigmodel.cn/api/paas/v4 --model(部署的模型名称) "autoglm-phone" --apikey(大模型的认证apikey) "your-bigmodel-api-key" "打开美团搜索附近的火锅店" python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "16d753e917694330ad1a2cc35fcd60ac.Rs0DDAoe5lhTn9sv" "打开微信的美团小程序搜索最近的火锅店"# 使用 ModelScope python main.py --base-url https://api-inference.modelscope.cn/v1 --model "ZhipuAI/AutoGLM-Phone-9B" --apikey "your-modelscope-api-key" "打开美团搜索附近的火锅店"示例:
python main.py --base-url https://api-inference.modelscope.cn/v1 --model "ZhipuAI/AutoGLM-Phone-9B" --apikey "your-modelscope-api-key" "请打开美团小程序,搜索附近的KTV。如果搜索框输入无效,请先点击空白处或返回键关闭搜索界面,再重新尝试点击搜索框。"总结
以上就是今天关于open-autoGLM学习的记录,希望对大家的学习有所帮助。在阅读过程中如若有误,还请小伙伴们多多指正;如若有妙解、疑惑也欢迎大家和我交流,感谢!
