大家好,我是刘聪NLP。
豆包手机没玩上(还没到),先玩一波autoglm,太好玩了,
开源一周已经15k star,只能说太猛了。

然后还看到有人发,闲鱼上这个AutoGLM部署,已经卖到199了,哈哈哈哈。

不过,这个大概率是用的api,还是不安全的!
其实,官方现在文档已经写的蛮清楚了,跟着官方文档走了一遍,基本是可以直接成的。
https://github.com/zai-org/Open-AutoGLM/tree/main
玩了半天,整体来说,简单任务基本上都能完成,一些付款需要手动点击,
然后本以为9b模型很小了,但其实整体操作速度还是有点慢。
下面三个示例,都是没有加速的(webui是我直接vibe的)
PS:然后才发现,其实已经有人做了一个,比我的页面更漂亮,哈哈哈
https://github.com/suyiiyii/AutoGLM-GUI
初级任务,给我老婆发微信,
中阶任务,发个小红书
高阶任务,12306订票
我还测试了,让他给我收集蚂蚁森林的能量,能进去(我加了支付宝的app package name),能操作,但是最后小球就不点,会有其他操作收集能量,最后没有收集成功。
可能跟没专门针对性训练过有关。

整体来说,还是不错的,9B模型能达到这个程度,感觉2026年,端侧芯片和模型再猛猛冲一下,
说不定,真能成,哈哈哈哈
虽然官方文档已经写的比较详细了,但是我还是遇到了一些问题,
一些遇到的坑,分享给大家,
先是使用本地模型部署的问题,
为了防止数据问题,本地部署是大多数人的选择,
但9B模型,你以为1张24G的显卡可以部署,你就错了,会报错,max-len小于一定程度时,会报错误。

我当时测试8000最大长度会报错,10000不会报错,但是10000最大长度24G显卡就会溢出。
所以这里你要不然选择32G、40G、48G的显卡,要不然选择两张4090-24G。
我这里是2张4090-24G显卡。
这里选择vllm部署,我这里是pull了一个pytorch的镜像,然后自己装的包,
# 拉镜像
docker pull pytorch/pytorch:2.8.0-cuda12.8-cudnn9-devel
# 创建容器
docker run -it --gpus all --name auto_glm -p 25302:25302 -v /home/:/home/ --shm-size 10gb pytorch/pytorch:2.8.0-cuda12.8-cudnn9-devel /bin/bash
# 进入容器装包
apt-get update
pip config set global.extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip install vllm==0.12
# 执行命令-我这里是两个GPU
CUDA_VISIBLE_DEVICES=0,1 vllm serve /home/AutoGLM-Phone-9B/ --served-model-name autoglm-phone-9b --trust-remote-code --host 0.0.0.0 --port 25302 --max-model-len 32000 --chat-template-content-format string --limit-mm-per-prompt "{\"image\":30}" --gpu-memory-utilization 0.8 --tensor-parallel-size 2
这里注意模型下载,用modelscope下载,很快
modelscope download --model ZhipuAI/AutoGLM-Phone-9B --local_dir /home/AutoGLM-Phone-9B
服务端就完成了,
但如果你没有资源,那么你可以使用官方的API,只要你不在意数据问题就行。
--base-url: https://open.bigmodel.cn/api/paas/v4
--model: autoglm-phone
--apikey: 在智谱平台申请你的 API Key
因为autoglm模型是通过ADB来控制的,所以我们要在PC端和手机端安装ADB。
PC端安装,先下载包,我是windows,大家按需下载
https://developer.android.com/tools/releases/platform-tools?hl=zh-cn

然后解压压缩包后,复制路径到系统Path中,

按键windows+r打开运行,输入sysdm.cpl,回车;高级->环境变量->系统变量->path,点击两次“确定”
验证,是否成功,在cmd中执行
adb --version

手机端,先调整开发者模式,
“设置-关于手机-版本号”,快速点击,输入密码,就进入开发者模式了。
PS:黑屏是在输密码,然后我这里一开始是不生效的,要重启后开发者模式才生效,为了方便,可以都直接重启一下
然后开启USB调试,用数据线连接PC端和手机端,会提示一堆信息,你确认就行
然后你在PC端CMD中执行
adb devices

最后还要在你手机端安装ADB Keyboard,要不然没法输入信息
下载ADBKeyboard.apk到电脑,你可以选择微信等一切方式传到手机,然后安装。
https://github.com/senzhk/ADBKeyBoard/blob/master/ADBKeyboard.apk
安装后,在输入法里,选择“ADB Keyboard”
然后把项目clone到你的本地,就可以启动你的服务了,
python main.py python server.py --base-url http://127.0.0.1:25302/v1 --model "autoglm-phone-9b"
缺啥包装啥包就行,

记得--max-steps设置大点,默认10步,很多任务都不够。
我vibe的代码,后台私信发autoglm获取。
启动命令
python server.py --port 8080 --base-url http://127.0.0.1:25302/v1 --model "autoglm-phone-9b"
最后,
智谱这边开源autoglm,真的太nb了,
接豆包手机的流量接的也是很顺畅,
虽然现在这个模型部署在手机上还不行,
然后速度其实也没有那么好,毕竟他是GUI模式,截图,然后理解操作,
跟豆包那种底层直接执行还是不同,
但我相信随着时间的发展,端侧芯片、端侧模型的持续发展,
那么豆包手机的数据安全问题是可以解决的。 但理性来看,
现在太复杂的模型还是不行,有待提高,
但已经很好了,2年轻,谁敢想象9B模型就这么nb呀。
PS:都看到这里,来个点赞、
在看、关注吧。 您的支持是我坚持的最大动力!