ChatGLM-6B操作手册：重启/停止/启动服务常用指令-柳州手可摘星辰科技有限公司

ChatGLM-6B操作手册：重启/停止/启动服务常用指令

1. 什么是ChatGLM-6B智能对话服务

ChatGLM-6B不是那种需要你从头编译、下载几GB模型文件、反复调试环境才能跑起来的“实验室玩具”。它是一个真正能直接投入使用的智能对话服务——就像打开电灯开关就能亮一样简单。

当你在终端里敲下一条命令，几秒钟后，一个支持中英文双语、能理解上下文、还能根据你的语气调整回答风格的AI助手就在线待命了。它不挑硬件（只要有一块能跑CUDA的显卡）、不依赖网络（模型权重已内置）、也不需要你懂PyTorch底层原理。你只需要关心一个问题：“我该怎么让它动起来？”

这个服务背后，是清华大学KEG实验室和智谱AI联合打磨的开源大模型ChatGLM-6B。它有62亿参数，但不像某些动辄百亿千亿的模型那样“吃显存如喝水”。它在性能和资源消耗之间找到了一个很实在的平衡点：足够聪明，又足够轻量；能写诗也能算账，能聊技术也能讲段子。

更重要的是，它被封装进了一个开箱即用的镜像里——你不用再为“pip install失败”“CUDA版本不匹配”“找不到model.bin”这些老问题抓头发。所有配置、路径、权限、日志、守护机制，都已提前调好。你要做的，只是学会几个关键命令。

2. 镜像设计思路：为什么这些命令值得你记住

很多人第一次接触AI服务时，会陷入两个误区：要么觉得“只要能跑就行”，结果服务崩了找不到日志、重启不了只能重装；要么一上来就研究源码、改config、调LoRA，把简单事搞复杂。而这个ChatGLM-6B镜像的设计逻辑，恰恰是反其道而行之——把运维变成本能反应。

它用Supervisor作为进程守护工具，不是为了炫技，而是因为你在远程服务器上运行AI服务时，最怕的不是“不会用”，而是“突然断了没人管”。Supervisor就像一个24小时值班的运维小助手：服务挂了？自动拉起；日志写满了？自动轮转；你想临时停一下？一句话就行。

Gradio WebUI也不是随便套个界面，它的端口固定在7860，界面简洁无干扰，连“温度”“最大长度”这些参数都做成滑块，点两下就能调。你不需要打开Python脚本去改数字，更不用记一堆API参数。

所以，这篇手册不讲模型结构、不谈量化原理、不分析attention机制。它只聚焦一件事：当你面对一台刚部署好的服务器时，哪几条命令能让你快速掌控这个AI服务的生杀大权。它们不是冷冰冰的语法，而是你和这个AI系统之间最直接的对话方式。

3. 服务管理核心指令详解

3.1 查看服务当前状态

在你执行任何操作前，先确认服务到底在不在跑——这是所有运维动作的第一步。

supervisorctl status chatglm-service

这条命令会返回类似这样的信息：

chatglm-service RUNNING pid 1234, uptime 1 day, 3:22:15

如果看到RUNNING，说明服务正在工作；如果是STOPPED或STARTING，你就知道下一步该做什么了。别跳过这一步，很多“服务没反应”的问题，其实只是它根本就没启动。

小提醒：如果你看到FATAL或BACKOFF，说明启动过程中出了错。这时候别急着重启，先看日志——错误原因通常就藏在第一行。

3.2 启动服务（首次使用或手动唤醒）

服务默认是关闭的。你拿到服务器后，第一件事就是把它叫醒：

supervisorctl start chatglm-service

执行后，你会看到：

chatglm-service: started

这时服务就开始加载模型、初始化GPU显存、启动Web服务。整个过程通常在20–40秒内完成（取决于显卡型号）。你可以用下面这条命令实时盯住它：

tail -f /var/log/chatglm-service.log

当看到类似Running on local URL: http://127.0.0.1:7860的日志出现，就说明它已经准备好了。

3.3 重启服务（修改配置后或响应变慢时）

重启不是“暴力关机再开机”，而是有秩序的软切换。它会先优雅终止当前进程（等正在处理的请求完成），再重新加载全部资源。适用于以下场景：

你刚调高了温度参数，想让新设置生效；
对话变卡顿，怀疑是显存碎片化；
修改了app.py里的提示词模板，需要刷新。

supervisorctl restart chatglm-service

它等价于先执行stop再执行start，但中间没有时间差，不会出现服务空窗期。

3.4 停止服务（释放资源或安全维护）

有时候你并不想让它一直占着显存。比如你只打算用半小时做测试，或者要给其他AI服务腾出GPU空间，那就主动关掉它：

supervisorctl stop chatglm-service

你会看到：

chatglm-service: stopped

此时GPU显存会被完全释放，nvidia-smi里将看不到相关进程。注意：停止后Web界面会打不开，但所有配置和模型文件都完好保存在磁盘上，下次start就能立刻恢复。

4. 日志与排错：读懂系统在说什么

日志不是只有出错时才要看。它其实是你和这个AI服务之间最诚实的沟通渠道。

4.1 实时跟踪日志流

tail -f /var/log/chatglm-service.log

加-f参数意味着“持续监听”，就像守着一个直播窗口。你输入问题、AI生成回复、用户点击清空……这些动作都会变成一行行日志。例如：

INFO: 127.0.0.1:56789 - "POST /api/chat HTTP/1.1" 200 OK INFO: User input: "帮我写一封辞职信" INFO: Model response generated (tokens: 128, time: 2.3s)

这些信息比“服务是否运行”更有价值——它告诉你AI是否真的收到了请求、响应速度如何、有没有token超限。

4.2 快速定位常见问题

现象	日志关键词	可能原因	解决方法
打不开网页	`Address already in use`	7860端口被其他程序占用	`lsof -i :7860`查进程并kill
回复极慢或卡死	`CUDA out of memory`	显存不足（可能同时跑了多个模型）	`stop`其他服务，再`start`
输入后无响应	`Connection refused`	服务根本没启动	先`status`，再`start`
中文乱码或英文夹杂	`UnicodeDecodeError`	某些特殊符号未过滤	在Gradio界面里避免粘贴富文本

经验之谈：90%的服务问题，看前三行报错日志就能定位。别一上来就重装镜像，先让日志说话。

5. 连接与访问：从服务器到浏览器的完整链路

光有服务还不够，你还得让本地电脑能“看见”它。这个过程分三步走，缺一不可。

5.1 确保服务已在服务器端运行

先SSH登录你的GPU服务器，执行：

supervisorctl status chatglm-service

确认状态是RUNNING。如果不是，请先start。

5.2 建立SSH隧道（把远程端口“搬”到本地）

ChatGLM-6B的Web界面默认只监听本地回环地址（127.0.0.1:7860），这是出于安全考虑。你要通过SSH隧道把它“映射”出来：

ssh -L 7860:127.0.0.1:7860 -p <你的SSH端口号> root@gpu-xxxxx.ssh.gpu.csdn.net

注意：

<你的SSH端口号>不是默认22，而是CSDN分配给你的实际端口（通常在控制台可见）；
gpu-xxxxx.ssh.gpu.csdn.net是你的专属域名，别写成IP；
这条命令执行后会保持连接状态（终端不退出），这是正常现象。

5.3 在本地浏览器打开界面

隧道建立成功后，打开你本地电脑的浏览器，访问：

http://127.0.0.1:7860

你会看到一个干净的对话框，左上角写着“ChatGLM-6B”。输入“你好”，它会用中文回应你——这一刻，整个链路才算真正打通。

避坑提示：如果页面打不开，请按顺序检查：① SSH隧道命令是否还在运行（终端没关）；② 本地是否开了代理（关闭SwitchyOmega等插件）；③ 浏览器是否缓存了旧页面（Ctrl+Shift+R 强制刷新）。

6. 进阶技巧：让服务更顺手的小习惯

6.1 给常用命令起别名（省去重复输入）

每次都要敲supervisorctl restart chatglm-service太长？可以加个别名：

echo "alias glm-start='supervisorctl start chatglm-service'" >> ~/.bashrc echo "alias glm-restart='supervisorctl restart chatglm-service'" >> ~/.bashrc echo "alias glm-log='tail -f /var/log/chatglm-service.log'" >> ~/.bashrc source ~/.bashrc

之后只需输入glm-restart就能一键重启，效率翻倍。

6.2 设置开机自启（适合长期部署场景）

如果你打算把这个服务作为团队共享工具长期运行，可以启用Supervisor的自动启动：

# 编辑Supervisor配置 nano /etc/supervisor/conf.d/chatglm-service.conf

找到这一行：

autostart=false

改成：

autostart=true

然后重载配置：

supervisorctl reread supervisorctl update

下次服务器重启，ChatGLM-6B就会自动跟着起来。

6.3 安全访问建议（非必须但推荐）

虽然Gradio默认没密码，但如果你的服务要对多人开放，建议加一层基础保护：

用Nginx反向代理 + HTTP Basic Auth，几行配置就能加上登录框；
或者限制SSH隧道只允许特定IP连接（修改/etc/ssh/sshd_config里的AllowUsers）；
更简单的方法：在Gradio启动时加auth=("admin", "your_password")参数（需修改app.py）。

安全不是越复杂越好，而是刚好挡住“误操作”和“随手点”。

7. 总结：掌握这五条命令，你就真正拥有了它

你不需要成为Linux专家，也不必读懂Transformer论文，就能让ChatGLM-6B为你稳定工作。真正重要的，是建立起一套属于你自己的操作直觉：

status是你的“心跳监测仪”，随时确认它还活着；
start是唤醒键，赋予它行动能力；
restart是刷新键，让改变即时生效；
stop是节能键，不需时就安静休眠；
tail -f是翻译器，把系统语言变成你能听懂的话。

这五条命令，就是你和这个62亿参数AI之间的握手协议。它们不炫酷，但足够可靠；不复杂，但足够有力。当你能在30秒内完成一次故障排查、一次参数更新、一次服务切换，你就不再是在“使用”一个工具，而是在“驾驭”一个伙伴。

现在，回到你的终端，敲下第一条status吧——看看那个沉默的AI，今天是否正等着你开口。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

企业官网建设流程全解析