本文记录了一个 WorkBuddy 用户在 31 轮对话中逐步探索出的实用技巧,涵盖自定义模型接入、云服务器中转本地大模型、积分攻略,以及一个解决"长对话上下文太长、回溯太慢"问题的实际方案。
用过 WorkBuddy 的朋友都有这个体验:在一个任务里聊久了,对话越来越长,想回顾之前讨论过的配置参数、踩过的坑,只能不断往上翻。上下文越长,AI 处理速度越慢,积分消耗也越高。
笔者在一个工作空间里连续聊了 31 轮,话题从任务管理到自定义模型配置,从云服务器中转到积分攻略,内容越来越丰富,但也越来越难快速定位之前的信息。
于是笔者和 AI 助手一起做了一件事——用 HTML 文件做"对话纪要",每轮对话自动追加摘要,随时预览,一秒定位到任何一轮的要点。这个方案的效果出乎意料地好,本文就从这个方案出发,把 31 轮对话中提炼出的所有实操经验整理分享出来。

痛点 | 说明 |
|---|---|
回溯慢 | 31 轮对话要翻很久才能找到某个具体话题 |
积分浪费 | 每次发消息,全部历史上下文都被 AI 重新读取,越长越贵 |
跨任务无法共享 | WorkBuddy 每个任务互相隔离,换了任务之前的经验就找不到了 |
核心思路很简单:
效果示意:
点击前:
【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek? 自定义模型
点击后:
【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek? 自定义模型
多宝回复要点: • 接口地址和通义千问相同 • 只需改模型 ID • 同一个 Key 通吃所有模型
在 WorkBuddy 的「设置 → 个性化 → 自定义指令」中加入以下规则:
【规则:对话纪要】 每轮对话结束后,更新工作空间下的 conversation-log.html 文件,追加本轮轮次、时间和内容摘要。如果文件不存在则先创建。
新工作空间首次使用时,让 AI 先建好 HTML 模板文件,后续每轮自动追加,你不需要做任何额外操作。
由于 WorkBuddy 每个任务的工作空间目录互相独立,这个 HTML 文件只存在于创建它的工作空间中。如果其他任务也需要类似功能,需要单独创建。不过可以通过工作空间的记忆文件(MEMORY.md)间接传递关键信息。
WorkBuddy 内置多个模型,按积分消耗系数从低到高排列。但如果你有自己的 API Key,完全可以接入外部模型,积分消耗为 0。
配置文件路径:~/.workbuddy/models.json(不存在则手动新建)。
格式如下:
{ "models": [ { "id": "模型ID", "name": "显示名称", "vendor": "OpenAI", "url": "接口地址/v1/chat/completions", "apiKey": "你的API Key", "maxInputTokens": 131072, "maxOutputTokens": 8192 } ] }
写完后完全退出 WorkBuddy 再重启,底部模型下拉菜单就能看到自定义模型了。
配置项 | 值 |
|---|---|
接口地址 | https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions |
API Key | 阿里云百炼平台的 Key(sk- 开头) |
可选模型 | qwen-turbo(快)、qwen-plus(均衡)、qwen-max(最强)、qwen-coder-plus(代码专精) |
阿里云百炼上架了 DeepSeek 模型,接口地址和 Key 与通义千问完全相同,只需改模型 ID:
模型 ID | 特点 |
|---|---|
deepseek-v4-pro | 最新旗舰,编程/数学/通用最强 |
deepseek-v4-flash | 快速且便宜 |
deepseek-v3.2 | 综合均衡 |
deepseek-r1 | 深度思考模型,回复前会先推理 |
也就是说,在 models.json 里可以同时配置通义千问和 DeepSeek,共用一个 Key,在模型下拉菜单里自由切换。
坑 | 错误 | 正确 |
|---|---|---|
接口地址忘了带 /v1 | .../compatible-mode | .../compatible-mode/v1 |
模型名称和实际不一致 | Qwen3-4B | qwen-turbo(必须和平台上的模型 ID 完全一致) |
如果你的高性能工作站上部署了大模型,想让其他设备的 WorkBuddy 也能调用,可以用云服务器做中转——固定 IP,配置一次就完事。
WorkBuddy → 云服务器(公网固定IP:端口) → SSH加密隧道 → 工作站(本地) → 大模型
不管用什么工具(Ollama / LM Studio / vLLM),关键是让模型监听在 0.0.0.0(所有网卡)而不是默认的 127.0.0.1(仅本机)。
工具 | 改法 |
|---|---|
Ollama | 设置环境变量 OLLAMA_HOST=0.0.0.0:11434 |
LM Studio | Server Settings 里把 Host 改为 0.0.0.0 |
在工作站上执行:
ssh -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP
关键:必须加 0.0.0.0: 前缀,否则隧道只在云服务器的 127.0.0.1 上监听,外部连不上。
同时需要在云服务器上修改 SSH 配置:
# 云服务器上 sudo nano /etc/ssh/sshd_config # 添加或取消注释: GatewayPorts yes sudo systemctl restart sshd
用 autossh 替代 ssh,配合 systemd 实现开机自启和断线重连:
autossh -M 0 \ -o ServerAliveInterval=30 \ -o ServerAliveCountMax=5 \ -o ExitOnForwardFailure=yes \ -R 0.0.0.0:11434:localhost:11434 \ -N user@云服务器IP
端口暴露在公网上,光靠防火墙限制 IP 不够(IP 可能变、同网段有其他主机)。加一层应用层认证:
server { listen 11434; auth_basic "Model API"; auth_basic_user_file /etc/nginx/.htpasswd; location / { proxy_pass http://127.0.0.1:11434; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_read_timeout 300s; } }
这样不管谁连 11434,都必须先输密码才能放行,IP 变了无所谓,同网段的别人也进不来。
{ "id": "qwen3:32b", "name": "工作站远程模型", "vendor": "OpenAI", "url": "http://云服务器固定IP:11434/v1/chat/completions", "apiKey": "任意字符串", "maxInputTokens": 32768, "maxOutputTokens": 8192 }
层级 | 防什么 |
|---|---|
防火墙限 IP | 随机扫描 |
SSH 密钥认证 | 非法建隧道 |
autossh 保活 | 断线丢失 |
Nginx Basic Auth | IP 变化、同网段主机——都能挡 |
方式 | 收益 | 说明 |
|---|---|---|
每月固定福利 | 500 积分/月 | 自动发放,永久有效 |
成长计划任务 | 900 积分(一次性) | 新手 + 进阶任务 |
邀请好友 | 双方各 +500/人 | 无上限 |
腾讯云社区发文 | 500~3000/篇 | 心得 500,教程 1000,精选 +2000 |
注意:每日签到已于 2026 年 5 月 10 日永久下线。
阶段 | 说明 | 省积分技巧 |
|---|---|---|
你的输入 | 消息 + 历史上下文 + 工具参数 | 长对话开新会话;一次性说清需求 |
网络响应体 | 网页/接口返回内容全量加载 | 这是大头,给精确 URL 比让 AI 先搜再开省一轮 |
AI 回复 | 模型生成回答 | 关闭深度思考模式可省 2~3 倍 |
模型 | 消耗系数 | 适用场景 |
|---|---|---|
MiniMax M2.5 | 0.18 | 简单问答,最省 |
智谱 GLM-4.7 | 0.23 | 中等复杂度 |
DeepSeek V3.2 | 0.30 | 复杂推理,比 M2.5 贵 1.67 倍 |
自定义模型 | 0 | 走自己的 API Key |
现象 | 说明 |
|---|---|
网页端入口还在 | 任务定义没下线 |
点击后自动打开 WorkBuddy 新任务 | 链路通着 |
用完模板后进度条不动 | 追踪逻辑断了 |
大概率是版本升级后模板内部标识变了,成长计划读取的是旧标识,匹配不上。属于客户端与服务器端之间的追踪 bug,建议去腾讯云开发者社区发帖反馈,等官方修复。
自定义指令在会话创建时注入系统提示。如果先开会话再写指令,当前会话不会生效。写好指令后必须新建会话才能验证。
盾牌形状里有个勾号的图标,点击后有两个选项:
权限级别 | 说明 |
|---|---|
默认权限 | 沙箱受限模式,只能操作工作空间目录内文件 |
完全权限 | 放开限制,可访问更广范围的文件和操作 |
日常使用保持默认权限即可,需要操作工作空间外文件时才切完全权限。
WorkBuddy 系列还有 CLI 形态(CodeBuddy Code),并提供了 Agent SDK(TypeScript / Python),可以嵌入到自己的应用中。结合外部 ASR 语音识别服务,可以实现"语音输入 → 文字 → AI 处理 → 结果输出"的完整链路。
31 轮对话提炼出的核心经验:
希望这些实战经验对你有帮助。
本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。 标签:WorkBuddy、AI 办公、效率工具、大模型部署
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。