WorkBuddy 深度使用笔记：自定义模型接入、远程中转与对话纪要，31 轮实战精华整理

原创

用户12525304

发布于 2026-05-30 22:41:39

2700

本文记录了一个 WorkBuddy 用户在 31 轮对话中逐步探索出的实用技巧，涵盖自定义模型接入、云服务器中转本地大模型、积分攻略，以及一个解决"长对话上下文太长、回溯太慢"问题的实际方案。

前言：为什么要整理这些笔记？

用过 WorkBuddy 的朋友都有这个体验：在一个任务里聊久了，对话越来越长，想回顾之前讨论过的配置参数、踩过的坑，只能不断往上翻。上下文越长，AI 处理速度越慢，积分消耗也越高。

笔者在一个工作空间里连续聊了 31 轮，话题从任务管理到自定义模型配置，从云服务器中转到积分攻略，内容越来越丰富，但也越来越难快速定位之前的信息。

于是笔者和 AI 助手一起做了一件事——用 HTML 文件做"对话纪要"，每轮对话自动追加摘要，随时预览，一秒定位到任何一轮的要点。这个方案的效果出乎意料地好，本文就从这个方案出发，把 31 轮对话中提炼出的所有实操经验整理分享出来。

一、对话纪要方案：告别无尽滚动

1.1 问题：长对话的三个痛点

痛点	说明
回溯慢	31 轮对话要翻很久才能找到某个具体话题
积分浪费	每次发消息，全部历史上下文都被 AI 重新读取，越长越贵
跨任务无法共享	WorkBuddy 每个任务互相隔离，换了任务之前的经验就找不到了

1.2 解决方案：独立 HTML 对话纪要

核心思路很简单：

创建一个独立 HTML 文件（如 conversation-log.html）
每轮对话结束后，AI 自动追加一条记录：轮次、时间、你的提问摘要、AI 回复要点
点击任意条目展开/收起详细内容
随时用预览功能查看，右侧面板实时刷新

效果示意：

点击前：

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek？自定义模型

点击后：

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek？自定义模型

多宝回复要点： • 接口地址和通义千问相同 • 只需改模型 ID • 同一个 Key 通吃所有模型

1.3 配合自定义指令实现自动维护

在 WorkBuddy 的「设置 → 个性化 → 自定义指令」中加入以下规则：

【规则：对话纪要】每轮对话结束后，更新工作空间下的 conversation-log.html 文件，追加本轮轮次、时间和内容摘要。如果文件不存在则先创建。

新工作空间首次使用时，让 AI 先建好 HTML 模板文件，后续每轮自动追加，你不需要做任何额外操作。

1.4 跨任务的局限

由于 WorkBuddy 每个任务的工作空间目录互相独立，这个 HTML 文件只存在于创建它的工作空间中。如果其他任务也需要类似功能，需要单独创建。不过可以通过工作空间的记忆文件（MEMORY.md）间接传递关键信息。

二、自定义模型接入：不花积分用 AI

WorkBuddy 内置多个模型，按积分消耗系数从低到高排列。但如果你有自己的 API Key，完全可以接入外部模型，积分消耗为 0。

2.1 配置方式

配置文件路径：~/.workbuddy/models.json（不存在则手动新建）。

格式如下：

{ "models": [ { "id": "模型ID", "name": "显示名称", "vendor": "OpenAI", "url": "接口地址/v1/chat/completions", "apiKey": "你的API Key", "maxInputTokens": 131072, "maxOutputTokens": 8192 } ] }

写完后完全退出 WorkBuddy 再重启，底部模型下拉菜单就能看到自定义模型了。

2.2 阿里云 DashScope 接入通义千问

配置项	值
接口地址	https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
API Key	阿里云百炼平台的 Key（sk- 开头）
可选模型	qwen-turbo（快）、qwen-plus（均衡）、qwen-max（最强）、qwen-coder-plus（代码专精）

2.3 同一个 Key 调用 DeepSeek

阿里云百炼上架了 DeepSeek 模型，接口地址和 Key 与通义千问完全相同，只需改模型 ID：

模型 ID	特点
deepseek-v4-pro	最新旗舰，编程/数学/通用最强
deepseek-v4-flash	快速且便宜
deepseek-v3.2	综合均衡
deepseek-r1	深度思考模型，回复前会先推理

也就是说，在 models.json 里可以同时配置通义千问和 DeepSeek，共用一个 Key，在模型下拉菜单里自由切换。

2.4 两个常见坑

坑	错误	正确
接口地址忘了带 /v1	.../compatible-mode	.../compatible-mode/v1
模型名称和实际不一致	Qwen3-4B	qwen-turbo（必须和平台上的模型 ID 完全一致）

三、云服务器中转远程工作站模型

如果你的高性能工作站上部署了大模型，想让其他设备的 WorkBuddy 也能调用，可以用云服务器做中转——固定 IP，配置一次就完事。

3.1 整体架构

WorkBuddy → 云服务器(公网固定IP:端口) → SSH加密隧道 → 工作站(本地) → 大模型

3.2 第一步：工作站部署模型服务

不管用什么工具（Ollama / LM Studio / vLLM），关键是让模型监听在 0.0.0.0（所有网卡）而不是默认的 127.0.0.1（仅本机）。

工具	改法
Ollama	设置环境变量 OLLAMA_HOST=0.0.0.0:11434
LM Studio	Server Settings 里把 Host 改为 0.0.0.0

3.3 第二步：建立 SSH 反向隧道

在工作站上执行：

ssh -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP

关键：必须加 0.0.0.0: 前缀，否则隧道只在云服务器的 127.0.0.1 上监听，外部连不上。

同时需要在云服务器上修改 SSH 配置：

# 云服务器上 sudo nano /etc/ssh/sshd_config # 添加或取消注释： GatewayPorts yes sudo systemctl restart sshd

3.4 第三步：隧道自动保活

用 autossh 替代 ssh，配合 systemd 实现开机自启和断线重连：

autossh -M 0 \ -o ServerAliveInterval=30 \ -o ServerAliveCountMax=5 \ -o ExitOnForwardFailure=yes \ -R 0.0.0.0:11434:localhost:11434 \ -N user@云服务器IP

3.5 第四步：加 Nginx Basic Auth 防护

端口暴露在公网上，光靠防火墙限制 IP 不够（IP 可能变、同网段有其他主机）。加一层应用层认证：

server { listen 11434; auth_basic "Model API"; auth_basic_user_file /etc/nginx/.htpasswd; location / { proxy_pass http://127.0.0.1:11434; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_read_timeout 300s; } }

这样不管谁连 11434，都必须先输密码才能放行，IP 变了无所谓，同网段的别人也进不来。

3.6 WorkBuddy 侧配置

{ "id": "qwen3:32b", "name": "工作站远程模型", "vendor": "OpenAI", "url": "http://云服务器固定IP:11434/v1/chat/completions", "apiKey": "任意字符串", "maxInputTokens": 32768, "maxOutputTokens": 8192 }

3.7 安全层级总结

层级	防什么
防火墙限 IP	随机扫描
SSH 密钥认证	非法建隧道
autossh 保活	断线丢失
Nginx Basic Auth	IP 变化、同网段主机——都能挡

四、积分攻略：获取与节省

4.1 免费获取积分的渠道

方式	收益	说明
每月固定福利	500 积分/月	自动发放，永久有效
成长计划任务	900 积分（一次性）	新手 + 进阶任务
邀请好友	双方各 +500/人	无上限
腾讯云社区发文	500~3000/篇	心得 500，教程 1000，精选 +2000

注意：每日签到已于 2026 年 5 月 10 日永久下线。

4.2 积分消耗的三个阶段

阶段	说明	省积分技巧
你的输入	消息 + 历史上下文 + 工具参数	长对话开新会话；一次性说清需求
网络响应体	网页/接口返回内容全量加载	这是大头，给精确 URL 比让 AI 先搜再开省一轮
AI 回复	模型生成回答	关闭深度思考模式可省 2~3 倍

4.3 模型选择对积分的影响

模型	消耗系数	适用场景
MiniMax M2.5	0.18	简单问答，最省
智谱 GLM-4.7	0.23	中等复杂度
DeepSeek V3.2	0.30	复杂推理，比 M2.5 贵 1.67 倍
自定义模型	0	走自己的 API Key

五、几个踩过的坑

5.1 成长计划"模板达人"任务进度不更新

现象	说明
网页端入口还在	任务定义没下线
点击后自动打开 WorkBuddy 新任务	链路通着
用完模板后进度条不动	追踪逻辑断了

大概率是版本升级后模板内部标识变了，成长计划读取的是旧标识，匹配不上。属于客户端与服务器端之间的追踪 bug，建议去腾讯云开发者社区发帖反馈，等官方修复。

5.2 自定义指令对新会话才生效

自定义指令在会话创建时注入系统提示。如果先开会话再写指令，当前会话不会生效。写好指令后必须新建会话才能验证。

5.3 对话框底部盾牌图标

盾牌形状里有个勾号的图标，点击后有两个选项：

权限级别	说明
默认权限	沙箱受限模式，只能操作工作空间目录内文件
完全权限	放开限制，可访问更广范围的文件和操作

日常使用保持默认权限即可，需要操作工作空间外文件时才切完全权限。

5.4 CodeBuddy CLI Agent SDK 集成

WorkBuddy 系列还有 CLI 形态（CodeBuddy Code），并提供了 Agent SDK（TypeScript / Python），可以嵌入到自己的应用中。结合外部 ASR 语音识别服务，可以实现"语音输入 → 文字 → AI 处理 → 结果输出"的完整链路。

总结

31 轮对话提炼出的核心经验：

对话纪要：用独立 HTML 文件记录每轮要点，解决长对话回溯慢、积分浪费的问题，配合自定义指令实现自动维护
自定义模型：一个阿里 DashScope Key 同时接入通义千问和 DeepSeek，接口地址相同，只改模型 ID
远程中转：SSH 反向隧道 + autossh 保活 + Nginx Basic Auth，固定 IP 安全访问工作站模型
积分管理：用便宜模型省积分，自定义模型零积分，社区发文赚积分
避坑：自定义指令需新会话才生效，模板任务有 bug 需反馈官方

希望这些实战经验对你有帮助。

本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。 标签：WorkBuddy、AI 办公、效率工具、大模型部署

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

登录后参与评论

0 条评论

热度