48小时从零到一：用WorkBuddy搭建AI应用的完整技术实践

原创

用户12403391

修改于 2026-04-14 15:50:47

4640

作为一个非技术背景的开发者（本职大阪房产中介），我从未想过能在48小时内交付两个完整的AI应用。这篇文章记录了我在腾讯云OpenClaw玩虾大赛中的技术实践，重点分享工作流设计、Prompt工程和多Agent协作的具体实现方案。

项目背景

在黑客松前，我在小红书看到一个获奖项目展示：一个护肤笔记诊断工具和一个AI发型师。作为房产从业者，我看到了跨界应用的可能——我的护肤博主朋友需要笔记诊断，我老婆需要发型预览。

最终交付了两个项目：

薯医NoteRx：小红书护肤笔记诊断工具
ChicChic：AI发型设计与预览工具

项目地址：https://code.coze.cn/p/7627831368319451174 演示链接：https://45dda966-6d4e-4c58-b95a-f539a3c5458d.dev.coze.site

技术架构设计

整体架构

两个项目都基于WorkBuddy平台的工作流引擎构建，核心架构如下：

plaintext

用户输入 → 意图识别Agent → 任务分发 → 专业Agent处理 → 结果整合 → 输出

关键技术选型：

LLM：GPT-4o（主推理）+ GPT-4o-mini（快速响应）
图像处理：DALL·E 3（发型效果生成）
知识库：向量检索增强（护肤成分数据库）
工作流：WorkBuddyWorkflow编排引擎

薯医NoteRx 架构

plaintext

┌─────────────────────────────────────────────────────┐
│                   用户上传笔记                        │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│              笔记内容提取（OCR/文本解析）               │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│    多维度诊断Agent（并行处理）                         │
│    ├─ 标题吸引力分析                                  │
│    ├─ 内容逻辑评估                                    │
│    ├─ 成分解读准确性                                  │
│    └─ 用户互动预测                                    │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│    改进建议生成（结构化输出）                          │
└─────────────────────────────────────────────────────┘

ChicChic 架构

plaintext

┌─────────────────────────────────────────────────────┐
│              用户上传照片 + 描述需求                    │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│    面部分析Agent                                      │
│    ├─ 脸型识别                                        │
│    ├─ 五官特征提取                                    │
│    └─ 风格匹配                                        │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│    发型推荐Agent（知识库检索+LLM推理）                 │
└─────────────────────┬───────────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────────┐
│    效果图生成（DALL·E 3 图像合成）                     │
└─────────────────────────────────────────────────────┘

核心技术实现

1. 多Agent协作模式

WorkBuddy平台支持多Agent编排，我采用了主从式协作模式：

主Agent（协调者）：

python

# 伪代码示例
def coordinator_agent(user_input):
    # 意图识别
    intent = intent_classifier(user_input)
    
    # 任务分发
    if intent == "note_diagnosis":
        result = dispatch_to_agent("note_diagnosis_agent", user_input)
    elif intent == "hairstyle_preview":
        result = dispatch_to_agent("hairstyle_agent", user_input)
    
    # 结果整合
    return format_output(result)

专业Agent并行处理：

薯医NoteRx：4个诊断Agent并行执行，最后汇总
ChicChic：分析Agent和推荐Agent串行，图像生成异步

2. Prompt工程实践

诊断类Prompt模板（薯医NoteRx）：

plaintext

你是一位专业的护肤内容诊断专家。请分析以下小红书护肤笔记：

## 笔记内容
{note_content}

## 分析维度
1. 标题吸引力（1-10分，并说明原因）
2. 开头是否在3秒内抓住读者注意力
3. 成分解读的准确性（如涉及专业成分）
4. 结构清晰度（总分关系、段落层次）
5. 互动引导（是否有提问、投票等互动设计）

## 输出格式
请以JSON格式输出：
{
  "overall_score": 总分,
  "dimensions": {
    "title": {"score": X, "reason": "..."},
    "opening": {"score": X, "reason": "..."},
    ...
  },
  "improvement_suggestions": ["建议1", "建议2", ...]
}

图像生成Prompt模板（ChicChic）：

plaintext

Generate a realistic hairstyle preview image based on:
- Face shape: {face_shape}
- Recommended style: {hairstyle_description}
- User photo reference: {uploaded_image}

Style requirements:
- Natural lighting
- Front-facing portrait
- Hair color: {hair_color}
- Professional salon quality

3. 工作流编排

WorkBuddy工作流的核心节点配置：

输入节点：

yaml

type: input
fields:
  - name: user_input
    type: string
    required: true
  - name: user_image
    type: file
    required: false

LLM节点：

yaml

type: llm
model: gpt-4o
prompt_template: "{{system_prompt}}\n\n用户输入：{{user_input}}"
output_variable: llm_response

知识库检索节点：

yaml

type: knowledge_retrieval
dataset_id: skincare_ingredients_db
query: "{{user_input}}"
top_k: 5
output_variable: relevant_docs

条件分支节点：

yaml

type: condition
conditions:
  - if: "{{intent == 'diagnosis'}}"
    then: diagnosis_workflow
  - if: "{{intent == 'preview'}}"
    then: preview_workflow

技术难点与解决方案

难点1：多角度照片处理

问题：用户上传的照片角度各异，面部分析准确率不稳定。

解决方案：

增加前置引导提示："请上传正面照片，确保光线充足"
在工作流中加入照片质量检测节点
对于不符合要求的照片，调用LLM生成引导话术让用户重传

yaml

# 照片质量检测节点
type: llm
model: gpt-4o-mini
prompt: |
  判断这张照片是否适合进行面部分析：
  - 正面角度：是/否
  - 光线充足：是/否
  - 面部清晰：是/否
  
  如果任一项为"否"，返回具体原因和建议。

难点2：诊断建议的实用性

问题：早期版本的建议过于泛泛，用户反馈"没什么用"。

解决方案：

引入结构化输出格式，强制模型给出具体建议
增加"改写示例"环节，直接给出优化后的文案片段
对接护肤成分知识库，提升专业度

改进后的输出结构：

json

{
  "issues": [
    {
      "problem": "标题缺乏吸引力",
      "original": "今天分享一个护肤心得",
      "suggestion": "用了这个方法，我的敏感肌终于稳定了！",
      "reason": "具体效果+情感共鸣"
    }
  ]
}

难点3：图像生成的一致性

问题：DALL·E生成的发型效果图与用户原照片差异过大。

解决方案：

在Prompt中强调"保持原有面部特征"
使用图生图模式，以用户照片为基础
增加风格约束词："realistic portrait photography"

性能优化

响应速度优化

优化项	原耗时	优化后	方法
意图识别	2.3s	0.8s	使用GPT-4o-mini
知识检索	1.5s	0.4s	缓存热门查询
图像生成	15s	12s	异步处理+进度提示

成本控制

快速响应场景使用GPT-4o-mini（成本降低90%）
复杂推理场景使用GPT-4o
知识库检索结果限制在top 5，减少上下文长度

部署与迭代

一键部署

WorkBuddy平台支持一键发布为Web应用，生成访问链接。部署过程无需配置服务器、域名、SSL证书。

部署配置：

yaml

deployment:
  type: web_app
  subdomain: chicchic-demo
  features:
    - user_auth: false
    - file_upload: true
    - rate_limit: 100/hour

持续迭代

通过WorkBuddy的版本管理功能，可以在不影响线上版本的情况下迭代开发。每次更新后一键发布，用户无感知升级。

经验总结

技术层面：

工作流编排是降低AI应用开发门槛的关键
Prompt工程需要反复迭代，结构化输出能显著提升实用性
多Agent协作适合处理复杂任务，但要注意协调开销

产品层面：

MVP先跑通核心流程，再优化细节
用户反馈是最好的迭代方向标
跨界视角能发现垂直领域的机会

平台层面：

WorkBuddy平台适合快速验证想法，从概念到上线可以压缩到小时级
OpenClaw的多Agent能力让复杂逻辑变得可配置
部署运维成本几乎为零，让开发者专注于产品本身

下一步计划

基于这次经验，我计划开发面向大阪房产中介的AI工具，核心功能：

房源照片自动优化
文案自动生成（日语/中文双语）
客户咨询智能回复

同样的技术架构，不同的垂直场景，AI工具正在降低跨界创业的门槛。

技术栈：WorkBuddy平台、GPT-4o、DALL·E 3、向量数据库 项目地址：https://code.coze.cn/p/7627831368319451174 演示链接：https://45dda966-6d4e-4c58-b95a-f539a3c5458d.dev.coze.site

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯云OpenClaw玩虾大赛

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯云OpenClaw玩虾大赛

#腾讯云OpenClaw玩虾大赛

登录后参与评论

0 条评论

热度