作为一个非技术背景的开发者(本职大阪房产中介),我从未想过能在48小时内交付两个完整的AI应用。这篇文章记录了我在腾讯云OpenClaw玩虾大赛中的技术实践,重点分享工作流设计、Prompt工程和多Agent协作的具体实现方案。
在黑客松前,我在小红书看到一个获奖项目展示:一个护肤笔记诊断工具和一个AI发型师。作为房产从业者,我看到了跨界应用的可能——我的护肤博主朋友需要笔记诊断,我老婆需要发型预览。
最终交付了两个项目:
项目地址:https://code.coze.cn/p/7627831368319451174 演示链接:https://45dda966-6d4e-4c58-b95a-f539a3c5458d.dev.coze.site
两个项目都基于WorkBuddy平台的工作流引擎构建,核心架构如下:
plaintext
用户输入 → 意图识别Agent → 任务分发 → 专业Agent处理 → 结果整合 → 输出关键技术选型:
plaintext
┌─────────────────────────────────────────────────────┐
│ 用户上传笔记 │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 笔记内容提取(OCR/文本解析) │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 多维度诊断Agent(并行处理) │
│ ├─ 标题吸引力分析 │
│ ├─ 内容逻辑评估 │
│ ├─ 成分解读准确性 │
│ └─ 用户互动预测 │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 改进建议生成(结构化输出) │
└─────────────────────────────────────────────────────┘plaintext
┌─────────────────────────────────────────────────────┐
│ 用户上传照片 + 描述需求 │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 面部分析Agent │
│ ├─ 脸型识别 │
│ ├─ 五官特征提取 │
│ └─ 风格匹配 │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 发型推荐Agent(知识库检索+LLM推理) │
└─────────────────────┬───────────────────────────────┘
▼
┌─────────────────────────────────────────────────────┐
│ 效果图生成(DALL·E 3 图像合成) │
└─────────────────────────────────────────────────────┘WorkBuddy平台支持多Agent编排,我采用了主从式协作模式:
主Agent(协调者):
python
# 伪代码示例
def coordinator_agent(user_input):
# 意图识别
intent = intent_classifier(user_input)
# 任务分发
if intent == "note_diagnosis":
result = dispatch_to_agent("note_diagnosis_agent", user_input)
elif intent == "hairstyle_preview":
result = dispatch_to_agent("hairstyle_agent", user_input)
# 结果整合
return format_output(result)专业Agent并行处理:
诊断类Prompt模板(薯医NoteRx):
plaintext
你是一位专业的护肤内容诊断专家。请分析以下小红书护肤笔记:
## 笔记内容
{note_content}
## 分析维度
1. 标题吸引力(1-10分,并说明原因)
2. 开头是否在3秒内抓住读者注意力
3. 成分解读的准确性(如涉及专业成分)
4. 结构清晰度(总分关系、段落层次)
5. 互动引导(是否有提问、投票等互动设计)
## 输出格式
请以JSON格式输出:
{
"overall_score": 总分,
"dimensions": {
"title": {"score": X, "reason": "..."},
"opening": {"score": X, "reason": "..."},
...
},
"improvement_suggestions": ["建议1", "建议2", ...]
}图像生成Prompt模板(ChicChic):
plaintext
Generate a realistic hairstyle preview image based on:
- Face shape: {face_shape}
- Recommended style: {hairstyle_description}
- User photo reference: {uploaded_image}
Style requirements:
- Natural lighting
- Front-facing portrait
- Hair color: {hair_color}
- Professional salon qualityWorkBuddy工作流的核心节点配置:
输入节点:
yaml
type: input
fields:
- name: user_input
type: string
required: true
- name: user_image
type: file
required: falseLLM节点:
yaml
type: llm
model: gpt-4o
prompt_template: "{{system_prompt}}\n\n用户输入:{{user_input}}"
output_variable: llm_response知识库检索节点:
yaml
type: knowledge_retrieval
dataset_id: skincare_ingredients_db
query: "{{user_input}}"
top_k: 5
output_variable: relevant_docs条件分支节点:
yaml
type: condition
conditions:
- if: "{{intent == 'diagnosis'}}"
then: diagnosis_workflow
- if: "{{intent == 'preview'}}"
then: preview_workflow问题:用户上传的照片角度各异,面部分析准确率不稳定。
解决方案:
yaml
# 照片质量检测节点
type: llm
model: gpt-4o-mini
prompt: |
判断这张照片是否适合进行面部分析:
- 正面角度:是/否
- 光线充足:是/否
- 面部清晰:是/否
如果任一项为"否",返回具体原因和建议。问题:早期版本的建议过于泛泛,用户反馈"没什么用"。
解决方案:
改进后的输出结构:
json
{
"issues": [
{
"problem": "标题缺乏吸引力",
"original": "今天分享一个护肤心得",
"suggestion": "用了这个方法,我的敏感肌终于稳定了!",
"reason": "具体效果+情感共鸣"
}
]
}问题:DALL·E生成的发型效果图与用户原照片差异过大。
解决方案:
优化项 | 原耗时 | 优化后 | 方法 |
|---|---|---|---|
意图识别 | 2.3s | 0.8s | 使用GPT-4o-mini |
知识检索 | 1.5s | 0.4s | 缓存热门查询 |
图像生成 | 15s | 12s | 异步处理+进度提示 |
WorkBuddy平台支持一键发布为Web应用,生成访问链接。部署过程无需配置服务器、域名、SSL证书。
部署配置:
yaml
deployment:
type: web_app
subdomain: chicchic-demo
features:
- user_auth: false
- file_upload: true
- rate_limit: 100/hour通过WorkBuddy的版本管理功能,可以在不影响线上版本的情况下迭代开发。每次更新后一键发布,用户无感知升级。
技术层面:
产品层面:
平台层面:
基于这次经验,我计划开发面向大阪房产中介的AI工具,核心功能:
同样的技术架构,不同的垂直场景,AI工具正在降低跨界创业的门槛。
技术栈:WorkBuddy平台、GPT-4o、DALL·E 3、向量数据库 项目地址:https://code.coze.cn/p/7627831368319451174 演示链接:https://45dda966-6d4e-4c58-b95a-f539a3c5458d.dev.coze.site
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。