大家好,我是《Redis 高后心法》作者码哥,可以叫我靓仔。
近期,腾讯云重磅发布了 CodeBuddy软件开发智能体Craft(2025年4月升级版) ,以 双核驱动架构 (混元大模型+DeepSeek V3)与 MCP协议生态 为核心,重新定义对话式编程范式。
Craft支持从需求拆解到多文件代码生成、重构、测试的全流程自主化开发3,在复杂工程场景中实现 无干预的代码生成。
同时,作为国内首个兼容MCP协议的代码助手,Craft可无缝串联腾讯云生态服务,实现跨平台任务调度,为开发者提供 “全自动人机协同” 的沉浸式开发体验。
码哥第一时间给大家做一次评测......
首先介绍下什么是编码智能体:
编码智能体可以基于需求(自然语言)理解项目代码,并自动查找目标代码进行改写,也可生成全新的代码项目。
当用户有一个具体需求,并且知道需求的改动范围,编码智能体可以自动感知上下文,并帮互助用户快速且准确的实现需求代码。
在业界中,像最新GitHub Copilot Agent、Cursor Agent(以前称为Composer)、Devin 等都是这类编码智能体的产品化表现。
在Cursor凭借Agent模式重新定义代码生成运行的无干预生成,定义像Devin那样的,腾讯云Code Buddy推出的Craft智能体以「对话式编程」和「多文件工程化协作」两大突破,将这场技术竞赛推向新高度。两者的竞争不仅关乎功能差异,更映射出AI编程工具从「辅助工具」向「研发伙伴」的范式跃迁。
2025年春季的AI编程工具市场迎来关键转折点。在Cursor、GitHub Copilot 凭借Agent模式,重新定义了全流程自主生成、运行、修正,从而多轮反思达到工程项目解决需求和问题的目的。
4月份,腾讯云Code Buddy推出的Craft智能体,用于「多文件自主AI协同编码生成」的产品交互突破。下图展示了一个包含六个步骤的软件开发工作流程图,流程依次为:在Edit Chat提出需求并添加文件、需求理解与规划、文件操作(读取/新增/修改)、IDE实时编码渲染、组织变更清单、接受或回退变更。
需求拆解到任务完成
提问内容: 创建一个微信小程序,实现五子棋游戏。游戏应包含完整的五子棋规则,包括黑白双方轮流下子、连线判断胜负、禁手规则等。同时,需要明确展示玩家何时会失败,例如无合法位置可下、超时未下子等情况。请确保代码结构清晰,界面友好,用户体验流畅。
考察目标:生成的五子棋小程序,可在微信IDE中打开,并编译运行成功。
1. Cursor的表现
调用了三个工具:
最后生成了8个文件。
打开微信小程序,看下运行后的效果。
第一次并没有能够落子,点击没有反应,同时也报错了。接下来我把错误贴到Cursor进一步让他做完,看看是不是可以纠正正确并运行。
能落子,但无法很精准的落子到棋盘,并且游戏输赢逻辑也不对,但至少报错没有了。我进一步去优化问题。
优化问题: 无法落子,请优化下棋盘落子事件,并需要对准棋盘完成黑白子的五子棋游戏。
最终还是没有办法正常模拟五子棋游戏。
2. 腾讯云Craft表现
首先开启了Plan模式,并用相同的提问内容。Plan模式下会询问很多澄清,就像是一个产品经理与开发者的需求澄清,拆解需求任务,对于不清楚的问题,他会提问给你,你只需要回答即可。
当需求澄清清楚后Code Buddy还提供了mermaid代码,我用mermaid online查看了一下描述的还不错。
然后附上了每个操作的实现方案。你只需要点击「开始」按钮进入代码生成阶段。
生成了总共10个文件
让我看看运行效果。打开微信IDE,导入工程。直接运行成功,并且落子正确。
Craft
比较简单,仅提供对话框和添加文件,结果展示也比较简单。
Cursor:
上述在Cursor均有所考虑
在引用上下文层面非常全面
支持将终端问题反馈直接添加到chat edit对话框中
可以实现重新生成、展示代码、收缩代码展示
总结一下
总体上 各插件在各方面存在一些差异性,Cusor 属于原生IDE, 交互生成体验上可以超越插件本身,效果可以做到最优。
作为喜欢本地IDE的用户会更倾向于选择和使用,但20美金的定价和数据代码外流也会劝退一些开发者。
而腾讯出品的Craft能力,从应用生成的质量和效果上,算是目前不错的平替。
由于在插件层面无法超越,所以生成的体验上中规中矩,细节处理上还有蛮多空间可以优化。
团队基本上一天一个版本的节奏也是非常的卖力。
Craft的Plan模式是一个很好的差异,在模型能力本身还无法完全比对最强claude模型的时候,通过Plan写清楚扩展完整需求,为接下来的任务拆解提供了更精准的信息和方向,无疑是一个很好的想法。
维度 | CodeBuddy | Cursor |
---|---|---|
简单任务处理 | 能够完成用户需求提供出Plan 模式,可以对用户需求进行多次澄清和深度思考⭐️⭐️⭐️⭐️ | 在完成任务的基础之上,中文结果和效果也有不错的美化能力⭐️⭐️⭐️⭐️ |
复杂任务处理 | 可以实现整体需求,过程中会报错,可以根据报错解决⭐️⭐️⭐️⭐️ | 可以实现整体需求,完成度和整体效果,页面效果更好⭐️⭐️⭐️⭐️ |
响应时间和处理速度 | 最快( 38s),比 Cursor 快一点,可能是因为国内网络原因⭐️⭐️⭐️⭐️⭐️ | 稍快(49.5s)⭐️⭐️⭐️⭐️ |
终端执行 | 可以在侧栏运行效果,跳过,终止等操作⭐️⭐️⭐️⭐️⭐️ | 可以在侧栏运行效果,跳过,终止等操作⭐️⭐️⭐️⭐️⭐️ |
多模型切换 | Default、DeepSeek- V3,支持本地 模型 API 接入⭐️⭐️⭐️ | 十几个主流模型,提供Auto自动化切换能力⭐️⭐️⭐️⭐️⭐️ |
用户体验与易用性 | 交互体验还有待提升⭐️⭐️⭐️⭐️ | Cursor 体验+多模型效果最佳⭐️⭐️⭐️⭐️⭐️ |
成本 | 个人和企业版都免费⭐️⭐️⭐️⭐️⭐️ | $20,价格昂贵⭐️⭐️⭐️ |