首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最接地气的大模型更新了,码农危矣

每天看各种模型更新,有点疲惫了。我有个不成熟的想法逐渐成熟,把现在最顺手的 AI 工具用好,不浪费时间在新概念上。因为从概念到产品,从产品到解决问题,还有好几步。而已经落地的 AI 工具,通过不断的迭代和更新,很快就能覆盖当下难以解决的问题。

大模型这么卷,一堆精兵强将为了自己的未来打生打死,我们作为用户,等着就好。科学研究和落地实践,在很多时候不是一件事。只看跑分意义不大。工具好不好用,还是要看能不能解决问题。

昨晚,编程最强的 Claude,发布了最新的3.7 sonnet,在取代程序员的路上继续领跑。虽然最近各家推出的大模型新版,都号称跑分超越 Claude,即将问鼎 Coding 大王。但实际上,Claude 的编程能力依然不可撼动,至少在我的实践中如此。

大模型测评中测试编程能力,通常以单一任务为主。前段时间流行让 AI 写一段代码,展示一个带有效果的网页,或者完成地球到火星的火箭发射任务,并且考虑现实中的发射窗口。这些题目都很难,完成不易,确实能够考验 AI 的推理和编程能力。但它们和一个小白或者基础码农每天面对的问题,依然有差距。

那我自己来说,我在做和我想做的项目,很多不是从零开始。我也不想从零开始。github 上那么多开源项目,拿过来修修补补,可以少走很多弯路。做产品,最重要的是做出来。

想法是想法,真实践起来会遇到很多问题。那些单一项目跑分高的模型,放到一个代码库里,经常抓瞎。它们自己可以完成单一任务,但无法流畅地融合进一个已有项目里。我需要花大量的时间进行人机交互,才能让 AI 明白自己在做什么,不要按下葫芦浮起瓢。好的 AI 应该在不破坏原有代码架构的基础上,进行改造和调优。

为什么说 Claude 最接地气,因为 Claude 这点做得比谁都好。它避免和解决 bug 的能力超强。3.7 出来之后,我马上让它优化一下我的代码。

一次成功。之前试过 OpenAI o1,效果要差很多。时常优化完,代码不能运行了。然后又要花时间排错。

Claude 贵,确实有贵的道理。

Claude 3.7 sonnet 在修复 bug 的测试中,成功率达到 70%,远超同行。不客气地说,它的表现完全可以替代一个基础程序员,甚至更多。

我觉得现在还在学习 CS 的大学生,应该提前考虑自己未来的职业发展。互联网高速发展的红利已经消失,对码农的需求一年比一年低。AI 的能力在编程上一枝独秀,很容易替代原本需要人的基础工作。有逻辑思维,懂产品,知人性的技术员才是未来能够借助 AI 放大自己技能的幸存者。

做数据分析也一样。人脑能够即时处理的信息量有限,AI 力大出奇迹,可以在海量数据中寻找线索。以前,大数据分析还需要人来建模,做数据挖掘。以后,这些事都可以交给 AI 做。AI 建模,AI 写代码,AI 交付结果。操作员的价值是理解项目意图,和 AI 做沟通。

Claude 除了编程,还有个很多人不知道的能力,写文。deepseek r1 撰写的文字固然让人眼前一亮,但看几次就腻了。ds 的小作文喜欢浓墨重彩,处处转折,看似关注细节,实则套路满满。Claude 则朴实很多,像人话。

于是,现在流行缝合怪,deepseek+Claude。可以编程,也可以写作。deepseek 出大纲,Claude 干活。

也许未来大模型卷的,不再是通用能力,而是垂直领域的专业能力。这些专业能力不是靠提示词套一下就能实现,它们应该从根本上不同,有各自擅长的领域。

说句题外话,AI 宠物和 AI 硅胶玩具,大概是今年最接地气的应用,充分符合人性。这些玩意儿大行其道之后,还有人想谈恋爱吗?

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OrdjST4lsChlPH6YnUuqtKfw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券