首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深入研究Deepseek以及团队精神,启示我们什么?

创始人:梁文锋

背景:80后,浙江大学电子工程系人工智能方向毕业,本土背景。

特点:兼具强大的infra工程能力和模型研究能力,学习能力强,像极客而非老板。

理念:强调“是非观”置于“利害观”之前,倡导原创式创新。

教育背景:浙江大学 。

终极愿景

"让每个开发者都能调用AGI能力,如同使用电力般自然"

1. **2025目标**:

 - 千亿参数开源生态

 - AGI测试基准框架

2. **2030愿景**:

 - 通用问题求解系统

 - 跨模态认知引擎

发展里程碑

简介:梁文锋出生于1980年代,广东省的一个五线城市(小镇学霸)。他的父亲是一名小学老师。梁文锋的家庭情况较为低调,公开资料中未提及其婚姻与家庭情况。梁文锋毕业于浙江大学,主修软件工程,本硕,人工智能方向。他在大学期间表现出色,展现了对计算机科学和数学的浓厚兴趣。梁文锋非常低调,几乎看不到媒体对他的采访,网上难以发现他的照片。本文编写时找到两篇记者采访,能否了解梁文峰的从量化到AI的背景及动因和抱负,包括创办深度求索储备的数万块GPU,以及如何组织AI本土研究人员。阅读DeepSeek V3的技术报告列出的研发人员名单近200人,均为本土CS,很多核心是清北及大学应届的CS硕博,即便核心人员也是毕业3-5年CS博士,研发人员充分信任不断自我选择,这是中国最像OpenAI研发组织分工和氛围的AI研究机构。本文引用了两篇记者采访,以及梁文峰自己为量化之父西蒙斯自传中文版本写的前序。

DeepSeek:AGI技术奇点

颠覆式创新技术点

A[多头潜在注意力MLA] --> B[显存占用降87-95%]

C[DeepSeekMoESparse] --> D[计算量降60%]

E[动态稀疏激活] --> F[推理成本降90%]

2024.05:DeepSeek V2引发行业价格战,一周后全部模型集体降价

2024.12:DeepSeek V3 685B超越Llama3.2

训练成本:600万美元(Meta同级别1/9)

性能指标:MT-Bench 8.7, MMLU 83.5

DeepSeek R1 的成就

App Store 排名:DeepSeek R1 冲到了美国区 App Store 第一名,超越了 OpenAI 的 ChatGPT。

口碑与技术实力:DeepSeek 没有市场部,也没有做任何市场投放,完全依靠技术实力和口碑赢得了用户的认可。

DeepSeek R1 的技术特点

性能与成本:DeepSeek R1 的效果比肩顶尖闭源模型 o1,但价格仅为 o1 的 27 分之一。

开源与创新:DeepSeek R1 的开源让行业认知整体拉齐,得到了全世界的尊重和喜爱。

DeepSeek R1 的创新模型 R1 Zero

训练方式:R1 Zero 跳过了监督微调 (SFT) 阶段,直接采用强化学习 (RL) 进行训练。

研究结论:模型的思考能力是可以自我涌现出来的,这一发现具有革命性。

DeepSeek R1 的影响

行业影响:DeepSeek R1 的发布引发了美国科技界的恐慌,Meta 内部对 DeepSeek V3 的出色表现感到震惊。

市场影响:DeepSeek R1 的低成本和高性能使得英伟达的市场地位受到挑战,其股价短期内大跌超3%,市值蒸发超300亿美元(27日盘前又跌14%)。

DeepSeek R1 的未来展望

开源模型的进步:开源模型的进步将超越闭源模型,顶级模型的推理价格急速下降,技术更加普惠平权。

AI 编程与创作:AI 编程将随着模型能力的提高,显著提升效率并降低门槛,AI 的创作能力将不断提升,催生更多 AI 创作的可消费内容形式。

DeepSeek 的组织与文化

吸引人才:DeepSeek 通过组织和文化吸引了有才华的年轻人,通过开源开放吸引了社区的贡献者。

技术前沿:DeepSeek 的研究员大多是年轻人,他们选择加入 DeepSeek,一起挑战世界最强模型。

创新方法论

- **资源调配**:

- GPU资源:无审批即时调用

- 团队协作:动态项目制

- **研发文化**:

- 70%时间自由探索

- 30%定向攻坚

- 日均论文阅读量2.3篇/人

总结

在今天这个社会高速发展的阶段,特别是科技创新企业,要用于颠覆式创新,走别人没走过的路,用于尝;其次敢于试错,试错对于很多科学研究以及实验具有非常高的价值。企业以及员工的格局要大,用于解决人类科技难题。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OC6-D9HJx9gep5BRhGqnB0og0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券