开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

首页视频DeepSeek开源了什么?没开源什么?

DeepSeek开源了什么?没开源什么?原创

2025-02-192025-02-19 11:17:45播放1.3K

点赞0 收藏 0

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
Deep think开源大模型，它到底开源了什么？没开源什么？Deep think的爆火除了他自己的技术创新，还有架构创新以外，他选择开源也是推动它爆火的一个重要因素。首先它开放模型框架，还有它的参数。这相当于任何一个开发工程师都可以直接使用它，而不需要冲头来训练。还有，它还有它的混合专家架构，这也为训练模型提供了一个新的思路，每个人都可以任意修改它，并且可以商业使用。其次，他还开源了技术报告，包括配套的工具。这就相当于告诉你一个秘籍，并且还告诉你如何检验自己练没练成，那么他没开源了什么呢？首先就是训练数据。我们都知道，一个AI大模型，它的质量好坏取决于它的训练数据的质量怎么样。而这些数据呢，可能都会有版权，所以大部分人都不会选择开源。还有就是他的训练代码和推理代码，Deep think在他的报告中披露了一部分的训练方式，但是如果我们想完整的复线这个模型其实非常困难的。总的来说，Deep think在开源架构模型还有配套工具上开源做的非常好，但是在训练数据还有它的推理数据方面还是有所保留，但是作为使用者，它无疑给我们带来了非常大的便利。
01:16
未来，AI大模型可能会像水和电一样，接入我们生活的各个场景中。

展开

我来说两句

0 条评论

登录后参与评论

作者

JavaPub

相关推荐

6分34秒

electron38+vite7跨平台聊天exe系统【源码演示版】

4380

8分7秒

vite7+electron38-wechat桌面客户端聊天exe应用【完整演示】

4401

3分43秒

基于electron38+vue3跨平台仿微信客户端聊天

5370

6分12秒

BOSS最新前端岗位数据分析：Bright Data+PandasAI洞察前端岗位市场趋势.

不叫猫先生

5662

3分19秒

最新版vite7+vue3.5网页版聊天系统

5901

4分19秒

tauri2-deepseek客户端ai流式聊天Exe系统

5932