温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
Deep think开源大模型,它到底开源了什么?没开源什么?Deep think的爆火除了他自己的技术创新,还有架构创新以外,他选择开源也是推动它爆火的一个重要因素。首先它开放模型框架,还有它的参数。这相当于任何一个开发工程师都可以直接使用它,而不需要冲头来训练。还有,它还有它的混合专家架构,这也为训练模型提供了一个新的思路,每个人都可以任意修改它,并且可以商业使用。其次,他还开源了技术报告,包括配套的工具。这就相当于告诉你一个秘籍,并且还告诉你如何检验自己练没练成,那么他没开源了什么呢?首先就是训练数据。我们都知道,一个AI大模型,它的质量好坏取决于它的训练数据的质量怎么样。而这些数据呢,可能都会有版权,所以大部分人都不会选择开源。还有就是他的训练代码和推理代码,Deep think在他的报告中披露了一部分的训练方式,但是如果我们想完整的复线这个模型其实非常困难的。总的来说,Deep think在开源架构模型还有配套工具上开源做的非常好,但是在训练数据还有它的推理数据方面还是有所保留,但是作为使用者,它无疑给我们带来了非常大的便利。
01:16
未来,AI大模型可能会像水和电一样,接入我们生活的各个场景中。
我来说两句