《杭州居然出了很牛的一个AI大模型公司,它叫DeepSeek》
自从迷上了AI编程之后,我对AI领域的新闻也开始变得多关注了一些。
最近这段时间,我连续在好几个不同的地方都看到有人提到DeepSeek。
一开始我还没有在意,直到我看到有人在微博上说,DeepSeek是中国公司研发的大模型,水平很高,都引起老外的重视了。
我当时就觉得奇怪,前几年ChatGPT刚出来的时候,国内互联网上有一种非常悲观的论调,很多人认为中国在大模型领域已经落后太多了了,永远都追不上美国了。
这才过去没多久,居然就有中国的公司做出了这么厉害的大模型,而且居然还不是我们熟悉的那些大厂做的,那我必须得关注一下了。
于是我注册了DeepSeek的账号,简单试用了一下,发现它有个特点,那就是回答问题的速度特别快,而且回答的还挺靠谱的。
虽然我也不是很懂技术,但是对比了一下Claude(国外的顶尖AI大模型)的答案,发现DeepSeek的答案也挺靠谱。
那我对这家公司就更感兴趣了,又上网查了一下,发现这家公司真的很特别。
第一个特别的点,就是它好像和国内的大厂关系不太大,要知道过去我们在互联网领域里偶尔出个什么厉害的产品,背后基本上都有大厂的影子。
也就是说,国内的互联网生态已经形成了非常稳定的格局,大厂们已经占据了绝大部分的市场份额,其他小公司想要做出什么厉害的产品是非常难的。
第二个特别的点,就是他的母公司居然是一家量化基金的公司,叫做幻方量化。
过去在我的印象中,国内金融领域的人眼里只有钱,他们根本不关心别的东西,更别说开发AI大模型了。
但是幻方量化居然愿意成立一家公司,花这么多钱去开发AI大模型,这让我觉得非常不可思议。
第三个特别的点,就是这家公司的技术创新居然引起了硅谷的重视,同时它还用更低的成本做出了更好的效果。
这也是我觉得值得欣赏的地方,前几年对于大模型大家都很悲观,现在这么快就有公司做出了这么好的大模型,我觉得是很能能够提振信心的。
第四个特别的点,是这家公司的人才好像都是本土的人,而且大部分都比较年轻。
好像没有特别强调自己公司里有多少牛人,但是却做出了很厉害的东西。
最后一个特别的点,就是这家公司居然在杭州。
之前我一直觉得杭州的高科技含量好像稍微差了点,现在多了一个大模型公司,感觉杭州的高科技含量也提升了不少。
我看了两篇关于DeepSeek的访谈文章,感觉他们的创始人梁文锋也是一个很有智慧但是务实的人。
看了他的访谈,我想起了另一个人,就是黄峥。
就是感觉他们这种人就是那种平平静静的、慢慢悠悠的就做出了一家特别牛的公司,不仅能够改变行业格局,甚至影响全世界的感觉。
因为从梁文锋说的话里面,我感觉出了这种稳健低调但又很有远见的味道。
破局者常常来自于行业之外,他们不拘泥于现有的规则。
说实话,我后面都想抽时间用DeepSeek的API尝试做一个小的工具,看看效果到底怎么样。
最后附上两篇访谈的链接:感兴趣的朋友可以看看。
领取专属 10元无门槛券
私享最新 技术干货