微软刷屏论文"AGI的火花"的第一作者Sébastien Bubeck, 就在论文发布到arxiv的三个小时前,做了一个校园演讲"First Contact",讲述了微软研究院团队对GPT-4的的早期研究成果。
这个演讲的完整视频最近在Sébastien Bubeck的YouTube上发布出来, 其中最高赞的评论说:
"这次演讲将载入史册。生活在如此疯狂的时代真是太不可思议了。"
以下对这次具有历史意义的GPT-4 演讲的完整内容进行了翻译整理,和大伙儿分享。
你知道,我给出今天这样的演讲的可能性非常小,但事实就是这样,世界在变化,我也在根据这一变化调整我的研究方向。
今天,我将向大家介绍一个非常神秘的主题,即“初次接触”。实际上,这个故事是关于过去几个月,在微软,我有机会提前接触到GPT-4,因为我们正在将它与新的Bing集成。
当然,在我研究它的过程中,我不仅仅是做产品部分的工作,这确实非常有趣,而且我们还围绕它进行了一些科学研究,或者说尝试进行一些科学研究。在这些大型模型上做科学研究是很困难的,我将告诉你们在过去几个月里,我们的科学研究部分和探索之旅。
所以,这个演讲的真正标题是《人工通用智能的火花》。
在过去的几个月里,我们与GPT-4的合作评估表明,我们看到了一些类似于人工通用智能的东西。在这次演讲中,我的目标是试图说服你们,随着GPT-4的到来,事情确实发生了变化。
这项工作是与MSR的许多优秀同事共同完成的,我想特别提到Varun Chandrasekharan,Ronaldo(我想在座的许多人都非常了解),他最近刚加入我们,还有Johannes Gerker、Ericovitz Eche、Camar Peter Lee、John和Julie等,他们也是我的团队成员。我认为,如果GPT模型回答他们是否在研究这个问题,他们会给出类似的答案。与我一起工作的还有Scott Landberg、Hashanori、Hamid Palangi、Marco Tulio Ribeiro和Yi Zhang,他现在已经全职加入了我们。
首先,我要对一些事项表示感谢,并作出一些澄清。我认为这非常重要。
首先,我们所研究的GPT-4模型完全是OpenAI的创作,我与此无关。我们完全是黑箱地被允许使用它,OpenAI创造了这个真正了不起的工具,一个即将改变世界的工具,他们应该得到全部的荣誉。我想再次强调这一点。
其次重要的是,我们所做的实验是基于模型的早期版本。这意味着他们发布的论文和所做的声明中的一个版本是多模态的,而我们接触到的版本不是多模态的,它仅支持文本输入和文本输出。更重要的是,在我们进行实验之后,他们对神经网络进行了进一步的修改。由于这些进一步的修改,当你尝试我将展示的一些提示时,你将得到的答案可能会有所不同。特别是,你可能得到的答案没有我展示的那么好。原因是他们为了安全性进一步进行了微调,他们在技术报告中非常清楚地解释了这一点。他们调整了模型,以某种方式使其变得更安全。所以这是一个重要的澄清。
现在,对于在座的任何科学家,你可能会担心我们无法复制你告诉我们的内容,是的,你将无法复制它。话虽如此,在这种特殊情况下,我认为可重复性并不是一个大问题,原因是我不会给你任何数量上的数据。在我的演讲中不会有任何基准。这是关于质的飞跃,而不是在这个基准上增加10,那个基准上增加20。这是另一回事。
领取专属 10元无门槛券
私享最新 技术干货