何帆系中国首席经济学家论坛理事,熵一资本首席经济学家
今天来读一本书,书名是:《为什么伟大不能被计划》。这本书最近很火爆,跟两位作者的身份有关。肯尼斯·斯坦利(Kenneth Stanley)和乔尔·雷曼(Joel Lehman)都是人工智能专家,都有在OpenAI的工作经验。
对,OpenAI就是研发出ChatGPT的那家公司。ChatGPT是一个令人激动的革命性技术创新。蒸汽机的出现标志着工业革命的到来,而ChatGPT则标志着人工智能革命的到来。在技术演进的历史中,ChatGPT有着和蒸汽机一样的里程碑意义。更有意思的是,这项技术创新更多的是源自研发人员的兴趣,而非对商业利益的追逐。这项技术创新是由一群游侠,而不是正规军和大部队实现的。在这个过程中,OpenAI的团队摸索出了一套独特的方法论。本书就是基于两位作者在研究AI算法中的一项创新而获得的顿悟,从中推演出了一套新的实践指南。
这是一个颠覆性的建议。
常规的打法总是在约束条件下求目标函数最大化。也就是说,想要取得成就,总要先有目标,然后,行动方案就要围绕着这个目标而定。本书的观点是:目标会误导你。越是伟大的目标越容易有误导性。没有目标比有目标更容易实现目标。
为什么会是这样呢?我们先讲个故事,看看从中能有什么启发。
假设有两个探索队。一支探险队有着明确的目标,他们要到山的另外一侧,比如说山的北面,去寻找传说中的金矿。因为目标明确,他们就会尝试用各种不同的办法越过这座山。一条路不通,再退回来找另外的路。每一次,他们都会先看看指南针,确定好方向,坚定地朝北走。
另一支探险队更像出门旅游。他们一边走一边欣赏风景。他们会在湖边露营,用地质锤敲打路上遇见的岩石。他们会对河流的方向、风的方向感兴趣。看到一条路,他们可能就会顺着这条路走,哪怕这条路是朝南走的,因为他们总想看看这条路到底通向何方。
最终会有收获的可能未必是第一支探险队,而是第二支探险队。或许,越过山峰的路可能是要先朝南走,再朝东走,迂回包抄。也可能,第二支探险队会在南边找到了更大的金矿。又或许,他们出发的时候是想找金矿,最后找到了一处石油矿。又或者,他们找到了一处美丽的风景,找到了“优胜美地”,可以做国家公园。
这当然只是个假想的故事。不过,人工智能科学家在实验室里做过相似的实验。他们把机器人放进迷宫,让机器人在迷宫中摸索。一种指令是目标导向,告诉机器人必须找到迷宫的出口;另一种指令是新奇性搜索,鼓励机器人在迷宫里瞎转。结果,在重复40次的新奇性搜索迷宫实验中,机器人在39次实验中找到了出口;而在重复40次基于目标的迷宫实验中,机器人只成功了3次。这背后的底层逻辑是啥?
创新就是发现,这是一个随机的探索过程。你不可能预测技术的演进路径。比如,现代内燃机的前身是感应线圈,但其最初不是以制造发动机为目的的。当内燃机刚刚出现的时候,还没有飞机,也不会有人想到要把内燃机应用到飞机上。从感应线圈到内燃机再到飞机,整个创新链条上,每一个环节的发明者都没有想到下一个环节会是啥。
这就意味着,过程比目的更重要,比起到达终点,路上的风景更值得关注。在发现的过程中,我们会遇到很多新奇的现象,这些新奇的现象似乎和最终的目标没有什么关系,其实却是奠定技术创新的垫脚石。没有这些垫脚石,我们就无法往前走。所以,在探索的过程中,应该注意找到更多的垫脚石,这些垫脚石预示着更多的可能性。
伟大的创新不是被计划出来的,而是来自误打误撞。比如说,在研发飞机的过程中,在当时看来最有可能成功的不是莱特兄弟,而是塞缪尔·皮尔庞特·兰利(Samuel Pierpont Langley)。兰利一度获得了大量的政府资助,莱特兄弟却只能自筹资金,而且钱少得可怜。那为什么莱特兄弟会成功呢?原因出乎意料,因为莱特兄弟原来本是自行车制造商。自行车就是通向飞行器的垫脚石。只有身为自行车制造商的莱特兄弟意识到,飞行器就是空中的自行车,于是,机缘巧合,他们才造出了最早能升空的飞机。
这就是垫脚石的妙处,你都不可能知道它们能用来干啥。这也是物种演化的规律。在进化论里,有个现象叫扩展适应,说的是生物曾经使用过某种功能的结构,在进入一个新的环境之后,又被用于另一个不同功能的现象。比如说,羽毛最初是在恐龙身上进化的,主要功能是为了保持体温,后来才逐渐成为适合鸟类飞行的结构。骨骼一开始只是用于储存供身体其它功能所需要的矿物质,后来才进化成为人体的支撑性结构。
这给我们的启发是,要把自己变成一个寻宝者,在积极地追求实现某个特定目标时,我们要做的是尽可能保留多块备选的垫脚石,以确保实现目标的成功率。寻宝者可以说是秉持着机会主义的探险家,他们致力于寻找任何有价值的东西,而不在乎这些东西具体是啥。
你可能会问,这跟人工智能又有什么关系呢?
OpenAI团队曾经建过一个叫图片孵化器的网站。图片网站上的图片就像动物一样能够繁衍出和“父母一代”略有不同的“孩子”。研究人工智能的科学家找到了一种方法,为存储在计算机内部的图片创造了一种人工DNA,然后再将这些图片的基因像动物那样整合在一起。大概是这样一个过程:屏幕上显示出一组图片,比如同时显示10张或20张图片,然后,用户点击自己喜欢的图片。这些图片就成为下一代图片的父母。然后,屏幕上再显示一组新的图片,用户继续点击自己喜欢的图片,以此类推,直到最后用户找到了自己最满意的图片。
实验表明,用户培育出的令他们最满意的图片往往并非他们最初设定的目标。以进化出一张特定图片为目标去繁育图片,其实是一个糟糕的想法。在实验的过程中,你会发现,一张外星人脸的图片,最终会变成汽车的图片。最终的图片很少与作为垫脚石的图片相似。网站上最成功的用户是没有设定目标的那些人。
由此,两位作者提出了一种新的AI算法,叫新奇性搜索。这个算法会随机生成一组解决方案,评估新奇性,保留新奇性比较高的方案,循环往复,直到将问题彻底解决。换言之,这种算法的标准是:只问新不新,不问好不好。
那么,为什么目标会误导我们呢?
因为通向最终目标的道路往往是曲折的,是需要在各个不同的方向上探索的,那就需要给予探索者更多的主动性,而且,要求探索者对新奇事物更为敏感,心态更为开放。一旦想要通过设定目标来完成任务,往往就会带来意想不到的扭曲。
比如,印度受英国殖民统治时期,英国政府为了消灭毒蛇,出台了一项政策:每上交一条死蛇就能领取一笔报酬。但这项措施并没有达到预期的效果,反而导致印度人为了获得赏金争相饲养眼镜蛇,然后杀死他们牟利。最终,毒蛇的数量反而增加了。还有,考古学家为工人发现的每块恐龙骨碎片支付报酬,会导致工人选择砸碎整个骨头获取更多的奖赏;企业为了提高企业收益,给高管支付奖金,会导致带来长期隐患的短期逐利行为。
两位作者指出,目标越是高大上,越容易带来误导。若想实现丰功伟业,目标往往会成为绊脚石。
正确的办法是:扔掉绊脚石,去找垫脚石。
——————
领取专属 10元无门槛券
私享最新 技术干货