Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >MSRA王晋东:大模型时代,普通人的科研何去何从

MSRA王晋东:大模型时代,普通人的科研何去何从

作者头像
量子位
发布于 2023-05-06 06:15:18
发布于 2023-05-06 06:15:18
9640
举报
文章被收录于专栏:量子位量子位
王晋东 投稿 量子位 | 公众号 QbitAI

最近,电子工业出版社送了我一本《一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革》,不禁感叹:现在连写书都这么卷了!

要知道,ChatGPT 于去年11月30日刚刚发布、距今仅4月有余。

借用《百年孤独》的开头,我想写这样的句子:

许多年后,面对AI对人类的全面奴役,曾经的AI科研工作者将会想起他们第一次登录ChatGPT的那个遥远的下午。

也曾无数次想借用电影《终结者》的故事:

回到过去,回到2022年11月29日,将保存有ChatGPT模型参数的服务器引爆,于是得以继续之前的科研和生活。

恰逢世界读书日前后,故写些读后感。

何为AIGC?

AIGC是AI-generated content的缩写,翻译成中文可以叫做人工智能内容生成,或者叫AI内容生成

通俗地讲,即是计算机自动生成一些人想要的内容,如图片、视频、音频、文本、网页、代码等。

不难看出,AIGC可以辅助用户做很多之前做不到的事情、提高工作效率(对应着更多人下岗):

AI绘画,可以以极快的速度生成插画(取代部分插画师和设计师);

AI代码生成,可以提高程序员的工作效率(取代部分低端程序员:自己写代码训练AI最后把自己给取代了);

AI聊天+文字生成,可以取代部分线上客服、低端文秘、新闻报道、文案写作策划、活动布置等很多需要与文字打交道的岗位……

而ChatGPT则是其中“最靓的仔”,发布后2个月之内就在全球范围内收获了1亿用户,是历史上用户增长最快的产品,我们在此无需对其火爆程度进行过多介绍。

今年3月12日,其升级版、GPT-4也正式发布了。

放眼2023年,所有人、特别是AI科研人,都经历了从未有过的连续震撼,几乎每天醒来都有一个大新闻:

内容出处:https://mp.weixin.qq.com/s/Wn7HzqfkDbRuFb-HCegitg

《庄子·养生主》里写道:“吾生也有涯、而知也无涯。以有涯随无涯,殆而已矣!”

AIGC对AI科研人的影响和颠覆

上述的震撼显然只是个前菜,震撼过后便是更大、更直接的影响。

原因其实说来也简单——疗效好呗。

(注:本文仅分析科研岗位。)

高校和研究所

此时的你,如果是个AI方向的高校教师或研究员,那么你可能发现,一夜之间大部分的教师群、项目群、学术群都在讨论所谓的大模型。

更悲惨的是:

你发现学生在质疑自己的研究方向:老师,这个方向还有什么意义?ChatGPT做得这么好了,我们打不过它的。

你打不过、想加入,但是发现你没钱买显卡:是的,一块计算显卡A100的售价在10万人民币左右,而自然语言处理大模型动辄需要几块、几十块的卡来开发和试错。试问有多少高校教师可以负担得起?

你想申请国家项目来买显卡:申请过项目的都懂,哪里会允许你用几百万来买显卡?噢,不好意思,青年基金只有30万、面上基金也就几十万……

你跟学生说,没有卡我们就做后处理、做fine-tune、做prompt tuning。但是你发现:其实这些操作也是要卡的,普通教师还是买不起。

你想躺平了、让学生还是沿着之前的方向水文章:学生说,老师,审稿人问我们说我们这个方法能不能用在大模型上、如果用不上去的话有啥意义?我之后怎么找工作?

你想站出来反对大模型、要找它的漏洞,却发现:好的东西都是不开源的;你仅能从人家的输出结果上进行分析、并且人家的模型在快速迭代、可能今天有的问题、明天就莫名其妙被修复了……

工业界

此时的你,如果是个工业界的研究员、像笔者一样的大头兵,你同样发现,一夜之间,昨天刚和老板说要做的事情突然变得不再重要:

  • 你:我要做更简单更基础的学习理论,对现有的学习范式进行颠覆。
  • 老板:能用在大模型上吗?
  • 你:我觉得self-attention的鲁棒性需要研究一下,它对对抗攻击也没那么鲁棒,只是比CNN好点。
  • 老板:能用在大模型上吗?
  • 你:我最近搞了个厉害的解耦算法,简单有效。
  • 老板:大模型时代还需要做解耦吗?
  • 你:我想再探索一下图神经网络做蛋白质分子结构预测。
  • 老板:大模型能做吗?
  • 你:Causality还是挺重要的,你看Bengio都一直在研究。
  • 老板:大模型还需要causality吗?
  • 你:那我看看大模型?
  • 老板:这是个不错的方向。
  • 你:那我需要64张A100来fine-tune一下LLaMA。
  • 老板:这个真没有。
  • 你:。。。。。。

是挑战、更是普通人的机遇

笔者也是无数普通人中的一员、同样经历了上述关于大模型的”灵魂拷问“。

所谓痛定思痛、知耻而后勇,经历过无数失眠的夜、写坏了几支劣质的笔、也摸完了十条无聊的鱼,笔者现在则认为:

大模型时代虽然是挑战,但更是普通人的机遇。

为何这么说?

因为ChatGPT等大模型,第一次把普通人和MIT、Stanford、CMU、国内清北等一众牛校大佬拉到了一个水平线上。你发现:原来大家都没搞出来ChatGPT呀;之前那些东西搞得再好,也没用了。甚至于,普通人的损失还少点。

那么,大模型时代,普通人如何做科研?

以下仅为个人观点,如不同意,就是你对。

新的分析和评测

大模型时代显然需要新的分析和评测方法。不同于以往以公开测试集为准的机器学习,大模型现在可以将所有的公开数据集全部吃下(即overfit)。因此,不宜采用传统方式进行评测。

可以思考:

  • 更有难度、更符合人类标准的评测集是什么样的?
  • 大模型的边界在哪里、什么样的数据可以测出来?
  • 小模型和大模型到底有什么区别、仅仅是benchmark得分不同吗?
  • 如何公平地评测不同大模型的能力?
  • 到底何为”AGI“?如今的评测是否是AGI评测?

新的理论和方法

大模型对于做理论和基础研究的科研人员是个毁灭性的打击。

原因很简单,深度学习理论在目前也无法很好地分析多层神经网络、更不必说更大、更不开源的黑盒大模型了。

因此,理论研究人员可能会出现”巧妇难为无米之炊“的情形、不知道自己还能做什么。

但笔者认为,基础理论、数学、统计、概率等基础学科的重要性仍然无需多言,但需要结合大模型进行一些探索和突破。

例如:

  • 为什么CLIP仅采用image-text pair进行对比学习、泛化能力就很好?
  • 如果是训练数据重要,那为何400M数据的CLIP和2B数据的Laion-CLIP在长尾数据上并没差太多?
  • 数据、模型、算法、优化,哪个更重要?
  • 如何加速大模型的训练,如从数据筛选、优化器更新的角度?

更好的人与AI协同

既然打不过,那索性就加入。我们可以将大模型看作一次大的技术革命、一种新的人机交互方式。

那么,此刻的你我就处于这种新的人机交互、人与AI协同的革命前夜,应该多去思考如何利用大模型的能力来做出更多变革:

  • 如何提高写Prompt的能力、最好是自动写好的Prompt?
  • CV、NLP、Audio都有大模型,如何利用这些模型进行更好的多模态信息融合?
  • 如何设计下一代人-AI协同交互的用户界面?
  • 如何将大模型快速轻量地部署于端侧设备?
  • 如何更轻量地微调大模型以服务于下游小数据领域?

找大模型的短板

不得不说目前的大模型并不完美、其问题多多。

笔者也在年初”卷“了一周、搞出了第一个ChatGPT的鲁棒性评测。我们发现大部分大模型其实对于对抗攻击并不鲁棒、其抗干扰能全力亟待提升。

因此,一个自然的研究方向便是”找茬“:

  • 大模型的OOD能力是不是够了?有大模型不需要OOD了?
  • 大模型的长尾是不是做得很好了?这个笔者探索过了,显然不太行。
  • 如何使大模型免受prompt injection、prompt leakage等攻击?
  • 大模型生成内容如何判别是hallucination还是真的?

更负责任、社会化的AI技术

新的技术革命需要新的社会变革,而变革的过程可能是充满荆棘的。

好的研究视野应该放眼全社会、做出更负责任和更社会化的AI研究(Responsible AI, or societal AI),方可确保技术不被滥用、更好地服务人类:

  • 如何进行有效的value alignment使AI准确地满足人的价值观?
  • 如何对AI生成的内容进行有效监管使其实不被滥用?
  • 如何分析生成式AI对教育、生产力、社会、心理学等诸多层面的影响?
  • 新技术应该是”有温度“的:如何引导”前人“更加无痛地完成新技术的更迭?

此类问题的每一个都值得深入探讨。

值得一提的是,笔者所在的研究组——微软亚洲研究院(MSRA)社会计算组的大部分研究人员均在做相关研究,也期待未来有更多的合作者加入进来一起合作。

社会化问题任重而道远,需要跨学科、全社会的长期密切交流合作。

好了,读到这里,你还觉得自己的研究一片灰暗吗?面对所有的挑战、只要你快速转变以调整方向,你也可以成为未来的“大佬”。

让我们乘着大模型的东风、继续乘风破浪吧!

视频版:

https://www.bilibili.com/video/BV1hM41157ZF/

量子位智库「中国AIGC产业全景报告」

开放下载!

行业首份AIGC产业全景报告已经开放下载!

三大类玩家、四种商业模式、万亿规模市场、最值得关注的50家企业,还有具体的赛道部署机会和行业变革机遇,都将在报告内一一分析呈现。更多产业洞察,不容错过。

公众号后台回复 “ AIGC ” 即可下载完整报告~

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-05-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
2023 年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024 年 2 月,OpenAI 旗下视频生成模型 Sora 正式对外发布。Sora 一名源于日文“空”(そら sora),取自天空之意,以示其无限的创造潜力。与 Runway、Pika、VideoPoet 等“前辈”相比,Sora 在视频生成效果和质量上具有明显优势。也正因如此,Sora 一经发布就在全球范围内掀起了讨论热潮,迅速成为当前最受关注的模型之一。
深度学习与Python
2024/05/06
3150
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
普通人如何赶上AI大模型浪潮
最开始,大家都惊叹于它的语言理解和文本生成能力,虽然充满想象空间,但并未找到实际的应用场景,更多是当做一种很有趣的新奇玩具在体验。
老_张
2025/01/15
1910
普通人如何赶上AI大模型浪潮
腾讯司晓:“相变”是下个时代的前情提要
2024 年 1 月 24 日,由腾讯研究院和腾讯可持续社会价值事业部主办的“2024 腾讯科技向善创新节”顺利进行。活动以“相变”为主题,包含主题演讲、圆桌论坛、在线研讨、线下展览、辩论赛等形式,探讨 AI 技术与行业变革、技术社会、科技艺术、城市发展、个人成长等议题。
小腾资讯君
2024/01/24
3760
AIGC时代,新闻不存在了?
自互联网诞生,关于新闻受众的争议就不绝于耳。原因很简单,当人们能够随时随地在互联网上发布信息,甚至在很多新闻现场,人们比传统的新闻媒体机构能更快地传播信息,似乎成为了“新闻制造者”。那么,“受众”这个概念还成立吗?毕竟这一概念更多指向被动地接受信息。
小腾资讯君
2024/04/01
4270
AI大模型进阶系列(01)看懂AI大模型的主流技术 | AI对普通人的本质影响是什么?
2010年至今,我们见证了移动互联网时代、大数据时代、短视频时代,以及炙手可热的通用AI时代。科技技术迭代之快,让15年时间短得仿若一梦。而强大的AI智能,到底会给我们的现实世界产生哪些影响,尤其是全社会对超级AI能力的无限期许,让AI技术的每一个进展都会成为时下社会关注和讨论的热点。
拉丁解牛说技术
2025/04/03
8730
要做中国OpenAI的很多,但智源要打造大模型领域的Linux
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI “要做中国的OpenAI!”“要打造中国版ChatGPT!”ChatGPT的火以燎原之势蔓延到每一个角落。 人们目光的焦点聚集到这个具体的现象级应用,或者其它大模型支撑的类ChatGPT产品上。大模型似乎成为了人人都能参与的游戏?智源研究院院长黄铁军并不这样想。 ChatGPT的出现,好比用电灯点亮了一个街区。 但是要建全国、全球的电网,中间还有很长的路要走。 “很长的路”上,技术、资金、算力、算法、基础设施,搭建了一道难以攻破的壁垒。要继续前行,得凿开
量子位
2023/03/04
4860
要做中国OpenAI的很多,但智源要打造大模型领域的Linux
ChatGPT一路狂飙,我们的安全带在哪儿?
机器之心报道 编辑:张倩 汽车是 19 世纪末被发明出来的,但直到 20 世纪下半叶,不同的国家才出台了强制要求开车系安全带的法规。今天人工智能的发展,显然不能走汽车的这条路。 自去年 11 月 30 日发布以来,OpenAI 的 ChatGPT 已经在短短的三个月内席卷了各个社会领域:普通人用它当搜索引擎;办公室文员用它来写文案、做会议纪要,程序员用它来写代码。 但是,令人担忧的是,学生们也会用它来写作业。前段时间的一项调查表明,美国近 9 成的学生已经在用 ChatGPT 写作业了,有篇 ChatGPT
机器之心
2023/03/29
4650
ChatGPT一路狂飙,我们的安全带在哪儿?
Stable Diffusion、ChatGPT爆火的背后!
"生成式AI是一种人工智能技术,它可以使用训练数据来生成新的内容。这种技术可以用来解决各种问题,具有很高的社会价值。
AI算法与图像处理
2023/02/28
1.1K0
Stable Diffusion、ChatGPT爆火的背后!
拐点时刻?AIGC时代的新闻业
2022年底,OpenAI发布自然语言对话应用ChatGPT,并在今年3月迭代推出GPT-4,迅速吸引了各行业与公众的关注。全球范围内大模型风云骤起,资金、技术、人才持续涌入,科技公司布局不断,纷纷推出自家的大模型。据估算,到2030年,AIGC市场规模有望突破万亿元。
小腾资讯君
2023/08/30
1K0
拐点时刻?AIGC时代的新闻业
Sora“碾压”一众模型,Pika等创业公司再无活路?
未必!真正在应用阶段,如果产品没有提供足够多的微操空间,确保用户能够通过微操将其整合到自己的工作流中,那么大概率Sora仍是效果越来越炸裂,距离用户越来越远。
小腾资讯君
2024/02/19
4960
大模型时代的人机关系:不要温和地走进与AI共生的时代
工业革命迄今,人类在数百年间逐渐习惯与机器朝夕相处,从最初的惊慌失措到现在的视若无睹,而今媒介成为身体的延伸,手机成为媒介的集成,机器甚至成为人身体的一部分,除了广泛应用于医疗的机械手臂、机械腿等,赛博格(Cyborg)、“脑机结合”也正在慢慢地从科幻故事变成现实……人类与机器的关系逐渐亲密,机器不再仅是客体和死物。人类在恐惧中萌生幻想,对机器拥有智能、甚至成为伴侣/朋友的想象不绝如缕,不少人希冀机器拥有真正的智能和情感,进而拥有独立思考能力和自主性,与人类发生深层次的情感交流。
小腾资讯君
2023/10/09
1.3K0
大模型时代的人机关系:不要温和地走进与AI共生的时代
ChatGPT+Midjourney,一卷卫生纸拍出科幻大片!200万网友围观
国外大佬为一纸「AI不扩散条约」吵得不可开交。国内这边,B站、爱奇艺等一众互联网企业也在成都视听大会上大讲特讲AIGC。其中,陈睿也在现场介绍了B站的AIGC内容。
新智元
2023/04/04
4940
ChatGPT+Midjourney,一卷卫生纸拍出科幻大片!200万网友围观
大模型时代下,算法工程师该何去何从?
链接:https://cloud.tencent.com/developer/article/2475520
中杯可乐多加冰
2024/12/10
8220
昆仑万维方汉:大模型时代,超级 APP 不会是神话
“艰苦奋斗,独立自主”——这是昆仑万维董事长兼CEO方汉做大模型3年以来的真实感受。
AI科技评论
2023/12/05
5480
昆仑万维方汉:大模型时代,超级 APP 不会是神话
AIGC元年 | 从科幻到现实,人工智能为何成为未来的引擎
AIGC是如今备受关注的热门概念,它属于生成式人工智能领域,可以创作出像AI绘画和ChatGPT等明星产品。尽管元宇宙和Web3等概念正风靡全球,但AIGC凭借着"创作"这一强大功能,已经高居榜首。
云坞网络-Peter
2023/05/21
6820
AIGC元年 | 从科幻到现实,人工智能为何成为未来的引擎
ChatGPT之后,AIGC如何革新数字内容创作
作者:胡 璇 腾讯研究院高级研究员 胡晓萌 腾讯研究院研究员、博士后 内容生产,特别是创意工作,一向被认为是人类的专属和智能的体现。牛津大学计算机学院院长迈克尔·伍尔德里奇 2019 年写作的《人工智能全传》一书中,“撰写有趣的故事”被列为人工智能“远未实现”的任务之一。 如今,AI 正大步迈入数字内容生产领域。AIGC(AI Generated Content)不仅在写作、绘画、作曲多项领域达到“类人”表现,更展示出在大数据学习基础上的非凡创意潜能。2023 年 3 月 15 日,多模态信息处理标杆 GP
腾讯技术工程官方号
2023/05/25
6060
ChatGPT之后,AIGC如何革新数字内容创作
大模型时代的“Linux”生态,开启人工智能新十年
演讲 | 林咏华  智源人工智能研究院副院长     整理 | 何苗 出品 | CSDN(ID:CSDNnews) 2018 年以来,超大规模预训练模型的出现推动了 AI 科研范式从面向特定应用场景、训练专有模型,转变为大模型+微调+模型服务的AI工业化开发模式。直至对话大模型 ChatGPT 引发全球广泛关注,人们终于欢呼 AI 2.0 时代来了。当我们立足由大模型推动的AIGC元年,AI 正在迎来新的一轮全球应用和研发热。 随着两波AI崛起浪潮接连在寒冬中袭来,人们终于看到了大模型+AIGC 将人工智
AI科技大本营
2023/04/06
7740
大模型时代的“Linux”生态,开启人工智能新十年
AIGC初体验:iPhone时刻,还是至暗时刻
2022年,当AI开始绘画的时候,很多设计师们觉得没什么。当AI开始生成代码的时候,很多程序员也觉得没什么。当ChatGPT出现的时候,才将AIGC这一领域彻底引爆。被称为AI届的『iPhone时刻』。
果冻虾仁
2023/03/25
8340
AIGC初体验:iPhone时刻,还是至暗时刻
今晚,谷歌对决微软,Bard 与 ChatGPT 的比赛正式开始
作者 | 孙溥茜 编辑 | 岑峰 1 谷歌今晚“姗姗来迟” “谷歌会在一两年内被彻底颠覆”,本月初Gmail的缔造者保罗·布赫海特(Paul Buchheit )在推特上公开谈论。 北京时间2月8日凌晨,微软举行发布会,正式推出由ChatGPT支持的最新版本Bing搜索引擎和Edge浏览器,新版Bing将借助ChatGPT,回答用户具有上下文内容的答案。桌面版已开启试用,手机版也即将来临。 保罗表示,当人们的搜索需求能够被封装好的、语义清晰的答案满足,搜索广告将会没有生存余地。而谷歌迄今仍是一家有超过50
AI科技评论
2023/02/23
3870
今晚,谷歌对决微软,Bard 与 ChatGPT 的比赛正式开始
AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考
AI,这个词在如今人们的视野中出现频率几乎超过了所有一切其他的事物,更有意思的是,出现频率仅次于这个词的,几乎都会加上一个修饰亦或是前缀——AI,没错,还是它。
Skrrapper
2024/06/18
5740
AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考
推荐阅读
相关推荐
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
首页
学习
活动
专区
圈层
工具
MCP广场
首页
学习
活动
专区
圈层
工具
MCP广场