大数据文摘出品
作者:周素云、魏子敏
中国、美国、印度和俄罗斯,这四个国家培养了世界上一半的STEM毕业生(STEM是科学-Science、技术-Technology、工程-Engineering及数学-Math四个学科的首字母缩略字)。
但是,哪家培养的学生更胜一筹呢?
中美印俄每年培养的stem人数
一直以来,全球学术界最常用的一种考察方法是,按照发论文的多少定输赢:谁家顶级论文发的更多,就说明在这个领域有更强的科研能力。
比如,上周一篇“中国AI论文数量赶超美国”的话题引起大家热议,一家研究机构Allen Institute从Semantic Scholar学术搜索引擎分析了截至2018年底200多万份AI研究出版物的数据。
这家机构比较美国和中国的人工智能出版物,称自2005年以来,中国发布的AI论文已经超越美国。中国已经成为人工智能的新兴强国, 仅AI论文已实现弯道超越。
当然,还有另一种更直接的考核方式——考试。
还真有一家机构发起了这样一项全球测试:本周《美国国家科学院院刊》发布了一篇对中美印俄四国,计算机科学高年级学生CS技能的调查结果。令人惊讶的是,在抽样测试中,中国学生竟输在了最擅长的考试上。
到底是怎样的考试呢?
该项目是由斯坦福大学助理教授Prashant Loyalka 领导的全球研究团队发起 。 他们精心设计了一个抽样机制, 以选择四个国家的高级(通常为四年级)计算机科学或同等学历学生来进行一项测试,这些学生分别来自中国、美国、印度和俄罗斯。
最终的考核对象包括来自美国的6847名学生、来自中国的678名学生、来自印度的364名学生和来自俄罗斯的551名学生参与测试。 样本数量看起来不是很合理,但抽样的方法和数据都是经过计算和设计,相对来说是具有可信度和真实性的。
比如: 样本分别由名校和普通高校学生按一定比例组成,中国的678名学生中有119名学生来自211,985高校,占比约17.5%。印度19.5%,而此抽样的美国学生中,仅有607名学生来自名校。
对抽样方法和数据有疑议论的可戳原文:
https://www.pnas.org/content/early/2019/03/12/1814646116
当学生被选定后,研究人员随后为他们进行了计算机科学专业测试。 为保证所有考生的考试条件公平,研究小组特意采取了四个步骤:
从机制设置上,可谓非常公平了。但尽管如此,中国学生依然输给了美国。
这套试题来自ETS的计算机题库(托福和GRE考试的官方机构),考试链接:
https://www.ets.org/mft/about/content/computer_science
不服气的文摘菌也找来了这套考试题,大家可以先来感受一下?
1. Consider the following recursive function.
int Fun(int n) if(n == 4) return 2 else return 2* Fun( n+1 ) end ifend Fun
What is the value returned by the function call Fun(2)
(A) 2
(B) 4
(C)8
(D)16
(E)24
点击下方空白区域查看答案 ▼
正确答案:C
2. The figure above represents a nondeterministic finite automaton with accepting state D.Which of the following strings does the automaton accept?
(A)001
(B)1101
(C)01100
(D)000110
(E)100100
点击下方空白区域查看答案 ▼
正确答案:E
3. Consider the following table in a relational database.
According to the data shown in the table,which of the following could be a candidate key of the table?
(A){Last Name}
(B){Room}
(C){Shift}
(D){Rank,Room}
(E){Room,Shift}
点击下方空白区域查看答案 ▼
正确答案:E
我们同时也把样题发给了几位高校的博士(cs专业和非cs专业都有),他们表示:出题范围较广,作为本科生的考试还是挺难的。
研究人员发现,从总体上看,参与的美国高校学生表现出更加优异的计算机科学能力,中国、印度和俄罗斯三国学生差异较小,中国考生以微弱的优势排在第二。
从名校和普通高校的学生成绩对比图可以看出,中国重点大学学生的CS水平还是要高于印度和俄罗斯的。美国普通高校学生的CS水平虽然大大降低,但仍远高于其他三国的普通高校学生。
不服!大家都知道,每年都有大量优秀的中国学生前往美国高校学习计算机科学,加上全世界各地的优秀生源,这6847名美国高校学生中应该请了不少外援吧!
为了排除质疑, 调查小组也是很拼了, 特意在测试中添加了母语调查。分为英语, 其他语言和双语同等的三个选择。并想通过此证明, 调查结果并没有受到太多国际学生的影响。
所以,此报告得出结论:“在美国CS课程结束时, 本科生的CS技能远高于中国, 印度和俄罗斯。值得注意的是, 这一调查想要间接证明,美国的科技优势并不是因为其CS学科吸引了大量优秀的国际学生。”
额…在数据面前,文摘菌也无力反驳,回去学习,我们来日再战!
除了此项测试结果,此报告还表明,在大一新生入学计算机科学专业时, 中国学生的数学和物理基础要远远高于俄罗斯、美国、印度。但在大学结束时,中国的研究项目质量最低,印度最高。
针对这项调查报告,“亚洲硅谷”印度媒体给出了这样的标题:印度计算机科学毕业生:数量高,质量低。
现在,再回到中国AI论文数量超过美国的话题,我们的数量多,那质量又如何呢?
在上周,清华大学与网易联合举办的2019 中国人工智能创新者论坛中,网易有道CEO周枫在答记者问时,也谈到我国人工智能论文数量多,但研究多停留在应用端,而美国高校的人工智能教学分为三类, 应用端,技术端和基础端各占三分之一。
腾讯研究院在中美两国人工智能产业发展全面解读的研究报告显示,美国基础层的人才数量是中国的13.8倍,美国团队人数在处理器/芯片、机器学习应用、自然语言处理方面全面压制中国。
网易有道CEO表示,企业最急需的人才还是技术端和基础端,而这部分的工作量大多是美国在做, 例如2018年Google 2018年最强自然语言模型论文,像网易有道这样企业是特别需要这样的产品。
我们还在等待中国更多高质量的论文出现!
论文怎么写, CS考试要过关才行啊!