哪种语言才是世界上最优秀的?一直以来围绕这个问题,各种的观点和声音都有。
有人提出为何编程语言都是英语而不是汉字?这无疑是因为英文更好。
有人认为,编程语言和现实中的语言使用不同,汉语一词多意的现象很普遍,如果要规范化使用,势必得确定一套新的标准。这要耗费的经历非比寻常,还不如将就着用英文,并不能证明英文比中文更优秀。
目前,世界上使用人口最多的语言,也就是汉语和英语,所以语言上的比较,基本上也都是围绕这两者来进行的。那么对比起来,汉语比英语有哪些优势呢?
较英语汉语所具备的优势
汉语作为联合国常用的六种语言之一,以书写《联合国宪章》为例,所用字是最少的。
汉语版本的为26000多字,其他几种语言的版本,只有阿拉伯语在40000字左右,别的语言版本都超过了50000字。
字数最多的是西班牙语,将近60000字。而英语版本的文字,也达到了55000多字。字数的多和少,则直接影响着阅读和理解的效率。而且这一点,从幼童时期开始学说话就产生了。
由于汉语的字数少,所以在幼童学说话的过程中,能够迅速掌握语言的要义,学习起来的效率也就更高。
统计显示,国内的幼童,出生后平均29个月左右,就能做到和成年人的基本沟通。无论是对话和表达层面,都能做到无障碍。
而英语和其他印欧语系国家的幼童,能够掌握沟通和表达的能力,所需时间超过了36个月。完全掌握沟通的能力,更是需要40个月以上。
这其中最关键的原因,就是他们的语言文字多于汉语,掌握起来的难度要大很多。比如在英语的学习中,由于单一字和词较多,需要大量记忆各种名词。
由于字数多,不但会直接影响幼童的学习效率。对于成年人的学习也有很大的影响。中国人的成年文盲,识字认字的效率高。而英语国家,一旦成年后还不认字,那么再进行学习的难度就很大了。
民国之前,我国的识字率一度也很低。但是新中国成立后,随着全民扫盲以及汉字的简化,全民识字率得以快速提升。
目前,我国人口的识字率排在世界首位,完全不识字文盲的比率,早在20年前就降到了10%以下。能够如此高效的扫盲,正是因为汉语的常规字数少。
因为常用字数少,进一步往前延伸,语言所包含的信息流,以及所能表达的意思就丰富多了。
汉字的信息量有多大?
常用的汉字不到4000,常用的汉语词汇更是只有400多个。对比之下,英语的单词数量达到了9600多组,西班牙语更是超过了10000组。汉语词汇的简洁程度,比其他的语言少了20倍以上。
不说其他,单单从记忆的角度去看,汉语记忆起来的难度就要比其他语言好多了。
词汇少,是因为汉语不需要过多的产生新的词汇,包括新的字都很少创造,利用原有的文字就能将意思完整的表达出来,这就说明了汉语的信息量和信息密度要比其他语言高。
哪怕是进入20世纪后,因为工业革命的纵深发展,出现了太多的新生事物,但在汉语领域,我们也没有创造出更多的新字和新词出来。对比起来,英语的造字和造词汇量是惊人的。
由于英语的信息承载量不够大,很多内容尤其是新生事物,无法用原有的字和词语表达出来。在这种情况下,就不得不创造出更多的新字词。
所以,有人就将英语称为笨蛋的语言。因为每出现一个新生的事物,就得用一个新的词组来表达。这样一来,字和词汇的数量就越来越多。
尤其是工业革命后,各行各业的专业性词汇,英语都是新造出来的。这些词汇比如碳酸钙、四环素、高血压、变阻器等等。如果用英语书写,很多识字的普通人都可能不知道这是什么。
但是,汉语则不存在这样的情况,哪怕是最高深和最专业的词汇,普通人看过后,通过融会贯通的能力,也能基本理解它代表的是什么意思。
然而,由于英语的词汇是单线程的组合,每出现一个新词,需要特别的记忆才能掌握。而大量的普通人,由于日常接触不到,所以就不会去做。如此一来,即便是认字的人,也可能不认识某些英语词汇。
总结起来就是,英语的信息承载量没有汉语高,所以需要不断创造新的词汇。而大部分人,又不可能始终去掌握新的词汇。这样一来,就会出现明明认字但又不认识新字的情况。
美国人竟是地理盲?
一个美国人来中国留学,因为担心汉语学的不好,就经常准备大量的字条,以便随时在大街上问路。他后来发现,基本上碰到的路人,都能认识他写的字。
这让美国人吃惊不已。因为在美国有一种很普遍的现象,即有些字词会说,但是写出来后,很多人并不知道它表示的是什么意思。这种情况不是个例,而是在美国很普遍。
甚至于此前曾有调查发现,美国大量的中学生都是地理盲。美国之前去打伊拉克,然而超过87%的年轻人,并不知道伊拉克在世界上的具体位置。
还有一些美国人,在地图上能够找到的国家只有3个。甚至有超过30%的美国人,竟然不知道太平洋在什么地方。早年,悉尼举办奥运会,有很多美国年轻人,就屁颠屁颠跑到奥地利去看比赛。或许,他们真的认错了澳大利亚和奥地利的英语单词。
听起来是笑话对吧,造成这种情况的主要原因,就是因为英语的词汇量太多了。对绝大多数的普通人来说,上学期间学习和掌握的都是常用词汇。
等到后来步入社会,这些有限的词汇,能够帮助人在社会上立足工作,但是大量的新词汇如果不去学习,人们并不知道那是什么。还有很多不常用的词汇,比如地理或者生物领域的专业词汇,如果不是专门去记忆和学习,普通人看了就会是一头雾水。
据不完全统计,英语在本世纪初的词汇量已经超过了40万个。到本世纪中叶,随着新词汇的不断产生,超过100万个将是板上钉钉的事。如此之多的词汇量,不要说普通人,就是最顶级的科学家他也认不全。
相比之下,我们汉语新的词汇量基本上没有增长。利用原有的字词,我们就能解释和概括当下的世界和社会。
而且,我们的字词不但能解释现在,过去的文献和史料,现在看起来也是毫无难度。
汉字的传承性很强
现在,只要是基本学过古文的中学生,让他们去看一些文言文,哪怕是不能完全了解,也能了解一些大概。而英语则完全不同,过去大量的文学和历史书籍,现代人读起来都很困难。
以英语为母语的人,去读莎士比亚的原著,不少人看起来都困难重重,因为有字词不认识。如果让他们去阅读一些更生僻的历史书籍,看得懂的人恐怕就更少了。
因为作为表音文字,人们或许能知道一个字或词读什么,要是让人们去理解它的意思,那就是另外一回事了。而且越是年代久远,理解起来的难度就更大。因为大量古代的字词,在现代的社会已不再使用,理解它的意思,就得专门去学习。
对比之下,汉语则不会存在这样的问题。再古老的文献资料,普通人也都能看个大概。所以,相比于英语等印欧语系,汉语的传承性很强。上下几千年,只要文字没有中断,过去的历史现代人也能统统掌握。
所以综合来看,汉语不管是传承性还是使用效率,都是其他语言所不能比拟的。
3000个常用字就能写出百万字的名著
国内的文学名著,虽然字数都接近和达到了百万级别,但使用字词的情况,基本上也都是只少不会多。
这就是说,汉字的重复使用率是最高的。虽然历代积累的汉字已经达到了4万多,但是常用的3到5千左右的字,就能让一个识字的人掌握大量的信息。
甚至像《三字经》和《千字文》,区区几百上千个字,就能让一个人掌握到基本的读写能力。对比之下,英语根本做不到如此。
或许英语唯一的优势,就是在信息化时代,它的输出成本比汉语低。
汉语的输出成本有多高?
在信息时代的文字输出中,使用的又是另外一套逻辑。在上世纪40年代,美国人为了提高信息的传递和储存效率,利用多种编码方法,找到了最优化的解决方案。
后来这一领域,有出现了信息熵和数据压缩的理论。信息熵简单理解就是,利用某种表达符号的信息量和多余度,找到最小的优化方案,来实现最高效的储存和传递。
我国在上世纪70年代,对汉字的字符进行了初步的信息熵计算。后来经过进一步的完善,得出汉字的平均信息熵是9.6比特,对比之下,包括英语等其他几种世界常用语言,它们的信息熵只有3到4比特。
简单理解就是,在信息化时代,汉字的信息量大的优势,反倒成为了劣势。在传递以及储存的过程中,由于信息量大,它的输出和消耗成本就高了。
结语
对普通人来说,不管使用哪种语言,掌握了常规的字词之后,在表达和输出的时候,基本上都能做到畅通无阻。而某种语言在表达和转化上的特点,那又上升到了更专业的层面。
汉语的优势和使用是紧密相关的,同样其他语言的使用,也跟各自的生活和工作场景分不开。在这种情况下,习惯了某种表达自然就会形成特定的依赖路径。
至于语言本身的优势,那就需要跳出使用圈子从更大的范围去比较。这样一来,孰优孰劣才能一目了然。
领取专属 10元无门槛券
私享最新 技术干货