《语言战略研究》微信公众号近期推出“2018中青年语言学者沙龙”专题。敬请关注!
刘丹青,中国社会科学院语言所所长、研究员
“2018中青年语言学者沙龙”总结发言
刘丹青
谢谢商务印书馆每年都提供这个条件给我们进行一次学术盛宴。这个盛宴曾经不是隐喻而是写实的,今天这个隐喻得到最近几年里最强的一次突显,我自己感觉到这个学术知识盛宴比写实的盛宴重要到无法比拟。
这个题目的由来,是我们与澳大利亚陈平先生在商务印书馆开小会时说起这个沙龙,他提到了这个。但他提这个的初衷是有世界语言学界的背景,跟形式语法有关,倒不是陈平先生主要从事的功能认知方面的研究、语用学方面的研究。因为他说:前不久有人对形式语法老是凭自己的语感,这个可靠不可靠,对形式语法作者主观判断的星号句、非星号句进行一次功能式的大数据研究,结果发现在绝大部分时候形式语法学界所做的判断是符合绝大部分人语感的。这实际上是用功能的方式对形式的方式进行了一次肯定。他说这个就是涉及原来人们怀疑的、内省式的判断是否能够作为证据的一次检验。
我们后来决定采用陈平先生的这个提议,但担忧跟暑期联谊会曾有过的“何为语言事实”的主题重合度太高,听完今天的学术盛宴,特别是这四个主题报告,感觉这个担忧基本可以消除了。我也在思考为什么证据问题跟上次语言事实的问题重合度不太高。因为上次语言事实主要是讨论语言学的一个来自索绪尔的根本问题:“我们所面对的都是言语,我们如何用言语来证明语言?我们每个人拿到的都是言语,你什么时候能够说这个言语是语言的事实而不仅仅是言语的一个片段而已。”
这次我最有感受的是,孟蓬生先生说到井底之蛙的警示,我们今天到这儿来,是要来做突破井底之蛙的语言学者。我抬头一看,上面果然有一口六角井的形状在那。如果我们成天只是在这个空间里,很有可能就成了孟先生所担忧的井底之蛙。今天我们更多是突破语言学传统的范围,到外面去,而且不仅仅是跑到井的外面面对天空,我们今天更像是一场星际旅行。
我们跨越的领域太大了,从古老的出土文献,到对于刚刚出生婴儿的实验,从时间平面的数千年的纵深,到空间平面的成千上百方言的数据,到我们对外国人来阅读中国语言文字的心理学眼动的实验,每一个领域之间都有非常大的跳跃。这些领域之间可以用一句话来概括:跟传统的语言文字证据相比,它们都是一些非典型证据、新型的证据。所以能够给我们这样一种学术盛宴的感觉,它更多带来的是维度的拓展。
希望在今天主题报告以及大家的讨论之下,每个人都能够突破上空的井栏,从眼界的突破开始,进入到境界的提升。
下面,我把这次主题报告以及大家讨论中所反映出来的集中问题和想法做几点归纳,里面也含有我个人的想法。
第一,好几位学者都提到“证据是在科学中和在语言学中都具有核心的地位”。我们大家都知道,证据是区别科学和非科学的关键因素。这个非科学的面可以很广,可以是巫术,也可以是很多猜测、假想,也可以是文学艺术创造,这些都不是真正的科学。科学的代表无疑不是人文科学、不是社会科学,而是自然科学。所谓science proper,最正宗的科学,指的是自然科学。自然科学没有确凿的证据是很难立足的,但人文社会科学现在远远做不到这一点。
有时大量低质的学术产出、学术垃圾就表现在人文社会科学,论文没有什么东西,或者有一些想法但谈不到论证、证据,也就是说人文社会科学没有到自然科学的程度。但现在人文社会科学追求向科学的靠拢、方法上的靠拢,进一步把自己从学科叫成了科学,而且有幸的是这个靠拢的队伍里面语言学始终是处于最接近自然科学的位置。我们语言学有理由在整个人文科学里面作为领先的学科,我们要在科学方法的探索上、在科学论证和科学证据的追求上,有理由、有责任走在人文社会科学的前列。
同时也要看到,即使在科学里面,如果深入的研究数学、物理、化学、生物学,并不是很容易达成共识,科学界内部也存在很多争议,你认为的证据在他看来还有疑问,即是不是可以作为证据?人文社会科学就更加严重了。今天大家都提到“证据本身具有相对性、主观性”,语言学很多证据的来历仍然最多只是好坏程度的问题,而不是确定的真理和谬误的关系问题,不是正确和错误的问题。但尽管如此,我们都应该在一条向善的道路上,我们应该尽量远离坏的,追求更高更好的证据。中国求实的传统跟科学的精神是非常一致的,在追求的道路上不断前进。
第二,证据的多维性、多样性大大拓展了我们原来认为的语言文字学所应该关注的那些证据。像大部分人都不了解眼动,很多年前就听到了这个词,但今天白教授给我们展示了具体的、直观的实验设计,让很多人第一次有了深入了解。今天的报告之所以信息量大,不是单纯由信息的性质决定的,还跟受众的信息储备关系密切。信息量本身有大小,但对于储备者的信息储备来说是个新的东西,即使这个信息本身不是新的,但对大部分传统的语言文字学研究方法来说,这些知识都是新的信息,这个信息量的比特会随着我们信息储备的减少而上升。
《当代语言学》刊登过文章,谈国外人对语言的形容。乔姆斯基讲最简方案,把普遍语法的核心部分最小化,另外一些跟他观点不同的人则说“我们要充分理解the largeness of language”,语言之大、语言之丰,今天我们知道研究语言的角度可以有许多,有的确实可以给我们带来实实在在的新知。
今天大家讲到大数据,大家不能仅仅停留在大数据的“大”字上,大数据带来的是一种观念。潘先生所说的大数据的观念特别重要。大数据思维包含总体思维。但大数据带来更大一个问题,也是我教类型学时经常回答的,就是“容错思维”,你怎么知道你用的几百种语言材料里面没有描写的错误呢?当数据达到一定数量以后是可以容错的,因为错的方向是随机的、乱的,例如语序类型的不同方向的误差可以互相抵消一部分,所以数据达到一定程度的话,朝这方面偏的跟朝那方面偏的,最后大数据偏下来的结果会趋向于准确的方向。所以要认识到大数据的总体思维、容错思维、相关思维,整体认识大数据给我们带来的新见解。
心理学的实验、眼动的实验,已经到了神经层面的实验,还有很多今天来不及展开的领域。除了今天四位讲到的之外,还有很多值得我们关注的新证据领域,比如我们原来还约了跨语言研究的黄成龙。还有实验语音学现在扩大为实验语言学的证据。实验语言学的证据由原来产出的为主,到产出的和感知理解的结合。这些方面都给我们原有的书斋之学能够带来一些新知。
还有域外汉语的资料,这些年随着改革开放的步伐加快,有越来越多的机会了解域外汉语在音韵、文字、词汇、语法等方面的研究。《中国语文》这两年就刊登了这些方面的文章,利用域外资料深化汉语尤其是近代汉语向现代汉语演变时期的变化研究。
还有北语这些年推的中介语的语料库和中介语的研究,不能仅理解为对第二语言习得有用,而且对本体的研究也有很多新视角。这是另外一种切橘子的方式,通过这种方式可以看到汉语本体研究看不到的但确实跟汉语本质有关的东西。我们教母语人时根本都不教这些东西,但在第二语言中介语的资料中发现汉语还有这么多重要的规则被我们无视。
第三,几个关键词,就是潘悟云老师给我们带来的、学界最近一段时间讨论比较多的“相关性和因果性”的问题。大数据首先直接带来的是相关性的表述和结论,但在多大程度上能够最终指向因果关系,受很多方面的研究力度和深度的制约。也涉及到计算语言学界一直存在的基于统计和基于规则的问题。大数据明显是基于统计的,但基于统计和基于规则不可能是完全偏废,尤其是对于我们认识语言的本质来说,最终要还原到陆先生所说的“语言是什么、为什么是这样的”,我们不能仅仅基于统计回答这个问题,必须回答到规则上来,语言是受规则制约的。
我就潘先生所说的例子说点个人想法,比如这么多数据都指向东吴那个地方,是不是就说明了孙权家族所建立的东吴政权在中国历史形成中间起了非常大的作用?我觉得现在我们得出这个结论还为时太早。东吴政权划出这个区域,语言现象多多少少跟这个区域有关系,这个关系是怎么形成的,还有很多其他的因素在起作用,不一定就是三国时候东吴政权直接的原因。但是现在这个数据指向的相关性是指向东吴的疆域跟这么多语言现象叠起来是一致的,但不能说这就直接回答了因果关系,我们对因果关系的解释还要从很多方面去探讨。有些是数量的问题,就是刚才潘先生所说的优势的问题,不能是有无的问题。讲到有无,北京一到夏天就吃庞各庄的西瓜,庞各庄这个“各”就是“家”的舌根音声母在北方的留存,再到西北可能更多。从数量能够得到这个结论,但定性等很多方面值得语言学者去研究。
最后,在证据的视野下,我们如何去推进语言学研究?刚才史金生的表态是为了消除过分的危机感,我们传统的是不是都没有用了?语言学的本体仍然是语言的中心和中坚,仍然有很多工作,回答“语言是什么、为什么这样”仍然要靠语言学者的努力。
今天大部分都是新的意义的“传统语言学”的研究学者,我们面对证据这份考卷,有哪些事情可以做?
第一,进一步提升语料的质。我本人这些年一直在做如何提升方言语法调查的质量,提升方言语法跨方言调查的可比性及资料的深度细度。商务印书馆要出的我们主编的方言语法的参考语法也要出来了。我们希望深化汉语方言语法,同时建立起更好的方言语法的语料库,为了大数据的研究做准备。但我们深切体会到资料调查描写的准确度、深度、细度对于资料的质量有至关重要的作用。
第二,大数据有结构性的和非结构性的,我们要让更多大数据资料语言学语料库变成是结构性的,变成是优质的结构性的语料,我们在此基础上才能够产出更好的语言学研究成果。
第三,有了大数据之后,如果没有很好的语言学素养、语言学理论、语言学思维,就像刚才李宇明教授所批评的,只能是一堆表格、一堆材料,没有真正价值。所以我们必须靠语言学的思维和创造力,去从大数据里面提炼出出来。
第四,做大数据的人需要深入了解语言学内部的学科发展,才能够设计出更加合理的大数据的结构。比如这两年出土文献越来越多,排名在前的高校都非常舍得花重金收藏,说明这个事情很有价值,让大量的竹简、帛书,成为推动汉语史研究的利器。语言学在社科院“登峰计划”下设立了孟先生为首的简帛语言特殊学科,我们也认识到这方面的重要性。出土文献对传统上对于汉语史的认知提出了新的挑战,只有了解的人去应对这个挑战,才能为汉语史的研究拓展新的空间。我们相信在这个领域将有更多成果出现。
作为每一个在语言学本体领域或者语言学应用领域里研究的工作者,通过今天的报告可以得到启发。了解到跟这个学科相关的新的题目、新的证据的研究正在进行,我们不一定去从事这项工作,但要关注他们的成果。对于有意义的、有启发性的成果更是如此。比如我一直注意“词在汉语里面的心理现实性”的问题,白教授的报告给我很多启发,可以从这方面为词在汉语里面的心理现实性提供新的视角和证据。
每位都可以站在自己的立场去关注和了解跟自己相关的领域有哪些,更加有证据意义的不同领域的研究哪些正在进行,有哪些成果可以用来强化我们的研究。如果能够做到这一点,也就是我们今天的沙龙起到了作用。
领取专属 10元无门槛券
私享最新 技术干货