历史研究的基础是收集资料,有资料才有可能出货,没有资料便不出货。司马迁能够撰写彪炳千古的《史记》,“天下遗文古事靡不毕集太史公”便是其坚实的资料前提。资料收集之难,非亲历者莫敢知。李延寿撰《南史》《北史》,在史馆“私为抄录,一十六年”,没有超乎寻常的毅力绝难成就其事。可是,有了充分的资料积累,在实际研究与撰述时如何迅捷地找到所需史料,又成为令史学家头疼的另一道难题。资料积累想“富”,资料查找想“速”,两者之间存在难以弥合的矛盾。但在大数据时代,信息技术的发展彻底解决了这一难题。海量的数据存储,同时还具有以秒来计算的查找速率,可谓既“富”且“速”。无怪乎大数据概念与相关技术一出,就立刻在史学界尤其是中青年史学工作者中引起强烈反响。
海量存储和快捷检索是大数据的两个重要技术特征,其外在表现形态就是各种各样的数据库。正因为如此,加强数据库建设成为当前史学界利用大数据来推动历史研究的焦点。大数据离不开数据库,但大数据却不是简单地等同于数据库。如果我们利用当代信息技术把有限的历史资料数据库化就称之为利用大数据开展历史研究,那么,所谓大数据的新瓶里装的还是传统思维的旧酒。事实上,大数据时代的到来正在推动一场影响深远的思维革命。大数据之“大”,已不再是有限之大,而是无限之大。因此,它将人类思维从有限的因果关系中解放出来。在大数据时代,史学家面临的将是如何突破数据无限的难题。舍恩伯格在《删除:大数据取舍之道》一书中指出,随着信息采录电子化技术的普及和飞速进步,记忆成为常态,每个人都在进行信息的持续记录,从而留下无法估算的包含着丰富细节的数字化历史资料。即使是前大数据时代留下来的史料,也会随着各类大型数据库的建设及数据库之间的联网,使细节内容越来越凸显。在这种资料条件下,一方面,微观史学研究将更趋广泛和深入;另一方面,历史研究的碎片化问题也将更趋严重。一旦史学家陷入史料的无限之境而又无技突出重围,就极有可能失去从整体上描述历史的能力。这恰恰是大数据时代历史研究需要高度关注的问题。
作为极其古老的认识活动,史学一直是人类实现自我认知、达致群体认同的重要途径。在文字尚未发明的原始社会末期,随着部族联合体及早期民族的出现,大型史诗随之创生并广泛传诵,与神话一道建构群体内部的认同,从而维系了较大规模人类社会组织的存在与发展,并最终促成文明时代的到来。进入文明时代之后,史学更是在促成民族认同、价值认同、文化认同等方面发挥着积极的社会作用。司马迁在《史记》中建构了以黄帝为中华民族共同祖先的起源话语体系,这一话语体系影响深远,其后拓跋鲜卑建立北魏,述其远祖即溯至黄帝之子昌意。班固在《汉书》中建构了一个五行相生、封闭循环的时间话语体系,将自太昊以来所有的正统帝王都纳入系谱之中。这一时间话语体系同样影响深远,之后的蒙元和满清,虽为少数民族所建王朝,但都自觉继承了为前朝修史的文化传统,其动因之一就是为了确立本王朝在这一时间体系中的位置。中华民族历经数千年风雨而能长盛不衰,发展成为当今世界规模最为庞大的民族共同体,离不开传统史学在推动群体认同方面所发挥的重大作用。显然,没有规模宏大的历史叙事,史学的社会价值便无从体现。乔·古尔迪和大卫·阿米蒂奇在《历史学宣言》中呼吁史学家们摆脱微观史学的狭隘局限,运用长时段思维,为人类思考现在及建设未来发挥独特的重要作用。这可以说是当下史学界的深刻觉醒,对于正在大数据时代走入史料无限之境的史学来说无疑是一次十分及时的提醒。
大叙事需要宏大的形式和时空,但这两者都非其本质。大叙事之“大”,主要体现在史学家的人文情怀上。希罗多德撰写《历史》,兼记希腊人和异邦人的丰功伟绩,藉此颂扬乃至炫耀人类作为一个整体曾经焕发出的勇气和荣光。司马迁撰写《史记》,更有着“究天人之际,通古今之变”的宏大抱负。经典之为经典,除其事实详核外,更在于其文字之中处处渗透着对于人类命运的悲悯和关怀。中西两大历史学之父早在两千多年前,就为史学家树立了伟大的人文情怀标杆。大数据时代,凡一切能够量化的学术技能,都有可能由信息技术全部或部分代劳,唯有人文情怀是人类主体性的最后营垒,技术无法染指。作为一门思考人类自身的人文学科,史学必须警惕信息技术的广泛运用所导致的工具性话语霸权。如果不想失去在本学科领域的话语权,史学家就必须借助大叙事高扬人文情怀。唯大情怀者才能驾驭好大数据、利用好大数据,书写出真正关注人类过去、现在与未来的伟大叙事。
(作者为吉林大学教授)
领取专属 10元无门槛券
私享最新 技术干货