查看原文
其他

从概念模型到计算批评:数字时代的“世界文学”研究

赵薇 DH数字人文 2022-07-17

本文各部分分别载于《中国比较文学》(2019年第4期),《外国文学动态研究》(2020年第3期),《西南民族大学学报》(人文社会科学版)(2020年第8期),引用请以原刊为准,于2019年12月25号发布于公众号:零壹Lab。

-----------------------------------

摘要:本文以Franco Moretti(弗朗科·莫莱蒂),文学实验室和文本光学实验室的探索为中心,尝试用“世界文学”问题来检视“莫莱蒂道路”,发现其早期实证化探索所面临的悖论和难度,追踪它随后汇入数字人文大潮的轨迹。从世界文学最棘手的方法论问题入手,可以发现“远读”这一自法国年鉴学派的书籍史研究中舶来的观念,是如何被视为解决比较文学危机的有效手段却终究搁浅的;而其后具备了“文化分析学”面向的数字人文,则有可能将“世界文学”这一抽象而雄心勃勃,或停留在经验层面、偏于“经济决定论”的概念,发展成为可付诸生产性实践的计算批评的对象。

关键词:世界文学 远读 数字人文 计算批评 实证化 


Abstract:Focusing on the explorations of Franco Moretti, the Stanford Literary Lab and the Textual Optics Lab, this article attempts to use "world literature" to examine the "Moretti Road" and discover the paradox and difficulty faced by its early empirical exploration, along with tracing its trajectory and import into the wave of digital humanities. Starting from the most difficult methodological problems in world literature, this article shows that although the concept of “distant reading" (which derived from the Annales school) was regarded as an effective solution to the crisis in comparative literature, it eventually proved to be too limited. Only after “cultural analysis” turned towards digital humanities has it been possible to move beyond the level of experience and “economic determinism” in the abstract study of “world literature” to develop a more productive practice of computational criticism.

Keywords: World Literature; Distant Reading; Digital Humanities; Computational Criticism; Empirical

------------------------------------




世界文学问题与“莫莱蒂道路”


尽管使用计算工具进行“远读”式研究在20世纪三十年代起就已存在[1],但是现在看来,意大利裔比较文学学者、马克思主义理论家弗朗科·莫莱蒂(Franco Moretti)和其提出的“远读”(Distant Reading)观念构成了数字人文(Digital Humanities)在文学研究领域兴起的一大宗,似乎已成为一种深入人心的认识了。一般认为,2000-2003年间,时任斯坦福大学比较文学系教授莫莱蒂的《世界文学猜想》(“Conjectures on World Literature”,2000)和《再猜想》(“More Conjectures”,2003)等系列文章在《新左派评论》(New Left Review)相继发表,不仅在文学界引起了强烈反响,也让计算机辅助下的文本分析亦即“人文计算”(humanities computing)进入了“远读”时代。作者认为,在全球化已经推进了两个多世纪的今天,西方学院里的比较文学专家们仍然满足于反复“细读”被塑造为“经典”的一小撮英语文本,是无法描绘出文学和文化史的全部地形图的。在个人阅读的基础上,还须借助大量“二手阅读”的比较分析,对多语种的庞大档案库中的文本类别因素和形式元素做出“远距离”的抽象,才能得出世界文学发展、交流的宏观规律。“‘远读’的概念成为激进的时代口号,重新唤起人文学界思考大问题的雄心,预示着以计算机和‘大数据’来考察文化体系之时代的来临。”[2]由此,计算技术经由“远读”这一观念中介对世界文学研究产生深远影响,数字人文也因之与比较文学和世界文学结下不解之缘。


2013年,莫莱蒂将自己自1990年代起陆续发表的一批文章汇编成一部崭新的批评文集,取名Distant Reading(《远读》),交由老搭档、英国著名左翼学术出版商Verso出版。作为对自己二十年来学术道路的一次回顾性梳理,这种有意为之的“旧作重整”,让“远读”伴随势头正盛的数字人文再次进入西方公众视野。2014年3月,该书获美国“全国图书评论界批评奖”(National Book Critics Circle Award Winner)。而实际上早在2010年,Conjectures on World Literature一文就首次被译为中文。[3]此后,此文及其续篇又先后有两个中译本,分别发表于张永清、马元龙编译的《后马克思主义读本:文学批评》,以及大卫·达姆罗什和刘洪涛共同主编的《世界文学理论读本》中。这些编译标志着弗朗科·莫莱蒂开始作为“世界文学问题”重镇引起中国学界的注意。此外,在赵文对《后马克思主义读本》的介绍和导读中,《世界文学猜想》作为“世界文学争论第一阵营”之代表,同帕斯卡尔·卡萨诺瓦(Pascale Casanova)和普伦德加斯特(Christopher Prendergast)的观点形成对照,从这一格局分疏中不难见出莫莱蒂在世界文学理论和“后马”流派中所占据的独特地位。


事实上,无论在世界文学问题的理论链条中,还是数字人文的发展史上,莫莱蒂都具有承前启后、继往开来的意义。国内学界一直着重谈论其“承上”的部分,但就其对文学研究的社会科学范式的开拓而言,却无疑更具有“启下”的价值。莫莱蒂并非传统意义上的人文学者,其理论也不适合以单一的学科视角和标准来加以考量,他早年深受实证主义的马克思主义理论家、意大利的德拉·沃尔佩(Galvano Della Volpe)影响,他提出的包括“世界文学猜想”在内的很多理论“模型”还带有假说和尚待检验的性质,这些都促使他义无反顾地走上了实证化的试验和实验的道路,也许这样的探索本身就为古老的人文学注入了新质。而无论莫莱蒂个人的命运终将如何,都很难影响他成为世界文学和数字人文历史上一个“无法绕过的人物”。


莫莱蒂的身份是多重的,也被称为当代西方最具争议的理论家之一。他首先在“世界文学”的问题史上,和帕斯卡尔·卡萨诺瓦一道,上接埃里希·奥尔巴赫、勒内·艾田伯,下启大卫·达姆罗什等,构成了重要一环。其次,作为“六八一代”的莫莱蒂,几乎全部与世界文学相关的理论建构都带有一定的左翼色彩。在最近的一次公开访谈中,他再次追溯大学时期积极投身托派政治,为意大利《宣言报》工作的经历。他坦诚青年时代阅读卢卡契,深受其历史哲学和微观形式主义的影响,终其一生的努力不过是要以自己的实践将这两个面向捏合到一起。[4]他信奉多年的文化唯物主义和形式主义的马克思主义在和自然科学的物种演化理论天然结合后,[5]自然促使他借助布罗代尔的量化史观和华勒斯坦的社会经济体研究来解释世界文类的发展,从而将目光投向了形式社会史可测量和可操作的一方面,这也是他反对战后转而向形而上学启灵的德法哲学的重要步骤;第三,他自述当年为了世界文学研究,纯属“意外”提出了“远读”概念,但概念本身的影响力与日俱增,其革命性和颠覆性已遍布人文社科各领域,成为“数字人文”最响亮的代名词。紧随其后的,是他会同斯坦福大学文学实验室(Literary Lab)的同仁,征用计算文体学和自然语言处理等手段,从文学研究内部开辟出的量化研究途径。然而,这个时候的世界文学问题,已经真如他当年所预言的,被悬置为一个永远的“问题”,留待更年轻的后继者来“解决”了。


那么在文学研究中,“远读”为什么和世界文学问题最相关?其大致样态和旨求为何会从比较研究中较早浮现出来?莫莱蒂是如何以它来规划世界文学研究的“原初场景”的?这一系列极具实验性和先锋性的探索最终导向了何处?尽管在国内这一问题已有学者关注[6],但就大体而言,除杨玲的文章较早地涉及了文学实验室的部分,其他研究还是对演化论、世界-体系理论这些明面上的理论资源关注过多,而未能将莫莱蒂的意义切实地放到一个学科融合的背景中加以考量。实际上在《远读》中,莫莱蒂已从数字人文的角度回顾、评价了自己2006年之前的道路,也在某种程度上弱化了演化理论和世界-体系论对他的影响。而如果仔细考察莫莱蒂的言论,会发现他本人也认为,不仅远读,就连数字人文,“本质上也是集科学方法、解读方法、实证方法、理性主义方法各种研究方法为一身的一种形式”。[7]换言之,与时俱进的莫莱蒂对早期理论模型历史性的扬弃,顺理成章走上一条社会科学探索之路,实际上正构成了数字人文背景中的量化文学研究(或者说文化分析)的起点。这提醒我们,也只有从数字人文发展的后视视野来回溯,才更有可能将他受到的来自于统计学、语言学和一套为自然科学和大部分社会科学所共享的假设-验证的操作范式的绝对影响揭示出来[8],而这些,才是贯穿其探索始终,牵引其不断向前的动力,也属于被他策略性地隐去、却渗透在其远读批评中,运用得极其自然而化为无形的部分。因此,本文并不想再就世界文学问题本身诉说莫莱蒂的价值,而是尝试以一种“后见之明”来反观他的世界文学研究,以世界文学问题来检验所谓“莫莱蒂道路”的得失。这不仅是因为他和世界文学问题的重大关系,也不仅因为他的实践几乎囊括了“大规模”、计量化和可视化在内的数字人文最重要的几个面向,更是想把他的足迹理一条线索出来,发掘其背后的蜕变逻辑,让人们看到这一追求必然会面临的难度和悖论,还有它在数字时代终将为一种更具批判性和生产性的人文研究框架所取代的必然。






生物演化理论和比较语文学的遇合


今天,当人们谈论“远读”问题时,已经习惯了从《世界文学猜想》这篇文章说起。在这篇文章中,“远读”之所以可以作为世界文学研究的方法论基础而提出,很大程度上是因为,借助于比较文学和各国现代文学研究者所关心的“文类”形式的现代起源问题,几十年来为莫莱蒂所着迷的演化论和世界-体系理论两大资源终于被较理想地融入了一个概念模型(conceptual model)中。[9]在莫莱蒂,这是自歌德使用“世界文学”(Weltliteratur概念以来,人们第一次依靠模型,以一种理性的方式“看”清了“世界文学”问题的面目。


这个“世界文学体系”的模型,具体说来,由两个部分构成。其一是从恩斯特·迈恩(Ernst Mary)的异域物种生成理论和历史比较语言学的基本假说中汲取灵感,认为文学形式不断旅行、演化的历史,成功地解释了地方文化的分歧造成的早期全球文化形式的多样性,这种多样形态正奠定了民族文学发展的基础——就像是植物的生长繁衍,主要表现为一种绵延子代的力量;第二种机制则表现为“波浪”,也就是我们通常所说的资本主义席卷全球的浪潮,始自18世纪受世界市场驱动的世界文学一体化进程,这个说法,主要受惠于华勒斯坦的世界-体系理论(world-system theory)。两个过程在时间上有先后继起的关系,在功能上有交叉,奠定了民族文学和“世界文学”分化的基础。前一个历史时期中,本土文学的发展主要受第一种文化机制驱动,基本特点是分化和求异;其后,世界文学时代到来了,其主导机制则是散播(diffusion),一种保守性的力量,它通过无限扩张主导性文化空间来达到减少文学形式的目的。在莫莱蒂看来,歌德、马克思等所说的世界文学,更多是由后一种机制催生的。[10]


尽管现在看来,这与其说是“模型”,不如说就是两个宏大的认知隐喻捏合而成的“假想”,它的形成和提出方式,都带上了较鲜明的莫莱蒂特色。在马克斯·韦伯的社会科学方法论中,概念是获得经验知识的基本单位,也是经验科学反对直觉和唯心主义的基点。莫莱蒂对世界文学概念的构造方式,尽管离今日科学中的概念模型和推断检验还有很大距离,但此种先提出理论化的假设后走验证之路的方式,却是莫莱蒂的一贯追求,而且某种程度上,也是因问题固有的难度不得已为之的。总之,按莫莱蒂本人的说法,这也绝非写作《世界文学猜想》一文时灵光一闪的发明,而是其多年“实证”摸索的结晶。[11]


首先是演化理论和历史比较语言学的历史性遇合,这一征兆从十年前的“Modern European Literature: A Geographical Sketch”(《现代欧洲文学:一份地理草图》,1991)中显露出来,然而人们更容易看到的却是实证倾向与古典语文学之间紧张对峙的一面。正如乔纳森·阿拉克(Johathan Arac)观察到的,莫莱蒂对韦伯实证主义的继承,与库恩图斯(Ernst Robert Curtius)、奥尔巴赫(Erich Auerbach)等人对维柯的继承保持了一种内部的紧张关系。表面上看事实的确如此。这篇长文中,莫莱蒂反驳的一个重要对象是一战期间有着某种内在流亡经验的语文学家厄内斯特·库恩图斯关于“一个中心的欧洲”的论断,也即库恩图斯、诺瓦利斯等人的欧洲民族文学整体观。在莫莱蒂心里,伟大流亡一代苦苦缅怀的罗马性,某种程度上竟也是跨国现代主义背后的帝国主义的一种征显,所以《世界文学猜想》的开篇就宣称了所谓“比较文学的危机”:

“现在,民族文学已经不是十分重要,世界文学的时代已经开始,每个人都必须为加速这一时代而努力。”当然,这是歌德1827年对艾克曼说的话;下面是马克思和恩格斯在20年后于1848年所写的一段话:“民族的片面性和狭隘性变得越来越不可能,从众多的民族和地方文学中,兴起了一种世界文学。”这是歌德和马克思所说的世界文学。不是“比较文学”,而是世界文学:歌德在那次谈话时正在阅读的中国小说,或《共产党宣言》中(“给每个国家的生产消费赋予世界主义特征”)的资产阶级。简单地说,比较文学并没有按照早期的这些期望发展。它始终是个比较谨慎的知识行业,基本上仅限于西欧,主要在莱茵河一带发展(研究法国文学的德国语文学家)。除此之外没有别的了。[12]


从世界文学的角度思考“比较文学”的出路,必然走向真正超越了民族文学疆界的世界文学研究,而不是围着以法国文学为中心的德国语文学家们转。对德国语文学正统的不以为然,是因为在莫莱蒂看来,战后短暂复兴的这一学统依然像是本着一种民族文学的思维在发展,也必然是欧洲中心主义的,而并非真正的“世界文学”,所谓比较文学的危机也是民族文学的危机。


那么,与捍卫“岌岌可危”的古典精神针锋相对,各民族文学和欧洲文学体系之间的关系到底是什么?对莫莱蒂来说,迈恩理论中异域物种形成概念“allopatric speciation”的关键,也就是随着地理的迁移,新的物种诞生了——正可以很好地类比文类(genre)的跨地域发生。这一概念刺激莫莱蒂采用同样的理论构架,来建构近代欧洲文学的演化模型:他将文学形式视为各种物种,它们在多中心欧洲(polycentric Europe)范围内的“旅行”,造就了独一无二的民族文学样式的生成,如此,欧洲文学变成了一个有机的生态系统。这既不同于之前诺瓦利斯、库恩图斯等人得自基督教传统的“一个统一的欧洲”,亦不同于后来那个冲突、分裂、现代的欧洲模型(基左、卢卡奇等人的论述)。莫莱蒂此篇长文是要从根源上来论证这“第三种模型”的合理性,一种世界文学理论的“欧洲雏形”。


值得注意的是,从莫莱蒂此时的论证方式来看,其实并没有走一条和古典语文学家们截然不同的路,而是仅仅以巴洛克悲悼剧(Baroque Tragedy)在17世纪的多民族起源;长篇小说在18世纪欧洲的兴起,以及欧洲文学场在19和20世纪的中心化和碎片化为例证,来强调“空间上的分离”在这一过程中所起的决定性作用。值得注意的是,此中已初步显示出方法论的矛盾,用莫莱蒂自己的话说,就是摇摆于“抽象建模”和“生动阐释”之间。也即在理论建构上,固然受遗传学和语言学的激发,但是一旦进入具体的细读环节,便依然要延续传统修辞阐释的路数,这一点从莫莱蒂对巴洛克悲剧形式元素的变迁所做的历史分析中不难辨出。莫莱蒂认为无论在德国悲剧、英国悲剧还是法国古典主义悲剧中,都曾具有相同的形式元素,即作为君主的“悲剧英雄”和他的“葬身之地”,这可能意味着“一个整一的欧洲”的最初迹象。但是,当欧洲戏剧第一次被现代性触动,在短短几代人的时间里,一种稳定的、具有共同特征的欧洲戏剧被一种形式突变迅速取代。到十七世纪中叶,西欧悲剧分化出三到四种版本,一切都变了,词与行动的关系,人物的数目,风格语域,时间尺度,情节传统,空间移动种种形式,甚至连“悲剧”这个名字也不再被分享了……从这种阐释中,不难看到生物种化理论的基本观点同某一时期的比较语文学的契合,但重要的是,这些分析同时又是建立在对经典场景所喻示的象征体系“超越字面意思”的“重挖”之上的。也就是说,占据主导的仍然是一种扣显微言大义的隐喻思维,这使其在处理具体的悲剧问题之时,并未完全出离黑格尔的影响。只不过与经验科学发生奇妙的结合后,产生了以先验细节做支撑的理论模型——这种模型当然没有什么实证基础可言。


事实上我们需要知道,在莫莱蒂的早期思想中,此前为人们投入过多关注的演化说和世界-体系两种宏大理论之所以可以成功绾合起来,被用于描述文类跨语言发展的规律,两者看似不搭界,实则离不了担当中介的历史比较语言学(也即历史上的比较语文学)。据当今学者考察,语文学在19世纪的德国达到巅峰,在Franz Bopp、August Schleicher等人的经典理论中,根据词源学系统比较同一语系(family)中相互对应的字词,发现共同的字根,不仅可以利用字型、音韵上的转变差异,推衍出这些同系语言间的演变关系,确定它们的远近亲疏,追溯其“远祖的语言”,建立起谱系亲缘的树图(genealogical tree),还可以发现此一语系中语言的共同规律,以及各个语言自身的特点。这一思路也曾广泛的用于语文学家的比较校勘和文本批评工作。由于其时达尔文的演化理论已经风行,语文学家开始认为语言的演变很可能像生物进化一样,遵循“科学法则”,语文学应该能够找出这背后的语言基因图谱。[13]这种由比较语文学分蘖出的观念,直接启发了后来的比较文学和世界文学研究,也成为“远读”思想的一大来源,为弗朗科·莫莱蒂所直接援引。[14]他认为类似于世界语系的演化,世界文学也可能有相类似的体系结构。这后来发展成为他早期最喜欢运用的“演化树”(tree)方法,用于研究各种文学形式,特别是各类文体、文类的生存策略,其本质仍然是一种基于特征性选择的形态学。


Distant Reading中的语言学树图


然而,莫莱蒂对演化树的运用和语言学家还是有极大差别的。据James Turner介绍,时至19世纪,英语语文学家们已经形成了若干跨地区、跨国别的工作组,充满信心地开始加大对方言数据收集的力度,制作词汇表,以显示各语言族群间的关系,再以此来反向揭示每一种语族的起源和它们形成的谱系,以及各种语言的变迁过程,初步形成了“文字共和国”的雏形。[15]可以说近代的比较语文学是建立在较扎实的语料采样和调查分析基础上的。“遗传学和语言学之间的相似性反映了历史人口活动的可比的潜在过程。因为语言承载着文化信息,语言的进化提供了对史前人类文化的洞察”,[16]遗传学和语言跨地域衍生规律之间的可类比性很大程度上源于其共同遵循的数理统计规律,或者,至少是一种可计算和可证实(伪)性。也正是基于这样的认识,从印欧语系假说到汉藏语系起源研究的最新进展,[17]今天如果没有统计学和计算机的帮助,人们已无法将这种典型的跨学科研究推向深入了。相比之下,文学形式的谱系树在当时的莫莱蒂手里,却很难,也未必有必要获得更确凿的统计证据,而最多只是被用于解释诸如“自由间接引语”在各民族叙事中的形态变异;柯南·道尔如何以“线索”技巧,从通俗小说市场中最终胜出;又或者是好莱坞电影在向全球传播中所遭遇的本土化改装等等世界文学现象。在这一过程中,与其说重视的是历史事实和模型建构的一方面,不如说是在为形式旅行造成的功能变异说做生动注脚,用他自己的话说,则是做“验证”。放在传统理论背景下,固然可以为人们带来启发,不失为一种描述问题的好方式,但若仅止步于此,便难免流于机械唯物主义的比附了。此外,不应忽略的是,无论是演化论,还是历史比较语言学,莫莱蒂最看重的,还是二者对“功能”的强调。这很可能也与语言学中同样受俄国形式主义影响的功能主义流派在1970年代的兴盛有关。另一个更有可能存在的背景,则是基于量化实证的文学文体学自身在八、九十年代发生的“功能转向”。[18]这些影响在后来文学实验室的小册子报告中,以“语料库文体学”(corpus stylistics)的形态真正显形,如“文体-风格研究”项目中对语义韵的引入等。这其中的关联都是值得进一步分析的。






远读、统计推断与文学世界体系


在这一对照下再看莫莱蒂的文学形式演变构想,不得不承认,“远读”时期的莫莱蒂无疑还需要更丰富的经验数据,来对假设做科学的检验。如果说莫莱蒂所勾画的近代欧洲文学演变的草图,多少还都来自经典文本的第一手阅读经验,欧洲文学(“文学的欧洲”)在此的确充当了一个前提性的概念模型,或者说仅仅是一个“西欧样本”。但是当问题从“欧洲”推向“世界”,把更大范围内的亚洲、美洲、南美洲、非洲都包括进来的时候,则很难再延用此法了。否则的话,任何一个世界文学学者都将面临前所未有的难度——这也是莫莱蒂在《世界文学猜想》中煞有介事地抛出的方法论难题: 

“文学如今已经明白无误地成为了一个行星体系……当然,很多人比我阅读得多而且好,然而我们谈论的是百来种语言和文学。“更多的”阅读似乎并非解决问题的办法。尤其是因为我们刚开始重新发现玛格丽特·科恩称之为“伟大的不读的部分”(我可以声称:)‘我是从事西方欧洲叙事学研究的,等等……’(然而实际上)并非如此,我从事的只是它经典化了的一小部分作品,它们甚至占不到(这个历史时期和欧洲此地)已出版文学的百分之一。而且,有些人读得比我更多,但关键在于有三万种英国19世纪小说还并不在这个范围内,或者是四万、五万、六万,没有人真正知道到底是多少,没有人真正阅读过它们,也不会有人去读遍它们。而除此之外,我们尚有法国小说、中国小说、阿根廷小说,美国小说……。读的‘更多’总是一桩好事,但,却并非解决之道。[19]


世界文学时代是一个文学爆炸的时代,对任何一名凡人,吾生也有涯,以有限的精力只能蜻蜓点水地读完民族文学的极小一部分,更不要说世界文学了,这首先是“数量”上的不可穷尽。其次,如果我们像往常一样,只以占据实际出版百分之一的“经典”来代替全部出版物,是无法达成对全球资本主义文学市场的全面了解的。那么,要怎样研究今天的世界文学(市场)?莫莱蒂以夸张而略带玩笑的语气抛出了“远距离阅读”(distant reading)。这里,他直接搬出华勒斯坦和布罗代尔的社会史方法:“沃勒斯坦用一页的篇幅把多年的分析,他人的分析综合成了一个体系”,——这种对“二手”的强调毋庸说带有故作惊奇的玩笑意思,其实更是想引起人们对将社会史方法应用于文学史的充分注意,也成了后来屡遭诟病的地方。2016年接受访谈时莫莱蒂再次强调这只是“最后一秒钟加上去的”,可以说只在一念之间,他原本想使用的是“serial reading”(序列阅读)的概念,出自法国年鉴学派著名的“计量系列史”观念,在针对启蒙运动时期的法国书籍史研究中得到了大规模的应用,产生了卓有成效的影响。这是一种从书籍的生产、发行和社会传播的真实经验状况入手调研,力图揭示思想在公众群体意见中的总体演变轨迹的方法。莫莱蒂的本意是将法国书籍和社会文化心态史的研究范例引入文学史研究,但他灵机一动选择了“远读”的说法。至于远读这一概念如何能够将主攻生产和传播的书籍史研究无力触及的“文学形式”部分也包括进来,莫莱蒂则不忘回到“The Slaughter House of Literature”(《文学屠宰场》,2000)就提出的观点上来:“远距离阅读:我再重复一遍,在此,距离是一种知识条件:它让我们着眼于比文本更小或更大的单位:策略、主题、修辞——或文类和体系。而且,如果在非常小的单位和非常大的单位之间,文本消失了,人们可以正当的说,少即是多。”也就是说,远读不仅仅是指拉远了距离观察,一切便可尽收眼底,而是要完全跳出原来的“维度”,使知识的“条件”(condition)得以彻底改变。这样,我们关注的对象就变成了一系列的策略、主题、修辞、语言陈规等“变量”与文类、文学体系——这些更高层次上的文本统计学单位之间的关系,这种关系,从另一种角度展现被我们“略过”的由单一文本组成的整体状况,是一种统计表征的“视觉”效果。在此,“远读”虽说是作为世界文学的方法论而提出,其内涵却指向一种基于测量统计和视觉呈现的“量化形式主义”方法,在其后的Graphs, Maps, Trees: Abstract Models for Literary History《图表,地图,树图:文学史的抽象模型》,2015)和斯坦福文学实验室的数字人文实践中有了更广泛的应用。值得一提的是,莫莱蒂在注释中再次引用了韦伯对“概念”的理解:“‘概念主要是智性掌握经验数据的分析工具。’显然想要研究的领域越大,就越需要能够掌握经验现实的抽象‘工具’”。(莫莱蒂 2000:127)在此,借助于概念模型来建构“世界文学”,就像建构了一个韦伯意义上的理想型概念,它虽然并不一定是“实在”,但是能够帮我们“抽象”地掌握关于世界文学的经验现实。构造模型即是“远读”的手段之一。


在此,“世界文学”是作为“远读”方法和世界-体系理论的“例证”进入人们视野的。只不过,无论是这个例子本身,还是莫莱蒂的论证都有很大问题,随后引发的争论也将焦点带离了“远读”。其内在逻辑是:由于华勒斯坦使用经济史的方法,发现了世界体系具有核心、半边缘和边缘区域,莫莱蒂认为他也以近似的方法“发现”了“文学世界体系”中的这三个结构。只是,这近似的办法并非是经过亲自挑选数据进行测算,而是建立在大量他所信服的民族文学专家、同时也是马克思主义者的研究“证据”上的,再加上他自己研究欧洲文学的心得,将这些现成的结论合起来作为样本,便“推断”出了世界文学体系的总体参数。和后来的研究比起来,这只能算是相当牵强的“远读”,而远非理想模式,其唯一共通点可能还在于他所采用的“实证”路径:为了说明文学世界体系的“不平等”已深深嵌入了“作为社会关系之抽象”的世界文学形式中,他首先从詹姆逊关于柄谷行人的研究中得到启示,认为来自核心地区(通常是法、英代表的西欧地区)的文化影响,在到达体系的边缘或半边缘地区时发生了一种“折衷”(interfere,或译“折射”),表现为外来因素对自律性的干涉,[20]在莫莱蒂这里则用于描述受到了全球化影响的民族叙事艺术,变成了地方传统中的“本地原材料”和西方“外来形式”的“妥协”,也就是后发的本土文学已经无法坚持自己的形式传统,而必须将外来内容灌注其中,才能获得现代性的新生,这样一种在莫莱蒂看来是普遍存在的现象。接着,为了“验证”这种非自主性是否普遍成立,也即是否来自一个更大的“总体”,他开始做“实验”,做“大规模”的检验。然而所谓检验,也不过是翻查了:“加斯佩雷蒂和戈希洛夫关于18世纪晚期东欧的研究;托斯基和马蒂·洛佩兹的19世纪早期南部欧洲;弗兰科和索莫的中世纪拉美研究;弗里登论1860 年代的意第绪语小说;默萨、萨义德和艾伦的1870 年代阿拉伯小说研究……”莫莱蒂认为,来自于“四个大陆、两百年、二十多个独立批评研究”都支撑了詹姆逊的“规律”。而且完全可以进一步表示为“外国情节”+“本土人物”+“本土的叙事声音”的简单三角关系,但同时,这结构又非常不稳定,尤其体现在19世纪下半叶不稳定的亚洲叙述声音中(如赵毅衡所说的晚清小说“苦恼的叙述者”)。这种不稳定其实正显示了难以弥合的“裂缝”的存在,证明了世界文学其实并非一体,英法核心的压力试图令其“一体化”,但是“差异”其实是难以消除的,所以“世界文学研究必然是对世界争夺象征性霸权的斗争的研究”,由于各地现实的不同,西方的影响在各地也是不均的,导致了所谓“不平衡”的出现。最后,莫莱蒂以看似轻描淡写的方式抛出了一个并未能引起人们重视的结论,却是这个“实验”的重心和意义所在:

“詹姆逊的‘规律’通过了检验——虽说是第一个检验。而事实上还不止如此,它完全颠倒了业已接受的关于这些问题的历史解释:因为如果外国和本土的妥协如此普遍,通常被视作小说兴起之惯例的独立发展轨迹(西班牙、法国、尤其是英国的情况)就不是惯例而是特例。它们首先兴起,但并不是典型。典型的小说兴起于克拉西茨、凯末尔、黎刹、马兰——而不是笛福。”(着重号为引者所加)


事实上即便在今天,如果不以一种“远距离”,或者说最基本的统计学眼光来观照,仍然难以察觉出这一字一句试图传达的颠覆“常识”的努力。在研究西欧现代小说多年的莫莱蒂看来,“远读”思想指导下的大面积“验证”,实际上“翻转”了普遍和特殊的关系。也就是说,以前被欧美学者树立为“典型”、被强势文化构建出的范例如《小说的兴起》中笛福、理查逊、菲尔丁等西欧小说自主发展的模式,实际上只是由某种特定范围内抽取出的“特例”,而非来自总体样本的“惯例”,以它们来指代世界文学体系实则是一个小概率区间中的“零假设”,必须被拒绝。反过来,真正的“典型”,属于那些默默兴起于少数族裔和殖民地区的,所谓体系“边缘地带”的“民族文学”作家,属于第一个波兰语小说家克拉西茨基(Krasicki)、属于菲律宾民族英雄梨刹用西班牙语创作的反殖民小说《社会毒瘤》(Moli Me Tangere),属于二叶亭四迷的《浮云》,属于法属圭那亚作家马郎(Maran)在1921年创作的《霸都亚纳》(Batouala)……等等“沉默的大多数”。换句话说,两种“现代文学”的发展轨迹并不属于一个同质性的空间,而是有根本区别的,这种区别说到底还是由来自英美的核心压力造成的。这一发现,当然得益于拉开距离的“阅读”,只有“拉开距离”,转换观察的“条件”,才能增大取样和检验的范围,才有可能放弃原先的欧洲中心视角,转而才有可能将视线重新聚焦至被忽略的半边缘和边缘区域。


在今天,重提大样本的政治代表性已成为人们再熟悉不过的批评理路,单纯从大样本的角度去重视玛格丽特·科恩所说“伟大的未读(great unread)”,也不复具有当年的激进意味。正如Underwood指出,无论是从文学生产的角度标榜大样本,还是从接受的角度挑选有影响力的经典,都有其合理性。对于“远读”的争论必将围绕世纪末的“经典重估”运动和被后殖民批评裹挟的“第三世界批评”潮流而起,[21]只不过,在这一潮流中被加以重审的性别、种族和阶级不平等现象,都从莫莱蒂的“世纪猜想”中获得了某种“体系性的解释”。[22]然而有意思的是,也正是由此种“远读”式的检验方式中暴露出的问题,引发了来自左、右两个阵营的激烈批评。


首先是暗含在“核心-边缘”模型中难以剔除的“欧洲中心”和“经济决定论”倾向,这种倾向意味着很大程度上仍然否定了边缘、半边缘甚至是核心区的自主性。三年后的《再猜想》中,针对各民族文学学者就各自民族文学发展史的经验提出的反例,莫莱蒂总体上承认了文学的发展与经济不平衡并非平行关系,而是有多种可能,具有与“经济不平等不相符合的不平等”,如18、19世纪英法两国长时间的争霸结果以英国胜利告终,在叙事世界结果相反,法国小说比英国小说更成功,其形式也更重要——但同时他仍然坚持形式的影响不会朝各个方向随意发展,而是形成一定方向和趋势,“中心到边缘的移动是迄今最频繁的”,很少相反。这一次,他再次强调了“半边缘”的能动性,如彼得拉克诗体在本国衰落后,彼得拉克风却登上了国际顶峰。唯一让他让步的,是关于西欧小说本身的绝对“自治发展”问题。他注意到早期英国小说也存在“模仿塞万提斯”现象,即也存在“地方与外来形式的折衷”,但这反而让他更加强了“形式总是相对力量的折衷”这一认识,亦即所有体系兴起和发展过程中“干涉”作用的“普遍性”:“没有不经过本地与外来因素折衷的文学”,但是,这不是说所有类型的干涉和折衷都是相同的:“流浪汉小说、囚禁叙事、甚至成长小说对法国和英国小说家的影响不可能与历史小说或神秘小说对欧洲和拉美作家的影响相同”。经过三年深思熟虑的莫莱蒂再次重申:“更重要的不是争论这些,而是我们应该找到某种方式来表现这种不同”。


如果仔细阅读这些答辩,顺着其内在理路,也许会感到,如果莫莱蒂还有下一步的打算,则可能是从关于世界文学的推断结果和“误差”出发,以民族小说兴起的可能性空间为“样本”,亦即以有多少种“折衷”的方式作为变量,对所谓文学世界体系的总体趋势进行进一步的推断。他期望从中发现某些规律、模式和参数,比如说,至少都是从文化中心向文化边缘地区流动,但是具体流动的样态差异需要被重新表征,以此来确认它们是否真的存在于一个体系化的时空中——这才是建构一个模型应有的步骤。毋庸说,和世界文学猜想一样,这也将是一个更具野心,也极富空想气质的计划。之所以这样说,是因为一旦真的想要“操作”起来,便会发现将此种方法实施于极其复杂的文学范畴时有可能面临的手段-目的、方法-价值间难以克服的矛盾。也就是说,他一方面承认世界文学存在种种不平衡发展的宏观模式,另一方又暂时只能从极其具体的经验性证据下手,去发现各种现代文类兴起的样态,他企图以此为突破口,获得方法论上的提升,然而,这在为他带来洞见的同时也带来了现实操作中的麻烦:例如,当从“差异”出发时,莫莱蒂已经意识到衡量“折衷”方式之不同的关键变量还在于不同地域现代小说的“叙述声音”,但他却认为这是民族文学研究的任务,因为只有民族文学专家才具备深入分析本民族语言形式的能力,所以他事实上又是无法从“差异”出发去做民族文学的细读研究的;至于他自己的着眼点,仍然是“观其大较”的“社会形式主义”,是“差异”能够形成何种“模式”的问题,这才是他赋予世界文学研究的本职要务。因而,他所倡导的比较形态学不应该拘泥于单一个例的形式分析,也不仅仅是文化群体间的比较分析,而更像是一种文化分析(Cultural Analytics),即关于“差异”的差异分析。但是如何去进行?莫莱蒂给出的方案是世界文学研究仍然要服从于民族文学专家,在具体操作中,还须仰仗各民族文学专家的“合作”来完成,具体到这个实验中,便是只能借助国别文学评论家的“二手”阅读来实现。由此,乔纳森·阿拉克(Johathan Arac)才不无夸张地指出,在为比较文学学科做新规划时,莫莱蒂提出了一个“令人震惊”的论点,他要求比较文学学科放弃自己的“语言状态”,而把它留给各民族文学去解决。实际上,莫莱蒂在此遇上了世界文学无法回避的基本问题:翻译。反对者继而认为,莫莱蒂快刀斩乱麻地略过了全球语言的政治问题,这种忽视是以忽视英语在全球信息交换过程中的实际作用为表现的。就像他之所以能够在各大陆学者的二手研究资料上直接得出结论,靠得无非是英语这种关键媒介。[23]如此,英语作为一种有隐蔽的帝国主义特征的世界语言,它传播的只是盎格鲁中心主义的全球性。也就是说,尽管他和卡萨诺瓦采取了布罗代尔-华勒斯坦的世界-体系理论,强调的是文学在不平等的经济体系中得以生产和流通的状况,甚至是要通过“远读”的方法来揭示“世界文学体系”中的权力机制,但是他自己如果跨过民族语言来搞世界文学,就无异于默认了英语作为“世界语言”的实际霸权,这就在无意中再生产、“再铭刻”了霸权文化中心的效果。[24]


事实上,如果真如阿拉克的理解,2000年的莫莱蒂让比较文学“放弃自己的语言状态”而走向“远读”,与此同时被赋权的便并非只有作为学术媒介的英语,还可能包括了完全遵循另一套编码规则和逻辑的数理语言。我们看到无论是后来莫莱蒂自己的“远读”研究,还是斯坦福大学文学实验室的合作研究,基本上无一例真正触及他国文学,而都是以英语文学发展为主要样板的,从而真的形成了某种英语语系优先的趋势,就颇能说明问题。可以说莫莱蒂的方法论在某种后殖民立场前遭遇了无情挑战:一套基于统计分析的符号语言便一定具有某种普适性,可以如“世界语”一般取代民族语言的位置,将文化差别“无差别”地“远读”出来,让“差异”在更高的层面获得各种通行的表达式了吗?此种方案在当时的确更像是一种权宜性的“后撤”。我们后来意识到,对数字人文至关重要的标准通用标记语言(Standard Generalized Markup Language, SGML)和以文本编码计划(Text Encoding Initiative , TEL)为代表的普及性协议(common protocols)依然附着在主导语言载体上,这种全球通用标准在很长一段时间段内处理起其他非字母语言来也未必友好。可见想要借助技术手段为世界文学实践划出一片“飞地”仍然困难重重,任何学术研究都要时刻保持对其意识形态前提的反思,作为一种工具和手段的数字人文更不例外。






方法论的难题


此外更重要的,是由上述矛盾牵扯出的关于“证据”本质的思考。如果说凭借其出色的外语能力,2000年之前的莫莱蒂还有可能凭借一己的阅读经验去“证实”某种西欧范围内的假说,那么什么样的证据才可以被用于推断更其宏大的世界文学猜想?从莫莱蒂所追慕的实证科学的角度来看,以“二手”批评来做进一步推断,这终究不合乎规范,连自己课堂上的学生也难以说服,即便放在文学经验科学的历史上也是十分棘手的问题。这里涉及的关键问题恐怕还在于,如果将“变量”让位给不同民族文学专家的研究结论,则不同的主体经验有可能造成样本间无法忽略的误差,那么,要如何将这些更复杂的因素控制住,或是考虑进来?这实在是当时的莫莱蒂无从顾及的,而从根本上讲,也与Gladstone所说的对“事实”(fact)和阅读(reading)的混淆有关。Gladstone认为,在研究19世纪英国侦探小说市场的《文学屠宰场》中,莫莱蒂并没有像Radway在那本开拓性的Reading Romance中一样,将结论建立在对真实读者的阅读进行问卷调查和抽样分析的基础上,而是认为“线索”的胜利在于读者对于有线索的小说所做出的形式选择,然而对这一假设的支持竟然来源于一篇分析电影大片儿的经济学论文以及本雅明的理论。[25]这远非纯粹的经验研究。这种半截子实证主义使得莫莱蒂的“远读”不过是一种远读式的文学批评罢了。



Goldstone的判断是正确的,却也让人不禁忧虑,一旦文学史研究全部跨入了实证领域,那它和以阅读史为对象的社会学研究还有什么区别呢?审美感兴、文学阐释和文学批评的位置又何在呢?实际上,在这篇文章的注释中,社会学家们已经讨论了流行于数字人文圈子里的“莫莱蒂的远读”,还有基于小范围内容的社会学的“内容分析”。Gladstone文章值得警惕的地方在于他从根本上否定了阅读,提倡“不读”,因为凡是来源于阅读文本的数据(他称之为“文本化”),都不是一种“事实”,应该摒弃。那么,到底有没有一种可称为“远读”的研究方法呢?这一类问题,也许只能靠此后的数字人文实践来解决了,但在此时,关于什么类型的证据可以作为变量来构成样本的疑问,却至少质询了哪怕是在模仿和类比意义上对世界文学总体进行“统计推断”的正当性。


尽管有太多不尽人意的地方,《世界文学猜想》仍被作者视为一个重要开端。此文十四年后收入《远读》时加入了一段按语,回顾了当年(1999)欲改革哥伦比亚大学比较文学系而写作的起因。[26]在这段事后追溯中,莫莱蒂特意强调自己之所以走向华勒斯坦这一十分强大的概念模型,是因为世界-体系理论恰恰“印证”了他在此前多年的欧洲小说研究中得出的结论,也和他自1990年代起的“实证研究”中收集起来的一系列事实证据正相吻合,如在欧洲文学研究中多次提到的法国大陆的中心性;在Modern Epic(《现代史诗》)中分析过的半边缘地区文学独特的生产性,和在Atlas of the European novel, 1800-1900(《欧洲小说地形图:1800-1900》)中出现的“不规则的叙述市场”等等。此处对“实证”路径的反复自觉颇有意思。因为我们知道,莫莱蒂早在1970年代就接触到华勒斯坦的书并大为震动。所以这与其说是经验性的探索在前,理论归纳在后,不如说是带着某种理论预设去寻找证据,继而对别人的理论做进一步的演绎和发挥,恰如这篇文章正文中所示:“我是想把产生于社会历史阐释框架下的结论应用到文学史之中”。这和1990年代以来自北美社会历史研究中大批涌现的“世界体系分析”如出一辙,但平移到文学研究中来却极易留下不够“科学”的印象。莫莱蒂的意图在同属早期的《文学屠宰场》中表现得更明显。他申述说当时是在用侦探小说写作策略的个案“反过来”验证或挑战文学形式演化模型的合理性,甚至,多年后他承认这一证实或“证伪”也并不成功,失败逼迫他去调整自己的假设,这一过程实在激动人心,因为人们甚至可以顺着这个方向去重写文学史,去思考诸如“简·奥斯汀的对手”之类的题目,去打捞那些被遗忘的文学形式策略,去辨认出它们有可能为历史发展提供的各种“功能”和方向——也就是说,从“非经典”的方向来逆向考察现有的文学史。[27]这种假设检验的思路,最早形成于Signs Taken for Wonder(《奇迹的先兆》,1983),在后来的“Style, Inc: Reflections on 7000 Titles”(《风格公司》,2009)中达到了顶峰,被莫莱蒂得意地称为“证伪批评”(falsifiable criticism),当然可以为既有的文学史研究带来启发,但是放在纯粹的经验科学的角度来看,依然有点不伦不类,可能要同时遭遇来自两个领域的双重麻烦,所以又只能将其界定为“量化形式主义”的文学社会学,这一思路一直延续到文学实验室时期才暂告一段落。


综上所述,以今之视昔,可以认为一种假设-检验-“建模”的实证化冲动主导了莫莱蒂的整个“远读”时期。一百多年来,作为一种概念形态的世界文学第一次在莫莱蒂手里被“实存化”,企图变成像实验科学一样可操作的问题,虽然这一操作并不具有实际意义,但孕育其中的方向却相当难得。可以说莫莱蒂对研究惯习的打破的确值得称道,然而如何做客观量化的文学史研究,取得较纯粹的、同质性的“证据”(数据),却一直是取道自然科学者必须面对的难题,也注定会为文学研究带来风险。之所以会出现这种两难情境,是因为与其他精神现象相似,文学研究说到底还是一个主客互动的过程,一千个读者会有一千个哈姆雷特,阅读、理解、共情、阐发各环节中的知、情、意过程何其复杂,要如何控制和测量方才算得上“科学”?同样处在由狄尔泰开启的“精神科学”传统中的莫莱蒂,无疑更认同韦伯关于经验科学的客观化认定,也曾尝试遵循实验心理学和认知科学的方法,来研究阅读过程中的经验主体,这一相当小众的探索方向在文学研究领域内部也的确存在过,[28]但是由于跨过了作为中介的文学语言,仍然很难对处于核心地带的文本论构成实质影响。所以,出路还要从社会因素真正赋身的“形式”上找。


也许正因此,2000年后的莫莱蒂几乎放弃了以二手批评为根基的偶一为之的“远读”,甚至宣称自己其实从未想过要以真正的经验性数据来验证“世界文学猜想”。此后他一方面在意大利编译出版了长达5000页的百科全书式小说理论集Romanzo(《小说》,2002,2003),收录各国学者论本民族小说的代表性文章,多少有辅证和总结前一段工作之意;另一方面继而转向了从阅读和传播实际的角度来研究世界文学的社会学思路;等真正的实验室团队组建起来,数字人文成为一种不容忽视的潮流后,则索性回归了几乎完全实证化了的语料库语言学和计算文体学。这一类以语料为数据的量化研究,无疑更符合莫莱蒂“只解释验证,不发现,更不以非单一作品介入社会批判”的研究原则[29],其新意更在于他所标举的“大规模”和“长时段(中时段)”这一点上,因而也终至显示出了某种保守性。



但是无论如何,我们今天看来,莫莱蒂为世界文学研究指出了可实证化操作这一理应该存在的“新”方向,这之所以能够成为可能,其前提还在于,正是在莫莱蒂手里,借助于对一个“概念模型”的构想,“世界文学”完成了从确定性观念向可能性空间的初步转变。也正是在这一意义上,对于莫莱蒂的“世界文学猜想”和其早期道路,我们如果不从概率论、语言学和实验检验的角度加以疏解和考量,是无法获得通盘理解的。可以说无论是生物演化论还是世界-体系理论,如果不以统计学这一古老又年轻的数理科学为中介,是很难对世界文学概念的形成发生影响的。从这个角度,可以更透彻的理解为什么莫莱蒂要关注那些“伟大的不读”——对作为一种可能性空间的“世界文类”的演化形态来说,关注“不读”的部分,并不是一种非此即彼的选择,而是说要关注整个演化树。这意味着不是去关注某个演化分支结构,更不是最高枝上那百分之零点五的可能性,近乎不可能的一种可能——相反,正如《文学屠宰场》的思路所暗示的,一整棵演化树却意味着历史不可避免的全部可能性,才是历史发展最终的“总体性”所在,也是站在一种“概率论的现实”的立场上对形式发展演化的全部可能做出的总体性观照。在后来的《图表,地图,树图》中,演化树正式发展成为“世界文类”衍生、传播的形态学。此后,莫莱蒂开始真正学习布罗代尔构造地中海经济模型的方式,也力图在重要的文学理论和文学史问题上构造量化模型。只不过计量史学以价格曲线、人口数量、工资利率变动等为对象,而量化形式主义则致力于以描述性的统计模型,来“总括”形态,来解释一些文学基本问题,例如不同尺度上的文体-风格模型、世界小说兴起的模型、经典生成的大型动力场模型……。至于本文所关心的实操意义上的世界文学模型的建立和检验,以及如何释放这一工作所蕴含的批评潜能等相关问题,也只能被暂时搁置起来。因为这种工作无疑需要对更大范围内的国别文学语料进行抽样、统计和建模,需要民族文学的批评家、统计学者和计算语言学家的通力合作才能展开,这一切,也只能留待更年轻一代数字人文学者来付诸实践了。






世界文学问题域中的“远读”


关于“世界文学问题”的论争,在《再猜想》(“More Conjectures”,2003)发表之后似乎暂时告一段落了。相比《猜想》发布后的热闹,《再猜想》引来的左、右两派的激烈批评,更多是针对“远读”方法本身。此后,被“逼上梁山”的莫莱蒂,开始利用大量现实数据,以一项项量化形式主义研究,向学界普及他所谓“远读”的要义,用自身行动打破批评界对他只专注于理论的印象。值得注意的是,尽管这其中只有一两项研究可被视为接续、辅证了《猜想》中的观点,但已能令人强烈地感受到,作者对模型的热情是与对方法本身的探索相关联的,这些都使得昔日的“世界文学猜想”在某种程度上真的变成了一种“猜想”,至少在莫莱蒂的实践道路上,留下了一个难以完成也无需完成的问题,一种构成知识的永久“条件”,倒是几项由世界文学生产延伸出来的研究,铺就了通向数字人文和计算批评的坦途。


恰如2005年出版的《图表,地图,树图:文学史的抽象模型》(Graphs, Maps, Trees: Abstract Models for Literary History)一书的标题所显示的,莫莱蒂在这一阶段开始转向了对实存而非观念意义上的文学史做真正的远读研究。这部书由三篇论文构成,曾首发于2003年的《新左派评论》上,其写作初衷也可认为是接续《猜想》《再猜想》,即以自己的实证化探索来对此前的“世界文学论争”做出回应。对此时的莫莱蒂来说,“二百本十九世纪英语小说构成的经典序列,远远少于实际出版过的三万部作品”[30],在这方面,含英咀华的“细读”并无太多用武之地。所以必须继续“寻找更少的要素,以换取对这些要素之间的关联更敏锐的洞察。形状,关系,结构,形式,模型”(Graphs:1)。不难看出,描述和建构模型的冲动仍主导了他这一时期的研究。


这本书使用的三个“模型”借用自三个曾经与文学研究都不太相干的领域:量化史学中的图表(graphs),地理学中的地图(maps),以及演化论的树图(trees)。其中真正与世界文学问题有关的部分,来自作者对第一和第三种模型的阐发和应用。但实际上,只有第一项研究可看作与《猜想》中的抱负直接相关,因为这是一项用统计分析图表来再现“世界小说的兴起”与文类霸权周期性更迭的实证研究。在这项研究中,莫莱蒂名正言顺地采取书籍史研究的手段,和几位研究英、法、日、丹麦、意大利、西班牙、印度以及尼日利亚的书籍史学者合作,使用他们提供的出版发行数据,将某一时期各国小说先后兴起的情况可视化出来。如果按照《猜想》和《再猜想》中的理想思路——随着统计图表的变换,在不同粒度的统计指标之间进行切换,研究者应致力于去发现不同国家小说兴起的差异模式——但遗憾的是,莫莱蒂最后也不过是以自己熟悉的英国小说为聚焦,对“远读”的方法给出了有示范意义的介绍。


首先是在主要趋势上,莫莱蒂发现来自三大洲五个国家的情况十分相似:从十八世纪二十至四十年代的英国到二十世纪六十至八十年代的尼日利亚,尽管前后相差二百年有余,但是从曲线图来看,这些国家的小说几乎都在各自关键的二十年间经历了出版速度的“剧增”阶段,完成了“兴起”的过程。如果分别以各个国家的小说出版量为纵轴,以年代为横轴,又会发现在短短几十年内,各民族国家小说的兴起模式各具特色:英国小说经历了三次持续性的崛起,才逐渐达到顶峰;日本小说的曲线趋势则体现为先繁荣,又下降,再上升,如此反复的“钟摆式运动”,而日本小说的产量曾一度超过英国小说,这很可能是随着政权和书籍审查制度的更迭而发生的必然变化;丹麦和意大利、尼日利亚及法国小说都表现出趋同的模式,唯一的例外是英国小说对印度的进口,在1857年叛乱后急速上升,似乎颠倒了殖民关系,这种上升在英国突然加速象征性霸权的建立时达到顶点,而后进口的趋势又回归到1857年之前(Graphs:5-12)。莫莱蒂认为,如此轮番观察,似乎只能带来个体化的解释。于是他接着以英国小说为例,认为寻求某个独立事件发生的原因(如为什么英国小说在1775—1783,1810—1817年间有两次回落),解释将可能是多重的。诸如拿破仑战争,纸张涨价,重印数波动等可能的因素,都只构成模式形成的一部分原因,但人们必须解释的是作为一个整体的模式,而非一段时期内的现象。所以,为了识别作为整体的兴起模式,需要以布罗代尔(Fernand Braudel)所谓的“中时段”作为观测范围。因为,长时段只有稳定的结构,短时段只有潮流没有结构,中时段是唯一将历史潮流包含在短暂结构中的。文类(genres)是“中时段”研究真正的主角,它不仅是“历史潮流”(flow)与“形式”(form)真正的遇合点,也是物种形成理论最直接的对应物。莫莱蒂此时的落脚点也再次说明了为什么在世界文学问题上,人们曾一度聚焦于文类。[31]


但令人颇感意外的是,接下来的统计和可视化呈现尽管是以“中时段”为范围,莫莱蒂却并没有再对各国差异做进一步的抽象,寻求更细粒度上的共性,而是转向了统计其他变量对小说兴起的影响。这其实和莫莱蒂自身对统计学的理解和运用水平有关——后文还会详细提及——例如,如果将更多的亚文类囊括近来,对其按年代迁移做聚类分析,就会发现四十四种英国小说亚文类在二百年间此消彼长的兴替过程中已经初步形成了“聚类化”(clustering)的形态(如图一)。就是说,每二十到三十年,一波新的文类就会活跃起来,同时某些旧文类会相应衰落。莫莱蒂认为什克洛夫斯基(Viktor Shklovsky)只是定性地描述了这个现象,却无法发现这个隐秘的周期规律,其实最好的解释当然是卡尔·曼海姆所说的代际更替(generation)[32]。至此,莫莱蒂认为,当量化不能再提供任何东西的时候,必须走向形态学的解释。

英国小说亚文类(1740—1900)(Graphs:19)


其次,与此相类的是性别变量导致的模式循环。莫莱蒂认为,在十八世纪写作的性别问题研究中,“性别”是文类下面经常会被考察的一个次变量,相关话题曾争讼不断:十八世纪到底是女性写作不断崛起的世纪,还是男性依然占据中心,以将女性驱逐出去为主导趋势?若将前后一百年间发生的事情用图表表示出来,会发现这不过是在女性写作和男性占据主导之间的五次范式转移而已(Graphs:27)。除了性别的转移和小说的兴起,类似的还有对高眉现代主义(High Culture)和流行文化的区分。在莫莱蒂看来,曾经的研究者都以为他们有了独一无二的发现,是因为他们没有从整体的角度拉开距离看,从而导致看到的只是中时段的一个瞬间——只见树木不见森林,而“远读”却是要发现和追问钟摆式隐秘运动的机制到底是什么。这需要进一步分析次变量间的冲突,因为只有冲突才是常量,这也是只有在中时段层面才能观察到的。


至此,中时段的各种循环构成了横轴,而文类的生产则是纵轴,二者当然不是小说史的全部,但却让我们看到了多样性,看到了复数的“小说”。小说不仅是一种基本的形式,不仅是前人以为的现实主义、辩证法、罗曼斯、元小说……若这样定义小说,就忽略了百分之九十的文学史。从宏观上看,莫莱蒂求助的仍是演化理论,但却不再追求一种遁入无形的运用效果,而是很明确地将结论表示为统计图表,且具备一定的可操作性了。因为人们只需设立一个时段,然后考察某种文类和所受诸影响变量之间的关系(在这项研究中,先是国别,后是亚文类,最后是性别),再获得一系列同质化的范畴(如“英国小说”“反雅各宾小说”等形态学概念),继而在更细的粒度上考察次变量内部的冲突和矛盾,从而发现整个文类体系的全貌,就完成了对文学史的共时和历时性研究。这种最基本的统计分析框架,后来被马修·乔克思(Matthew Jockers)发展为针对文学史具体问题进行“大分析”(Macroanalysis,又译宏观分析)的研究,显然更有意义一些。然而在莫莱蒂这里,他所关心的对象,与其说还是曾经的“世界文学”,不如说是长篇小说这种文类自身的演化规律。就此一时期的莫莱蒂而言,较多地诉诸演化论的解释,就像是什么也没有解释一样,仍停留在人们的常识范围内,这无疑让人们对以经验的方法证实“世界文学猜想”的期待再次落空。


此书涉及的第三个模型是演化树(Evolutionary Trees),主要想借助对演化树谱系的简易绘图,来解释某种文体策略的微观文化政治功能。对莫莱蒂来说,这一篇是其马克思主义形式理论的真正起点,也是将形态学和历史主义融合为一枚硬币之两面的开端,因而在量化的程度上显得更加“初级”。然而,由于演化树关注的是文学形式跨越民族国家疆界不断衍生变化的“实存”历史,所以讨论的是地道的世界文学问题,某种程度上也可视为“世界文学猜想”在偏向演化理论路径上的具体生发。在这部分中,莫莱蒂是通过分析自由间接引语的跨民族演化史进入到对文体特征政治功能的微观解释层面的。这一思路,已经比《猜想》中单纯举出某种“边缘地区”现代文学的发生情形要高明许多了,因为它是以一种明晰、具体,又有全球特色的叙述语体的形式演化为分析对象的。以某种全球流播的现代文学技巧为跟踪对象,这种做法为后来的文化分析学者对世界文学现象进行特征化建模和追踪提供了可资借鉴的思路。


我们知道,西方语言中的“自由间接引语”(free indirect speech,以下简称FIS)直接表述就是“叙述者的动词时态和介词,加上人物的语调和语句顺序”(Graphs:81),指在人物的声音中渗入了叙述者声音这样一种小说文体技巧。莫莱蒂认为,1800至2000年的现代小说史上,FIS一直是一种最重要不过的叙述装置,可以被视为人物社会化的标志,同时也是小说现代性的最好表征,在社会刻度和个体声音之间,FIS是他们之间力量平衡的指示剂。在大致画出FIS的演化树之时,莫莱蒂发现,只要考察还限制在西欧范围内,就没什么令人惊异之处,这种复合声音,最多只是从对意识的“反映”(reflective)到“不反映”(non-reflective)的转移(如图二所示)

现代叙事中的自由间接体(1800—2000)(Graphs:84)


例如从奥斯汀尖锐准确的人物话语,到福楼拜和左拉那种无所不包的情绪。在福楼拜和左拉的小说里,人物的内部世界完全被公众世界的陈词滥调所占据,因而显得完全不可知。但有趣的是,当个人的思想世界将要全部淹没在意识形态话语中时,一个慢慢生长、延伸到“东方”的分支现象渐渐逆转了这种趋势,FIS开始变成冲突而非统一意志的世界。正如巴赫金对拉斯柯尔尼科夫内部话语的分析一样,FIS开始从客观化“叙述”冲向富于戏剧性和紧张感的“对话”一极,因而充满了辩论色彩。在其后的演变史中,巴赫金重视口头艺术的倾向,在自然主义运动中达到新的顶峰,构成了多种符号霸权。在西欧的国家政权之下,非个人化的内部声音又从新闻报纸、书籍及公众意见中渐渐升起,在南部语言中,多视角的众声喧哗或窃窃私语从外省的忏悔室中传出(如西班牙语小说《庭长夫人》,或意大利南部的村庄小说《枸杞树屋》)。此时,FIS被社会喉舌附身,相比于欧洲西部的安静叙事,南欧的叙事里有更多扰攘和争吵,但他们大体上仍处在“反映”的一极。如果说至此莫莱蒂追溯的还都是FIS如何分化出那些更具备社会性和“客体化”特点的流派分支,接下来一些实验小说(如伍尔夫,托马斯·曼,普鲁斯特等人的作品)的相继出现,则让光谱的另一端浮现。也就是说,直到乔伊斯真正超越“非反映性的意识”,深入到无意识或潜意识的心理生活中,在这个时间点上,第二次文体突变出现了。“正如在《罪与罚》中,第三人称的叙事话语转变成为第二人称对话,在《尤利西斯》中,则是一贯地滑入了他的第一人称的意识流中”——一种对话技术的异质性关联(Graphs:88)。这里,文化的杂交作用遇上了无法超越的障碍(意识流技术)。这意味着,一种“分化”(diverge)的另一个极限又出现了,一种“形式”定型了,分化的力量不再主导这种文类的发展了。换言之,“对话”(陀思妥耶夫斯基)和“意识流”(乔伊斯)圈定了FIS这种语体不断向两个方向分化的边界,因为“会聚”(coalesce)作用的存在,它不可能无限分化下去。最后,再到二十世纪偏向“不反映”一端的最后一个分支中,第一人称与第三人称之间的摇摆还存在,这就是拉丁美洲小说中的“独裁叙述”。


不难看出,莫莱蒂对FIS全球演化史的描摹,是将各民族文学中叙述形态的变异放在了历史的变迁中来比较和纵观,尽管不无见识,而且也做了某种文化人类学的修正,但总体上还是依附于生物物种的演化理论。对莫莱蒂来说,由于文化“分化”和“会聚”作用的同时存在,任何两种叙述技术,不管它们多么接近,都如同两片叶子无法真正长成一体一样,“引语”技术永远无法和“对话”手法真正接合,所以其“世界历史”只能表现为一棵在各种“极化”空间中左冲右突的生长演化树。需要强调的是,与莫莱蒂的世界文学体系同源,这里提供的同样也是一个可能性的空间,但是不会随机地生成无所不在的“文化杂种”,这是一个遵循一系列确定性的内在规则的世界文学生态体系。


这一个案的新意恐怕还在于,通过这种可资讲述的可视化手段,研究者将决定了FIS边界的重要形式特征和其他要素(如人称、视角、口头/书面语域)综合起来,便可以把它在历史时空中不断演变的形式“模型”初步勾勒出来。遗憾的是,这个模型并不具备量化基础,也明显缺少更细致的描述维度。某些重要特征维度,像所谓“主”“客”之分,“反映”与“非反映”等,莫莱蒂已模糊地提出来了,然而在真正的数据分析中,却是要经过繁复的计算工作自下而上地把它们“发现”出来的。莫莱蒂本人显然无法做到这一点,只能凭借其丰富而专业的长篇小说研阅经验,像在《现代欧洲文学》中一样粗糙地设想其大概结构。此外最致命的是,这一模型中的重要“极值”点(如《罪与罚》《尤利西斯》等)依然由二十世纪小说史上几个经典作家来担当,这本也无可厚非,因为很可能经过纯粹的经验研究后,计算出的离群值正是这几个对象,但这毕竟还需要得到更大范围内样本数据的验证,否则“演化树”便无异于莫莱蒂个人的创造物,也就消解了此举的意义。可以说,这种并未建立在全面语料之上的“远读”还是以忽视玛格丽特·科恩(Margaret Cohen)所说的“伟大的未读”(Great Unread)[33]为代价的,某种程度上仍与其初衷背道而驰,这使得莫莱蒂不过是再次借用生物学模型来阐发己见,此种个人化的独立探索将永远止步于对模型的“描述”,而非真正地开始“建构模型”。这一点已被后来者不无犀利地指出,也为莫莱蒂本人所承认。[34]


如今再对《图表,地图,树图:文学史的抽象模型》这个小册子的写作进行回顾,自然可以看出它充满了朴素探索意味的初级性。实际上,包括2013年编辑出版的《远读》中的全部论文在内,读起来都有一种尽力说服读者的味道,其作用更像是在别开生面地介绍一种全新的文学研究方式,这本身还是不自信和犹疑的表现,也意味着探索者自己还处在演化理论和世界-体系理论之影响的巨大阴影中。莫莱蒂在后来果然一步步远离、抛弃了生物演化论和体系论,显示出其志并不在此,而是朝向了更加开阔的量化社会形式主义和计算批评前进。






文学实验室时期的尝试与“计算批评”


“数字人文”并非由莫莱蒂提出,而是2005年写作《世界体系分析,演化论、“世界文学”》[35]时的作者必须直面的形势和亟待采纳的手段。直到这一年受邀去华勒斯坦(Immanuel Wallerstein)任主任的布罗代尔研究中心发表这一关于“世界文学”的演讲时,莫莱蒂才开始考虑如何能够真正地将演化论和世界体系,这两个受到诸多经验证据支持的宏大理论整合一体。在2013年结集出版的《远读》中,作者以一种回顾性的视角将此文的开头调整为:

尽管“世界文学”的术语产生已经伴随我们近两个世纪,我们却仍然还没有关于世界文学这个对象的某种真正的理论——而仅仅是随意地界定它的内涵。我们没有一系列的概念,没有理论假设能够组织起构成世界文学的海量数据。我们并不知道什么是世界文学。这篇论文并不能填补这个空白。但是它将两种时常使我着迷的理论相对照,为世界文学勾勒出一个极好的模型。这就是演化论理论和世界体系的分析。[36]


时隔多年,此文的口径与写作《猜想》时已显出差别,从中不难感到,作者之所以坦诚自己还无力将模型真正建立在关于世界文学的巨量“数据”之上,而只是“为世界文学勾勒出一个极好的模型”,或许是因为这个任务本身在现阶段很可能是虚妄的,此外,这种无力感还来自于某种更深层的问题——事实上,也正是在写这篇文章时,他尴尬地意识到了将演化论和自然科学的“概念模型”应用于文学史解释的天然缺陷,那就是人们其实很难在生物演化理论中找到“社会冲突”的真正对等物,亦即有机体之间的物种竞争,或者说弱者和强者间无论再怎么冲突,也无法改变整个生态体系的结构特征,而这将是任何一种社会文化理论无法容忍的(Distant:121-122)。


今天再来审视“莫莱蒂道路”,已经能够清晰地看到这种关键性转折,然而演化论和世界-体系理论的重要性之所以将在他日后的实践中减弱,却不仅仅由于理论自身暴露出了弱点,也不是因为世界文学难题让人一筹莫展。起决定性的原因,还在于此类研究中日益增长的对量化手段本身的需求。这种需求终于导致一个独立的文学实验室(Literary Lab)于2010年在斯坦福大学创立。若干年后,他甚至说,情况并非是有了与这两种理论相悖的量化数据,而是数据本身提供了完全属于另外一种类型的经验证据,这让莫莱蒂感到措手不及。今天看来,这便是指从原先依靠于自然科学的认知隐喻来解释数据、勾勒“概念模型”,变作了由社会科学和人文科学自身提供的“另一种数据”来驱动研究。由此,在“闭门造车”地自行摸索了十多年后,“远读”研究彻底汇入“数字人文”,进入了数字人文时期。这一迫切性让莫莱蒂把曾经以“世界文学猜想”为代表的理论冲动和热情暂时抛之脑后,走上了自下而上的量化实践的道路。在后来的莫莱蒂看来,慢慢浮现在眼前的精彩世界,就是由文学档案和文学文献提供的总体理论世界,这是一个崭新的实证领域,也会是演化理论和历史唯物主义再次相遇的地方(Distant:122)。


“转型”后的莫莱蒂很快意识到,计算的办法的确改变了传统人文学的方法和策略,但同时,数据是无言的,数量再大的数据和档案也不会自己说明问题,所以使用量化手段的前提是研究者必须提出正确的问题;其次,真正的提问必需要将批评意识转化为可操作的程序。这一点至关重要,也是莫莱蒂主导文学实验室时所提倡的“计算批评”(computational criticism)的出发点,不过现在看来,可以说实现得并不理想。例如,从世界文学和比较形态学的角度出发,莫莱蒂在编著百科全书式小说理论集《小说》(Romanzo)时,曾萌生了对中国古代散体长篇小说的强烈兴趣。他发现了中国小说迥异于西方小说的形式结构,认为中国古典长篇小说提供了另外一条道路,几乎找不到任何一种历史实例可以像中国小说这样,对西方既有的视野和学说构成挑战,让他可以名正言顺地抵抗欧洲长篇小说理论中的“现实主义霸权”。然而,认识归认识,这一本来可以触及中西文化构型之核心的关键问题,却并没有得到切实可行的验证,除了在《小说:历史与理论》(“The Novel: History and Theory”)中对中国小说的历史下过些似是而非的判断(即便是这些判断也大多建立在汉学家的二手研究之上,且正在不断受到挑战[37]),真正涉及“可操作化”的部分,仅体现在《远读》结尾的一篇《网络分析,情节理论》(“Network Theory, Plot Analysis”)中——后又成为斯坦福实验室小册子的开篇之作。在这篇报告中,中国古典章回体小说体量庞大、人物成百上千的特点激发了莫莱蒂的浓厚兴趣,从而得出中国小说“人际关系网”在文本中存在的重要意义。在此想法的基础上,他曾尝试绘制《红楼梦》各章回人物关系的网络简图,再由此对比中西小说在结构对称性方面的巨大差异。但可惜的是,莫莱蒂的工作也仅止步于此,这一大有文章可做的数字人文方向并没能得到应有的拓展。[38]


也许这时的莫莱蒂迈出的有关键意义的一步,是将统计和计算作为必不可少的步骤整合进论证的过程中。正如在发表于实验室成立前夕的《风格公司:对1740至1850年间七千本英国小说标题的反思》(“Style, Inc: Reflections 7000 Titles (British Novels, 1740-1850)”,以下简称“《风格公司》”)中,莫莱蒂不仅跨进文学档案的广漠世界,先后采用平均数、中位数、标准差等常见的统计学指标,对1740至1850年间七千本英语小说的标题长度、形态分布和内容进行了测量和统计分析,而且,这些分析的基本变量再也不是《猜想》中难以界定和量化的批评性体验,而是相对容易操作的语言学研究对象:词汇、词语单元和语义。它们无疑为莫莱蒂向往已久的实证研究奠定了基础。在这一研究中,莫莱蒂首次与马修·乔克斯(Matthew Jockers)、塞姆·鲍尔斯(Sam Bowles)、大卫·布鲁尔(David Brewer)、鲍勃·福尔肯福利克(Bob Folkenflik)等后来的文学实验室主力成员合作,建立起百年间七千部英语小说标题的语料库。为了发现有价值的问题,形成有意义的解释,莫莱蒂不断变换统计量,寻找更恰当的计算方法,还引入图书出版流通数据,比照市场的扩张程度,对小说标题和文学场生态的关系进行深入探讨。在第二部分中,他不仅展示了标题语义结构的分布,也将“文类”这一他本人最关心的问题作为元数据量容纳进来,发现了百余年间各类最受欢迎的小说标题的语法结构,接通了所谓“计算文体学”(computational stylistics)的领域。可以说,统计算法的变换不可谓不繁多,真的是多角度立体地“远读”了作为文学史演化标本的小说标题形式。然而,即便如此,在后来的苏真(Richard Jean So)等人看来,此时的莫莱蒂却仍停留在对各种语料库的统计分析进行“描述”的阶段,其实并没能对其语料数据展开准确而复杂的“建模”。苏真的批评不无道理,在《所有模型都是错误的》一文中,苏真亲自教给人们,如何运用回归分析,让《风格公司》中的研究更上层楼,更具有正当性。莫莱蒂不厌其烦地解释每一种数据结果,试图发现它们的问题所在,凭借的都是他良好的直觉。但这项工作可以更系统一些,可以依靠统计检验来发现随机抽样的误差,再选取更好的模型,依此循序渐进,不断地贴近“现实”本身。在这一过程中,重要的并非论证模型对错与否以及为什么对,而是要追问某种统计推断为何错了。简单化的数据和图表呈现,让莫莱蒂的工作变得非常普通,也缺乏足够的说服力。必须恢复统计学模型的“自反性”,让它们真正成为研究中推理、分析诸环节的有机组成部分。[39]因而,能否坦然接受错误,从错误、误差甚至是不合理想的结果入手,去发现最初的那道阐释学的裂缝,就成为量化的文学批评能够开展的关键,这一点对整个基于统计的数字人文也至关重要。


事实上,这种量化的文学批评,或称“计算批评”(computational criticism)、“算法批评”(algorithm critics)的统计学基础正是苏真所说的模型检验,这一做法的本质是人和算法的互动,一种强调人的意识和机器逻辑进行对话、交锋的文学批评[40]。其具体路径在数字人文的文化分析学中经常体现为:形成一些松散的猜想→大规模的文献挖掘(所谓“远读”)→统计建模→找出离群值→通过回归细读来精准定位→提出随意阅读难以发现的问题——又或者,继续在细读、远读间回返,不断精确模型,无限逼近想要再现的问题。从这一意义上讲,统计学既是表征世界的方式,也是研究人员用于推理和分析的工具,当然还可以发展成为一种文学批评的利器。更进一步说,统计分析是当我们有了数据并且通过远读发现了事物间的关联,形成假设后,用于检测这种假设的合理性的工具。在计算批评中,这一过程应该体现为一种手术刀式的精湛技艺,而绝非凭借某种粗糙的经验观察或是大刀阔斧地施以“数字技术”就可以完成的。


在这一点上,前实验室时期的莫莱蒂显然做得还不够。也许正是由于对统计学的理解还有一定偏差,在莫莱蒂的认识中,计算批评更是与“编码智慧”联系在一起的。他在不同场合反复提到,同行们在运用计算机语言编写程序脚本的过程中体现出一种极赋直觉性的魅力和智慧:

这种智慧体现在脚本编写上,但在编写脚本的过程中,某个概念也会逐渐成形。虽然这个概念往往不会以概念的形式呈现,但是你能够看到它就隐藏在编写的脚本里[……]未来诸多最具价值的成果实际上都会由脚本产生。这些脚本一半是脚本程序,一半是文化、文学、历史概念。因此,我认为开展数字人文研究项目的高校,不管这些项目是大是小,都应该确保每个人都有机会获得这种智慧。[41]


正如实验室的年轻骨干们对1785至1900年间英国小说语言变迁模式所做的研究,最后全部结晶出的新质便是一种“脚本概念”:由他们发明的“相关器”(correlator),以词频为单位,用来寻找在某一历史阶段,与给定的“种子词”最相关的词丛,再从这些关键词丛入手,衡量和解释十九世纪小说社会文化空间转变的基本轨迹,是谓雷蒙·威廉斯“关键词法”的量化拓展版本[42]


这一崭新的计算批评的概念是经算法和文学批评视野的叠加创造出来的,是算法和批评之间的中介。在这一过程中,算法甚至解放了原先限制在文学史视域中的批评潜能。不难想到,莫莱蒂这样做是为了将“算法”合理划入文学批评的范畴,是想通过批评概念的建构来进一步确立算法的合法地位,以此来更好地利用算法,获得计算和文学研究高度融合的方法论前提。然而,也许这在苏真等人看来还是不够,因为只有走到下一步,在一个由研究者发动的批评性环节中,主体通过与自身文学研究经验的比对,完成了对算法的质疑、检验和融通,才算是真正达成了与机器的互动。在当时的莫莱蒂和后来的文化分析学之间之所以会有这种细微的差别,究其根底,还是由莫莱蒂对数字人文“可操作性”的绝对强调决定的,也是早年深受实验物理学的影响使然。在此,我们也可以再次确认莫莱蒂多年来一贯坚持的一种倾向,即反对以单一的文学批评或语料库研究来介入社会批评,这种保守性也许会使得他的研究自然地缺少了艾伦·刘(Alan Liu)所提倡的在一个批判性的整体框架下运用工具的意识[43]


但是,诚如苏真同时注意到的,实验室成立后的数字人文研究也正在努力改变这种面貌[44],逐渐显示出对试错性试验的强烈兴趣,而这才是远读精神最可宝贵之处。这一取向,如果以文学实验室成立后的第一个大型团队成果“文体/风格研究三步曲”中的“句子尺度上的文体风格”项目为例是可以看清的[45]。这个实验利用标注过的查德威克-希利(Chadwyck-Healey)十九世纪小说数据库里的二百五十部英国小说做语料来源,试图分析文体风格是如何从句子尺度上浮现出来的。以其中的“叙事性句子”为重心,实验室曾给与计算机操作程序的要求是,去发现句子的哪种成分会随着句法的选择变化,随后机器发现了一些存在于句法与叙事、句法与语义之间的显著关系模式。实验重复了这个过程,先后利用“最特别的词”(Most Distinctive Words)和语义向量(semantic vectors)等常用技术[46],再结合主成分分析(PCA),在不同的尺度上层层深入,继而得到越来越多的结果反馈,经过不断调整测量方法、设计新的程序,生成了新的概念循环。正是在这种问题意识和测量程序的交互碰撞中,他们逐步获得了建立在概率基础上的关于风格的“新”定义。这种可操作性的概念生成方式,当然是以固有的文体/风格论为前提的,但在莫莱蒂看来,他们却绝非要仅仅发展一种新的风格概念,也正是在这一点上,他们和传统语文学家、文体学家斯皮策(Leo Spitzer)、奥尔巴赫(Erich Auerbach)等人形成了区别:后者的论述固然更丰富,但在他们的理论中,不同的风格组成要素只是单纯的相加,或者总是以一些微小的差别来不断重申一个总体观点——这完全谈不上真正的“主客交互”,更不要说在这个过程中让总体性自然浮现出来了。莫莱蒂认为,正是这个互动的过程,为人文学阐释提供了契机。也就是说,尽管机器提供了结果,但这只是一半,机器所无法做到的是,如何去解释新的发现——它无论如何无法在多样化的语义选择和更广阔的社会文化背景之间建立起有意义的联系。所以,在人机交互的实验发现和文学解释相遇的地方,计算批评诞生了。


最后,通过对从句组合方式、动词和语态的统计分布检测,将所有看似“不相干”的因素重新放到一起来考虑,莫莱蒂团队把文体风格在句子层面的定义重新描述为:“当句法-语义成分以超乎预料的方式凝缩为一个句子,并且这个过程被作者不断地重复时——风格就产生了。”[47]这既是对作为惯例的文体范型的“偏离”,同时,在一个作者身上又是大概率重复发生的现象,因而形成了某种可能性模式,某种概率模式。在这个意义上,作为最小语义单元的句子,就成为探测和度量文体风格的“实验室”。值得一提的是,这个可能性的模式和莫莱蒂当年对“世界文学”的概念创新一脉相承,其本质,同样建立在一套可操作的测量程序和概率论的基础上。只不过,世界文学的概念模型是通过想象、设想甚至是“猜想”来提出的,就莫莱蒂的有限经验来看,并不具备可验证性;而如今“句子层面上的风格”,则是实实在在地由操作程序的反复“证伪”和迂回式锚定来实现的。也可以说,从《猜想》到《句子尺度的风格》,初步具备了实证性、可操作化、问题性,乃至一点点“生产性”的“远读”研究终于“落地”了,蜕变为数字人文范式中的计算文学研究。






从“中心”到“边缘”:多面向的“世界文学”研究


弗朗科·莫莱蒂(Franco Moretti)在其著名的《世界文学猜想》(“Conjectures on World Literature”,2000)、《再猜想》(“More Conjectures”,2003)等系列文章中提倡以“远读”(Distant Reading)的方法从事世界文学研究,其动机和观念都极具创新性和前瞻性。然而在他尝试验证这一猜想时,却一度遭遇手段-目的间难以克服的矛盾,这种困境也曾将某种根深蒂固的欧洲中心主义倾向暴露出来。就世界文学而言,一种完全建立在国别文学批评家“二手”经验之上的远读方法,如何能同时取得实证科学的信任?或者说,绕过了翻译和民族语言的世界文学研究又如何可能?在大规模语料已成为最重要的数据形式的今天,这种二十年前提出的初始路径无疑显得相当成问题。2010年,斯坦福大学文学实验室(Literary Lab)的建立标志着以真实的文学语料为对象的实证化探索在文学研究内部正式开启。从系列实验“Quantitative Formalism: an Experiment”(“量化形式主义:一个实验”)、“Style at the Scale of the Sentence”(“句子尺度上的文体风格”)、“On Paragraphs. Scale, Themes, and Narrative Form”(“段落:关于尺度、主题和叙述形式”)(以下简称“文体/风格三部曲”),到用语义群挖掘的办法从小说中提取关键词来研究英国文化史(From Keywords to Cohorts: Tracing Language Change in the Novel, 1785-1900,“从关键词到语义群:追踪1785-1900年间的小说语言变迁”),再到量化文学社会学的诸多成果如“Canon/Archive. Large-scale Dynamics in the Literary Field”(《正典/档案:文学场域大型动力学》)、“Between Cannon and Corpus: Six Perspectives on 20th- Century Novels”(《在档案和语料库之间:二十世纪小说的六个方面》)、“Popularity/Prestige”(《流行/声望》等)可以说,一篇篇建立在具体的语料库语言学技术上的实验报告,同来自英语文体学、文学社会学、文学形式主义的经典理论结合后,一方面消解了文学阐释和经验研究之间由来已久的敌意,为人们打开了新空间;另一方面,却因其尚缺乏“比较”的维度,仍然像是在继续制造某种普遍理论效果,离真正意义上的世界文学视野还相距甚远,这在某种程度上也是以单一语料库为对象所导致的结果。


如果说早期的斯坦福大学文学实验室和各类蓬勃兴起的数字人文实践,大都由英语系的教授们发起,且以英语文本为对象,那么无论是从便于语料处理的角度考虑,还是由学术惯习所决定,这种“崛起”都因其不无偶然地流露出的“英语语系霸权”迹象,而极易糟致批评。好在近年来,具有多语言背景的第二代数字人文学者的全面涌现正在逐渐改变这一局面。仅以东亚领域为例,他们有的出身亚洲系或东亚研究专业,属于“区域研究”中的佼佼者,也是国别文学的专家。他们的研究大多聚焦欧洲文学之外的世界文学形态,更关心这些区域在“现代转型”过程中生成的“新文学”品类,特别是卡萨诺瓦(Pascale Casanova)等人所强调的为“体系边缘”和受压迫地区作家“一再征用”的现代主义,不仅关注它们是如何成为“资源贫乏”地区作家的符号武器,用以争取自由的文学空间,还会涉及东方文化对它的反影响,所谓东方主义氛围中国际现代主义的流变等。恰如艾米丽·阿普特(Emily Apter)早先在《文学的世界体系》中的预言,由于“世界现代主义中的东方学批评致使亚洲现代派努力恢复其文化的独特性和理论比重”,人们对“现代主义中的多元帝国主义”的讨论将不断升温。[48]可以说,这些数字人文实践在双重意义上构成了对莫莱蒂当年雄心勃勃的“世界文学猜想”的检验或补充,推翻或反驳。在这方面,芝加哥大学文本实验室近年来的东亚现代文学文化研究不仅具有典型意义,也为比较文学学者在一个更具批判性和生产性的框架中开展数字人文实践提供了方向。


这个实验室最初由芝加哥大学东亚研究系的日本现代文学研究者霍伊特·朗(Hoyt Long)和当时在英语系研究美国和亚太地区文学的苏真(Richard Jean So)组建。苏真是一位韩裔美国学者,而朗则是美国白人,他们二人投身量化文学研究的时间都比莫莱蒂要晚,却有各自独特的机缘。在本科阶段拥有计算机副学位的朗,一直从事的是日本现代诗歌的专门研究。和很多数字人文学者一样,起初引起朗兴趣的是社会网络分析(Network Analysis),他对探索艺术家工作网络的形成与发展产生了浓厚兴趣。这种研究需要掌握的信息量之大,可处理的文本和作家量之广,都是他未曾想过的,却让他受益匪浅:“转换了分析的单元和规模之后,潜藏在历史材料中的模式浮现出来,这促进了新的研究问题的产生,以及对艺术生产中社会过程的新理解。”[49]与朗类似,本科段拥有一个理论经济学副学士学位的苏真,博士论文Transpacific Community: America, China, and the Rise and Fall of a Cultural Network(《跨太平洋共同体:美国,中国及其文化合作网络的兴衰》)[50]关注的是文化冷战、信息论和社会网络的问题,但是同样没有采用量化手段。苏真对数字人文的好奇,缘自他发现数字人文能够为自己“萨义德式的研究”提供更多、更大范围内的文化证据。他早年在哥伦比亚大学参与了赛义德的研讨班,为其“结合了细读的理论问题和框架,以及文档材料、证据”的语文学方法着迷,但是在自己第一本专著的写作过程中,又发现了这一方法的局限性,他想要寻求更多证据来支持“更大范围内文化系统性的观点”,[51]而后来的数字研究无疑提供了新类型的证据,支持了这些领域的核心观点。所以苏真的数字人文研究是其原先研究兴趣的分支,可以称为自然伸展出来的一种“数字语文学”。有趣的是,这二位在芝大建立文学文本实验室(Chicago Text Lab)时,其实际依托的主体的确是一个叫作“PhiloLogic”的跨语言的电子语料库检索分析平台,也属于一种通用的技术基础设施平台。这个平台隶属于历史悠久的数字化项目ARTFL,[52]由统一的技术总监负责建设和维护,目前已经建成包含英、法、日、德以及古典拉丁文文献在内的三十多种数字语料库,近两年还拓展到了中文领域。一个主要在建的中文数字人文项目是与上海图书馆合作的“Republic China Periodicals Corpus (1918-1949)”(民国时期期刊语料库1918-1949)。[53]


该实验室在2018年随着苏真前往麦吉尔大学而解散,现阶段的主体是名为“Textual Optics Lab”(文本光学实验室)的资助项目,其成员分布相对松散,该项目凝聚了一批来自不同学科但具有共同研究旨趣的学者。在方法论方面,他们一方面致力于用最前沿的技术和方法来从大规模文献中揭示出之前无从勘查的趋势、长时段的历史转型,而特别是跨文化存在的文学语言模式;另一方面,又不满于单纯依靠软件来跨越语言的壁垒。针对目前最复杂的工具仍执着于“远读”的方面,因而便有可能在“以算法处理文本”和文本自身之间造成了不同程度的断裂,从而抹掉了文化知识生产的特殊性,这一人文学者最看重的东西,他们提出“可伸缩阅读”(scalable reading)的概念和实践,即利用一系列工具和阐释办法,通过多种尺度的“透镜”来阅读和分析文本档案——“从单一的词到上百万卷的资料,可以在细读和远读之间自由滑动,在诠释学之类的传统定性研究和从大量数据中提取统计学意义上的显著模式之间来回交替。”[54]对于这个数字人文社群的学者来说,无论是数据挖掘,可视化,还是机器学习和网络分析,工具仅仅是用于从很高的层面上勘查语料库中的现存抽象模式(pattern)的,所以,也只有把工具和语文学的文本分析方法细致入微地结合起来,才便于从计算机计算和人文质询的交汇处发力,最终通向一种计算批评(computational criticism)和文化分析学(cultural analytics)的研究。


尽管作为一种量化文学研究之必要前提的“计算批评”曾由莫莱蒂提出,在斯坦福文学实验室的研究中也已经初步显形,但如果考察莫莱蒂的定义,可以发现他更偏重对“编码智慧”的单向度强调,[55]或者不如说,是对编码所蕴含的计算创造力的望洋兴叹这或多或少也是由于他的实践仍然缺乏某种具体而微的历史意识,因而也就很难将种族、性别、阶级等更多的社会性维度函纳进来,在一个艾伦·刘(Alan Liu)所说的“更广阔的权力、经济及其他支配协议的框架下”批判性地从事一种真正意义上的文化分析,而这一点恰恰是数字人文最不该忽略的题中应有之义。在这方面,苏真和朗等人区域研究的训练背景让身处更加“边缘”院系的他们,在从事实践时带上了不同于主流英语学界的特色。可以说,作为北美第二代数字化手段的大力推动者,他们在研究中相对系统、谨慎地引入了更多量化手段,较容地走出了一条将计量融合进整个发现、求证、阐释、乃至批评各环节中去的计算批评的道路。他们对数字人文的借助,也体现为从文学、文化史上的具体问题和症候出发的一种合理、必然的需要。


仅就他们十分关心的现代主义研究来说,芝加哥大学的这个团体尤其注重现代主义“由西向东”传播中的帝国主义特征,他们要么关注欧美现代主义时期的东方主义历史,要么尝试从比较的角度去阐发亚洲先锋派运动对现代主义的重新定义。这使得一些跨越国界的文学潮流相互影响、相互交接的“灰色地带”和跨文化、跨语际的美学现象成为他们有意识聚焦的目标,像美国现代主义时期东方风格的英语俳句、现代主义诗歌和意识流在亚太地区的传播,以及日本私小说和中国浪漫派小说中的“重复”等等,都成为饶有趣味的课题。而与此相对应的,由数字技术带动的一些实践热点,如单个的文本细读与统计模式的远读、人机阅读的差异、人机互动中的反黑箱操作等等,为他们以可伸缩阅读来纠偏数字人文的现有缺陷、在后殖民和去中心的背景下开展计算批评提供了重要切口。






语言特征建模与现代主义的全球流散

  

这个实验室第一个有影响的比较文学与世界文学研究是《文学模式识别:文本细读与机器学习之间的现代主义》(“Literary Pattern Recognition: Modernism between Close Reading and Machine Learning”)。[56]从方法论上讲,这一研究的出发点便是调和近年来关于数字人文研究的两种针锋相对的观点:其一是莫莱蒂、马修·乔克斯(Matthew Jockers)、和安德鲁·派博(Andrew Piper)等人大力提倡运用主题建模、文本挖掘、网络分析等技术手段来从海量数字化资料库中揭示语言与形式发展的宏观模式;与此相对,则是来自艾伦·刘、亚历山大·加洛韦(Alexander Galloway)、大卫·科伦比亚(David Columbia)、塔拉·麦克弗森(Tara McPherson)等人的媒介批判,认为此类技术会将文学文本的复杂性化约成纯粹的“数据”,与批评理论的目标相去甚远。为此,研究者在这个实验中有意设计了操作路径:针对文学史上关于现代主义俳句的诗体界定争讼不清的情况,他们分别利用文本细读、社会历史考察和机器学习的模式识别(Pattern Recognition)三种方法,来完成对俳句的“文体辨认”这一基本任务,再通过比较和协调此三种方式塑造出的英语俳句的本体观,来拓宽和重审全球范围内现代主义的历史研究。


具体说来,他们首先从单一的文本细读中发现了现代主义诗人写作英语俳句和读者阅读英语俳句时的“惯习”,也就是一套可操作的辨识模式:对诗人来说,俳句是短暂的、并置了具体却不相称的自然意象,通常包含对视觉语言的运用,且表达含蓄、具有暗示性等等——这既是一种写作标准,也是历史上的研究者和批评者用于“确认”俳句的文体和风格标准。这些相对模糊的风格/诗体标准都在一首诗的“个体层面”上预设了俳句的理想模式,人们可以将某首诗与理想模式进行对比,就可根据其近似或偏离的程度来评估该诗的“俳句性”了。其次,从作为社会历史事件的英语俳句的发生来看,俳句作为出现在20世纪早中期英语中的亚洲文本,受到了异域情调和帝国主义话语的影响,被视为西方艺术家广泛痴迷于东亚文化的一部分。所以对英语俳句的试验和英美的意象主义运动有一段重叠的历史,模仿的热潮随之继起并在1920年达到了饱和点。在最终的演变阶段和后来的批评中,英语俳句成为了一种客体化模式,“一套与东方主义话语结合的美学理想”,一种形式混杂、边界模糊、充满异域风情的混合体。这使得人们不由得忽略了每一首俳句的具体细节,而将关注点放在了东方主义的文化政治上。这种模式也是一种文学史家和文化批评者据以确认俳句的标准。然而,在实验室成员看来,无论是细读每一首英语俳句的独特性,还是将俳句文本视为更广阔的社会活动的一部分,都无法将这一流行文本模式中累积下来的历史文化因素与其混杂的文本形式层面完全打通,无法深入探究这种相互生成的关系。在此,需要找到一种比历史文化批评更精细,但又比文本细读更开阔、宽松的阅读模型,不把文本局限在个体美学效果亦或是社会话语产物的尺度上,“而是将其视为上百个例子共同分享的一套种属特征”,这就是由机器读者识别出的、作为“统计模式”的英语俳句。


研究组首先建立了“英语俳句”和“非英语俳句”的语料库,用监督学习(supervised learning)的办法,让机器掌握识别俳句的方法。他们将诗歌文本拆分为一个个单一语义块即“词包模型(bag-of-words)”,对特征向量进行标记后,使用朴素贝叶斯算法对数据集进行训练,学习俳句和非俳句的特征分布情况,再根据计算出的概率评分情况,对每个测试文本所属的类别进行预测。接下来,研究进入最关键的部分,即要从被机器误判为英语俳句的部分入手,来弄清楚用于识别英语俳句的文本模式的统计学模型,怎样才能与文本细读和历史文化的模型相协调。对朴素贝叶斯分类器来说,俳句文本只是一些特征(如短诗使用的措辞和音节数)的组合,这些特征通常在某类文本中比在其他文本中出现得多。如果一首诗歌包含了更多与被分派为俳句相关的特征,那么这首诗就有可能被认定为俳句。由于机器能否做出准确清晰的判断,实际上取决于人们指示它考察什么样的具体特征(集),所以一旦当它出现了错误,错误就引发了一个重要的“阐释性的问题”:是什么特征让某些诗那么地“像俳句”。而且,如果进一步放松人们对俳句特征的限定,还可以用这种扩大了的算法去发现更多具有俳句风格的诗歌。这样,就有可能去认清俳句(及其模仿运动)在构成更广泛的东方主义文化中的重要角色了。这使得研究人员开始调查机器识别与人类识别模式的相交或差异地带。他们将误判的俳句分组,分为候补俳句、机器俳句和潜在俳句三组,认为第三类俳句是一种尚未被发现,却也有可能被界定为“俳句”的“潜在俳句”,这类俳句最具有阐释价值。它说明一个相对多元的文学模式识别模型,一个敏锐的“机器读者”如何有助于重绘文学影响的边界。这里的“影响”已经指的是一种统计上的可能性了。一首极易可能被细读和文化历史批评排除在“俳句”范畴之外的短诗,却在统计模式的层面与俳句分享着某些共同的音组、单词和词汇配置特征——更重要的,从所选出的误判率最高的文本来看,它们往往也具备了东方特征,却相对远离意象派运动的团体和圈子,它们实际上参与了现代主义时期更普遍的“东方主义共鸣”。事实上,尽管机器用于辨认俳句的方式与文学批评者可能完全不同——但却让在个别诗歌的层面看来很可能是偶然的某些特征,“在散落于数十家期刊的上百首诗歌的层面上,出现了一个共享着俳句文本特定要素的更广泛的文本集合”。这个更宽泛的文本集,让俳句译作和改编中的文本特征模式也包含、渗透进来,提供了“一个既与俳句文体相关、同时又属于某些更广泛的事物的东方主义氛围”,一种“流传中的文本模式”。这种介于历史文化和细读之间的“俳句性”,使得人们可以在更宽泛的诗学话语中考察它的社会历史影响和地位,来追索这一由英语俳句表征出的20世纪早期现代主义的文化逻辑。


可以看到,在这个基于模式识别比对的英语俳句研究中,从历史遗留问题出发的文学批评是直接和算法进行对话互动的。首先,曾经的现代主义诗歌研究者和批评家通过关于俳句的“公式”和描摹的语言塑造出某种文学的本体观,数字人文研究则根据数据和计算机语言来精准重塑这一本体观。其次,当批评者想要进一步揭示英语俳句的东方主义氛围之时,他必须不断往返于文本细读、历史文化批评和机器学习所提供的三种英语俳句的本体观之间,文学模式识别把这三种模式汇集在一起,使其相互补充,这种结合导致的碰撞,“可以产生关于英语俳句以及广泛意义上的现代主义的新历史”,也是此研究的最终旨归。最后,当他们把机器的理解与人类阅读模式中固有的理解,也就是由文本细读和历史文化解释相对比之时,便发展了斯坦福团队在风格研究中的人机阅读分类模式对比的思路,以此打开了突破口,从错误入手找到了阐释的契机。这一点,也较成功地体现出以人为主导的算法批评的旨归——它对破除算法黑箱化和工具主义的努力。


Turbulent Flow: A Computational Model of World Literature(《湍流:世界文学的计算模型》)是一篇从题目上就可以看出主旨的论文,发表于2016年9月的Modern Language Quarterly《现代语言季刊》,由霍伊特·朗和苏真共同完成。[57]在这项研究中,两位研究者真正找到了一种全球传播的文学迹象,可以通过追踪它的历史轨迹来证实世界文学体系的存在样态,这种文学现象就是作为现代主义技艺之一的意识流(Stream of Consciousness,简称SOC)。这个研究用计算建模和大规模勘测(detection)的办法,将意识流文本的全球播散描述为一种湍流涌动(turbulence flow)的过程。具体说来,即是将意识流叙事视为一组由语言和修辞组成的离散特征集,用这一模型去证实意识流技巧随着20世纪现代主义运动的旅行,从英语现代主义向更流行的文学体式、从英语文学向日语文学跨类型、跨语际传播的趋势,这也是一项直接和莫莱蒂的世界文学模型对话的研究。由于莫莱蒂在自己的著作Modern Epic(《现代史诗》)中认为,意识流作为二十世纪“形态爆炸”的产物,曾经席卷了世界文学体系的“核心区”(如英法和北美),这股“浪潮”于1920年代后期到达了日本,1950年代到达拉美,[58]意识流遂成为世界文学研究的理想聚焦对象。然而,如何在一定规模上考察它在这一散播过程中产生的变体,以及它们在地理上的实际到达情况呢?在莫莱蒂的概念模型和卡萨诺瓦的文学世界体系理论中,意识流应该和大多数现代文学现象一样,是呈波浪(wave)式传播的,为了检验这个假设,朗和苏真采取了建模的办法来检测英语语系意识流(Anglophone SOC)的实际流播情况。实验分三个主题进行:


首先是建立英语意识流模型,以此来初步说明意识流的特征是可以被一个明确的语言学模型所尽述的,亦即能够用于确认意识流的文体特征其实是有限的。在这一步骤中,他们建立英语SOC叙述形态的语料库,抽取十三种意识流的文本特征来建模(如平均句长、词汇多样性、动词缺省的句子比率等等),并用现实主义文本作为对比语料库。对模型进行交叉验证后发现,模型对意识流小说和现实主义小说的分辨率达到了95%。


在这一基础上,研究者开始追问意识流的散播问题:当它从相对核心的欧美地区移动到同属英语语系的“半边缘”地区,是否仍然具有与“核心区”相同的形式特征?在第二个步骤中,他们建立1700部来自英美、爱尔兰、澳大利亚和南非的英语小说语料库,将已经被标志为SOC的小说去掉,从剩下的约800本小说中随机抽取500个段落,用同样的特征集和分类程序将这些1923-1950年间的段落区分为“意识流”和“非意识流”两类,不仅达到了90%的正确率,而且还可将该时间段内意识流写作的总趋势可视化出来。如图1所示,1923-1935年为上升趋势,其后为持平阶段。接下来,为了探究1923-1934年间,究竟是什么因素推进了SOC的广泛传播,其中起关键性影响作用的是“民族国家”还是“文类”、种族、性别等因素,为了检测这些变量的影响,他们对语料库里作者的国籍、性别、种族以及小说亚文类等信息做线性回归的统计学检测,去确定这些因素是否可以预测一部小说有多么接近(多么“像”)意识流小说。结果显示,任何角色对于意识流使用情况的广泛增长都不具备解释力,甚至连传统批评观念所认为的“小说品类”因素也无法做到,那么这便部分地推翻了前人的看法:也就是说,无论高眉现代主义(high culture)还是通俗作品(包括历史小说、言情小说,探险故事、科幻小说等等流行小说),都有可能在写作中实验意识流,唯一不太采用意识流的类型只有侦探小说。这说明意识流其实是跨越精英/大众和各种小说亚文类而存在的。最后,为了一探究竟,他们回归到文本中,去看看被模型认为是最“标准”的意识流段落是什么样的。他们发现,被机器认为最符合意识流的段落竟然来自于英国摄政时期的浪漫主义小说家Jeffery Farnol的The Way Beyond,一本畅销爱情小说。批评史上几乎还从来没有学者将它和意识流联系在一起,但是经观察可以发现这个段落几乎具备了符合经典意识流的全部修辞特征,例如蜿蜒的长句子、矫揉的描述、用省略号来代替人物的心境和沉思,以及意识流最明显的标志:自由间接话语。可以说,Farnol的这个段落为令人困惑的结果提供了更好的粒度,在叙事体式和技艺的层面上捕捉到了这种流散的具体形态。在此,模型固然证实了关于意识流传播的大致假说:意识流通过借鉴和固化某些文体特征的方式融入了文学市场——但是细读提供了直接证据:1923-1950年间的“半边缘”地区不仅经历了意识流写作的广泛传播,而且,只要还限制在英语语系内部,这种传播便基本上没有遭遇任何来自国别、文类(精英/大众)、性别、种族之别的“障碍”。这是一种畅通无阻的传播,因而也就谈不上莫莱蒂等人所预设的从核心区传播到“半边缘区”所发生的文体形式上的“妥协”或“折衷”了。

1923-1950年间小说样本与意识流模型相似度的逐年平均分数(1923-1950年间,全部小说样本意识流平均相似度的每年得分情况。每个点代表当年全部小说样本的平均得分。黑色的回归直线显示出1923-34年间的显著增高趋势,从灰色区域中则可以看出数据的整体趋势。)


那么,当意识流传播到“边缘地区”的情况又如何呢?这是该研究最关心的问题,也是对莫莱蒂作为概念模型的世界文学所坚持的一个观点的回应。莫莱蒂在《世界文学猜想》、《再猜想》以及《世界体系分析,演化论、“世界文学”》(“World-Systems Analysis, Evolutionary Theory, ‘Weltliteratur’”)[59]等系列文章中认为,叙事文学在做全球旅行的过程中,一些缺乏“独立性”的语言和文体特征将会遭遇各种各样的“传播障碍”,从而导致文学形式上的“折衷”。这类情况被夸张到极端,就是莫莱蒂所举的那些后发国家现代小说的例子。他认为,当现代文学在做全球旅行时,相对而言,情节、故事和原型是容易传播的,体式和风格却很难,只能由“本土”文化来提供。如果承认这个假设,那么是否可以认为,意识流在现实传播中将很少有“形式”元素能够跨越语言存在,也就无法被同样的跨语言模型所抽象出来了?问题于是被转化为:如果仍旧基于英语文学的SOC模型,那么在何种程度上,意识流进入新的文化背景后仍旧会保留它原有的修辞特征?这些被保留下来的部分无疑将成为意识流最独特的部分。由于日语和英语在语法上存在巨大差异,且自1920年代晚期起,意识流的实验写作就给日本现代文学带来了昙花一现式的深刻影响,此时,处于所谓“边缘地带”的日本意识流遂成为一个很有趣的检验物。朗和苏真发现1920年代的日本现代文学批评中一个流行的主题是如何将《尤利西斯》中的激进技巧驯化并用以革新此前的“心理现实主义”,然而,无论是作为现代人思想现实的复杂表征,还是值得吸收的文体风格,批评家们却很少讨论其技术方面,这就使得尽管对意识流的译介和引用都大量地产生了,但是人们对具体的“同化”过程却不甚明了。那么,这些译介实践到底依据了多少英语意识流中那些足以将其“区别”出来的特征呢?显然此前的文学评论相对侧重审美判断,却无法达到精确的量化描述。这是他们通过下一个实验想要精确验证的。


在对特征模型进行翻译后,他们建立了包含翻译作品在内的日本意识流文学语料库,并以“心理现实主义”语料库作为“对照组”,以“侦探小说”占比80%的语料库(其余为历史小说和无产阶级小说)为“控制组”。最后,研究发现,只用英语SOC模型中的七个特征就可以把日本意识流语段和此前的心理现实主义小说区分开来,而且达到了97%的正确率,这些特征是:拟声词和新词、省略、高类符-型符比、名词化句子、自由间接引语等。这一鲜明的区分,一方面证明了作为文学场中的立足之道,一种“占位”策略的意识流作家的意义;而另一方面,这种占位实际上又是通过对十三个英语意识流特征的进一步选择来实现的。也就是说,和英语意识流的情况并不一样,诸如句子长度,无动词的句子这些特征对日语意识流来说已不再重要,都显示了与SOC的负相关,所以也不再存在。事实上,正是通过这一复杂的选择过程,意识流进入新语言背景的所有问题都获得了“形式上的解决”。依据这一模型,可以在发现这一跨越语言的潜在结构一致性的同时,也将其在何种程度上获得了形式的解决揭示出来——这一点,是可以通过比较那些高分或低分段落分别是在多大程度上接近和远离意识流的理想模型来实现的,此处的重点细读对象是夏目漱石的《心》(最高分段落的提供者)。同样的,意识流段落和对照组的区分度达到了93%,除了“新词”在用于区分现实主义文本的作用上减弱外,“自由间接引语”不再成为预测SOC的显著特征。这一变化,正表明了日本现代小说自身所经历的语言演进历程。通过观察其后每部小说在分布图中的得分,还可以对正确率的微弱下降做更进一步的分析。例如,有三部无产阶级小说落入了临近意识流的阈限处,对这三个文本进一步的细察将可以得知什么样的文体特征会被阶级意识征用。


最终可以认为,他们的模型基本支持了意识流从核心地区向世界文学体系的边缘和半边缘地区散播的假说。模型测量了这种散播潮流的轮廓和边界,以及它最终的变种是什么。变种虽然产生了,但这仍然是一种同质性的传播模式。为了捕捉这种由计算机揭示出的结构内部的不确定,他们就此赋予“世界文学”一个新概念:湍流。这里借助的是流体力学的知识和想象。湍流又叫紊流或乱流,是流体的一种流动状态。当流体的速度增到很大时,流体不再分层流动,而是形成了很多小漩涡,这种状态即湍流。在物理学中,如何构建一个理论模型来描述湍流的行为和内部结构,一直是一个悬而未决的问题。朗和苏真之所以会想起这个比喻,主要还是借重了层流遇到障碍物时转变为湍流这一物理特征作为喻义,认为它描述了某种线性的连贯流动变得极端不稳定、异质甚至是混乱的过程,这正是现代主义的文学“技艺”向全球扩散的过程。这一运动的主体是现代主义的文学形式,在形式旅行的过程中,当它过多地承受外界的刺激(例如来自新的宗主国的环境压力)时,自身便耗散、破裂为另外的样子,它可以有无限多的变种。这种湍流的形态虽然不可见,但是却可以通过测量它的潜在结构来达到理解它的目的。如果想明白意识流如何以波浪的形式流散开来,就必须仔细研究意识流从传播中的主流转化为支流的路线,在这一点上,“数字人文允许人们既看到主流,也看到湍流,既看到世界文学的结构,也看到了它多样化的形态”。[60]在方法论的层面上,这一研究消除了人们对统计学模型的误解,研究者力图表明,模型仍然为模糊和未知留下了足够的阐释空间,本研究中的三个关键之处都是通过引入单一段落的细读,提供了更好的粒度和证据,才将研究推进到新的、更合适的层面的。模型并不能精确地解释一切,它只是深入探究数据不确定性的一种办法,这也是模型自反性的体现。


另一项由《湍流》引申出来的研究,是最近由霍伊特·朗、戴安德(Anatoly Detwyler联合留美中国统计学者朱远骋发表的《自我重复与东亚文学的现代性,1900——1930》。[61]此研究不仅将中、日两国的现代主义小说直接作为世界文学研究的对象,还抓取到了“重复”这一发生在中国“浪漫主义小说”和日本“私小说”中共通的语言趋势、心理模式和文学风格,重新探讨了所谓“东亚现代性”在较大规模文本层面的“自主发生”。


研究以涵盖在中国“浪漫主义”小说和日本“私小说”标签之下形形色色具有“自我指涉”意味的小说为对象,分别构成了中、日语料库的主体,与之相对的则是作为控制组的中国“鸳鸯蝴蝶派”小说和历史演义小说,以及日本的侦探小说,这样便有了“中\日”、“纯文学\通俗文学”的双变量比较设计。针对学界关于“私小说”、“浪漫主义”等文学类型范畴标签是否有意义的争论,研究启用了“熵”(信息的冗余量)和类符型符比(TTR)以及其他两种词汇集中度测量方法,来测量存在于这些小说中显著增强的词汇重复和叙述冗余现象,继而发现,无论使用哪种方法,这两个指标的分布都是非常擅长将私小说和浪漫主义小说与同时期的通俗作品分开的。这一方面说明了“私小说”和“浪漫主义小说”的确是有意义的类型标签,另一方面,也预示着在中、日两国的现代文学中的确存在一些“共同的语言模式”,这种模式的出现既与心理现实主义小说中的精神失常内容有关,也在文体风格的层面成为受“文言一致”和白话文运动影响产生的欧化语言结构的准确标识(proxy)。因而“重复”和冗余其实是通过算法创造出来的一个跨语言的心理语言学指标,它能够更好地捕捉到传统批评难以觉察和澄清的现象:相比于流行作品更多靠情节驱动且具有更加动态化的叙事焦点,浪漫主义和私小说倾向于将焦点集中在更小的词汇表和收缩的语义场中,也即集中在更小的词汇多样性上,而且,每句话中指明主语和宾语这一倾向更会加重这种趋势。这一良好的区分度初步确定了与同时期写作的其他小说相比,白话风格、西式语言结构和心理聚焦的结合,的确导致了更狭窄的词汇范围,私小说或浪漫主义小说显示了夸张的重复倾向。接下来,他们采用粒度更细的词汇和语法特征,分别为白话风格、语法结构和自我指涉内容寻求额外的测算指标,发现熵和“表达沉思、感情和注意力的动词比率间存在相关”,这在中、日两国且无论人称、类型如何都可以成立。如果将最冗余的100个段落挑出来,其中“思想/感情”动词尤为凸显,也辅证了同样的问题。最后,在此基础上,研究者将所有特征整合为一个单独的模型,想要看看凭借熵、TTR和“思想/感情”词等测量方法,可以多好地预测文本类型。在日本文学方面,最后的结果是需要熵、“思想/动作次比率”以及停用词和句号来实现这一精确性;而在中国这边,则只需要平均熵和尤尔的K方法就可以做到。


这一研究的终极目标是要将重复作为风格特征分离出来,然而只有通过细致地察看每一段得分处于极值状态的文本机理,才能理解重复如何跨越不同文化语境与特定的文学主体进行互动。所以,在细读中日语料库中“最重复”的两个作者武者小路和叶灵凤后,研究者获得了更多启发,进一步追问和阐释的方向变得明朗起来。总体而言,就像莫莱蒂认为所谓“布尔乔亚风格”,是由“无意识的语法模式和语义联合、而非清晰明确的观念”组成的“精神状态”,在以往很少被放在一起讨论的武者小路和叶灵凤等作者的交汇点做切片,正可以观察到日本私小说作者和中国浪漫派作家在1920年代围绕一种新的语法心态(grammatical mentality)而进行的“心理痴迷”写作的征象,一种通过采纳欧式语法结构而将书面语口语化的风格革命。


应该说,该研究的问题意识最初由东亚研究中相关问题的推进程度所决定,但研究者却并没有陷入既有的争论中,而是绕过了关于“私小说”、“浪漫主义”这样的批评标签是否合理的问题,继续沿用了意识流研究中“文类区分”(classification)的实验思路来建立关于“重复”的多特征模型;最后再将比例尺拉回至单个文本上,以查看某些“西式”的语言策略和风格生产之间的深层互动——其最终的落脚点是意在回答“重复”在建构东亚现代意义的“叙事自我”中所发挥的实际作用,还有这种模式跨语言成立的真正原因:“这种语言实验旨在提供一种与现代个体的主体性相称的写作模型,实际则提供了自我‘发现’的条件……在日本和中国文学史上内化的现代主体(modern interiorized subject)的发展中,白话写作都是生成式(generative),而非反应式(reactive)的”。[62]该案例与前面几项研究的不同之处在于,研究者放弃了对莫莱蒂和卡萨诺瓦等人的世界文学模型进行验证的思路,真正做到了以东亚现代主义文学为建模和比较分析的对象,这无疑代表了美国“区域研究”中,由“世界文学”问题牵引出的一种颇有前景的数字人文研究取向,一种从“边缘”处主动回应西方中心视角的微妙抵抗。






网络分析与跨太平洋的现代主义诗歌社群


如果说《文学模式识别》、《湍流》、《自我重复与东亚文学的现代性》等研究主要利用了语言学建模的手段来研究现代主义文学的全球生产和传播,其研究对象仍然是文学文本,那么在朗和苏真完成于2013年的一项题为Network Analysis and the Sociology of Modernism(《社会网络分析与现代主义的社会学》)的研究中,[63]他们还曾采用更加直观的社会网络分析(Network Analysis)方法,以文学活动为对象,结合期刊档案和出版数据,来追踪英美现代主义诗歌跨太平洋的实际演变网络。这一研究可视为《湍流》的前身,也同样含有回应莫莱蒂假说的意图。可贵的是,其1920年代的诗刊和出版数据不仅将美国东西海岸和日本地区完全包括进来,还囊括了一部分中国同一时期的数据,因而中国1920年代新诗群体的诗歌活动也被纳入跨国诗歌网络,成为比较的对象。


值得一提的是,另一项由朗独立完成的论文“Fog and Steel: Mapping Communities of Literary Translation in an Information Age”(《雾与钢:图绘信息时代的文学翻译社群》),同样以探讨此种诗歌现代主义的跨地域接受和流动为目标,却在不同尺度上聚焦于文学翻译,这一被构想世界文学模型时的莫莱蒂所忽略的重要问题。朗利用两次世界大战之间日本诗坛翻译诗歌的期刊数据,搭建起被译介诗人的“关系网络”。有趣的是,在这一基础上观察“被翻译诗人网络”的结构状况,再结合对当时诗坛的细读,便可以看到“源文本”的美学氛围是如何被译者利用,进而造成了本土诗歌阵营之间复杂的审美区隔的。也就是说,为此种做法所关心的是当“源文本”进入新的文化背景后,是在何种关系上被重组为不同的“翻译诗歌社群”的?例如,桑德堡(Carl Sandburg)如何成为了一个关键性节点而被左翼宣传诗阵营和抒情派所“共享”的?值得注意的是,对这一网络的绘图是建立在对一定规模的历时数据进行计算的结果之上的,据此朗提出一种新的翻译模型:作为附属机制(affiliative mechanism)的诗歌翻译,其核心职能便在于调节诗人和其所在文学场中占据的立场之间的关系。在这篇文章中,朗感兴趣的个案是日本诗人草野心对桑德堡的“选择”,他力图呈现的是在持续多年的译介过程中,草野心对诸种美学立场和占位策略的权衡选择是如何体现出来的,或者说,译者是如何以翻译行为来回应本土的美学和政治?此外,中国的翻译网络也被拿来做更大规模上形态比较的对象。由此可以看到,从宏观的翻译网络分析,到对具体诗人译介行为的细读,这一研究的另一潜在焦点在于如何启用不同规模(scale)的量化视野来观察先锋诗歌的翻译和发表行为,由此才最终产生了一种基于文本流通情况的量化关系模型。


令人稍感遗憾的是,以上比较研究的项目虽然采用了中国方面的数据,但是所涉数据量仍然十分有限,如在《社会网络分析与现代主义的社会学》中仅收集到中国现代时期的八本重要文学期刊的数据。所以如果想将民国诗歌社群的情况作为国际现代主义拼版的一块也纳入进来,只能寄希望于后续中文项目的深入展开了。






结语

  

至此,从概念模型到计算批评,从弗朗科·莫莱蒂到文本光学实验室,“实证研究”和文学阐释、文化批评被有机地融合一体。首先,“远读”与“细读”不再截然对立,而是要根据研究需要,灵活取用不同度数的观察“镜片”,选择有效的测量手段,才能发现问题的关键,这是量化文学研究的本质所在。其次,文本(光学)实验室不仅推进了数字时代的“世界文学”研究,也让该问题真正获得了数字人文的解决手段。从社会科学假设-验证的实证模式出发的莫莱蒂,在写作《文学史的抽象模式》时仍然是在做理论,这种理论是关于研究对象与其处身的世界之关系的一种“抽象”,为了把关系进一步抽象出来,他主张“远读”的方式,为的是从大量文化现象中勘测出宏观模式,然而在后继者看来,他恰恰没能真正走到“建模”这一步,而仅仅满足于对假设和模型的描述而并非运用统计工具完成对模型的“检验”,这使得他的全部工作,仍然还是一种阐发式的理论构想,这便在一定程度上导致了反思维度的缺乏。相反,数字人文和文化分析学以多语种的现实语料为对象,通过对作为世界文学现象的现代主义精确而复杂的建模,使得大规模的形态比较终于成为可能,而更重要的,启用不同的观察和分析尺度,是为了完成对模型本身的反复验证。最后,人们不仅验证了莫莱蒂当年的相关猜想,还找到了对机器进行质询,也就是走向一种文化批评的重要突破口,文化分析学成为批判性的数字人文实践的代名词,其最终目的是为了在数字时代批判地生产新知。


向上滑动 查看注释:

[1]蕾切尔·萨格纳·布玛、劳拉·赫费曼:《查找与替换:约瑟芬·迈尔斯与远距离阅读的起源》,汪蘅译,《山东社会科学》,2018年第9期。

[2]Detwyler , Anatoly、姜文涛:《数字人文作为一种方法:西方研究现状及展望》,赵薇译,《山东社会科学》,2016年第11期,第30页。

[3]弗兰科·莫莱蒂:《对世界文学的猜想》,诗怡译,《中国比较文学》,2010年第2期。

[4]Ruben Hackler and Guido Kirsten:"Distant Reading, Computational Criticism, and Social Critique. An Interview with Franco Moretti", in: Lefoucaldien, 2/1(2016),DOI:10.16995/lefou.22

[5]让莫莱蒂心仪的其实是Ernst·Mary(恩斯特·迈恩)的系统理论和物种起源论。迈恩的理论在1930年代左右成形,是一种将19世纪孟德尔遗传学与达尔文“进化论”整合的理论,但并不就是达尔文的“进化论”。而进化论也并不是很多人理解的拉马克主义和相信社会进步的斯宾塞主义。关于如何区分两者,以及“被宣传扭曲的达尔文”在传播过程中所遭致的悲剧,高树博在其著作中曾给予解释。参见高树博:《远距离阅读视野下的文类、空间和文学史——弗兰克·莫莱蒂文论思想研究》,中国社会科学出版社,2016年,第15页。

[6]高树博:《远距离阅读视野下的文类、空间和文学史》,中国社会科学出版社,2016;杨玲:《远读、文学实验室与数字人文:弗朗哥·莫莱蒂的文学研究路径》,《中外文论》,2017年第1期;陈晓辉:《世界文学、距离阅读与文学批评的数字人文转型》,《文艺理论研究》2018年第6期。

[7]Hackler, Ruber, Kirsten, Guido & Moretti, F. " Distant Reading, Computational Criticism, and Social Critique. An Interview with Franco Moretti", Lefoucaldien, Vol. 2, 1 (2016).

[8]实际上,为了避免数字人文陷入技术主义的迷思,Underwood甚至不惜重启“远读”的概念,在重新评价莫莱蒂的时候,认定“假设-验证”实验范式的引入,才是远读研究的真正创新。

[9]Franco Moretti: “Conjectures on World Literature”, New Left Review 1. Jan-Feb.实际上,莫莱蒂更是受到了华勒斯坦的“世界-体系”概念模型启示,来阐发自己的世界文学观。但是他的阐发同样是在描述一种“文学世界体系”——“既是整体,但同时不平衡”的模型。在今天的社会科学和数据科学中,概念模型作为现实世界到信息世界的第一层抽象,具有较强的主观色彩,在概念模型和社会现实之间,很可能并没有简单的一一对应的关系,却对后续体系的建构至关重要。

[10]Franco Moretti: “Conjectures on World Literature”, New Left Review 1. Jan-Feb.  “World-Systems Analysis, Evolutionary Theory, ‘Weltliteratur’”. Review (Fernand Braudel Center), vol. 28, 3(2005): 217-228.

[11]Franco Moretti: Distant Reading. Verso. 2013. p44.

[12]弗朗哥·莫莱蒂:《世界文学猜想》,尹星译,《世界文学理论读本》,124页,北京大学出版社,2013年。

[13]张谷铭:《Philology与史语所:陈寅恪、傅斯年与中国的“东方学”》,《“中央研究院”历史语言研究所集刊》,第87本,第2分册(2016年6月);Robert J. Richards, “The Linguistic Creation of Man: Charles Darwin, August Schleicher, Ernst Haeckel, and the Missing Link in Nineteenth-Century Evolutionary Theory,” in Experimenting in Tongues: Studies in Science and Language, ed. Matthias Doerres, Stanford University Press, 2002, pp. 21-48.

[14]Franco Moretti: “Conjectures on World Literature”, New Left Review 1. Jan-Feb.

[15]James Turner: Philology : the Forgotten Origins of the Modern Humanities, Princeton University Press, 2000.p.126

[16]转引自“前沿动态:译文-汉藏语系起源于新石器晚期中国北方的发生学证据” https://mp.weixin.qq.com/s/F8Ds06meB46n02N7anaOlQ

[17]例如前不久发表在Nature上的一项关于“汉藏语系起源于新时期时期晚期中国北方”的成果,就是利用贝叶斯分布定理,对具体词根义数据做贝叶斯谱系的发生分析统计,识别和重建语系内部的显性遗传关系,再经过与考古资料的对比,从而发现汉藏语系家族内部自身的“血统”演变样态。见Zhang, Menghan, et al. "Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic." Nature .569 (2019):112-115.

[18]但汉松甚至认为,功能语言学加上文体学再往前推一步,某种程度上就构成了今日“数字人文”的语言学基础。参见但汉松:《朝向“数字人文”的文学批评实践:进路与反思》,《文化研究》,2018年第2期。

[19]弗朗哥·莫莱蒂:《世界文学猜想》,《世界文学理论读本》,124页,尹星译,北京大学出版社,2013年。

[20]这其实就是《好莱坞星球》中的世界市场与地方原材料相遇之后发生的“形式妥协”,这一次则表现为一种现代小说兴起的“共同”样态。不难看出,这一来自文学社会学的术语,原指文学场或文化场的自主性(autonomy,或自律性)被政治、商业等非自主原则影响,变成了半自主或不自主的空间。

[21]上世纪末随世界文学问题而起的,还有为中国读者所熟悉和喜欢谈论的“世界诗歌”问题。

[22]Ted Underwood. “A Genealogy of Distant Reading”. Digital Humanities Quarterly. Vol.11, 2 (2017). http://www.digitalhumanities.org/dhq/vol/11/2/000317/000317.html.

[23]乔纳森·阿拉克:《盎格鲁-全球性?》,赵文译,张永清、马元龙主编:《后马克思主义读本》,北京:人民文学出版社,2011年。

[24]亚历山大·比克罗夫特:《没有连字符的世界文学》,赵文译,张永清、马元龙主编:《后马克思主义读本》,北京:人民文学出版社,2011年。

[25]Andrew Goldstone. The Doxa of Reading. Publications of the Modern Language Association of America. Vol. 132, 3 (2017): 636-642.

[26]Franco Moretti: Distant Reading. Verso. 2013. p43.

[27]Franco Moretti: Distant Reading. Verso. 2013. P64.

[28]例如上世纪九十年代曾活跃于北美的经验研究发展联盟REDES(Research Development of Empirical Studies)下属的一些研究小组,对文学阅读反映(Reader Response Research)所进行的一系列持续性研究。他们采用现象心理学记录出声思考的方法,再和神经脑电以及访谈手段结合,力图以文学阅读标准化计量的经验研究与传统的接受美学进行对话。此类探索是在同来自主流叙事学界和主流心理学界的理论辩驳中成长起来的。参见:Miall, D. S., & Kuiken, D. (1994). Beyond text theory: Understanding literary response. Discourse Processes, 17, 337-352. Miall, D. S., & Kuiken, D. (1998). The form of reading: Empirical studies of literariness. Poetics, 25, 327-341.Kuiken, D., & Miall, D.S (2001). Numerically aided phenomenology: Procedures for investigating categories of experience. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research [On-line Journal], 2(1).etc.

[29]Hackler, Ruber, Kirsten, Guido & Moretti, F. "Distant Reading, Computational Criticism, and Social Critique. An Interview with Franco Moretti", Lefoucaldien, Vol. 2, 1 (2016).

[30]Franco Moretti, Graphs, Maps, Trees: Abstract Models for Literary History, London: Verso, 2005, p. 4. 后文出自同一著作的引文,将随文标出该著作首词和引文出处页码,不再另注。

[31]正如他在《现代欧洲文学:一份地理草图》的注释中就已写明的那样:“空间分离的原则不仅适用于文学文体和文学运动,而且也被应用于文类的发展。”参见Franco Moretti, "Modern European Literature: A Geographic Sketch", in New Left Review, vol. 206 (1994), p. 92.

[32]虽然莫莱蒂的解释是代际,但这个概念最好的对应性理解应是“文学时代”。正因活跃在同一时段历史舞台上的并非一种文类,而是某一种文类最兴盛,占有最多市场份额,而另一些同样蓬勃发展。这种“一超多强”的情形,形成了“霸权”。正如我国八十年代以来的“新时期文学”是“新启蒙”、寻根文学、改革小说一同登场,但是也许某种传统的现实主义小说仍占有最多市场。

[33]莫莱蒂曾在《猜想》中援引此概念来指代书籍史上那些为学院中的英文经典所遮蔽的、大量不为人知的文学档案。参见Franco Moretti, “Conjectures on World Literature”, in New Left Review, vol.1, (2000), p. 55。

[34]Franco Moretti, “Franco Moretti: A Response”, in PMLA, v. 132, 3 (2017), p. 688.

[35]Franco Moretti, “World-Systems Analysis, Evolutionary Theory, ‘Weltliteratur’”, in Review (Fernand Braudel Center), vol. 28, 3 (2005), pp. 217–228. 

[36]Franco Moretti, Distant Reading, London: Verso, 2013, p. 123. 后文出自同一著作的引文,将随文标出该著作首词和引文出处页码,不再另注。

[37]参见林凌瀚、戴利娅·波特《杂糅的商品、性别审美及跨文化比较的挑战:回应莫雷蒂<小说:历史与理论>》,曾毅译,林凌翰校,载《澳门理工学报》2019年第2期。

[38]倒是中文世界的研究者曾在这一方向上做过一定探索。参见廖俊凡《中国古典白话小说中的社会网络关系:以<儒林外史>为例》,台湾大学电机资讯学院资讯网络与多媒体所硕士毕业论文,2010年;赵薇《社会网络分析与<大波>三部曲的人物功能》,载《山东社会科学》2018年第9期。

[39]Richard Jean So, “All Models are Wrong”, in PMLA, v. 132, 3 (2017), p. 5.

[40]此前,只有但汉松曾明确地将“算法批评”视为数字人文的一种“进路”。参见但汉松《朝向“数字人文”的文学批评实践:进路与反思》,载《文化研究》2018年第2期。

[41]Franco Moretti, "Preface", in Franco Moretti, ed., Canon/Archive: Studies in Quantitative Formalism, New York: N+1 Foundation, 2017, p. xv.

[42]See Ryan Heuser, Long Le-Khac, "From Keywords to Cohorts", in Franco Moretti, ed., Canon/Archive: Studies in Quantitative Formalism, pp.147-194.

[43]参见艾伦·刘《通往思辨的基础设施研究》,汪蘅译,载《山东社会科学》2019年第6期。

[44]实际上,苏真并未明确说明实验室显示出了哪种改变,此处为笔者的理解。参见Richard Jean So, “All Models are Wrong”, p.672 .

[45]Literary Lab, “Pamphlet 5”, in project “Style at the Scale of the Sentence”, Jun., 2013

[46]在这个实验中,为了将由句子结构体现出的“句法”(syntax)和其所含有的“语义”(semantics)之间的具体关系表示出来,实验室采用了自然语言处理中常用的“指示词”(MDW)的检测办法(同时也曾被莫莱蒂用于悲剧研究):即首先计算所有句子中单词的平均“预期”出现频次,然后计算这些单词在每一种句子类型中实际出现的频次,这样便找出了那些显著高于预期的词语,以这些最特别的语词作为“指示剂”来为四种类型的句子做标注。最后又将这些数据用主成分分析法做降维分析,这样就将这四种类型句子的语义向量分布可视化出来了。

[47]此处参照了杨玲的翻译。参见杨玲《远读、文学实验室与数字人文:弗朗哥·莫莱蒂的文学研究路径》,载《中外文论》2017年第1期,第303页。

[48]艾米丽·阿普特:《文学的世界体系》,王国礼译,《世界文学理论读本》,大卫·达姆罗什、刘洪涛、尹星主编。北京:北京大学出版社,155-156页。

[49]霍伊特·朗、戴安德、姜文涛《美国芝加哥大学霍伊特·朗副教授访谈》,赵薇译,《山东社会科学》,2016年第11期。

[50]Richard Jean So, “Transpacific Community: America, China, and the Rise and Fall of a Cultural Network”, Columbia University Press, 2016.

[51]梅丽莎·丁斯曼,苏真:《人文研究中的数字:苏真访谈录》,向俊译,《山东社会科学》,2018年第9期,78-79页。

[52]http://artfl-project.uchicago.edu/

[53]该项目的建设情况,参看Spencer Stewart,朱吟清,吴佩臻,赵薇等:《比较文学研究与数字基础设施:以建设中的“民国时期期刊语料库(1918-1949,基于PhiloLogic4)”为例》,《数字人文》,2020年第1期,中华书局,2019年12月。

[54]同上注

[55]Franco Moretti, "Preface", in Franco Moretti, ed., Canon/Archive: Studies in Quantitative Formalism, New York: N+1 Foundation, 2017, p. xv.

[56]霍伊特·朗、苏真:《文学模式识别:文本细读与机器学习之间的现代主义》,林懿译,《山东社会科学》2016年第11期。

[57]Hoyt Long and Richard Jean So, Turbulent Flow: A Computational Model of World Literature, Modern Language Quarterly, 77:3,2016.9,345-367.

[58]Franco Moretti: Modern Epic: The World-System from Goethe to Garcia Marquez, Verso. 1996, 177.

[59]Franco Moretti, “World-Systems Analysis, Evolutionary Theory, ‘Weltliteratur’”, in Review (Fernand Braudel Center), vol. 28, 3 (2005), pp. 217–228.

[60]Hoyt Long and Richard Jean So, Turbulent Flow: A Computational Model of World Literature, Modern Language Quarterly, 77:3,2016.9,365-366.

[61]戴安德、霍伊特·朗、朱远骋:《自我重复与东亚文学的现代性,1900——1930》,《山东社会科学》,2018年第7期。

[62]戴安德、霍伊特·朗、朱远骋:《自我重复与东亚文学的现代性,1900——1930》,《山东社会科学》,2018年第7期, 53页。

[63]Richard Jean So, Hoyt Long, “Network Analysis and the Sociology of Modernism”, Boundary2, 40(2), 2003,p147-182.


作者简介:

赵薇,中国社会科学院文学研究所助理研究员,芝加哥大学Neubauer Collegium文本光学实验室访问研究员(2017-2019)。研究方向为比较文学、二十世纪中国文学与数字人文。




《数字人文》2020年第3期目录

未来学者论坛|时代精神:历时文本关键词提取与解读 ——基于《人民日报》文本的实践

走进数字人文——爱尔兰科克大学“数字人文导论”课程纪要

关于科克大学数字人文学院的报告

DH国外最新动态:2020年10-12月

校对  |  肖爽

美编  |  徐璇


公众号ID:thudh2020
转 载 请 联 系 授 权

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存