“精确人文科学”的价值

DH数字人文 2022-07-17

〔德〕 Gerhard Lauer（撰）庞娜娜（译）

-------------------------------

［提要］作为一种新兴的人文科学研究方法，数字人文为人文科学提供了更好的研究基础和更广阔的发展前景。但这种“精确的人文科学”对研究方法和研究内容的革新引发了“数字人文之争”。实际上，人文科学的精确化之路有着悠久的历史，在人文科学研究中走更精确的道路并不是一种破坏性行为。“精确人文科学”对人文科学的进一步发展是有价值的。“精确人文科学”能否在21世纪的人文研究中扮演更重要的角色，取决于人文学者们对它的态度。

［关键词］数字人文精确人文科学不精确人文科学价值

［中图分类号］I0-05;G05［文献标识码］A［文章编号］0874-1824(2020)03-0144-12

-------------------------------

一

引言

不论是在博物馆还是在大学，抑或是在其它什么地方，用鱼敲打油画都不是一个可被社会接受的行为。在接受《卫报》采访时，苏格兰着名作家艾莉森·路易斯·肯尼迪（Alison Louise Kennedy）便用这样一个“拿鱼打画”的比方，来说明计算机为人文科学和艺术领域所作的“贡献”。在肯尼迪看来，就文学而言，计算机辅助法不能为人文和艺术领域带来任何新东西；数字化不过是人文科学在失去前进方向的状态下做出的错误尝试。^①没有比这更直接的批评了。随着计算机的应用，文化研究失去了肯尼迪所谓的某种评价文学和艺术的能力。如果人们认同肯尼迪的观点，那么那些追求数字化的文化分析专家们的评价标准就会变得很怪异：专家们好像只字不提文学，仅仅把文学故事分解成无意义的小单位来研究。肯尼迪认为，这种方法也许特别适用于畅销文学的创作，但无法带来对文学和艺术的新认识，因为研究者间主观层面的微妙差异已经被淹没在“以计算机为驱动的文学批评”的大数据中了。简言之，这种数字化的发展于肯尼迪而言是病态的。更可怕的是，在数字化的背景下，这种不安更是难以言表。

肯尼迪不是唯一一位坚决批判数字人文的学者。相较之下，美国文学理论家斯坦利·费什（Stanley Fish）对数字人文的批评更是有过之而无不及。费什曾在《纽约时报》上公开指责：以计算机为导向的人文科学描绘了一种虚假的永恒，这助长了人们对计算机和互联网的盲从。^②美国诗人、文学评论家亚当·基尔希（Adam Kirsch）也为计算机导致的人文科学的平庸而惋惜。^③丹尼尔·阿灵顿（Daniel Allington）、莎拉·布鲁耶特（Sarah Brouillette）和戴维·哥伦比亚（David Golumbia）等人^④还担心，随着数字和计算机的广泛运用，人文科学领域也会像硅谷一样出现对技术的盲信。^⑤迈克尔·哈格纳（Michael Hagner）和卡斯帕·赫希（Caspar Hirschi）^⑥等人也批评了数字人文宣称的对社会知识的夸张性重塑。^⑦2018年，《法兰克福汇报》更是以《数字人文——繁荣时期的回顾》（“Digitale Geisteswissenschaften - Bilanz einer Gründerzeit”）为题，用了整整两个版面来介绍人文科学的这一新发展。但文章最终并没有确定，数字人文究竟是发展的新机遇，还是实证主义的骗局。^⑧

这类针对数字人文的争论逐年增加。2019年，甚至出现了“数字人文之战”。学者们在《批评探索》（Critical Inquiry）和《高等教育纪事报》（The Chronicle of Higher Education）等知名学术刊物上争论计算机辅助方法对文学专业的价值：计算机辅助方法值得应用吗？它会不会只能带来平庸的研究结果？^⑨几乎不需要多么敏锐的洞察力，学者们就会发现这场争论涉及诸多不同的内容：肯尼迪关乎写作的创意性，费什关乎数字出版路径，基尔希关乎文学研究理想形态的建构，阿灵顿等人关乎新自由主义，哈格纳和赫希关乎对研究中博学美德的称赞，《法兰克福汇报》、《批评探索》和《高等教育纪事报》的作者们则致力于捍卫他们所熟悉的人文科学的传统，以防其可能发生的变化。观点俗套是这些非议的共同之处：翻来覆去无非是病态、新自由主义或实证主义等说辞，所强调的依然是温暖、有人情味的文化同冰冷、理性的文明之间的对立。早在1994年，文化学家格奥尔格·波勒贝克（Georg Bollenbeck）就在《教育和文化——德国式阐释模式的辉煌与不幸》（Bildung und Kultur. Glanz und Elend eines deutschen Deutungsmusters）一书中阐明了这一逻辑存在的问题。^⑩

面对数字人文所带来的不安，人们常常借用文化批评的套话来回避一个关键问题：人文科学除了其长期依赖的、熟悉的既定研究形式，能不能或者该不该拥有更多的可能性？人们总能发现各式各样针对数字人文的批评：现代批评派认为的阻碍作用，文化批评派宣称的自我毁灭等，这些非议和批评都值得我们认真探讨，因为我们能够从中获悉人文科学的现状及其发展的可能性。这场争论从不同角度涉及了人文科学的自我认知。这篇文章选取了其中的一个方面来探讨，即“精确科学”（exakte Wissenschaft）和“不精确科学”(inexakte Wissenschaft)之间的复杂关系。

二

格林兄弟的“准确”与“不准确”

在数字人文遭遇非议的当下，可能并不是仔细权衡各方观点的好时机。但事实上，关于精确与不精确的人文科学的争论由来已久。早在1846年的法兰克福日耳曼学者大会上，雅各布·格林（Jacob Grimm）就已经谈到了“不准确科学”（ungenaue Wissenschaft）的价值。他指出，“不准确科学”和“准确科学”（genaue Wissenschaft）的概念分别译自法语“science inexact”和“science exacte”。和我们现在的做法相似，当时的人们也对学科进行了划分。用雅各布的话来说就是：

准确科学指的是那些所有内容都经过了仔细论证的学科：例如数学、物理和化学。一旦缺乏这种准确性，其所作的全部努力便会统统失去效力。不准确科学指的则是那些允许自己在实践中迷茫的学科，我们所投身的专业就属于这一范畴。尽管可能长期存在着错误和不足，但它们总能从这些错误和不足中不断进步，变得更加纯粹：例如历史研究和语言研究。诗歌本身也是一种不准确的科学。人们几乎无法要求历史研究做到完全的准确；陪审团的判决也不是基于算术运算，而是简单的常识，且常常出错。^⑪

雅各布补充道：“在战争中，炮兵秉持的就是准确、严谨的原则，但骑兵在近距离砍杀敌人的时候，则无需那么准确。”在他看来，“准确科学”和“不准确科学”之间虽然有所差别，但各有其独特的价值。例如格林兄弟研究的语言科学，其价值在于：“所有令人欢欣鼓舞的发明创造，……都来自语言描述的创造力。”因此“不准确科学”更接近人的内心。另一方面，“准确科学”也是有价值的，因为它能利用精确性将自然物质解构和重组。雅各布写道：“所有的杠杆和发明，（以及）那些让人惊奇或害怕的东西，都是它们的产物。”换句话说：“准确科学”正在改建世界。它们之所以有这种能力，正是因为它们的“仔细论证”。对雅各布来说，“准确”大概指的就是化学的精确实验，严格遵循逻辑的林氏植物分类法，^⑫硅藻属或船蛆属的新物种，以及数学的严谨性。“不准确”描述的则是一组更贴近我们内心的科学。尽管它们可能长期存在着不准确、错误乃至缺陷，但显然，新出现的词句、歌曲或历史背景更容易触动我们。因此，相较于“准确科学”，“不准确科学”为教化国民作出了更大的贡献。所以直到今天，它们也依然是报刊杂志上的热议话题。不难发现，借助“准确”和“不准确”的概念，雅各布·格林描述了两类科学在研究方法上的不同，同时也涉及双方在社会影响以及社会地位层面的差异。

从雅各布1846年的演讲中可以看出，自然科学家的不断成功着实让他感到了不安。雅各布认为，自然科学家的能力是“可怕的”：比起非凡的词句、华丽的辞藻，广大青年更重视物理学家和化学家的实验及其应用范围。他甚至宣称，大家都在追着物理学跑。当时，雅各布就已经感受到了人们对“准确科学”的倾向性。可见，早在170多年前，科学就已经有了向精确化道路发展的趋势。雅各布也谈到了“不准确科学”的“不断进步”，他说，“尽管可能长期存在着错误和不足”，但随着时间的推移，“不准确科学”也“能从这些错误和不足中不断进步，变得更加纯粹”。这里的“纯粹”和“准确”是可以互换的词汇。在雅各布看来，这种对“准确科学”的倾向性似乎是历史发展的必然趋势，他所研究的语言科学，迟早也会被算作是“准确科学”中的一员。

当然，精确的语言科学在格林兄弟时期尚未形成。兄弟二人的词典编纂项目为语言科学发展成一门精确的科学作出了重大贡献。在谈到兄弟俩的辞典编纂计划时，威廉·格林说他们想要编纂成一部涵盖“各个词汇的自然史”的大词典。^⑬雅各布·格林反对当时普遍强调概念和审美的文学研究，他要求建立以作品的语言构成为基础的文学史，这导致了19世纪及其之后的很长一段时间里，语言和文学的研究是分开进行的。^⑭格林兄弟的“德意志研究”为语言科学树立了严谨的工作标准。^⑮作为“精确性”（Exaktheit）的变体，“严谨性”（Streng）能成为他们的指导原则之一绝非偶然。格林兄弟和校勘学家卡尔·拉赫曼（Karl Lachmann）以及语言学家乔治·弗里德里希·贝内克（Georg Friedrich Benecke）一起，将语言科学从以前的信息搜集发展成了严谨且专业的独立学科。

因此，准确性可以说就是格林兄弟的方法论理想。这一方法论将格林兄弟的研究与冯德哈根（Friedrich Heinrich von der Hagen）以及布辛（Johann Gustav Gottlieb Büsching）等日耳曼学者主张的以文化民族或民间教育为取向的语文学研究区别开来。格林兄弟常常尖锐地批评冯德哈根等竞争对手，丝毫不能容忍布辛等人的错误和不足。因为格林兄弟认为，语文学的研究也应被严格论证。因此，在兄弟二人看来，“准确科学”与“不准确科学”之间的矛盾并非是不可调和的。温暖的人文科学和冰冷的自然科学的说辞，更多的是人文科学对外的一种策略，其目的是为自己所属的学科创造合法性。正是因为有了严谨的方法论理想，格林兄弟才被算作是语文学的创始人之一。他们把语文学发展成了一门具有共同研究对象的学科，规定了语文学学者应具备的基础知识，定义了语文学的研究问题，同时也指出了适用的研究方法。除此之外，他们还确立了语文学的学者结构，据此可以判断一位学者到底属不属于语文学家。按照格林兄弟的标准，冯德哈根和布辛的研究并不属于语文学的研究范畴。正是得益于格林兄弟的精确传统，古典语文学家维拉莫维茨（Ulrich von Wilamowitz-Moellendorff）才能在1921年完成了《古典学的历史》（Geschichte der Philologie）一书，这本书的核心便是语文学在语法研究中所遵循的精确性准则。^⑯对格林兄弟和维拉莫维茨来说，严格的文本批评是为了重现文本在历史上的重要意义。格林兄弟把语文学视为一门追求精确的学科，即使是身处浪漫主义文学时期，他们的严谨性也丝毫不减。

这就是19世纪中叶发生在格林兄弟身上的“准确科学”与“不准确科学”间的争论。时至今日，“两种科学群”^⑰的说法仍然以不同的形式普遍存在，相关的讨论也和格林兄弟时期一样充满矛盾。两个阵营的学者对数字人文的评价也往往大相径庭。例如，肯尼迪就敌视地把计算机辅助方法比作是对艺术品的摧残。对一些学者而言，“精确人文科学”是不经反思的技术主义；对另一些学者而言，“不精确人文科学”不是科学。从雅各布到肯尼迪，人们讨论的主题总能被划分成这两类。至于“准确人文科学”最终会决定人文科学的研究范式这一观点，只是在争论中被顺带提及。“准确人文科学”到底是一种威胁还是光明的前景，完全取决于学者的立场及其所遵循的论证策略。如果仔细审视雅各布将语文学准确性的方法论合法化的做法，就会发现，其实这并不涉及“准确人文科学”和“不准确人文科学”的对立；肯尼迪和其他批判数字人文的学者也只是在为自己的学科和学术利益辩护，并未因此把自己的学科视为不准确的科学。实际上，没有学者愿意在学术研究中被认为不严谨或不准确。

只有把“反对精确的人文科学”这种矛盾性的表述同文化批评的传统相分离，人们才能更清楚地看到，精确和不精确人文科学的研究对象和研究方法的差异是与学科间不同的作用范围相关联的。像格林兄弟那样研究语言自然史的学者，需要用高度概括的检验标准，甚至是语言变迁的法则来进行研究。而那些着眼于艺术品的独特性或反思文学的主观艺术性的学者，则强调审美经验和文学诠释的个性化。双方都强调了各自研究对象的复杂性，尽管在具体的研究方法上存在差异，但他们都用自己的方法达成了研究目标。所以，哲学家威廉·狄尔泰（Wilhelm Dilthey）所宣称的“理解性的人文学科应与严格规范的学科相对立”，无论在学科体系上还是在历史上都是不准确的。更准确的说法是，由于学者对研究对象的理解存在差异，衍生出了对“精确人文科学”的不同理解。例如，对单一诗作的阐释可以被认为是精确的，因为这种解释只适用于这一个研究对象，且不能被刻意泛化。反之，对语音变化法则的表述也可以被看作是精确的，因为它适用于语言这一多样的研究对象，因而可以被概括成普遍的语音规则。

可以看出，关于人文科学准确性的争论早在计算机和互联网出现之前就已经存在了。但一直以来，争论所涉及的观点大多有失偏颇。只有在精确性成为双方都熟识的常规概念之后，这一争论才有意义。格林兄弟便是证明“精确人文科学”并非悖论的范例。对格林兄弟而言，精确性不仅是一种熟识的常规概念，更是一个崇高方法论理想。

三

从圣灵中诞生的“精确方法”

“精确人文学科”的理想并非由格林兄弟首创，它的历史比格林兄弟所处的时代更久远，甚至要早于近代自然科学的兴起。^⑱正如我们在格林兄弟和当前的数字人文之争那里所看到的，人们通常认为精确性不适用于人文科学，它只存在于自然科学、生命科学和技术科学之中，精确人文科学就是个悖论。为了证明这一观点，人们总是会强调科学史上的关联性：16至17世纪，人们通过观察和测量获得了有关自然界的客观知识，近代自然科学随之兴起，直到19世纪中叶，近代自然科学才最终形成。^⑲毫无疑问，望远镜、显微镜等仪器以及知识的数学化，都在当时促进了新科学理想的实现，即对自然现象进行准确的观察和规范的描述。从那时起，理论、模型以及系统设计的实验就成了“精确科学”这一概念和现象的一部分。乍看之下，这些似乎正是人文科学所缺乏的东西，人文科学的研究似乎并不要求达到自然科学所要求的客观性。

然而，正如悉尼大学科学史教授斯蒂芬·高克罗格（Stephen Gaukroger）所发现的那样，在科学史上，类型化、刻板化地划分出精确的自然科学和不精确的人文科学的做法几乎是站不住脚的。他注意到，强调精确观察的近代科学与基督教信仰的教派化几乎发生在同一时代。在那个时代，宗教既扮演着主导性的角色，又发挥着破坏性的作用。^⑳高克罗格的观点有启示意义，因为它可以证明，对那些现在常被列为不准确科学的学科来说，向精确化方向发展的理想同样适用。例如，如今大多被划归到了历史诠释学范畴的某些学科，比如文献学、印章学和古文字学等，它们都在充满宗教色彩的环境中产生，并且使用了精确的研究方法。

不同的教派和修会都想通过研究证明自己才是对的，强调其他人坚持的都是异端邪说。^㉑1675年，耶稣会士帕佩布罗施（Daniel Papebroch）出版了《古文书真伪辨异序》（Propylaeum antiquarium circa vert et falsi discrimen in vetustis membranis）一书，第一次详细阐释了如何精确区分真假手稿。1681年，本笃会士让·马比荣（Jean Mabillon）发表了开创性的研究成果《古文书学》（De re diplomatica），由此产生了一种对文献进行精确鉴别的新科学。科学工作应以研究对象的客观物质性为指导，而非某种先入为主的偏见。只有这样才能证明，“加尔默罗会^㉒的宗教传统来自先知以利亚”或者“罗马地下墓穴里的是圣人遗骨”等说法是错误的。教士们总在强调自己才具有科学上的准确性，并以此证明其它教派的错误。这正好符合了那个时代科学界的共同理想，即对研究对象进行准确的观察。世界上最早的科学团体之一，1603年于罗马成立的山猫学会（Accademia dei Lincei），其标志就是视力极佳的猞猁。^㉓著名的物理学家伽利略以及剧作家波尔塔（Giambattista della Porta）都曾是学会的成员。

有史以来最大的版本项目（Editionsprojekt）——记载圣人言行的《诸圣传记》^㉔（Acta Sanctorum）将“精确人文科学”的精神体现得淋漓尽致。因为一旦涉及神圣，几乎所有内容都会严格遵循精确性原则，以便将其与非神圣相分离。但由于这种区分绝非易事，所以《诸圣传记》的成书才会跨越300余年。这本书对圣人生平和事迹描述的准确性也达到了史无前例的高度。这一研究所运用的客观方法，在外交学、印章学或古文字学等领域更是前所未有的。要想分辨出圣人的真伪，就有赖于对手稿的仔细审查，以确保结论的准确和客观。可见，400多年来人文科学对研究的精确性一直都有要求。对手稿等文物进行系统且客观的观察，这种方法与自然科学所遵循的系统客观研究法并无二致。

因此，第一部电脑辅助的作品是由神父罗伯托·布萨（Roberto Busa）出版的有关托马斯·阿奎那（St. Thomas Aquinas，约1225~1274）的宗教作品也就不足为奇了。1949年，布萨神父说服了IBM创始人托马斯·沃森（Thomas J. Watson）帮助创建了包含1,100余万单词的《托马斯著作索引》。布萨的版本继承了“精确人文科学”所遵循的宗教传统，同时这也是计算机在文本领域的首次应用。^㉕1965年，第一篇计算机科学的博士论文由修女玛丽·肯尼斯·凯勒^㉖（Mary Kenneth Keller）发表，她同时也是“初学者通用符号指令代码”（BASIC: Beginners’ All-purpose Symbolic Instruction Code）的研发者之一。布萨神父和玛丽修女证明，人文科学也可以是精确的，这一点不言而喻。

上述历史告诉我们，“精确人文科学”的历史比雅各布·格林所设想的还要复杂得多；精确性和客观性的理想绝不仅限于自然科学。2016年，阿姆斯特丹大学人文学教授任博德（Rens Bod）在《人文科学的新历史》（A New History of the Humanities）一书中表示：对文化规律和文化原则的探索将决定人文科学的历史；精确的研究方法并非伴随计算机的产生而出现。从宗教视角出发摆脱宗教偏见，鉴别不同流派的主张，尽可能准确地阐明事实，这些科学理想早在人文科学与自然科学对立之前就已经存在了。因此，自帕佩布罗施和马比荣时代起，“精确的人文科学”就一直是近现代科学的一部分，而非某种破坏行为。

精确的研究方法对人文科学来说是有意义的，这种方法也总能在人文科学中得到应用。但圣母大学助理教授笪章难（Nan Z. Da）^㉗和肯尼迪却否认这一事实。她们认为，这种精确性削弱了人文科学的特殊性和历史性，因为算法无法理解个体的复杂性。只有整体性的方法才能阐释文学作品的特殊性。文学是如此的复杂，以至于一切计算都只能片面地把握那些琐碎的内容。基于这种设想，她们本应该对人文科学复杂的研究对象加以说明，以便支撑他们的观点。然而，肯尼迪和笪章难都没有论述，文学的复杂性为何与脑科学或社会学的不同。虽然她们承认，精确的计算机辅助方法可以应用于脑科学和社会学的研究，但她们认为这对文学或史学来说并不适用。同样具有复杂性，文学和史学的研究对象同生命科学和社会科学的研究对象之间存在哪些区别和联系？对此，肯尼迪等人什么都没解释。她们提出的有关文学复杂性的论断，更多的只是一种没有依据和理由的个人看法。^㉘

实际上，在目前针对数字人文的争论中，肯尼迪和笪章难等人只是延续了前人的旧有观念——首当其冲的便是威廉·狄尔泰的观念。狄尔泰曾明确地将人文科学的大部分内容排除在自己的理论之外，例如19世纪被广泛应用的文本关系学（Stemmatologie），它精确地展现了文本或语言之间的亲属关系。文本关系学的精确性后来影响了20世纪的遗传学和支序分类学，也就是影响了弗朗西斯·克里克（Francis Crick）、詹姆斯·沃森（James Watson）和罗莎琳德·富兰克林（Rosalind Franklin）以及他们发现的DNA双螺旋结构。同样被狄尔泰排除在外的，还有人们为文学的科学化而作出的巨大努力。例如，恩斯特·埃尔斯特（Ernst Elster）在1897年出版的第一卷《文学研究原理》（Prinzipien der Literaturwissenschaft）^㉙中，第一次定义了文学的概念，并为当时的两门学科（文学和文学史）提供了精确的划分标准。埃尔斯特将文学研究划分成了两个流派：一是他的老师威廉·冯特（Wilhelm Wundt）的实证心理学^㉚；二是新语言学派，以赫尔曼·保罗（Hermann Paul）的《语言史原理》（Prinzipien der Sprachgeschichte）和爱德华·西弗斯（Eduard Sievers）的计量语言学^㉛为代表。狄尔泰和他的追随者们既没有提到德摩根（August de Morgan）那样的数学家（德摩根曾尝试依靠音节和句子的长短来判断《保罗书信》作者的身份）；也没有提到门登霍尔（Thomas Corwin Mendenhall）那样的物理学家（他曾为探究莎士比亚作品的真实作者提出过相关学说）；更没有提到温森蒂（Wincenty Lutoslawski）那样的古典语文学家（他曾致力于用计量分析法确定柏拉图对话的先后顺序）；甚至都没有注意到俄国数学家马尔可夫（Andrey Andreyevich Markov）的具有划时代意义的贡献（1913年，马尔可夫借助普希金的诗文小说《叶甫盖尼·奥涅金》［Eugen Onegin］计算出了从给定字母到接下来每一个字母的过渡概率）。众所周知，“马尔可夫链”^㉜后来在1948年启发了克劳德·香农（Claude Shannon），香农发现，通过计算已知词句在过渡时的平均信息量，人们便可以推定出未知的词句。^㉝因此，肯尼迪等人所谓的人文科学领域的“独特复杂性”，既不成体系，也没有历史依据，只是延续了威廉·狄尔泰的观念。

四

对精确形式的赞扬

对“精确人文科学”的不安在很大程度上与数字人文的形式化特征有关。这种不安导致了在反对“精确人文科学”的辩论中，特别是目前针对数字人文的争议中，某些学者对数字人文的误解。确实，数字人文与诠释性人文学科的研究方法有所不同。数字人文是对研究问题进行建模，也就是将研究问题形式化，进而利用计算机支持的方法和程序来进行研究。^㉞

早在半个多世纪以前，布萨神父就将他的研究问题，即圣托马斯的“上帝在这个世界存在”^㉟指的是什么，用建立词表的方式进行了分解和简化。从研究“上帝存在”到建立“词语索引”，是一种将研究问题模式化的重要方法，这种方法在诠释性的人文科学那里是行不通的。但作为严谨的语言学家，布萨神父有充分的理由选用这种方法。他注意到，承载意义的大词总是紧随在功能性的小词之后。比如，“praesentia”在文本中会以词组“in praesentia”的形式出现，而非单独的“praesentia”。因此，他在《托马斯著作索引》中对功能词给予了和意义承载词一样的重视，并尝试统计出托马斯着作中的所有词汇。但由于词汇量大到远远超出了个人所能统计的范围，所以他开始使用电脑。穿孔卡片帮助他准确地计算出了单词所在的各个组合。通过这种方式，布萨神父在形式上将研究问题分解成了多个精细的步骤，然后再一步步地将研究结果进行重组，这是典型的精确科学才会运用的方法。因为计数也是需要阐释的，至少对“精确人文科学”而言，两者都属于这个范畴。

另一个例子也可以对形式上的建模和阐释进行补充，即由意大利艺术评论家、医生和政治家乔瓦尼·莫雷利（Giovanni Morelli）提出的莫雷利方法（Morellische Methode）。这一方法指的是，不根据模糊的大单位，如提香的构图或拉斐尔的表现形式，而是根据小的细节来理解意大利的艺术作品。^㊱当被问及“什么构成了提香或拉斐尔的风格”时，莫雷利说，与当时把画作为一个整体来鉴赏的传统方法相比，手或耳的绘画技巧更能提供可靠的信息。要想研究绘画风格，就需要将风格这一概念进行精细化的分解，使其形成单独的、可准确观察的、进而可测量的量。这种方法的前提是，像提香或拉斐尔等人艺术作品的复杂性，并不是不可研究的。相反，莫雷利假设：复杂性可以通过将细节形式化的办法来进行建模。这与博兰主义者协会^㊲在17世纪区分手稿时，或布萨神父将圣托马斯的着作分解为可数单词时所采用的方法不谋而合。

在莫雷利之后的一百多年，也就是布萨之后的约半个世纪，英国语言文学家约翰·巴罗斯（John Burrows）在其1987年出版的《计算进入批评》（Computation into Criticism）一书中对简·奥斯汀的小说进行了开创性的研究。与莫雷利和布萨的方法相似，巴罗斯也对文学风格这一复杂的现象进行了建模，并强调了一个很少受文本研究者关注的形式化特征——词频的分布。^㊳随后，在对不同年代作者进行的一系列研究中，他发现，一些不显眼的形式特征，如一位作者会使用哪些词汇，这些词汇的使用频率及其分布，也可以让研究者获得类似于“指纹”的风格，并在此基础上区分作者。^㊴适合区分作者和文本类型的不是句法顺序，也不是那些意义承载词，而是我们经常使用的冠词和连词等功能词。巴罗斯也是最早将系统树图^㊵，即用干系法将基于距离、层级划分的数据集进行可视化，再次从生物学带回到语言学中的学者。此外，他还反驳了“文本作者只是社会建构中的一环”的观点。这一观点认为，同时代的作家作品都是对当时社会的折射，因此作品风格相似，很难区分。巴罗斯认为，只要细心观察，懂得用电脑计算，任何人都能学会如何分辨作者的文体风格特征。

2014年，追随着巴罗斯的脚步，我们对不同文学史上的作者归属问题进行了研究。通过对作者最常用的词汇进行Z检验，我们发现，这种精确的建模方法不仅可以区分不同历史时期的写作，也可以区分19世纪男性和女性作者的不同写作风格^㊶，甚至还可以解决其它疑难问题，例如某匿名期刊上的文章可能是由一战期间作为新闻主编的罗伯特·穆西尔（Robert Musil）撰写的^㊷。也就是说，它可以回答一些文学研究的基本问题，例如作者身份的归属，男性和女性的写作差异，时代的建构，以及作者的个体特征，等等。通过词频、词分布的向量化、感情词或主题的分布等因素对研究问题进行建模，人们可以更好地从历史维度或根据作家的个体特征来把握文学作品的复杂性。

文学不是单一的复杂，而是像自然界和文化中的许多现象那样，有着多重的复杂性。因此，以肯尼迪为代表的对计算机辅助人文研究方法的质疑确实说明了一定问题，但并不是肯尼迪等人所声称的问题。对文学研究中的一些基本问题，计算机能够做出一些贡献，但它并不是万能的。对文学研究问题的建模清楚地表明，在文学研究中，我们应严谨地讨论，或者说必须严谨地讨论这种研究方法的可能性和合理性。科学不是结论性的真理，而是在最大程度上就研究问题给出合理的解释。至少从卡尔·波普尔（Karl Popper）开始，人们就在不断地强调这一观点：科学既不意味着确定性，也不能严格证明什么，它只是确定一种可能性，并以此来驳回零假设^㊸预先建立的联系。因此，科学并不是要证明所谓的备择假设，^㊹而是要发现备择假设之于零假设的优势。这种在证伪和证实的方法论层面存在的区别既适用于自然科学，也适用于“精确人文科学”。

可见，数字人文并没有消解语言学和历史学，而是用量化的方式对其研究方法进行了批判性的拓展。在一些问题上，数字人文对准确性有着严格的要求，例如，在情感词词典中，应该用哪种情感理论作为词条的分类标准。这种对情感问题的建模决定了情感分析适不适合把握文学的情感结构，能不能根据作品中的主导情感来区分流派，以及可不可以从较大的文学作品库中提取出叙事模式。^㊺因此，肯尼迪是对的，情感分析法确实将小说的复杂结构进行了分解；但她同时也错了，因为她认为这样的方法不能说明任何文学问题。

我们看到：对人文科学的研究问题进行建模，是数字人文的基础。这就要求所有隐含的知识都能得到明确的体现，并精确到可以用计算机辅助方法进行研究的程度。比起我们熟悉的“不精确人文科学”，这种研究方式的步骤更为精细。因此，“精确人文科学”往往比较复杂，成本也更高，其研究方法也无法在短时间内快速取得成果。因为人们既要对文本进行建模，又要对迄今为止的语境变化进行建模。比如，要想研究Wattpad^㊻之类的社交平台上的年轻人怎样撰写文学作品，以及他们喜欢哪些素材和类型，抑或是他们如何评价文学作品，就必须将这些复杂问题拆分成多个不同的步骤：数据提取，基于机器学习对文学评论进行情感分析，等等。这些步骤绝不仅限于对数学算法的简单利用，而是更多依赖于相关的专业知识。这里所指的并不是与计算机和互联网相关的理论或概念，而是与文学以及读者有关的知识。所以说，计算机辅助的文学研究并不简单，它不仅需要诠释和历史学的知识，更需要建模和统计学的知识。也正是这种不简单使得某些学者产生了对数字人文的不安。在科学史上，方法论层面的差异十分普遍，语文学的研究也不例外。语文学以及相关的人文学科应该接受计算机辅助方法作为其研究方法的延伸。但事实却并非如此。正如肯尼迪等人对数字人文的批评那样，不同研究领域的概念和方法论都对“精确人文科学”提出了尖锐地批评，但这些批评往往缺乏客观的论证。这些批评的原因是多方面的。因为除了自狄尔泰以来人文科学理想主义的狭隘性，数字人文自身也在发展中带来了一系列问题：新的基础知识需要被研究者大规模地掌握；新的研究问题及其合法性也需要得到确认；新的研究方法更需要在人文学科的实践中得到检验；最后，还需要建立不一样的学术成员结构。这些新问题似乎一下子就出现在了人文科学面前。数字人文也因此成了21世纪人文科学的任务和功能之争的热议话题。对数字人文的不安是可以理解的，因为专业之所以成为学科，正是因其具有系统上的稳定性：它既不会在所有构成层面上同时受到挑战，也不会遭遇颠覆性的重构。

五

21世纪的人文科学

对数字人文的尖锐批评还有一个原因，那就是在学科已经较好地实现了它的内外部学术功能的时候，几乎就没有理由再进行深刻的变革了。人文学科早已成了“现代社会以科学的形式获取自身知识的场所”。^㊼数字人文等精确的人文科学所代表的精细化方法论，因依赖于长期的系统实验、精确统计以及小组研究，作用范围是有限的。因此，它们的研究成果更多的是以学术刊物的形式，而非书籍著作的形式出版。此外，数字人文研究大部分需要花费大量的时间，且成本较高，其结论也无法在社会系统中得到直接应用。如贝多芬如何扩大了和声连接的可能空间？英语动词形式在近几个世纪的发展有哪些规律？用统计学方法所得出的此类问题的答案并不是社会所急需的。^㊽因为针对这类问题，音乐学可以根据现有形式做出更准确的回答，并给出更符合听众的音乐评判。语言发展的进化模型也在生物学等领域找到了自己的受众。进化并不属于社会自我认知的范畴。这就是为什么这类研究通常只出现在Nature或PLoS ONE等期刊上，而且它们的结论很少会被社会公众讨论。

因此，虽然数字化要求人文科学从根本上改变既有的自我认知，但已经发展完善的人文科学似乎并没有理由这样做。与之相对的是文化数据却呈现出迅速增长的趋势。图书电子版本、网络门户和语料库，以及近年来不断丰富的音乐下载、在线阅读或访问博物馆的实时数据，它们都在以前所未有的规模和深度被收集并创造着新的文化信息。^㊾人文科学将这些信息和数据拱手相让，给了那些互联网公司，这无异于是停止了以科学的形式从社会获取知识。数据密集型科学并不是一种宿命，但如果因此而忽视了新数据洪流所带来的机遇，将会对人文科学的发展带来不利影响。^㊿其它一些因素，例如人文科学学生人数的逐渐缩减，也宣告着人文科学的沉寂与消亡，这就要求我们在另一个历史性、系统性的层面上探讨人文学科的精确性之争。这篇文章就是要说明为什么人文科学可以有一个更好的研究基础和更好的发展前景。“精确人文科学”是有历史、成体系的科学。“精确人文科学”能否在未来扮演更重要的角色，取决于学者们现在对它的判断。人文科学沿着精确化的方向发展并不是什么新鲜事，在人文科学研究中走更精确的新道路也并不是一种破坏性行为。因此，“精确人文科学”对人文科学的进一步发展是有价值的，就算遭受到“拿鱼打画”之类的非议，我们也得去做这件事。

编辑 | 桑海

向上滑动查看注释：

①Richard Lea, “It‘s like hitting a painting with a fish: Can computer analysis tell us anything new about literature?”, The Guardian (15.September), 2016, URL:https://www.theguardian.com/books/2016/sep/15/what-is-the-point-of-cultural-analytics-computers-big-data-literature.

②Stanley Fish, “Digital Humanities and the Transcending of Mortality”, New York Times (9. Januar), 2012, URL: https://opinionator.blogs.nytimes.com/2012/01/09/the-digital-humanities-and-the-transcending-of-mortality/?rref=collection%2Ftimestopic%2FFish%2C%20Stanley&action=click&contentCollection=opinion&region=stream&module=stream_unit&version=latest&contentPlacement=49&pgtype=collection.③Adam Kirsch, “Technology Is Taking Over English Departments: The False Promise of Digital Humanities”, The New Republic(9. Mai), 2012, URL: https://newrepublic.com/article/117428/limits-digital-humanities-adam-kirsch.④丹尼尔·阿灵顿（Daniel Allington）是伦敦大学国王学院高级讲师，莎拉·布鲁耶特（Sarah Brouillette）是卡尔顿大学副教授，戴维·哥伦比亚（David Golumbia）是弗吉尼亚联邦大学副教授。——译者注⑤Daniel Allington, Sarah Brouillette, David Golumbia, “Neoliberal Tools (and Archives): A Political History of Digital Humanities”, Los Angeles Review of Books (1. Mai), 2016, URL: https://lareviewofbooks.org/article/neo liberal-tools-archives-political-history-digital-humanities/#.⑥苏黎世联邦理工学院教授迈克尔·哈格纳（Michael Hagner）和圣加仑大学教授卡斯帕·赫希（Caspar Hirschi）。——译者注⑦Michael Hagner, Caspar Hirschi, “Editorial”, Nach Feierabend, Zürcher Jahrbuch für Wissenschaftsgeschichte 9, 2013, S.7-11.⑧Lorraine Daston, Peter Galison: Objectivity, Boston: MIT press, 2007; “Digitale Geisteswissenschaft — Bilanz einer Gründerzeit”, Frankfurter Allgemeine Zeitung 107 (9. Mai 2018), N3f.⑨Nan Z. Da, “The Computational Case against Computational Literary Studies”, Critical Inquiry 45(3), 2019, pp.601-639, https://doi.org/10.1086/702594; ”The Digital Humanities Debacle: Computational methods repeatedly come up short”, The Chronicle of Higher Education (27. März), 2019, https:// www.chronicle.com/article/The-Digital-Humanities-Debacle/245986?cid= wcontentgrid_41_2.⑩Georg Bollenbeck, Bildung und Kultur: Glanz und Elend eines deutschen Deutungsmusters, Frankfurt/M, 1994.⑪Jacob Grimm, “Über den Werth der ungenauen Wissenschaften”, Kleinere Schriften, hg. v. Karl Müllenhoff u. Eduard Ippel, Bd. 7, Anhang, Berlin 1884 ［1846］, S.563-566.⑫由瑞典生物学家卡尔·冯·林奈（Carl von Linné）提出。林奈采用阶梯等级分类法，将自然界分为“三界”，即动物界、植物界和矿物界，界以下依次是纲、目、属、种，实现了分类范畴的统一。——译者注⑬Wilhelm Grimm, "Bericht über das Deutsche Wörterbuch", Kleine Schriften, hg. v. Gustav Hinrichs, Bd. 1, Berlin, 1881 ［1847］, S.513.⑭Rainer Rosenberg, “Zur Bedeutung von Jacob Grimms Konzeption der philologischen Germanistik für die Entwicklung der Literaturwissenschaft”, Zeitschrift für Germanistik 7(1), 1986, S.33-40.⑮Lothar Bluhm, “Die Brüder Grimm und die Wissenschaft: Anmerkungen aus philologischer und kulturwissenschaftlicher Sicht”, Neuphilologische Mitteilungen 106(4), 2005, S.469-485.⑯Ulrich Wilamowitz-Moellendorf, "Geschichte der Philologie", Alfred Gercke u. Eduard Norden (Hg.), Einleitung in die Altertumswissenschaft, Band 1, Heft 1, Leipzig, Berlin, 1921, S.1-80.

⑰Charles P. Snow, Two Cultures and the Scientific Revolution, London, 1959.

⑱James Turner, Philology: The Forgotten Origins of Modern Humanities, Princeton, 2014.⑲Lorraine Daston, Peter Galison, Objectivity; “Digitale Geisteswissenschaft — Bilanz einer Gründerzeit”, Frankfurter Allgemeine Zeitung 107 (9. Mai), 2018, N3f.⑳Stephen Gaukroger, The Emergence of a Scientific Culture. Science and the Shaping of Modernity, 1210-1685, Oxford, 2006; The Collapse of Mechanism and the Rise of Sensibility. Science and the Shaping of Modernity, 1680-1760, Oxford, 2010; The Natural and the Human: Science and the Shaping of Modernity, 1739-1841, Oxford, 2016.㉑Jan Marco Sawilla, Antiquarianismus, Hagiographie und Historie im 17. Jahrhundert: Zum Werk der Bollandisten, Ein wissenschaftshistorischer Versuch, Tübingen, 2009.㉒又称“圣衣会”、“迦密会”，天主教托钵修会之一，12世纪中叶创建于巴勒斯坦的加尔默罗山。——译者注㉓David Freedberg, The Eye of the Linx: Galileo, his friends, and the beginnings of Modern Natural History, Chicago/London, 2002.㉔一部68卷本的百科全书式文献，按照基督教节日的顺序记载了圣徒的生平，最早由波兰耶稣会士路斯威德（Heribert Rosweyde）构思并撰写，实则是一部批判性的传记。——译者注㉕Steven E. Jones, Roberto Busa, S.J., and the Emergence of Humanities Computing: The Priest and the Punched Cards, New York, 2016.㉖Mary Kenneth Keller, Inductive Inference on Computer Generated Patterns, Madison, Wisconsin, 1965; Denise Gürer, “Pioneering Women in Computer Science”, ACM S1GCSE Bulletin 34(2), 2002, pp.175-180.㉗Nan Z Da, "The Digital Humanities Debacle. Computational methods repeatedly come up short", The Chronicle of Higher Education (27. März), 2019,https://www.chronicle.com/article/The-Digital-Humanities-Debacle/245986?cid= wcontentgrid_41_2.㉘Berenike Herrman, Anne-SophieBories, Francesca Frontini, Simone Rebora, Jan Rybicki, “Response by the Special interest Group on Digital Literary Stylistics to Nan Z. Das Study”, Journal of Cultural Analytics(5), 2019, https: // culturalanalytics. org/2019/05/response-by-the-special -interest-group-on-digital-literary-stylistics-to-nan-z-das-study/; Fotis Jannidis, “On the Perceived Complexity of Literature: A Response to Nan Z. Da”, Journal of Cultural Analytics, 2019, https:// culturalanalytics.org /2019/06/on-the-perceived-complexity -of-literature-a-response-to-nan- z-da/.㉙Ernst Elster, Prinzipien der Literaturwissenschaft,1897/1911, Halle.㉚Wilfried Barner, “Literaturwissenschaft”, Robert Harsch-Niemeyer (Hg.), Beiträge zur Methodengeschichte der neueren Philologien: Zum 125jährigen Bestehen des Max Niemeyer Verlages, Tübingen, 1995, S.91-110.㉛Karl-Heinz Best, "Eduard Sivers (1850-1932)", Glottometrics 18, 2009, S.87-91.

㉜马尔可夫链（Markov Chain, MC）是概率论和数理统计中具有马尔可夫性质且存在于离散的指数集和状态空间内的随机过程。——译者注㉝Peter Grzybek, Contributions to the Science of Text and Language: Word Length Studies and Related Issues, Dordrecht, 2006.㉞Julia Flanders, FotisJannidis, (Hg.) The Shape of Data in Digital Humanities: Modeling Texts and Text-Based Resources, London, 2018.㉟托马斯·阿奎那认为天主的存在是不证自明的，但却也不是无法证明的。在《神学大全》中他提出了证明天主存在的五个证据。——译者注㊱Lermolieff, Ivan［i. e. Giovianni Morelli］, Die Werke italienischer Meister in den Galerien von München, Dresden und Berlin, Leipzig, 1880.㊲博兰主义者协会（Die Gesellschaft der Bollandisten）将罗马天主教会圣徒的生平事迹以手抄本的形式汇编成批判性的版本，在《圣徒行实》（Acta Sanctorum）一书中发表，并附有历史批判性的评论。这个名字可以追溯到荷兰神学家Johannes Bolland（1596~1665）。其初衷是通过对文本和传统进行批判性的重新评价，保护神学传统不被新教和当时的理性主义精神迫害。——译者注㊳J. F. Burrows, Computation into Criticism: A Study of Jane Austen's Novels and an Experiment in Method, Oxford University Press, 1987.㊴John Burrows, "Computers and the Idea of Authorship", Fotis Jannidis, Gerhard Lauer, Matias Martinez, Simone Winko, (Hg.) Rückkehr des Autors：Zur Erneuerung eines umstrittenen Begriffs, Tübingen, 1999, S.167-181.㊵系统树图是生物学上表示亲缘关系的树状图解，能很好地描述数据群与数据群之间的关系，是在统计学数据群分析过程中一种非常直观的表达方式。——译者注㊶Fotis Jannidis, Gerhard Lauer, "Burrow's Delta and Its Use in German Literary History", Matt Erlin u. Lynn Tatlock (Hg_), Distant Readings: Topologies of German Culture in the Long Nineteenth Century, Rochester, New York, 2014, pp.29-54.㊷Simone Rebora, Berenike Herrmann, Gerhard Lauer, Massimo Salgaro, "Robert Musil, a War Journal, and Stylometry: Tackling the Issue of Short Texts in Autorship Attribution", Digital Scholarship in the Humanities, 2018, https://doi.org/10.1093/llc/fqy055.㊸在统计学中，零假设（虚无假设）是做统计检验时的一类假设。零假设的内容一般是希望证明其错误的假设。比如说，在相关性检验中，一般会取“两者之间没有关联”作为零假设，而在独立性检验中，一般会取“两者之间有关联”作为零假设。——译者注㊹备择假设（对立假设），统计学的基本概念之一，假设检验中需要证实的有关总体分布的假设，它包含关于总体分布的一切使原假设不成立的命题。——译者注㊺Jian Gao, Matthew Jockers, John Laudun, Timothy Tangherlini, A Multiscale Theory of the Dynamical Evolution of Sentiment in Novels, 2016 International Conference on Behavioral, Economic and Socio-cultural Computing (BESC), DOI: 10.1109/BESC.2016.7804470; Jodie Archer, Matthew Jockers, The Bestseller Code: Anatomy of the Blockbuster Novel, 2016, New York; Evgeny Kim, Roman Klinger, “A Survey on Sentiment and Emotion Analysis for Computational Literary Studies”, arXiv:1808.03137 ［cs.CL］, 2018.㊻Wattpad是一个电子阅读和写作平台，是社交出版商兼在线免费电子书制作分享社区。作家写手将自己的小说免费发布在该平台上，在此过程中，作者可以跟读者互动，甚至通过读者的反馈来塑造故事。——译者注㊼Wolfgang Frühwald, Hans Robert Jauß, Reinhart Koselleck, Jürgen Mittelstraß, Burghart Steinwachs, Geisteswissenschaften heute, Frankfurt/M, 1991.㊽Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang, Martin Nowak: “Quantifiying the Evolutionary Dynamics of Language”, Nature 449, 2007, pp.713-716; Fabian Moss, Markus Neuwirth, Daniel Harasim, Rohrmeier Martin, “Statistical characteristics of tonal harmony: A corpus study of Beethoven‘s string quartets”, PLoS ONE 14(6): e0217242, 2019, https://doi.org/10.1371/ journal.pone.0217242.㊾Niels Brügger, “Digital Humanities in the 21st Century. Digital Material as a Driving Force”, Digital Humanities Quarterly 10(2), 2016, http://www.digitalhumanities.org/dhq/vol/10/3/000256/000256.html.㊿Tony Hey, Stewart Tansley, Kristin Tolle, The Fourth Paradigm: Data - Intensive Scientific Discovery ,Cambridge,2009, https://www. microsoft. com/en - us/research/publication/Fourth - paradigm - data - intensive -scientific- discovery/.Heidi Tworek, “The Real Reason the Humanities are‘in Crisis’”, The Atlantic (18. Dezember), 2013, https://www. theatlantic. com/education/archive/2013/12/the- real- reason - the - humanities - are - in -crisis/282441/;Kent Cartwright, SarahChinn, Tarshia Stanley, A Changing Major: The Report of the 2016 - 17ADE Ad Hoc Committee on the English Major , 2018, https://www.ade.mla.org/Resources/Reports - and - Other -Resources/A- Changing- Major- The- Report- of- the- 2016 - 17 -ADE- Ad- Hoc- Committee- on- the- English- Major.

作者简介：

Gerhard Lauer，瑞士巴塞尔大学数字人文中心主席、巴塞尔大学德语语言文学教授。瑞士巴塞尔4046

译者简介：

庞娜娜，山东大学外国语学院副研究员，博士。济南250100

文章转自：澳门理工学报2020年第3期

公众号ID：thudh2020
转载请联系授权

俄罗斯中国总商会会长：与俄罗斯的支付谈判将很快有结果

环球时报驻美记者评青岛公安通报：偏袒女司机过于明显

青岛路虎女：嚣张女妖是那个大神的坐骑？

痛心！山东泰安突发惨烈车祸！

“背锅”干部复出应该如何安排新岗位

“精确人文科学”的价值

您可能也对以下帖子感兴趣

俄罗斯中国总商会会长：与俄罗斯的支付谈判将很快有结果

环球时报驻美记者评 青岛公安通报：偏袒女司机过于明显

青岛路虎女：嚣张女妖是那个大神的坐骑？

痛心！山东泰安突发惨烈车祸！

“背锅”干部复出应该如何安排新岗位

生成图片，分享到微信朋友圈

“精确人文科学”的价值

您可能也对以下帖子感兴趣

环球时报驻美记者评青岛公安通报：偏袒女司机过于明显