查看原文
其他

语言学人|袁毓林:让语言学徜徉于人文精神与科技理性之间

施今语 语言学心得 2022-12-22



让语言学徜徉于人文精神与科技理性

之间


   语言学人(第4期)

袁毓林


    摘  要:本文是对著名语言学家袁毓林先生的书面访谈,袁教授首先谈到了自己如何在个人的努力、朋友的鼓励和老师的教诲下踏上学术研究的道理,并根据自己和他人的理论研究和探索实践,介绍了基于认知科学的语言研究。而后袁教授通过个人经历指出带着问题去阅读和思考是解决实际问题、拓宽学术视野的有效途径。他认为,语言研究有必要结合经验主义人文关怀与理性主义科学精神,从而更加透彻地理解人类的本质,并以自己的两个研究课题(关于谓词隐含理论和网球问题的求解思路)作为案例,说明语言学研究成果的社会意义和在现实生活中的可能。谈及学术研究时,袁教授提出学者应有更高的精神层次上的追求。最后,袁教授指出研究生的成长要在乐观中奋斗。

    关键词:袁毓林;语言学;认知科学;谓词隐含理论;网球问题;科学精神;人文关怀


【被采访人】

袁毓林,江苏昆山人,北京大学中文系教授,博士生导师,《当代语言学》《语言文字应用》《汉语学报》《汉语学习》《中文信息学报》《南开语言学刊》、日本《中国语学》、日本《现代中国语研究》、韩国《中国语教育与研究》、新加坡《汉语研究和计算学报》等海内外十多家期刊编委。1998 年入选北京市跨世纪(新世纪)中青年社科理论人才“百人工程“,1999 年入选教育部跨世纪人才培养计划,2015 年被聘为教育部长江学者特聘教授。曾经获得中国社会科学院青年语言学家奖、北京市优秀社科成果奖和中国高校人文社会科学研究优秀成果奖等多个奖项,主持国家社科基金重大招标项目《汉语国际教育背景下的汉语意合特征研究与大型知识库和语料库建设》等国家级和省部级项目数十项。主要研究理论为语言学和汉语语言学,特别是句法学、语义学、语用学、计算语言学和中文信息处理。在《中国社会科学》《中国语文》等刊物发表论文百余篇,出版著作《现代汉语祈使句研究》《语言的认知研究和计算分析》《汉语句子的焦点结构和语义解释》《汉语语法研究的认知视野》《基于认知的汉语计算语言学研究》《汉语词类的认知研究和模糊划分》《汉语配价语法研究》《汉语词类划分手册》《袁毓林自选集》《著名中年语言学家自选集:袁毓林卷》和Cognition-Based Studies on Chinese Grammar等十余部。


【采访人】 

施今语,伦敦大学学院(UCL)发展变化与可塑性实验室研究助理,爱丁堡大学语言学硕士,伦敦大学学院心理与语言科学学士(采访时为本科生)。


【采访时间】

2017 年 8 月 28 日 


【采访形式】

书面采访


【开场白】

施今语(以下简称施): 袁老师,您好,我在伦敦大学学院(University College London)脑科学学院的心理学与语言科学专业学习。从2016年暑假开始,我在做一个世界著名语言学家的系列访谈项目,但是由于时间关系,这次只能做一次书面采访了。这次采访您,不仅可以满足自己的好奇心,让我对自己未来的学习产生-一个更为明确的概念和想法,也可以为包括我们所有中学生和大学生了解语言学和著名语言学家提供一些帮助。




一、授课之余,踏上学术研究之路



:袁老师,我从互联网上了解到您大学毕业后在江苏省昆山县千灯中学当了四年的老师,请问是什么让您决定继续考研并且走上研究之路?我还了解到,您的硕士生导师是王维贤先生,博士生导师是朱德熙先生,您觉得两位导师对您的学术影响主要体现在哪些方面?

袁毓林(以下简称袁):从1980年8月底开始到那年底,我在昆山成茂中学(今昆山市锦溪中学) 实习,教两个班的初中一年级语文,每周12节课。教课之余,每天晚上漫步在水乡古镇的石板路上,想着将来除了教书之外,是不是还应该做点什么?当然,可以选择的也无非是继续学习写作或者继续练习写文学评论和语言研究方面的文章。从1981年开始,我被分配到母校昆山千灯中学(今昆山市亭林中学)工作,先是教初中语文和政治,后来教高中语文和历史。课余时间,练习写了一些文学评论、语法修辞方面的小文章,也都投稿出去了。当然,我也感觉到文学研究跟语言研究大不相同,两个方面都做是不太现实的。那时候,我心里想着:哪个方面的文章先发表,我就专攻哪个方面。结果,年底的时候,读书时期写的《汉语量词的描摹性》发表在延边大学的《汉语学习》(1981年第6期)、《浅谈修饰性暗喻》发表在上海教育出版社的《语文学习》(1981年第12期)。于是,我就下定决心专门学习做语言研究。1982 年又发表了3篇小文章:《浅谈“衍词”》(华东修辞学会的《修辞学习》, 1982 年第3期),《“ 怎么样”补议》(杭州大学的《语文战线》,1982 年第12期),《着色点染化虚为实——谈谈虚摹的修辞手法》(华南师院的《语文月刊》,1982 年第9期)。就这样一边教书一边学习研究,过着十分惬意的校园生活。

     也就在这一年, 情况有了变化。原来,1982年秋季,从南京师范大学分来一个教政治的老师赵曰君。我和他,还有几个青年教师经常一起散步聊天, 成为无话不谈的好朋友。赵老师比我年长,也更加见多识广。他跟我说:“我看你有锐气,在专业上也有一些基础, 应该去考研究生。在中学里做学术研究是不可能成气候的。”他看到我正在听上海人民广播电台的中级英语,就说: “这太浅,至少必须学完许国璋的《英语》1-4册,才能去应付研究生入学考试的英语试卷。”正好,他也要考研究生,也要学许国璋《英语》。于是,我们就一起 到邮局函购了许国璋的《英语》1-4册。接下来,我一方面因为基础太差,另一方面白天要上课,晚上要看专业书籍,每天只能抽一个小时左右来学英语; 所以,每半年只能学完一册。磨蹭到1984年2参加研究生考试时,我刚刚学完许国璋《英语》第3册。说起来实在是运气好,我侥幸考上了杭州大学中文系的研究生。

     我的硕士生导师是倪宝元先生和王维贤先生。两位先生当时都是副教授。那里好像有一个不成文的规矩:称新中国成立前大学毕业的老师为“先生”,新中国成立以后的,就只是“老师”了。后来到北大中文系读博士研究生,一看好像基本上也是这种规矩。比如,叶蜚声老师虽然是新中国成立前的大学毕业生,但是研究生是新中国成立以后在北大中文系上的,所以称“老师”,不称“先生”;只有朱德熙先生、林焘先生等少数老师称“先生”,不称“老师”。这是题外话了。倪宝元先生主要研究修辞学,方法朴素踏实,就是广泛收集例句、排比分类、归纳条理。比如,他的《成语辨析》(中国社会科学出版社,1979 年)、《成语例示》(北京出版社,1984 年)等著作,都是在收集了大量的成语使用实例的基础上,对相关的成语进行意义和用法方面的同异辨析。《汉语修辞新篇章一从名家改笔中学习修辞》(商务印书馆,1992 年)对照四十多位著名作家的作品的早期版本和以后的修订版本,寻找这些作家对自已作品的文字修改;做了上万张卡片,对这些改笔进行对比分析,从修辞原则的角度加以评判、分类和归纳,从而直观地告诉人们“应该这样写,不应该那样写”。倪先生的这种收集例句、抄写卡片的功夫,对我的学术态度和治学方式影响至深,也令我获益匪浅。王维贤先生早年在燕京大学哲学系读研究生时,跟随王宪钧教授研究数理逻辑,对于自然语言的逻辑分析和语言学理论有独到见解。王先生熟悉结构主义描写语言学理论,对于汉语语法研究观念和方法的演进也深有研究。除了亲自给我们讲授《现代语言学》(一学期,每周2节,跟高年级本科生合上)、《汉语语法专著选读》(一学年,每周3节)、《语法论文选读》(一学期,每周3节)、《生成语法和语法理论》(一学年,每周3节)之外,还请傅国通老师讲授《语音学基础》(一学期,每周3节)、《方言调查和研究》(一学期,每周3节),请哲学系邱国权讲授《数理逻辑和计算机基础》(一学年,每周3节),请胡伟民老师讲授专业英语(一学年,每周3节),用的是JohnLyons的Introduction to Theoretical Linguistics (1968) 作为课本。刚刚入学,王先生就给我们准备了4页打字纸的必读书目,涉及现代汉语(语法为主)、古代汉语(语法为主)、国外语法理论(英文版)、一般语言学理论(英文版)、小学(文字学、训诂学、音韵学)。倪先生在旁边打趣说:“看不完的,三年看不完的,一辈子也看不完的。”王先生笑着说:“那,那些打三角号的书一定要读。”我们回到宿舍一数,整个书目列了65本;打三角号的也有35本,其中还包括段玉裁的《说文解字注》呢。

     1984年暑假(7月28日—8月12日),正好洛杉矶奥运会(第23届夏季奧林匹克运动会)召开,中国大陆代表团首次参加奥运会,并且取得了不俗的成绩(获得15金、8银、9铜,位列奖牌榜第4名)。王维贤先生在上课时若有所思地跟我们说:“体育比赛讲金牌、银牌、铜牌,语言学研究其实也有这种差别。比方说,朱德熙先生就应该得金牌,我连铜牌也不该得;但是,我希望你们将来能够得金牌。”这几句话,一直沉甸甸地压在我们的心上。朱德熙先生跟王维贤先生不一样,没有跟我们学生讲太多的大道理;更多的是,通过自己深入而系统的研究成果,来昭示语言学研究的方法论。这大概就是“天地有大美而不言”(《庄子•知北游》)。我对“的/者”字结构—名词/动词配价—谓词隐含—物性结构—定语小句等,一系列的研究,就是希望学习朱先生那种连续、递进式的学术研究的路子

     因此,可以这么说:王维贤先生重“言教”,给我的影响更多的是理论层面的;朱德熙先生重“身教”,给我的影响更多的是方法层面的。当然,无论哪一个方面,对我来说都是不可或缺的。记得1985 年前后,延边大学《汉语学习》主编吴葆棠老师去北京约稿,请吕叔湘先生写关于如何培养研究生的文章。吕先生让吴老师去杭州大学找王维贤先生写。由于是吕先生的推荐,王先生就答应了,还跟我们学生们议论了一下该谈哪些方面。但是,王先生最终还是放弃了。他跟我们说:“吕叔湘先生都觉得不方便写,那我就更没有资格来告诉别人该怎样培养研究生了。”




二、认知科学视野中的语言学和语言学

视野中的认知科学


袁老师,我从您的很多文章和讲座中了解到您主要研究的方面是有关“认知”的语言研究。通过您的文章我发现我们普遍理解的认知语言学好像和您所研究的不太一样。您能简单介绍一下 认知科学的研究和您的主要思想以及观念吗?

:我是从阅读人工智能的论文和书籍开始,逐步了解认知心理学和认知科学的;然后,再用计算机科学技术、认知心理学和认知科学等有关概念、理论和方法来分析语言现象。因为痴迷计算语言学,所以形式语言学的一些思想和方法对我影响很大。当然,后来也直接学习和吸收功能语言学和认知语法的理论和方法。     

     简单地说,认知科学(cognitive science)是研究心智的科学;具体地说,认知科学是一门研究智能系统(包括天然的和人工的)的内部结构、功能和工作原理的科学。这里,天然的智能系统指人的大脑,人工的智能系统指计算机。认知科学是一门新兴的前沿性学科,它是在哲学、心理学、语言学、计算机科学和神经生理学等多个学科的交叉领域中发展起来的。早期的认知科学用信息加工(information processing)的观点来研究认知结构和认知过程,比如,把记忆比作计算机的存储器、把思维比作信息加工(即对符号串进行受约束的变换)等。像Herbert Simon和Allen Newell 还提出了著名的物理符号系统假设(hypothesis of physical symbolic system):智能的基础是符号操作,通过符号的产生、排列和组合,智能系统就能将外部的事件内化为内部的符号事件并加以控制,从而表现出智能来。因此,一切认知系统 (不管是天然的人脑还是人工的电脑)的本质都是符号加工系统。而符号操作的实质就是计算(computation), 表现为具有特定语义解释的符号表达式的各种受规则约束的变换。比如,人的心智表征就是一种形式化的符号表达式,是跟系统的物理状态(即神经元的某种运动方式)相对应的某些基本要素的离散的排列。所有跟系统有关的语义内容都依靠深层的符号表达式及其变换形式和符号关系结构来规定。显然,这是一种语义上中断的物理符号操作,因而是一种计算。因此,“认知就是计算”是经典的认知科学的一个信条。20世纪90年代,我在研究现代汉语中的一价名词和二价名词的句法、语义特点时,借鉴认知科学的的研究方式和相关成果,尝试用扩散性激活的语义记忆机制和非单调推理的逻辑机制,来分析有关句子的语义解释问题。所谓扩散性激活,是指当某个词语被提起时,大脑内自动激活相关联的词语,二者联系越紧密越快被激活。例如:(1)这种酒很淡。(a. 味儿淡> b.颜色淡)(2)这种花很淡。(a.颜色淡> b. 味儿淡)
      这种语义理解上的不平行性只能从语义记忆和语义推导的方式上寻求解释。比如,名词“酒”可以激活(液体、饮料、刺激性的味道、颜色……)等一组语义,名词“花”可以激活(植物的器官、观赏性的颜色、味道……)等一组语义,形容词“淡”可以激活(味道、颜色)不浓、(含量)稀薄、(态度)不热情……等一组语义。人们根据常识推断,酒作为一种有特别味道的饮料,(味道)是它的强特征,就直接把“酒淡”理解为“酒的味儿淡”。因为,根据缺省推理(reasoning by default)的原理“除非特别说明,可以默认某个命题总是成立的”,听话人有理由相信:如果说话人想表达“这种酒颜色很淡”,那么他一定会把表示酒的弱特征的“颜色”说出来。同样,“这种花很淡”中花的强特征完全可以省略,在语义解释时必须优先补入。有意思的是,我的同学白硕博士在20世纪90年代后期,尝试用范畴语法的演算规则来建立一个语言理解系统,为网上的信息快速查找服务。在这个系统中,他除了利用动词、形容词的配价信息外,还大量地把名词配价研究的成果吸收了进去,增强了该系统的表示能力和推演能力。我甚至希望用扩散性激活的语义记忆模型和缺省推理的非单调逻辑来建立一种语言理解的微观机制,用以解释同一句子中不同词项之间的语义连结和制约关系;并以此来揭示人脑处理语言信息的某种心理过程,从而为认知心理学和计算机理解自然语言提供强有力的语言学支持。作为案例,我着重分析了下列这种例子:(3)a. 这房子很大→b. 这房子面积很大(4)a. 这箱子很大→b. 这箱子体积很大    (3)例(3a)和(4a)的句法、语义构造是一样的,但是语义解释却很不一样。对此,可以从认知的角度假设:第一,大脑中语义储存的方式是网络(network)式的,语义提取的方式是扩散性激活(spreading activation) 式的。并且,由于常识和生活经验(房子用以住人、箱子用以装物)的作用,人们在听到或者看到“房子”这个词时,“面积”这一语义节点优先激活,它跟其他词的语义节点的连接权值增大;人们在听到或者看到“箱子”这个词时,“体积”这一语义节点优先激活,它跟其他词的语义节点的连接权值增大。第二,语义推导的方式是基于知识的缺省推理。虽然“大”的语义可以跟(面积、体积、数量、强度、力量)等语义节点相连接,但是人们在听或看到“房子大”时可以直接理解为“房子的面积大”,听或看到“箱子大”时可以直接理解为“箱子的体积大”。这是因为,听话人相信说话人一定遵守交际的缺省约定,如果说话人要表达“房子的体积大”或“箱子的面积大”这种特别的意思,那么他必须特别声明,因而不能省去“体积”或“面积”这类词语(见图1):


      非常有意义的是,姬东鸿博士和黄昌宁教授在一篇论文中,讨论如何建立关于汉语形容词跟名词的语义组合的计算模型,其中运用我提出的上述语义扩散性激活和缺省推理的机制、语义特征强弱的优先顺序以及相关的规则和策略,作为消解由多重属性继承引起的冲突的机制。例如这三个句子:

(5)王明很难受。(a.心里难受 > b.肚子难受)(6)这孩子很灵。(a.脑子灵 > b.耳朵灵)(7)衣服很大方。(a.样子大方 > b.领子大方)      这里名词“王明”既具有心理属性、也具有生理属性,而形容词“难受”既可以描写心理属性、也可以描写生理属性。这样,当名词的语义跟形容词的语义相互组合时,就势必会发生多重属性的冲突问题。怎么来消解这种冲突呢?根据我们发现的心理属性强于生理属性、整体属性强于局部属性的优先顺序,可以用这种属性继承的优先规则来解决这一问题。像这种基于认知的语言研究,计算语言学研究者和心理语言学研究者都是比较感兴趣的。




三、带着问题去阅读和思考,解决实际

问题



袁老师,据我所知,研究认知科学、研发语料库都需要结合很多不同学科的知识,尤其是您的研究思路又非常活跃。包括您在中国科学院物理研究所的讲座中提到,做语言学研究的人,不仅要是一个语言学家,还要是一个计算机科学家和神经科学家。那么您是如何去掌握这些学科的知识,发现他们的关联,并且将它们熟练地运用于自己的研究的?

我的做法是,先读一些计算机科学技术、 心理学、生物学、神经科学、现代哲学、逻辑学方面的导论类书籍,了解一下其中哪些方面能够引起我的兴趣或者跟我研究的方向与课题相关,再查找和阅读更加专门一点的书籍与期刊论文。


那么您是如何做到高效地吸收这些书籍中的知识的呢?这些阅读对你的语言学研究有哪些具体的作用呢?

在阅读和学习新学科的知识时,要带着自己的问题去阅读和思考。比如,20 世纪90年代初,我被下面这个问题深深地困扰:汉语肯定有词类的分别,词类分别的基础是词的语法功能;但是,单纯根据一两条或两三条语法功能,又难以划分出人们心目中的名词、动词和形容词等词类来。于是,就向自己提出了这样一连串问题:人们心目中的名词、动词和形容词等词类是从哪儿来的?这种连分类标准都无人能说清的类别是怎样建立起来的?我们人类的心智能够容忍这种分类吗?这时候,阅读一些认知心理学上关于原型范畴的书籍和论文时,不由得恍然大悟:原来,我们天天打交道的蔬菜、水果等范畴,也都无法给出一个精确的定义,但这并不妨碍人们使用这些范畴。汉语词类也是这样的原型范畴,表现为:各种词类无法给出严格的定义,不同的词类之间边界不清晰,同一种词类内部的各个成员在语法功能方面的相似性多寡不一。从1993年开始,我在不同的场合宣扬这种观念;1995 年《词类范畴的家族相似性》(《中国社会科学》第1期)发表后,引起更多同行关注这个问题,也有不少人认可汉语词类是原型范畴的观点。认识到词类范畴边界的模糊性以后,我又不断地学习模糊数学(模糊集合论)、心理学上的心理量表和教育水平测试方面的量表设计方面的知识;并且,逐步形成了这样的研究路线:先研究各类词的典型成员的分布情况,用公理系统来定义词类的典型成员;然后通过跟典型成员的分布情况进行类比,用隶属度及其量表来确定非典型成员的词类归属和隶属度。我把相关的研究结果加以梳理和总结,整合成《汉语词类的认知研究和模糊划分》(上海教育出版社,2010年)。并且,为了便于一般非专业读者的理解,我在三位同事(马辉、周韧、曹宏)的协助下,把我相关文章中的各个专业版词类量表进行改写、简化和通俗化,形成通俗版汉语词类模糊划分量表。然后,用这套经过修订的通俗版量表,对900多个疑难词语(以义项出条)的词类属性进行了隶属度分析,内容包括:每一个词的注音、释义、主要的语法特征及其例句、每一种语法特征对于某种特定的词类的得分、每个词对于有关词类总的得分和它对于特定词类的隶属度,形成一部小型的《词类模糊划分词典》。最终,这两部分内容合成书稿《汉语词类划分手册》(北京语言大学出版社,2009)。另外,我还指导我的研究生魏雪,根据我的这套词类理论及量表,设计并编程实现了网络版汉语词类测试平台。这样,用户进入这个网站以后,只要按照提示输入被测词,再根据自己的语感进行按钮选择,最后由计算机自动给出被测词的词类归属及其相对于某种词类的隶属度。语言学理论探索和计算机网络技术的结合,居然能给我们带来如此奇妙的便利;这实在是我在二十几年前刚开始从认知角度研究词类时未曾料到的。就这样,在十八年中,我经历了词类研究的五个阶段:从确立词类是原型范畴这种观念出发,到建立词类的公理系统,达到研制一整套词类的隶属度量表,并形成一部小型的词类模糊划分词典,最后建成词类知识的测试网站。

      总之,各种知识的学习是为了增强认识能力和解决实际问题。反过来说,为了增强认识能力和解决实际问题而学习各种其他学科的知识,一定会拓宽人的学术视野。




四、语言学研究中的人文关怀和科学

精神


:我在准备这次采访提纲时,从您的一次报告中看到,您主张“经验主义人文关怀与理性主义科学精神之间的鸿沟和隔阂应该被逐渐弥合”。请问在研究中您是如何兼顾科学精神与人文关怀的呢?怎么样能让语言学成为一个不单单在象牙塔里的学问呢?

:我的想法是,语言是人类思维和交际的工具;其中,既有人脑生物学方面的自然属性,又有人际沟通方面的社会、文化等人文属性。这样,语言研究势必要把经验主义人文关怀与理性主义科学精神结合起来,从而更好地了解语言如何运作(机制)并有益于人类社会(功能),即希望了解语言的结构、机制和功能及其对于人类进化的影响。因为只有人类有语言、使用有声语言进行交际,通过语言研究,可以更加清楚地了解人类在世界或宇宙中的位置,从而更加透彻地理解人类的本质。这应该是一个永恒的、根本性的哲学问题,也是语言学研究走向人文关怀的一个途径。问题是,不同的研究者要找到适合自己的道路。我的做法是:建立并且践行一种基于认知并面向计算的语言研究的进路(approach)。我相信,沿着这条路走下去,语言学必定能够一方面植根于人文科学对于人类本质的理解和关怀,另一方面又跟当代先进的科学技术紧密地联系在一起。

     为了让你对我所说的从一般语言研究走向认知分析的科学主义研究方式有更直观的认识,我简单谈谈我做过的两个研究课题。

     第一个是谓词隐含理论。请看两个例句:“红木的家具”,意思是“红木制造的家具”,省略了谓词“制造”;“战争的故事”,意思是“讲述战争的故事”,省略了谓词“讲述”。这个大家都能明白,但从看到这两个句子,到明白谓词的省略,在这过程中大脑是怎么工作的?1995年前后,我做了这方面的研究,我有一篇文章《谓词隐含及其句法后果》,发表在《中国语文》1995年第4期上,提出了谓词隐含理论以及具体的语义解释模板。后来,我们北京大学做计算语言学研究的几位学者,利用了我的一些研究,在新的统计学习技术的基础上进行研究,写了一篇文章《基于动词的汉语复合名词短语释义研究》,发表在核心期刊《中文信息学报》2010年第6期上。为什么我的这个谓词隐含理论对他们有启发作用?因为它有利于建立有关词语组合的语义处理模型,有利于应用到语义搜索等工程方面。现在的网络检索,主流的是百度、google等搜索引擎。百度和google的主要技术是关键词匹配,但有时候匹配出来的结果不那么令人满意。我们人是有很强的语义理解能力的,我们知道“红木家具”是红木做的家具,知道“婴儿奶粉”是给婴儿吃的奶粉,不是婴儿做的奶粉。如果让机器也知道这些,它们的检索结果将会更准确。据统计,现在的网络检索,名词加名词的关键词检索方式占25%,甚至可以到30%;也就是说,四分之一以上的检索词语串是名词加名词。如果计算机能将名词加名词组合中蕴藏的动词找出来,并且扩展它,那就意味着理解了这个检索关键词组合的真正意思,也就基本上理解了用户真正的检索意图。所以,网络检索下一步的发展,争夺的是谁最先设计出基于语义的搜索技术。前面说的那篇文章,主要利用统计方法。我们想更加全面地利用我的谓词隐含理论,因此做了一个实验系统。因此,我又指导我的研究生魏雪,重新开发了一个基于规则的汉语名名组合的自动释义系统。我们通过构建汉语名名组合的释义模板库,并在这个数据库的基础上,初步实现了一个汉语名名组合的自动释义程序,其自动释义的准确率达到94.23%。你可以看一下这个释义系统的一个查询页面的截图(见图2):


你看,输入“爱心快车”,它给出的释义是“运送/传递爱心的快车”。我们设想,如果利用这种系统对检索系统进行改进,那么检索结果的准确率也许会提高不少。我们的这项研究结果写成论文《基于规则的汉语名名组合的自动释义研究》,发表在《中文信息学报》2014 年第3期上。这项研究的具体过程,很好地体现了我所强调的三个do。在网络上大量调查检索关键词语的使用情况,分析其句法、语义特点,这是do investigation;根据谓词隐含理论,建立检索词语串的概念模型,设计相应的释义模板库,这是do model;进行计算分析和相应程序设计,并且进行释义系统的运行检验和不断调整,这是do experiment

    再看第二个课题,就是我们目前正在探索的一个世界性的难题——“网球问题”(Tennis Problem)。这个问题是美国普林斯顿大学认知科学实验室提出来的,他们在构建语言词汇知识库WordNet时遇到一个难题:如何将racquet(网球拍)、ball(网球)、net(球网)等词语以一定的方式联系到一起?推广一步,就是:怎样把racquet(网球拍)、ball (网球)、net(球网)或者“蜡烛”“蛋糕”“生日”之类具有情境联想关系的词汇概念联系起来,发现它们之间的语义和推理关系?从而为计算机自动理解自然语言的意义和进行常识性推理,提供充分的知识和资源。关于这个问题,我们看几个例句:

(8)父亲:小明怎么不在房间里看书?

母亲:大早晨拿着拍子出去了。

父亲:又去打他该死的网球了!

母亲:这回上985是没戏了。

(9)小红:小芳,你买的什么东西?

小芳:一盒蜡烛。

小红:你们寢室要给谁过生日呀?

小芳:是李萍。

     在第一组例句中,母亲说的是“拍子”,但父亲马上联想到“网球”。在第二组例句中,小芳说的是“蜡烛”,小红由此知道有人要过“生日”。我们的大脑是怎么工作,才能做到这样的?推进-步,我们能不能设计一个系统,让计算机也做到这点?这就需要首先了解大脑的工作方式,在这方面,现在我们的研究已经取得了一些进展。论文《怎样用物性结构知识解决“网球问题”?》发表在《中文信息学报》2014年第5期上。要知道,目前国际上四种主流的知识库都无法解决“网球问题”。一是普林斯顿大学的WordNet,它注重同义、反义、上下位关系、 整体一部分关系等聚合性知识,无法处理“网球问题”之类基于情境联想关系的句法组合和语篇共现关系。二是宾夕法尼亚大学和科罗拉多州立大学的VerbNet,它是以动词为中心,注重动词跟其论元的语义关系和句法实现,也无法处理“网球问题”这种由名词引起的概念和推理关系。三是加州大学伯克利分校的FrameNet,它以事件框架为单位。四是麻省理工学院的ConceptNet,它注重概念之间的常识性推理关系,它们同样无法解决基于名词的“网球问题”。我们以前开发的系统一谓词知识库 也解决不了“网球问题”。现在,我们又开发了新的系统——汉语名词的物性结构知识库。我们把谓词和名词这两个系统结合起来,通过对“网球问题”这类名词的描述、认知建构,已经差不多接近解决这个问题了。图3是相关知识的一个图示:


     通过上面的举例和说明,我相信你对语言学家如何可以像科学家那样地思考、研究,并且将自己的研究成果应用到工程实践中,已经有了比较清晰的理解。这样看来,语言学就不会成为一个单单在象牙塔里的学问了。更何况,我们正在逐步打破人类自然语言只是有声语言的认识藩篱,把聋人的手语(sign language)也纳入语言学观察和研究的范围。其实,国际学术界早在20世纪中期已经公认,手语是一种特殊而专门的语言,也是一个国家语言文字的重要组成部分。对于手语的理论研究、规范制定和教育实施等应用研究,对聋人教育以及语言康复等领域具有理论指导意义和现实的参考作用,也直接关乎听障残疾人的语言文字权益的实现。因此,我们中文系正在跟中国残疾人联合会、国家语委合作,一起筹划培养手语语言学专业硕士、博士研究生;让他们掌握中国手语,并能够从理论角度对手语进行分析和研究。最终目标是培养以语言学基础研究推动中国手语规范化,并能够将手语纳入国家语言规划等政策理论层面的特殊人才。从而通过他们的研究和工作来更好地为我国两千多万听力障碍残疾人士服务,帮助他们提高文化素质和脱贫能力,帮助他们跟健听人群更好地融合,从而更好地促进社会的和谐发展。可见,语言学早就不是一种象牙塔里的学问了。问题是,你准备好了吗?




五、精神素养之于学术研究

袁老师,我在学习您在物理所的讲座中了解到,中文系培养出来的学生将来可能成为三种人:思想家或公共知识分子、专家学者、科学家。在讲座中您将自己定义为一名科学家,那么您认为一名科学家需要具备哪些能力?不光是学术上的,更是生活中的精神目标和人生态度。

:我的想法是,作为一个学者,不管他是自然科学家还是人文社会科学家,他做研究,通常不只是为了解决专业领域的具体问题,或者只是为了满足自己对某个未知现象的好奇心,或者只是为了通过征服难题来显示自己的聪明才智;除此之外,应该还有更高的精神层次上的追求。比如,为了证明个体生命的价值,发现生存的意义;冲破各种诱惑和迷惘,建立起自己的精神坐标。为了克服眼前生活的苟且,寻找诗歌和远方;在世俗的喧嚣中,从容不迫地安顿自己的心灵。当然,还为了谋得并且保住一份既符合自己的志向、不损害内心自由与人格尊严,又能够保障体面生活的工作,从而成就一种有意义的学人生涯。

     台湾著名史学家、“中研院”院士严耕望认为,如何确立志业、修养身性、规划目标,关乎一个历史学者能否取得重大的成就。因为,历史学不像文学与科学,少有年轻的大史学家;历史学的创获也主要不仰赖于天才。为了帮助年轻学者尽快成长起来,尽快成为一个纯粹的学术人,严耕望在《治史三书》中提了很多中肯的建议。这里,择其要点罗列如下:第一,有大志、有信心、有计划;第二,一心力、惜时光;第三,淡名利、避权位。

     作为一个纯粹的学术人,严耕望以其“淡泊自甘、寂寞自守”的性格和“体大思精、卷帙煌煌”的论著,赢得了海内外无数的赞誉。如果你愿意,那么你也完全可以做一个像严耕望那样纯粹的学术人,你的研究也应该可以载入学术史。


:作为一个对学术研究还没有多少感知的学生,我经常听到别人说现在的学术风气比较浮躁,您是怎么看待这种现象?怎么才能改变这种状况?

我的看法是,现在学术界可能是鱼龙混杂。学术风气方面,的确有比较浮躁的,其中的原因很多,不一而足。另一方面,应该看到,大多数学者还是比较踏实宁静的。用清代大学者纪昀(晓岚,1724—1805) 的话来说:“文章公论,历久乃明。天地英华所聚,卓然不可磨灭者,一代不过数十人。(《四库全书总目》卷一百四十八《别集类一》)用明代内阁大学士李东阳(宾之,1447—1516) 的话来说:“文章如精金美玉,经百炼历万选而后见。《麓堂诗话》)大浪淘沙,唯卓然不可磨灭者方可流传于后世。本来,真正能够传诸后世的学术就不多。因此,不必太在意人家的学风浮躁不浮躁;而是要专注于自己,努力做到认真读书、刻苦钻研,对自己热爱的学术有所贡献




六、教学理念

袁老师,在作为一名科学家的同时您也是一名孜孜不倦的教师。根据我的了解,您指导的研究生成材率很高,而且成长速度非常快。请问您觉得您具备了哪些能力和素质,采用哪种教学方法使您成为这样一名优秀的大学教师?

我的想法是,主要靠学生的刻苦努力。当然,还有当老师的在一旁鼓励和加油。我经常套用北岛的诗句卑鄙是卑鄙者的通行证,高尚是高尚者的墓志铭跟同学们(包括已经毕业的博士生)说:乐观是乐观者的通行证,悲观是悲观者的墓志铭。这下可好,谁也不敢悲观了,谁愿意看那墓志铭啊?但是,想乐观也不容易。你必须奋斗,才能有成就;有了成就你才能乐观,否则,盲目乐观无异于自杀




七、寄语青年学生

袁老师,作为--位著名语言学家,您能否给予我们学生一些您的建议和希望?

我的想法是,你们风华正茂,春秋鼎盛,有足够的资本可以大胆地畅想未来,踏实地规划自己的人生。其实,不管将来你做什么,学好基础知识,恐怕仍然是第一位的重中之重


本文来源:《国际汉语学报》2019年第10卷

感谢文章作者及采访人施今语授权发布!




袁毓林先生论文发表集锦


关注“语言学心得”公众号

后台回复“袁毓林”可获取

袁毓林先生论文发表集锦文档



往期推荐


语言学人|冯志伟:汇通文理,探索语言奥秘

语言学人|陆俭明:在不断的认知升级中研究和教学


语言学人|沈家煊:立足汉语特点的科学探索


语言学人|冯志伟:汇通文理,探索语言奥秘



课程推荐



博学有道|海外语言学专业申博交流会

2022-08-02

刊讯|SSCI 期刊《第二语言学习与教学研究》2022年第2期

2022-08-02

博士招生|安特卫普大学招收语言学博士生

2022-08-02

好文荐读|金立鑫:汉语动词的典型性等级

2022-08-01

免费研修|汉语语言、互动与多模态方法工作坊

2022-08-01

刊讯|《汉语教学学刊》2022年第15辑

2022-08-01

刊讯|SSCI 期刊《双语:语言与认知》2022年第1期

2022-07-31

学术会议|语言发展与障碍研究生学术创新论坛

2022-07-31

重  磅|2022年度教育部人文社科项目评审结果(语言学)

2022-07-30

刊讯|SSCI 期刊《语言与社会互动研究》2022年第1-2期

2022-07-30



欢迎加入
“语言学心得交流分享群”“语言学考博/考研/保研交流群”


请添加“心得君”入群务必备注“学校+研究方向”

今日小编:丸   子

审   核:心得小蔓

转载&合作请联系

"心得君"

微信:xindejun_yyxxd

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存