查看原文
其他

数据驱动的语言学研究新路径

刘海涛教授 语言科学 2024-03-07


随着数智时代的浪潮席卷全球,语言学迎来了新的机遇和挑战(数智时代语言研究的挑战与机遇)。一方面,多语种的大规模语料库使得基于数据和实证的语言研究成为可能,这些新的材料和方法有助于解决传统方法难以解决的问题;另一方面,学科鸿沟的存在,特别是文科背景的语言研究者对处理大规模数据的畏惧,阻碍了语言学更好地服务于科学进步和社会发展。

自2006年以来,基于大规模真实语料和交叉学科方法,刘海涛教授与其合作者对人类语言在诸多层面的共性及特性展开了系统研究,相关成果大多发表在国际知名的学术刊物上。自2014年起,刘老师连续八年入选“中国高被引学者”。正如《科技日报》所评论的那样:“在计量语言学、语言复杂网络、依存语法等领域,刘海涛团队的相关研究多年来均处于国际前沿,在探索语言世界的舞台上亮起了一盏来自中国的‘明灯’(学术访谈|刘海涛教授:好奇是做研究的原动力)。”

近年来,刘老师一直在思索如何让更多国内的语言研究者认识和了解“数据驱动”的语言学研究方法、更好地参与中国语言学的科学化和国际化,《依存关系与语言网络》因此应运而生。该书精选了刘老师及合作者近二十年的研究成果,较为系统、全面地展示了以大规模依存树库为基础,围绕语言的线性结构和网络结构对语言这一“人驱复杂适应系统”所做的探索。其中包括已在相关领域得到广泛认可的“依存距离最小化”(Dependency distance minimization)和“刘-有向性”(Liu-directionality)等。



书名:《依存关系与语言网络》

书号:978-7-03-072783-1

作者:刘海涛

字数:510000

出版社:科学出版社

出版时间:2022-08

定价: ¥98.00元




内容简介





借助大规模真实语料探究人类语言的本质规律及其机制,是数智时代语言学家的主要任务之一。本书精选了笔者近年来的研究成果,较为系统、全面地展示了以大规模依存树库为基础,围绕语言的线性结构和网络结构对语言这一“人驱复杂适应系统”所做的探索,其中包括已在相关领域得到广泛认可的“依存距离最小化”和“依存方向连续统”等。全书内容丰富、结构明晰、友好易读,较好地回答了“什么是数据驱动的语言研究”、“为什么要开展相关研究”,以及“应该如何开展”等问题。





本书目录

从无序中寻找有序
写在前面的话
依存关系计量研究
第一章 依存距离和依存方向 3
第一节 依存关系的基本概念 3
第二节 依存距离作为衡量语言理解难度的计量指标 10
第三节 依存方向作为面向语序类型研究的计量指标 26
第二章 影响依存距离和依存方向的因素 39
第一节 句长 39
第二节 语体 52
第三节 标注方式 63
第三章 依存距离最小化及其形成机理 83
第一节 汉语依存距离的概率分布 83
第二节 30种语言的依存距离分布规律 90
第三节 交叉依存与依存距离的关系 103
第四节 组块在降低自然语言句法复杂度中的作用 113
第四章 依存结构的计量特征及其应用 124
第一节 汉语句法及类型特征 124
第二节 依存距离最小化与汉语的“VP+N1+的+N2”结构 131
第三节 罗曼语族语言的类型特征 136
第四节 依存距离和动态配价 145
第五节 依存结构层级的分布规律 159
第六节 依存距离与层级距离 166
第七节 依存结构树句长、树宽、树高之间的协同关系 174
语言复杂网络研究
第五章 语言网络的整体特征 187
第一节 语言是一个复杂网络 187
第二节 汉语句法网络的复杂性 201
第三节 汉语语义网络的复杂性 208
第四节 汉语音素网络的复杂性 215
第六章 现代汉语多层级复杂网络研究 224
第一节 引言 224
第二节 汉语多层级网络的构建 226
第三节 汉语四个层级网络的复杂性特征 230
第四节 从复杂网络参数看汉语层级结构特点 234
第七章 语言网络的局部特征 240
第一节 句法在语言网络中的作用 240
第二节 汉语句法网络的中心节点 243
第三节 局部句法结构与网络整体特征的关系 253
第八章 语言网络应用研究 265
第一节 基于语言网络的语言分类 265
第二节 句法网络与语言的形态复杂度 276
第三节 词同现语言网络与斯拉夫语族语言分类 285
第四节 基于句法网络和语义网络的语体分类 292
第五节 复杂网络视角的翻译研究 300
参考文献 306
附录一 从依存距离到语言学交叉学科研究 328
附录二 大数据时代的语言研究 338
附录三 数智时代的(应用)语言学杂谈 356
附录四 语言学理论研究如何应对智能时代的挑战 368
写在后面的话 382





作者简介





刘海涛,国际世界语学院院士,教育部“长江学者”特聘教授,国务院政府特殊津贴获得者。浙江大学求是特聘教授,博士生导师;广东外语外贸大学云山领军学者,北京语言大学特聘教授。两次获省优秀博士论文指导教师,国内外多种语言学出版物的编委会成员。连续八年入选爱思唯尔“中国高被引学者”榜单。用多种语言在数十种文、理、工出版物发表过涉及数十种人类语言的成果300余篇(部),被WOS核心库收录100多篇,多篇论文入选ESI热点论文与高被引论文。12项成果获教育部与省级社科奖。



(识别二维码购买)


1.相关阅读
认知语言学的研究方法
语言类型学视域下的领属范畴研究
起始年龄和语言学能与二语学习成效的关系研究
语言迁移和概念性迁移:理论与实证
李葆嘉教授等——幼儿语言的成长:常用词汇语义系统建构
鲜活的语言:语言人类学导论
杨亦鸣教授导读《人类语言的大脑之源》
冯志伟教授谈依存语法


2.工具方法

一次搞懂十大文献综述是什么体验?

文科生的编程自白

王华树博士团队带你走进人工智能时代的翻译技术

语言科学研究的利器——R

趁着假期,论文写起来、项目准备起来|必备书单

文献综述如何催生论文、专著和项目

国家社科基金中华学术外译项目申报

Journey into Journals——国际期刊论文写作与发表


3.学术会议
首届语言学学术争鸣与理论创新研讨会(提问征集)
第十届中国第二语言习得研究国际研讨会
2023年外语测试与教学研究高端论坛
第六届语言学与汉语教学国际论坛
北京语言大学第七届人文社会科学研究生学术论坛
历史与文化、语言与认知:研究生联合学术研讨会
第七届汉语作为第二语言研究国际研讨会(CASLAR-7)
继续滑动看下一个

数据驱动的语言学研究新路径

刘海涛教授 语言科学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存