查看原文
其他

文章荐读 | 词汇位置功能视角下的交叉领域知识生长研究

操玉杰, 王施运等 情报学报ISSN10000135
2024-09-23

文 章 荐 读 



词汇位置功能视角下的交叉领域知识生长研究


操玉杰1, 王施运2, 毛进2, 李纲2

1.华中师范大学信息管理学院,武汉 430079

2.武汉大学信息管理学院,武汉 430072


摘要

       挖掘记载科学知识的交叉领域文献,可以探究交叉领域形成和发展中的知识流动和知识创造规律。本文依据词汇在交叉领域文献中的位置功能,提出了“文献空间观”和交叉领域知识生长过程模型,包括知识吸纳、知识内化和知识创新三大环节,进而构建一种全文本分析方法框架实现对交叉领域知识生长过程的量化分析。以生物信息学领域作为案例开展了实证分析,研究结果发现,知识内化与知识吸纳高度相关,数量差距约6倍,但变化趋势相同;领域知识创新第一次高峰出现时间晚于知识吸纳和内化4年左右;随着学科不断成熟,即时内化率保持相对稳定,总内化率降低,新增吸纳知识的内化时滞降低,内化知识激发知识创新的效率越来越高。本文所提出的面向交叉领域知识生长的全文本分析方法框架,能够丰富学术文献全文本内容分析方法体系。


关键词

领域分析; 知识计量; 全文本分析; 引文上下文; 跨学科研究


引用格式:

操玉杰, 王施运, 毛进, 李纲. 词汇位置功能视角下的交叉领域知识生长研究[J]. 情报学报, 2023, 42(4): 393-406.


👈长按识别文章二维码查看全文


0

引言

        2020年12月,“交叉学科”正式被国务院学位委员会和教育部设立为第14个学科门类[1],这彰显了学科交叉融合已是大势所趋。学科交叉研究领域(以下简称“交叉领域”)是指针对单一学科无法解决的复杂问题,两个及两个以上学科通过知识融合产生对问题新的整体认知或解决方法,形成超越已有学科边界的新知识的研究活动或研究领域[2-3]。然而,目前学界对交叉领域的形成和发展的研究仍显不足,制约并阻碍着学科交叉融合的深入推进。厘清交叉领域知识生长的内在机制与本质规律,有助于研究人员和管理部门理解交叉领域的发展脉络及其内因,合理制定交叉科学相关的科技政策,从而促进交叉科学蓬勃健康发展。

        现有研究一般是通过知识系统的计量实体来研究交叉领域的知识传播与知识演化,赖以计量的实体正从期刊、论文、作者等粗粒度物理实体,转向文献关键词等中观知识实体,以及理论、方法、数据和领域实体等细粒度知识实体[4]。词汇作为文献标题、摘要及正文中出现的具有实质意义的最小表达单元,也是知识元构成的基本组件,因其具有高度浓缩性、文献耦合性、度量难度低等特征,其在较多研究中被视为一种表征文献内容和确定知识含量的简单且有效的计量单元[5]。当前,主流学术数据库往往提供包含摘要文本在内的丰富型题录数据。随着开放获取计划的进一步推广以及自然语言处理、机器学习等文本挖掘技术的发展,全文本知识计量与内容分析取得了长足进步[6]。借助文献题录文本(包括标题、关键词和摘要等)和全文内容,通过定量手段研究交叉领域的知识生长机制与演化规律,已成为学术文献分析和交叉领域研究的一个重要研究方向[7]

        词汇在单篇文献的章节结构中往往承担着一定的功能和角色。已有研究表明,出现在文献不同章节(如引言、方法、结果、讨论)的词汇拥有的知识类型(理论、方法等)具有显著差异[8]。相较于这种文献层次的词汇位置功能,本文从知识流动视角展开研究,认为词汇在领域文献集合层次上也具有特定的词汇位置功能。针对交叉领域的动态文献集合和词汇位置功能,本文提出一种“文献空间观”,以区分交叉领域内部知识空间和外部知识空间,词汇在交叉领域内部和外部知识空间的相应文献中的篇章位置变化,能够反映交叉领域中知识流动、知识角色转化,从而揭示领域的微观知识生长过程。具体而言,本文认为,词汇在交叉领域文献集合中的篇章位置,反映了交叉领域知识生长中的“知识吸收→知识内化→知识创新”动态过程。

        鉴于此,本文以特定交叉领域的科学文献词汇及其出现的篇章位置为切入视角,基于交叉领域文献和参考文献集合,构建词汇位置功能视角下的交叉领域知识生长分析框架,以从细粒度层面解构交叉领域知识生长微观过程,借助自然语言处理技术和统计分析方法提出不同类型知识的识别方法和生长过程分析方法,解析交叉领域“知识吸收→知识内化→知识创新”的微观过程中的知识内容构成和转化特征。本文所提出的基于词汇位置功能和文献空间观的交叉领域分析方法框架,是一种面向交叉领域知识生长的全文本分析方法,能够丰富学术文献全文本内容分析方法体系。同时,本文所提出的文献空间观也能够为学术文本知识组织、知识检索和知识发现提供新的研究视角。


1

相关研究概述

1.1 基于词汇的交叉领域分析       

        词汇是科学文献内容表征和文献知识含量计量的最小单位[9]。学者通常基于词汇来分析交叉领域主题内容和各粒度知识之间的关系,其目的是从结构层面剖析交叉领域知识全貌,相关研究主要包括以下两个方面。

        (1)交叉领域主题内容分析。早期学者们借助文本挖掘、共现分析、耦合分析、主题模型等方法,从学科交叉领域文献中抽取词汇,并基于词汇判定交叉领域主题,通过对词频、共现次数、耦合强度、主题数量等进行统计分析,实现交叉领域主题分布、主题热度、主题关系变化情况和主题演化路径的观察,并加入专家解读主题内容构成和内容变化[10-12]。在此基础上,部分学者引入热度指标、新兴指数、跨学科指数等统计指标,进行研究热点、潜在研究、新兴交叉主题、学科交叉点和学科交叉主题等交叉领域特色内容识别[13-14]。为了揭示交叉领域的学科、作者和主题等特征,相关研究的学者们尝试通过交叉领域学科特征词库构建、作者与词汇双向聚类分析、由词汇构成的跨学科主题和单学科主题特征对比分析等方式,进行交叉领域不同层次的知识主体认知特征挖掘[15-16],该尝试使得交叉领域的主题内容分析从领域粗粒度层面深入到学科、作者、主题等多个细粒度层面。同时,使用词汇进行交叉领域学科、作者和主题研究内容表征的实现,推动了基于内容的知识主体关联强度、相似度和差异度计算,为潜在合作主体识别提供了可能[17-18]

        (2)交叉领域知识结构分析。交叉领域知识结构分析主要以词汇为节点,词汇间的共现关系和引用关系为连边,构建交叉领域共词网络和引文网络,借助中心度、关系强度、网络路径、结构洞等拓扑结构,结合节点的跨学科属性,探测交叉领域突发节点和社团结构,揭示交叉领域知识网络静态结构特征,以及产生、消亡、分裂和合并等演化动态规律[19-21]。为进一步识别交叉领域发展过程中知识网络结构的知识主体与知识内容的组合模式,学者们引入了学科影响力指数、词汇主题类别等词汇属性,构建二模、三模主题网络模型,用于挖掘作者-主题、学科-主题、学科-对象-方法等交叉领域核心作者研究贡献、跨学科主题内容、跨学科知识组合等知识组合特征[22-23]。部分学者在主题网络模型构建基础上,进一步加入了知识主体的潜在跨学科合作指数、知识节点影响力指数、知识媒介影响力指数、跨学科知识相关性等知识流动和跨学科性度量指标,尝试从知识网络结构层面识别合作潜力较高的学科知识组合和作者知识组合[24]

        事实上,从动态视角研究交叉领域主题和知识结构,就是从知识内容角度剖析交叉领域知识生长过程。早期研究以学术论文为计量单位,利用科学计量方法度量领域知识的时序演化现象和规律[25],随后加入文本挖掘和知识网络分析方法观测领域主题和知识结构的演化过程[26]


1.2 科学知识流动研究

        科学知识流动能够促进科学知识的生长,本节首先对科学知识流动的定性与定量研究进行概括,然后对交叉领域知识流动的相关研究进行综述。

1.2.1 科学知识流动的定性研究

        科学知识流动的定性研究主要包括以下两个方面。

      (1)知识流动过程解构。借助SECI(socialization, externalization, combination, internalization)知识创造模型、波普尔世界3理论、网络日冕模型、知识场理论等传统理论,从不同知识类型和组织层次的知识转化、科学知识的自然选择、知识节点的知识输入输出组分划分、知识流动网络结构的时序演化等角度,对科学知识流动过程进行理论解读[27-28]

        (2)知识流动动因分析。从知识流动影响因素角度,将知识流动要素划分为主体、内容和流动方向三个方面,知识流动的产生动因源自主体间的知识势差,相应地从知识特性、合作特性、知识受体特征、知识源特性、情境特性等多个维度对知识流动影响机理进行归纳[29-30]。可以看出,从主体、内容和方向三大要素解读知识内容在知识主体间的定向流动,以及在流动过程中的内容变化是知识流动理论研究的主要方式。其中,知识吸收与知识扩散研究侧重于特定主体的知识流入或流出,而知识生长则侧重关注主体本身的知识内容变化。

1.2.2 科学知识流动的定量研究

        科技文献因包含了由文字符号显化的知识单元,成为当前知识流动定量分析的主要研究对象,相关定量研究可以分为以下三个方面。

        (1)科学知识流动关系判定。文献的引用关系和合著关系被视作知识流动关系判定和计量的基础。前者认为不同主体间包括文献间、学者间、期刊间、学科间和国家间的科学知识流动主要通过文献引用来实现,后者则认为知识可借助学者为载体通过作者合著实现主体间的科学知识交换与交流[31-32]

        (2)科学知识流动的定量测度。基于文献的知识流动计量关注知识流动通量、知识转移效率、知识转化贡献和知识流动能力等多个维度的度量。其中,知识流动通量主要通过文献关系来对知识流动的规模、广度、强度、速度进行统计[33];知识转移效率是通过比较不同环节的知识通量,获得知识流动过程中知识的进化、遗传、共生、变异和转化等内容效率[34];知识转化贡献是通过节点度、凝聚子群等网络结构指标识别对知识流动贡献较大的知识节点或社群[35-36];知识流动能力则是通过节点属性如引文重要性[37]、网络结构如网络距离、聚集系数等网络特征来度量知识流动网络或知识节点间的流动能力[38]。除以文献为计量单元外,近年来较多学者也开始以术语、关键词等词汇为计量单元设计指标用于研究知识流动[39-40]

        (3)知识流动影响模型。在对知识流动效率、知识转移效果、知识流动有效性等流动结果进行指标设计和度量分析基础上,将关系强度、网络中心性、网络密度等网络特征,提供者知识存量、接受者知识存量和知识场强度等知识场特征,以及知识传播媒介、知识性质、知识主题等认知结构特征,作为自变量构建知识流动影响模型,通过统计模型剖析其对知识流动的影响[41-42]

        相较于定性研究中对知识流动过程的完整解读,知识流动定量研究着重于知识吸收与知识扩散这两个特定环节的量化分析。前者侧重于知识主体对于外界知识吸收的多样性和规模度量,后者用于知识主体对其他领域的知识影响力评价和作用过程挖掘[43-44]

        1.2.3 交叉领域知识流动

        近年来,交叉领域作为一类特殊的学科领域吸引了科学界的广泛关注,学者们采用了多种方法研究其知识流动现象,以深入揭示交叉科学发展规律。部分研究基于不同学科文献间的引用关系,设计了跨学科知识流动测量指标开展研究[14,20]。从内容角度,交叉领域研究除关注领域内部的知识特征(如主题内容和知识结构)之外,还关注领域外部的多学科知识吸收[45]。基于文献间的引用关系,从文献内词汇所表征的知识点和主题角度,借助统计分析和知识网络分析可以测度交叉领域的知识流入流出特征[46]。学者们还逐渐关注到词汇所承担的跨学科知识交流功能和作为特定角色的跨学科迁移现象[47]。部分学者开始深入全文内容(如引文上下文)中,将术语作为一种特殊的词汇,结合学科和位置特征揭示不同学科间和不同位置上的跨学科知识流动特征[48]


1.3 研究现状述评

        现有文献从知识内容角度对交叉领域的知识生长结果和演化过程进行了研究,同时也从文献和内容角度探究了其知识流动过程和特征。现有研究存在的不足主要体现在两个方面:一方面,是仅将知识流动或知识生长作为独立环节分隔开来进行研究,较少对交叉领域吸纳外部知识内容进而创新实现知识生长这一完整过程进行建模和分析;另一方面,是知识结构和知识流动中的知识测度较多以论文、作者或主题为度量单位,鲜少深入词汇和词汇属性方面深入剖析交叉领域知识生长的微观过程。区别于单一传统学科研究,交叉领域更关注多学科知识引入和跨学科知识融汇及其作用于领域知识产出的过程[49]。基于现有研究存在的不足,本文尝试从词汇在文献中的不同位置视角入手,结合科学知识流动过程理论进行交叉领域知识类型细分,并借助量化指标分析知识生长过程,以期揭示交叉领域知识生长过程特征。


2

交叉领域知识生长过程建模及测度

        本文在文献空间观的词汇位置功能理解基础上,提出交叉领域知识生长模型,进而提出一种全文本量化分析方法框架,将文献中词汇知识单元分类为吸纳知识、内化知识和创新知识,量化测度交叉领域知识生长过程。与传统的仅测度交叉领域知识产出结果的时序演化[50-51]不同,本文所构建的交叉领域知识生长模型更关注知识内容在完整知识生长过程中的作用和转化特征。


2.1 文献空间观下的词汇位置

        科学文献由能够表征知识内容和知识含量的最小知识单元(即“词汇”)所构成。科技文献的基本篇章结构一般包括标题、摘要、关键词等题录数据项,引言、相关研究、方法、结果、结论等章节内容项,以及参考文献等。现有词汇位置功能研究主要根据文献篇章结构划分,认为出现在不同章节内容位置的词汇具备能够反映研究叙事逻辑上的结构功能[52-53],而章节内引文上下文中的词汇也具备反映引用动机和知识使用重要程度的引用功能[54-55]。因此,从整体来看,当前研究侧重于在文献层面关注词汇在内部篇章结构位置所反映的研究叙事逻辑功能。

        知识空间观认为,知识生产不仅受其产生的特定局部情境影响,还与其所处的公众空间密切相关[56]。文献知识创造不仅受其内部研究逻辑影响,还受其所处的外部文献环境影响。在当前词汇位置功能研究基础上,本文通过进一步整合相关理论提出“文献空间观”,从更加广阔的视角来理解科学文献中的词汇和词汇位置。一方面,从单篇文献拓展到文献之间的关联,通过引文上下文和参考文献建立起文献间的知识流动,强调词汇在其中的表征作用;另一方面,突出领域性,目标领域文献的参考文献构成了目标领域的外部知识空间,同时目标领域自身存在一个内部知识空间,因而引用上下文则是观察知识从外部空间流向目标领域的重要渠道。

        图1展示了文献空间观下的单篇文献词汇位置示意图。基于文献空间观,词汇根据其所在篇章位置,不仅可以反映其在文献中的研究叙事逻辑功能,也能反映文献内部知识空间和外部知识空间。文献内部知识空间是指文献中体现出的科学研究活动的知识结果,即文献所承载的知识。已有研究表明,标题、摘要和作者关键词等位置的词汇能够较好地表征全文主题内容[57],本文也使用处于以上题录位置的词汇来表征文献内部知识。例如,图1中的“relation types”和“literature-based discovery”等反映了该文献的内部知识空间。文献外部知识空间则是指通过参考文献与目标文献建立直接关联的外部知识,其经由引用上下文流入文献内部,本文采用引用上下文中的词汇进行表征。例如,图1中的“novel connections”“Raynaud's disease”和“fish oil”等是文献外部知识。  

图1  文献空间观下的单篇文献词汇位置示意图


        这种文献层次的内部知识空间和外部知识空间可以进一步拓展到研究领域层次,即领域内部知识空间和领域外部知识空间。需要注意的是,领域内部知识除了领域产生的创新知识外,也会容纳所吸收的外部知识,即相同的词汇可能会出现在两种知识空间。基于这种文献空间观,通过文献中不同位置的词汇则可以分析领域内部知识空间、领域外部知识空间以及知识在两者之间的流动和转化,从而揭示交叉领域的知识生长过程。


2.2 交叉领域知识生长过程模型

        结合波普尔知识生长四段图式假说[58]、SECI知识创造模型[59]和知识系统论[60]来看,交叉领域的知识生长是伴随着知识在个体与群体间的知识转移和认知转化,以新知识的产生为目标的螺旋式增长过程。结合交叉领域内涵可将交叉领域知识生长过程理解为不同学科的文献外部知识通过文献转移进入文献内部空间,基于研究者的理解和选择部分与文献内部知识作用发生知识转化、创造新知识,领域研究成果(即学术文献)的动态积累引起交叉领域的知识体系发生变化。简而言之,交叉领域知识生长可定义为由学术文献累积的领域“知识吸纳→知识内化→知识创新”的动态螺旋生长过程。该过程可以发生在任意学科领域,而本文的研究重点是关注跨学科知识进入交叉领域及其作用于交叉领域知识生长的过程。图2呈现了以词汇为观测知识单元的交叉领域知识生长过程模型。

  图2  词汇位置视角下的交叉领域知识生长过程模型


        通过正式科学交流过程中的学术文献,可以界定交叉领域知识生长的主要环节。

        (1)知识吸纳。知识吸纳作为企业知识吸收的细分环节被提出,是指对外部知识的理解和整合[61]。同理,将交叉领域视为一个主体,其知识吸纳可定义为交叉领域从其他学科中获得跨学科知识转移的过程,是还未发生的潜在知识吸收。在文献层面,表现为交叉领域中的施引文献通过引用上下文引用其他学科文献,即源学科中的知识基础跨跃学科边界流动到交叉领域中。这部分知识尚未被融合进入目标领域的知识体系中,是游离态的吸纳知识。

        (2)知识内化。知识内化是SECI知识创造模型的关键环节,是指将从外界所学到的显性知识内化为组织的重要资产[59]。基于此,本文将交叉领域吸纳跨学科知识之后转化为领域自身知识体系的过程理解为交叉领域的知识内化,该过程伴随着领域知识产出而发生,是已经发生知识转化的、实际的知识吸收。以文献为观察对象,交叉领域对于跨学科知识的吸纳与内化是同时发生的,通过单篇施引文献对于被引文献的引用来实现跨学科知识吸纳,同时通过该文献复用游离在交叉领域外的跨学科知识,内化为交叉领域内部知识体系的有机组成部分。

        (3)知识创新。在科学研究活动中,知识创新被理解为通过科学研究获得新知识的过程[62]。本文将交叉领域知识创新定义为交叉领域综合领域内外的多学科知识开展科学研究工作,进行新知识内容创造的过程。受到酝酿效应的影响,相较于知识吸纳与知识内化,交叉领域知识创新存在一定的延缓发生现象。知识创新的结果在交叉领域知识体系中表现为在以往科学研究中未出现的领域新兴知识结构。


2.3 基于词汇位置功能的吸纳知识、内化知识和创新知识分类

        为了观察交叉领域知识生长的整体过程,需要对交叉领域文献以及其参考文献进行综合分析。根据词汇位置的不同,本文提取以下三类词汇集合:①引文词汇集,从参考文献的标题、摘要和关键词等位置抽取的词汇集合,反映交叉领域的参考知识基础;②引用词汇集,从交叉领域文献的引用上下文中抽取的词汇集合,能够反映交叉领域参考并使用的知识;③发文词汇集,从交叉领域文献的标题、摘要和关键词等位置抽取的词汇集合,表征了交叉领域科学研究活动所创造产生的知识。

        借助于文献空间观,本文通过观测词汇在交叉领域文献集合中的位置变迁,可以分析交叉领域知识的吸纳、内化和创新过程,整体分析过程如图3所示。基于词汇位置的交叉领域知识类型划分,本文定义和识别以下三种知识。

图3  吸纳知识、内化知识和创新知识分类


        (1)吸纳知识。从单篇文章视角来看,交叉领域的知识吸纳过程由文献引用所表征的词汇流动而推动。交叉领域所发表的研究文献作为施引文献,通过引用上下文(本文中将引用句视为引用上下文)显式地表达了对被引文献知识的吸纳,将游离在交叉领域外的不同学科基础知识输入交叉领域中。相应地,作为知识的承载体,词汇从被引文献流动到交叉领域文献的引用句中,发生位置转移。在领域集合层面,知识吸纳表现为知识从引文词汇集进入引用词汇集,本文将交叉领域知识吸纳环节所获得的这种领域知识收益称为“吸纳知识”。本文中,引文词汇集从被引文献中标题、摘要和关键词中获得,引用词汇集从交叉领域文献的引用句中获得,两个集合的交集即代表了交叉领域文献获得的吸纳知识。

        (2)内化知识。交叉领域的知识内化过程将交叉领域外部的跨学科知识转化为交叉领域知识体系的组成部分。该过程是交叉领域施引文献在知识创造过程中,对从被引文献中吸纳知识的直接复用,是对吸纳知识的移植和借鉴。本文将交叉领域知识内化环节所复用的吸纳知识称为“内化知识”。从词汇位置来看,知识内化过程体现在从引用词汇集移动到能代表交叉领域知识产出结果的发文词汇集,即交叉领域文献的标题、摘要和关键词等核心位置出现的词汇。以文献为观测单元时,交叉领域对于外部学科知识的吸纳与内化可以是同时发生的,也可以是内化的发生晚于吸纳。单篇施引文献吸纳被引文献知识后,可能在当前文献中被内化,也可能在后续文献中才表现为内化,即内化知识可能存在一定的时滞。

        (3)创新知识。交叉领域知识创新是指产生出不同于内化知识和领域已有知识的新知识内容,促进领域知识体系的不断增长。本文将交叉领域通过知识创造活动产生的新兴知识称为“创新知识”,其甄别方法为:从词汇位置来看,创新知识主要存在于领域文献词汇集之中,表现为发文词汇集中区别于内化知识的新兴增长部分。

        知识吸纳是交叉领域的知识来源,知识内化和知识创新是交叉领域知识生长的两种主要形式,三者存在一定的时序关系和非同步性。一般而言,知识吸纳先于知识内化和知识创新,但知识创新可能是由当下的知识内化所触发的,也可能是受到酝酿效应影响而被延时触发。交叉领域的学科发展即“知识吸纳→知识内化→知识创新”的螺旋式动态生长过程。


2.4 交叉领域知识生长的量化测度

        已有研究尝试以关键词等知识单元作为测量对象,设计数学指标测度知识流动过程中的知识通量,通过指标的时序变化来观察科学领域知识的演化特征或现象[63]。从领域文献中识别出吸纳知识、内化知识和创新知识词汇后,本文设计了以下两个方面的量化分析。

        (1)知识吸纳、内化和创新的知识规模分析。本文通过统计相应的词汇出现频次和数量,来分析交叉领域知识吸纳、内化和创新的知识规模。从交叉领域发展过程来看,分析交叉领域中不同年度知识吸纳、内化和创新的知识规模、来源学科及其变化趋势,可以揭示不同学科在交叉领域知识生长过程中的具体角色,并从知识演化视角探究交叉领域知识生长过程特征。为此,本文做出以下定义。

        ①知识频次:指相应类型词汇在文献或文献集合中出现的次数。

        ②知识数量:指相应类型词汇的种数,同一词汇只计一次。

        ③知识的来源学科:针对参考文献,其所在期刊归属的学科视为其来源学科;针对吸纳知识,将其所在施引句对应的参考文献归属的所有学科视为该知识的来源学科;针对内化知识,其对应的吸纳知识在首次被内化前所关联的参考文献学科均视为该内化知识的来源学科。由于同一吸纳知识可能出现在多个施引句中,因此,吸纳知识和内化知识的来源学科均可能有多个。

        (2)“知识吸纳→知识内化→知识创新”的转化分析,探究吸纳知识到内化知识、内化知识激发创新知识的转化特征。首先,从跨学科知识被交叉领域吸纳到内化的转化过程来看,存在两种现象:一是即时内化,即跨学科知识在被交叉领域吸纳的同时,被交叉领域内化;二是滞后内化,即跨学科知识在被交叉领域吸纳后,经过一段时间的消化和研究工作才被交叉领域所内化。为此,本文做出以下定义。


3

实证分析

3.1 交叉领域选择与数据收集

        交叉学科是发展较为成熟的交叉领域形态,通过其历史发文及其携带的知识内容能够较好地回溯交叉领域的知识生长过程。生物信息学(Bioinformatics)已是一个相对较为成熟的交叉学科领域,其涉及生物学、计算机科学、统计学、信息系统等多个学科领域[64],因此,本文选择生物信息学作为案例领域。本文所关注的知识生长过程不仅限于领域内知识产生和演化,还需要观察从其他学科领域吸纳知识的过程。在收集数据时,需要同时收集该学科领域的研究论文及其参考文献的题录数据。

        为收集生物信息学领域文献,本文以bioinformatics为检索词在期刊引证报告(Journal Citation Reports,JCR)中检索到13本期刊,进而以这些期刊的ISSN号在Web of Science(WoS)核心集中检索文献数据,检索式为“(IS = 1367-4803) OR (IS = 1177-9322) OR (IS = 1471-2105) OR (IS = 1574-8936) OR (IS = 0219-7200) OR (IS = 1467-5463) OR (IS = 1176-9343) OR (IS = 1672-0229) OR (IS = 0887-3585) OR (IS = 1748-5673) OR (IS = 1545-5963) OR (IS = 2192-6662) OR (IS = 1613-4516)”,检索时间是2022年6月9日,且仅保留截止到2019年的开放获取文献记录,共得到27052条记录。根据这些记录在PubMed数据库中的文献ID(PMID)从PubMed Central数据库中匹配论文全文,共得到13400篇XML格式全文文献。

        然后,对全文数据进行结构化解析,抽取题录元数据、引文句信息和参考文献信息,共获取到486558条引文句。解析文后参考文献,并与PubMed数据库进行匹配,去重后,最终得到参考文献题录数据140711条。


3.2 词汇抽取与三类知识识别

        科技文献中承载知识的词汇多为名词,因此本文后续分析中所指词汇主要是名词术语[65]。本文运用spaCy工具包(https://spacy.io/)抽取生物信息学领域文献及其参考文献的标题、摘要和引文句中的名词及名词短语。对抽取得到的名词术语进行词根还原,将不同形式的名词表达(如同一名词的单复数)进行标准化,得到生物信息学领域每篇文献的发文词汇集、引用词汇集和引文词汇集。

        根据本文对于吸纳知识、内化知识和创新知识的定义和识别方法,将引文句的引用词汇集及其对应参考文献的引文词汇集进行匹配,以两者共有的词汇作为该引文句从参考文献吸纳的知识,从而得到该领域的吸纳知识。从整体领域出发,将每篇文章的发文词汇集与累积到该文发表年份的吸纳知识词汇集进行对照:若某一发文词汇出现在了吸纳知识词汇集中,则视为内化知识;若发文词汇出现在该文发表当年的吸纳知识词汇集中,则视为当年即时内化知识,由此得到该内化知识的内化年份。将每篇文章的发文词汇集去除领域中已存在知识、累积吸纳知识和当年内化知识,新增加的词汇则视为创新知识,该文章发表年份为创新知识的产生年份。


3.3 三类知识的识别结果

        生物信息学领域吸纳知识、内化知识和创新知识的识别结果统计如表1所示。从整体来看,吸纳知识远多于内化知识和创新知识,且吸纳知识的篇均词频也远高于其他两类知识,表明该领域广泛而持续地从其他学科吸纳知识作为领域的知识基础。内化知识涉及的文章数量最少,表明并不是所有文章均在吸纳外部知识的同时,将其转变且固化为领域内知识;同时,内化知识数量最少,且远少于吸纳知识,表明知识吸纳的内化过程相对缓慢,整体的转化率较低,表明生物信息学领域直接移植借鉴的外部知识比例较低。同样地,并不是所有的领域文献均包含了创新知识,表明该领域中部分研究文献可能并没有创造以新词汇为表现形式的新知识。虽然创新知识主要从标题、摘要等数据项中识别得出,但创新知识的篇均词频也较大,多于内化知识。需要特别说明的是,本文仅从本学科领域视角识别新词汇,而未从全局科学版图来判定创新知识,因此,所识别的创新知识数量比领域真正创新的知识会更多一些。

        生物信息学领域吸纳了来自多个相关学科的知识单元,为进一步分析其吸纳知识和内化知识的学科分布特征,本文根据知识频次筛选出贡献较大的10个知识来源学科。本文参考文献的学科由其期刊归属的Science-Metrix学科分类(2016年版本,https://science-metrix.com/classification/)进行表示,共包含覆盖全科学领域的176个学科分类。排除Bioinformatics学科自身的参考文献后,按年度分别统计了来自其他学科的吸纳知识和内化知识的知识频次和数量。研究结果发现,无论是生物信息学领域的吸纳知识还是内化知识,更多来自生物学的各个相关子学科。例如,Developmental Biology(发育生物学)、Biochemistry & Molecular Biology、Biophysics、Evolutionary Biology、Medical Informatics、Biotechnology等。除此之外,一般科学技术领域General Science & Technology占比也较大,表明其对生物信息学的知识贡献比较大。除生物学相关子学科以外,由于统计学以及计算机相关的信息技术领域也是知识贡献较大的学科,本文选择上文提及学科和Statistics & Probability、Artificial Intelligence & Image Processing、Software Engineering三个学科进行量化分析。


3.4  生物信息学的知识生长过程特征

        交叉领域知识生长过程伴随着吸纳知识、内化知识和创新知识的不断增长,本文进一步分析了三类知识的增长趋势,以探究生物信息学领域的知识生长过程特征。利用动态分析,描绘了生物信息学领域三类知识的年度知识频次和数量的增长趋势(图4),按年统计了当年出现的吸纳知识、内化知识和创新知识的频次和数量。三类知识的频次增长趋势大致相同,在学科发展早期增长速度较快,且均在2010年达到第一个波峰;随后,每年吸纳知识和内化知识大致保持在一定的数值范围,经过短暂下降后再次增长,但增速有所放缓,创新知识的增长最慢,保持相对稳定不再加速增长。三类知识的数量变化趋势与频次变化趋势大致相同,吸纳知识的知识频次和数量大约是内化知识的6倍,由于知识数量的数值比知识频次的数值小一些,其变化幅度也相应要小一些;而创新知识的知识频次与知识数量趋势线较为重合,其主要原因是创新知识在文章题录文本中往往不会被多次提及。

图4  三类知识的年度知识频次与知识数量变化趋势


        图5展示了生物信息学吸纳知识、内化知识和创新知识的年度新增情况,按年统计当年第一次出现的吸纳知识、内化知识和创新知识的频次与数量。由图5可以看出,三类知识的数量变化趋势与频次变化趋势整体上大致相同。年度新增的吸纳知识与内化知识的变化趋势较为一致,均在2006年达到第一次高峰,其后相对保持稳定,但内化知识波动幅度相对较大。而年度新增的创新知识虽然变化趋势与吸纳知识和内化知识相似,但其第一次高峰出现时间(2010年)却晚于两者,由此表明生物信息学领域的创新知识高峰时间晚于知识吸纳和内化时间。

图5  三类知识的年度新增频次与新增数量情况


        图6和图7分别展示了以上10个代表学科的吸纳知识和内化知识的年度知识频次分布情况,由此可以观察到每个学科对于生物信息学所贡献的吸纳知识和内化知识的年度变化情况。从整体来看,这10个学科对生物信息学的知识贡献呈增长态势,各学科知识贡献占比排序稳定。其中,发育生物学贡献了最多的吸纳知识和内化知识,在2010年以前,其知识贡献均保持持续增长,内化知识相对保持稳定,而吸纳知识经过短暂减少后又缓慢持续增长。从每年的知识频次分布来看,无论是吸纳知识还是内化知识,生物学相关子学科贡献的知识规模均比统计学和信息技术学科要大得多。由此发现,虽然生物信息学被认为是生物学和统计学、计算机科学等交叉融合所产生的交叉学科,但事实上从知识规模来看,生物学所贡献的知识量要远大于统计学和计算机科学。其原因可能是生物信息学是利用统计学和计算机科学知识来解决生物学中的科学问题,其核心所依赖的仍然是生物学的科学理论和科学知识。

图6  10个代表学科的吸纳知识年度知识频次


图7  10个代表学科的内化知识年度知识频次


        从“知识吸纳→知识内化→知识创新”的知识生长过程做进一步分析,可以发现:①知识内化伴随着知识吸纳而发生,年度新增的内化知识均少于吸纳知识,但变化趋势相同。②生物信息学发展表现出生命周期特征,在发展早期,吸纳知识、内化知识和创新知识均快速增长;随着学科成熟度的提高,三类知识的增长速度相对趋于稳定;生物信息学仍然处于高速发展期,三类知识的增长速度未见下降。③创新知识的年度新增知识广度达到第一个波峰时间晚于吸纳知识和内化知识,表明知识创新存在一定的滞后性。造成这一现象的原因可能是科学研究的“酝酿效应”:生物信息学领域在吸收和内化了其他学科输入知识后,经过一定时间的研究工作和科学探索,发生知识酵化反应后才能创造新的研究成果。④为解决生物学中的科学问题,生物信息学核心依赖的科学知识持续来源于生物学相关子学科的科学理论和知识。从知识量来看,统计学和计算机科学等提供方法技术的学科占比相对较少。


3.5 不同类型知识之间的转化特征

        为揭示生物信息学“知识吸纳→知识内化→知识创新”的知识流动与转化过程特征,本文进一步探究吸纳知识转化为内化知识、内化知识激发产生创新知识两个子过程。

3.5.1 吸纳知识到内化知识的转化特征

        吸纳知识与内化知识具有相同的时序演化趋势,但内化知识规模和广度均相对较小。由图8可知,在生物信息学学科发展早期(2006年以前),即时内化率相对较高,而之后的即时内化率相对较低(仅在0.08左右)且保持稳定,表明生物信息学领域文献在发文时即时内化所吸纳的跨学科知识的比例较低。然而,从年度总内化率来看,表现出整体降低趋势,在学科早期内化率较高,2006年以前为0.4,而随着学科发展,总内化率也在不断降低。造成这一现象的原因可能是:随着吸纳知识量的逐年增加(见图4),生物信息学领域内化的知识量增加幅度不及吸纳知识量的增加,引起总内化率降低。该过程揭示了吸纳知识的内化过程表现出的“漏斗效应”:学科领域从其他学科吸纳知识后,经过科学研究过程的沉淀和筛选,仅一部分知识被该领域所接受并内化为领域固有的知识结构。


图8  生物信息学的年度即时内化率和总内化率


        根据图9可知,每年新增内化知识的平均内化时滞随着时间的推移而不断增加,反映出在交叉领域研究过程中的延时内化较为普遍,且由于累积吸纳知识量的增多,内化过程中的知识选择越来越难。然而,每年新增的吸纳知识的内化时滞却在不断地降低。造成这一看似矛盾的现象的原因可能是:随着学科研究的不断推进,科学问题变得越来越清晰、明确,研究者会倾向于从其他学科借鉴并应用更能解决科学问题的相关知识,从而表现出在吸纳知识后快速内化这些知识。

图9  生物信息学的年度内化时滞


3.5.2  内化知识激发创新知识的特征分析

        交叉领域知识创新的直接知识基础来源于领域中已建立起的知识结构,内化知识对知识创新具有一定的激发促进作用。从图10可以观察到,生物信息学领域的创新-内化知识比值随着时间不断地提高。由此说明,随着这一交叉领域的不断成熟,内化知识所激发的知识创新越来越活跃,创新效率得到有效提升。据此可以推测,创新-内化知识比可以作为一种潜在的交叉领域发展成熟度指标。


图10  生物信息学领域的内化-创新激发关系


        本文分析了生物信息学文献的内化知识来源学科共现关系,以反映在知识创新过程中所依赖的内化知识的学科组合结构。从图11可知,在内化知识激发知识创新过程中,多数学科组合仍然是来自生物学的各个子学科。例如,Biochemistry & Molecular(生物化学与分子学)和Biology Developmental Biology(生物发育生物学),Biochemistry & Molecular Biology(生物化学与分子生物学)与Biophysics(生物物理学);相较而言,Statistics & Probability(统计与概率)与其他学科的组合较少,而Artificial Intelligence & Image Processing(人工智能与图像处理)和Software Engineering(软件工程)两个计算机学科则处于网络边缘位置,两者与其他学科的组合更少。从激发知识创新的内化知识学科组合结构来看,其也印证了统计学和计算机科学知识对于生物信息学领域的贡献相对来说弱于生物学领域的各个子学科。


图11  生物信息学面向创新激发的内化知识学科共现网络(部分)


4

结论与展望

        交叉领域知识生长是一种复杂的、跨学科知识整合和创新的过程。本文尝试对该过程进行整体建模,并从知识内容角度进行量化分析。本文基于词汇在文献中的位置功能,提出一种“文献空间观”,区分领域内部知识空间和外部知识空间,进而以词汇来观察交叉领域知识生长过程,将其理解为“知识吸纳→知识内化→知识创新”的螺旋式动态增长过程;提出一种全文本分析方法框架,以词汇为计量单元,通过量化指标分析交叉领域知识生长过程中知识吸纳、内化和创新的动态趋势,揭示了知识转化特征和激发特征,分析了不同学科知识贡献。

        本文以生物信息学这一典型交叉学科为例进行实证分析,发现了该交叉领域的知识生长过程中的一些重要特征:①知识内化与知识吸纳高度相关,两者在知识频次和数量数据差别较大情况下变化趋势(拐点方向和拐点出现年份)基本相同。②交叉领域将从不同学科吸纳的知识进行内化时,往往会发生知识选择,表现出“漏斗效应”和时滞现象。其中,被内化的吸纳知识仅占16.19%,且延时内化达92%。随着时间推移,总内化率降低,同时每年新增的吸纳知识的内化时滞却在不断地降低。③创新知识的年度新增知识达到第一个波峰时间晚于吸纳知识和内化知识4年,体现了科学研究中的“酝酿效应”。④为解决生物学中的科学问题,生物信息学核心依赖的科学知识持续来源于生物学相关子学科,统计学和计算机科学等提供方法技术的学科占比相对较少。生物信息学领域的上述特征,对于理解一般交叉学科领域的知识生长规律亦有启示意义。

        针对交叉领域的知识生长过程,本文在文献空间观的基础上提出了一种全文本分析方法框架,但该框架仍存在一些待改进之处,需要进一步研究更加先进、性能更好的方法来实现其中的多个方法环节。首先,在知识内容表示方面,本文以词汇来表示知识,知识的揭示能力有限,尚未采用本体三元组、主题等更高阶的模型来表示知识内容。其次,针对吸纳知识、内化知识和创新知识的识别,主要采用的是词匹配的方法,并没有考虑同义词、相临近概念词等的匹配问题;同时,对于其他的知识表示方法,也需要研究相应的识别方法。最后,在知识量测度和分析时,未纳入更多度量和分析维度,如词汇的类型和概念层次、词汇关系与网络结构、词汇学科属性等,词汇位置功能所揭示的研究叙事逻辑功能也可以纳入分析框架中,从而探究交叉领域知识吸纳、内化和创新过程中词汇角色和功能所起到的具体作用。

        本文亦存在一些数据上的不足:实证数据覆盖量有待提高,仅采用了期刊来界定生物信息学领域的核心文献作为领域文献,且所获取到的全文文献仅占总体约50%;参考文献的数据覆盖范围也需要扩大,可以整合其他学术数据库题录数据,以充分揭示不同学科之间的知识流动关系。

        未来将进一步针对这一全文本分析方法框架的优化问题展开深入研究,并引入更多交叉领域案例进行对比分析,以期提炼和归纳交叉科学知识生长过程的关键特征和一般规律。


参考文献

[1] 国务院学位委员会 教育部关于设置“交叉学科”门类、“集成电路 科 学 与 工 程”和“国家 安 全 学”一级 学 科 的 通 知[EB/OL].(2020-12-30) [2023-03-05]. http://www.moe. gov. cn/srcsite/A22/yjss_xwgl/xwgl_xwsy/202101/t20210113_509633.html. 

[2] 刘仲林 . 交叉科学时代的交叉研究[J]. 科学学研究, 1993, 11(2): 9-16. 

[3] Wagner C S, Roessner J D, Bobb K, et al. Approaches to under‐standing and measuring interdisciplinary scientific research (IDR): a review of the literature[J]. Journal of Informetrics, 2011,5(1): 14-26. 

[4] 钱佳佳, 罗卓然. 全文本计量分析理论与技术的新进展与新探索——2019 全文本文献计量分析学术沙龙综述[J]. 信息资源管理学报, 2020, 10(1): 111-117. 

[5] 张颖怡, 章成志, 陈果 . 基于关键词的学术文本聚类集成研究[J]. 情报学报, 2019, 38(8): 860-871. 

[6] 章成志, 李铮. 基于学术论文全文的创新研究评价句抽取研究[J]. 数据分析与知识发现, 2019, 3(10): 12-19. 

[7] Wang S Y, Mao J, Cao Y J, et al. Integrated knowledge content in an interdisciplinary field: identification, classification, and appli‐cation[J]. Scientometrics, 2022, 127(11): 6581-6614. 

[8] Wang S Y, Mao J, Lu K, et al. Understanding interdisciplinary knowledge integration through citance analysis: a case study on eHealth[J]. Journal of Informetrics, 2021, 15(4): 101214. 

[9] 马费成, 陈锐, 袁红 . 科学信息离散分布规律的研究从文献单元到内容单元的实证分析(I): 总体研究框架[J]. 情报学报,1999, 18(1): 79-84. 

[10] 顾秀丽, 黄颖, 孙蓓蓓, 等 . 图书情报领域中的交叉科学研究:进展与展望[J]. 情报学报, 2020, 39(5): 478-491. 

[11] Chi R B, Young J. The interdisciplinary structure of research on intercultural relations: a co-citation network analysis study[J].Scientometrics, 2013, 96(1): 147-171. 

[12] Zhang J, Yu Q, Zheng F S, et al. Comparing keywords plus of WOS and author keywords: a case study of patient adherence re‐search[J]. Journal of the Association for Information Science and Technology, 2016, 67(4): 967-972. 

[13] 韩正琪, 刘小平, 寇晶晶 . 基于 Rao-Stirling指数和 LDA模型的领域学科交叉主题识别——以纳米科技为例[J]. 情报科学,2020, 38(2): 116-124. 

[14] 刘冬东 . 新兴交叉主题识别与引文扩散影响研究——以计算生物学领域为例[D]. 郑州: 华北水利水电大学, 2020. 

[15] 吴蕾, 田儒雅, 张学福 . 基于主题相关分析的跨学科主题发现方法及实证研究——以动物资源与育种领域为例[J]. 图书情报工作, 2017, 61(1): 72-79. 

[16] 屈文建, 朱丽, 虞逸飞 . 学术交叉领域的双向聚类及主题关联特征分析[J]. 情报科学, 2021, 39(7): 30-37. 

[17] 杜德慧, 李长玲, 相富钟, 等. 基于引文关键词的跨学科相关知识发现方法探讨[J]. 情报杂志, 2020, 39(9): 189-194. 

[18] 曹嘉君, 王曰芬, 陈盛之, 等. 多学科交叉综合的研究领域内学科间分布状态与演化研究[J]. 情报学报, 2020, 39(5): 459-468. 

[19] Lee P C, Su H N. Investigating the structure of regional innova‐tion system research through keyword co-occurrence and social network analysis[J]. Innovation, 2010, 12(1): 26-40. 

[20] 郭婷, 许海云, 岳增慧, 等 . 情报学学科交叉态势可视化研究[J]. 情报理论与实践, 2015, 38(9): 94-99. 

[21] 刘小慧, 李长玲, 崔斌, 等. 基于闭合式非相关知识发现的潜在跨学科合作研究主题识别——以情报学与计算机科学为例[J].情报理论与实践, 2017, 40(9): 71-76. 

[22] 叶春蕾 . 基于 Web of Science学科分类的主题研究领域跨学科态势分析方法研究[J]. 图书情报工作, 2018, 62(2): 127-134. 

[23] 商宪丽. 基于多模主题网络的交叉学科知识组合模式研究——以数字图书馆为例[J]. 情报科学, 2018, 36(3): 130-137, 150. 

[24] 刘小慧, 李长玲, 刘运梅, 等 . 基于作者—核心关键词 2-模网络的潜在跨学科合作组合识别——以图书情报学与计算机科学为例[J]. 情报理论与实践, 2018, 41(2): 105-110. 

[25] 邱均平, 赵蓉英, 董克, 等 . 科学计量学[M]. 北京: 科学出版社,2016: 327-329. 

[26] 关鹏, 王曰芬. 基于LDA主题模型和生命周期理论的科学文献主题挖掘[J]. 情报学报, 2015, 34(3): 286-299. 

[27] Nonaka I, Takeuchi H. The knowledge-creating company[M].New York: Oxford University Press, 1995: 65. 

[28] Björneborn L. Small-world link structures across an academic web space: a library and information science approach[D]. Den‐mark: Royal School of Library and Information Science, 2004. 

[29] Hai Z G. Discovery of knowledge flow in science[J]. Communi‐cations of the ACM, 2006, 49(5): 101-107. 

[30] 华 连 连, 张 悟 移 . 知 识 流 动 及 相 关 概 念 辨 析[J]. 情 报 杂 志,2010, 29(10): 112-117. 

[31] 金碧辉, Loet Leydesdorff, 孙海荣, 等. 中国科技期刊引文网络:国际影响和国内影响分析[J]. 中国科技期刊研究, 2005, 16(2):141-146. 

[32] 徐晓艺, 杨立英. 基于合著论文的学科知识流动网络的特征分析——以“药物化学”学科为例[J]. 图书情报工作, 2015, 59(1):89-98. 

[33] 王旻霞, 赵丙军. 中国图书情报学跨学科知识交流特征研究——基于CCD数据库的分析[J]. 情报理论与实践, 2015, 38(5): 94-99. 

[34] 王雪, 李睿 . 知识生态学视角下的各类引文现象阐释[J]. 情报杂志, 2018, 37(9): 179-184. 

[35] Choe H, Lee D H, Kim H D, et al. Structural properties and interorganizational knowledge flows of patent citation network: the case of organic solar cells[J]. Renewable and Sustainable Energy Reviews, 2016, 55: 361-370. 

[36] Tsay M Y. Knowledge flow out of the domain of information sci‐ence: a bibliometric and citation analysis study[J]. Scientomet‐rics, 2015, 102(1): 487-502. 

[37] 夏红玉, 胡潜, 王忠义 . 基于引文重要性的知识流动主路径分析[J]. 情报学报, 2022, 41(5): 451-462. 

[38] 王晓红, 张宝生 . 知识网络的知识流动效率测度模型[J]. 情报杂志, 2010, 29(10): 89-93. 

[39] 黄晨, 赵星, 卞杨奕, 等 . 测量学术贡献的关键词分析法探析[J]. 中国图书馆学报, 2019, 45(6): 84-99. 

[40] Mao J, Liang Z T, Cao Y J, et al. Quantifying cross-disciplinary knowledge flow from the perspective of content: introducing an approach based on knowledge memes[J]. Journal of Informetrics,2020, 14(4): 101092. 

[41] 杨玉兵, 胡汉辉 . 网络结构与知识转移[J]. 科学学与科学技术管理, 2008, 29(2): 123-127. 

[42] 刁丽琳, 朱桂龙. 产学研联盟契约和信任对知识转移的影响研究[J]. 科学学研究, 2015, 33(5): 723-733. 

[43] Rousseau R. Robert Fairthorne and the empirical power laws[J].Journal of Documentation, 2005, 61(2): 194-202. 

[44] Liu Y X, Rousseau R. Knowledge diffusion through publications and citations: a case study using ESI-fields as unit of diffusion[J].Journal of the American Society for Information Science and Technology, 2010, 61(2): 340-351. 

[45] 宋凯, 李秀霞, 赵思喆, 等. 基于引文分析的学科知识流动计量研究[J]. 情报杂志, 2017, 36(1): 154-159. 

[46] 张瑞 . 我国图书情报学跨学科知识流入特征研究[J]. 情报杂志, 2019, 38(8): 195-201. 

[47] 张瑞, 赵栋祥, 唐旭丽, 等. 知识流动视角下学术名词的跨学科迁移与发展研究[J]. 情报理论与实践, 2020, 43(1): 47-55, 75. 

[48] 刘丽帆, 张恒, 章成志 . 基于学术文献引文内容的跨学科知识流动研究[J]. 情报理论与实践, 2022, 45(6): 24-31, 47. 

[49] 解恩泽, 赵树智, 刘永振. 交叉科学概论[M]. 济南: 山东教育出版社, 1991. 

[50] 操玉杰, 毛进, 潘荣清, 等 . 学科交叉研究的演化阶段特征分析——以医学信息学为例[J]. 数据分析与知识发现, 2019, 3(5): 107-116. 

[51] 李长玲, 荣国阳, 范晴晴, 等. 跨学科引用对知识生长的刺激作用与程度分析——以图书情报学为例[J]. 情报理论与实践,2022, 45(6): 1-8. 

[52] 程齐凯. 学术文本的词汇功能识别[D]. 武汉: 武汉大学, 2015. 

[53] Lu W, Huang Y, Bu Y, et al. Functional structure identification of scientific documents in computer science[J]. Scientometrics,2018, 115(1): 463-486. 

[54] Bertin M, Atanassova I, Gingras Y, et al. The invariant distribu‐tion of references in scientific articles[J]. Journal of the Associa‐tion for Information Science and Technology, 2016, 67(1):164-177. 

[55] 陆伟, 孟睿, 刘兴帮 . 面向引用关系的引文内容标注框架研究[J]. 中国图书馆学报, 2014, 40(6): 93-104. 

[56] 刘敏, 张瑞芳. 建构论视阈下科学知识的空间生产——基于SSK的知识空间性研究[J]. 科学技术哲学研究, 2021, 38(6): 116-121. 

[57] 赵磊, 章成志. 基于不同内容层面的特定领域研究主题差异分析研究[J]. 农业图书情报学报, 2021, 33(5): 14-27. 

[58] 卡尔·波普尔 . 客观知识——一个进化论的研究[M]. 舒炜光,卓如飞, 周柏乔, 等译. 上海: 上海译文出版社, 1987. 

[59] Nonaka I, Byosiere P, Borucki C C, et al. Organizational knowl‐edge creation theory: a first comprehensive test[J]. International Business Review, 1994, 3(4): 337-351. 

[60] 李喜先. 知识系统论[M]. 北京: 科学出版社, 2011. 

[61] Zahra S A, George G. Absorptive capacity: a review, reconceptu‐alization, and extension[J]. The Academy of Management Re‐view, 2002, 27(2): 185-203. 

[62] 肖希明 . 知识创新与知识信息管理[J]. 图书情报知识, 1999(1):7-9, 13. 

[63] Nonaka I, Toyama R, Konno N. SECI, ba and leadership: a uni‐fied model of dynamic knowledge creation[J]. Long Range Plan‐ning, 2000, 33(1): 5-34. 

[64] Lewis J, Bartlett A. Inscribing a discipline: tensions in the field of bioinformatics[J]. New Genetics and Society, 2013, 32(3): 243-263. 

[65] 张栋 . 基于海量科技文献的自动聚类研究与设计[D]. 北京: 北京邮电大学, 2018.

制版编辑  |  李    静

审核  |  王海燕


国家自然科学基金管理学部A类期刊

全国中文核心期刊

CSSCI来源期刊

《中国人民大学复印报刊资料》重要转载来源期刊

CSTPCD(中国科技论文与引文数据库)收录期刊

NSSD (国家哲学社会科学学术期刊数据库)

长按扫描二维码 | 关注我们

情报学报官网:qbxb.istic.ac.cn

邮箱:qbxb@istic.ac.cn

电话:010-68598273

欢迎投稿!


【免责声明】本公众号主要发布《情报学报》期刊的录用文章,或转载其他媒体与网站的图文资讯。文章仅代表作者本人观点,本公众号对文中陈述、观点判断保持中立。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。抄袭本文至其他渠道者引发的一切纠纷与本公众号平台无关。

继续滑动看下一个
情报学报ISSN10000135
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存