查看原文
其他

中心成果 |《基于知识图谱的北京冬奥智能问答系统》项目成果介绍

高而杰 语言资源高精尖创新中心 2022-06-09

 导 语 


自2016年成立至今,语言资源高精尖创新中心(以下简称“中心”)已经走过近五年的建设发展历程,并将于2021年4月迎来五年建设终期评估。近五年来,中心签约23个在研项目,着力建设“语言资源库”、“语言文化博物馆”“‘语言通’智能服务”三大工程,取得了诸多丰硕成果,具体包括18个语言数据库(集)、11个应用系统。其中,18个语言数据库(集)包括:世界语言基本信息库、一带一路国家语言文化核心资源集、中国周边国家(6国)语言资源集、用于语言识别的世界语言资源集、海外华语资源库、俄汉大规模语汇库与句对库、中阿语言资源集、中俄日韩英对齐4000词汇库、用于句法分析的大规模汉语语料库、汉语国际教育优质学习资源集、全球汉语中介语语料库、面向智能语音教学的汉语中介语语音库、中俄经贸合作信息库与双语合同文本库、冬奥会多语言术语资源库、面向冬奥会的机器翻译资源库、大规模冬奥项目知识图谱资源集、中华经典诗词资源集、汉学研究文献库和人才库等。中心开发的应用系统包括:冬奥术语库系统、冬奥机器翻译系统、智能化冬奥项目问答原型系统、中俄语商通系统、海外华语资源系统、SAIT汉语智能发音教学系统、“文心”智能作文批改系统、全球语言文化资源采录展示系统、《疫情防控外语通》在线查询系统等。本公众号自2020年12月17日起,推出“中心成果”系列文章,陆续介绍中心各项目的资源、系统成果。今日,我们推送基于知识图谱的北京冬奥智能问答系统项目成果。





 项目介绍 


《基于知识图谱的北京冬奥项目智能问答系统》项目由语言资源高精尖创新中心特聘研究员、中国科学院软件研究所孙乐研究员主持开展。项目于2018年2月立项,2020年9月开展结项工作。本项目以面向2022年北京冬奥会的冬奥项目智能问答系统为核心研究目标,立足于以智能化的手段普及冬奥项目知识,集中解决“冬奥知识碎片化”、“知识展示单一化”、“服务手段智能化不足”三大核心挑战,从而为语言资源高精尖创新中心的“语言通”智能服务《北京冬奥会语言服务行动计划》的人机智能交换平台提供关键技术支撑。

针对“冬奥知识碎片化”挑战,项目构建了首个对外发布的大规模冬奥项目知识图谱资源,可为各类冬奥智能应用提供有力的资源支撑。针对“知识展示单一化”挑战,项目设计了立体化知识展示平台,为冬奥知识提供了不同粒度、不同视角的多种知识展示方式,使得用户可以更方便、快捷、全面地了解冬奥会知识。针对“服务手段智能化不足”挑战,项目研发了冬奥项目智能问答原型系统,为普及冬奥知识、宣传冬奥文化提供了一种智能化手段。



 资源成果 


项目研发的资源类成果主要是大规模冬奥项目知识图谱资源。与冬奥会相关的知识分散在互联网的各个网站上,呈现出一种碎片化的局面。针对该挑战,项目组深入探索了各类数据挖掘与知识抽取、知识融合方法,从互联网上获取并融合国内外各类冬奥相关的知识资源,建设了一个包含179万知识点、完整覆盖5类冬奥核心实体(项目、赛会、运动员、比赛、参赛队)的北京冬奥项目知识图谱,不同类型的实体之间具有丰富的关联关系,为知识展示、智能知识问答等上层应用提供有力的资源支撑。



 技术成果 


项目研发的主要技术类成果包括:

1、立体化冬奥项目知识展示平台

项目组针对冬奥知识展示单一化问题,设计了多种类型的知识展示服务,为普及冬奥知识、宣传冬奥文化提供全方位、立体化手段。当前平台可提供的知识展示手段包括:知识浏览、文本查询、结构化知识查询、全景交互式知识查询等,使得用户可以更方便、快捷、全面地了解冬奥会知识。

知识浏览

文本查询

结构化知识

全景交互式知识查询


2、智能化冬奥项目问答原型系统(“小奥”智能问答系统)

针对冬奥知识服务精准化、智能化不足问题,项目研发了智能化冬奥项目智能问答原型系统(“小奥”智能问答系统)。系统采用自主研发的国际前沿深度学习语义解析模型,构建了精准的问句分析引擎。系统以微信公众号、小程序、网站入口等多种方式提供服务,接受文本和语音两种方式的自然语言问句输入,在准确地识别用户的问句意图之后,实时便捷地返回文本、图片等多种模态的答案。系统当前可以提供与历届冬奥会赛会、冬奥比赛项目、冬奥运动员、冬奥比赛成绩等相关知识相关的问答服务。

微信公众号和微信小程序




成果入口



冬奥知识图谱资源网站(基础版)
http://oly.icip.org.cn



“小奥”智能问答系统(微信公众号和小程序)


注:当前站点及智能问答系统均为基础版,主要提供与【冬奥项目】和【历届冬奥赛会】相关的知识服务,如需完整版本,请与课题组联系(olyqa_icip@163.com)。




延伸阅读

中心成果 |《面向北京冬奥会的机器翻译》项目资源和系统成果介绍中心成果 |《汉语中介语语料库建设创新工程》项目成果介绍


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存