查看原文
其他

中心成果 |《中俄经贸合作数据库及俄汉语智能化综合服务平台》项目成果介绍

高而杰 语言资源高精尖创新中心 2022-06-09

 导 语 


自2016年成立至今,语言资源高精尖创新中心(以下简称“中心”)已经走过近五年的建设发展历程,并将于2021年4月迎来五年建设终期评估。近五年来,中心签约23个在研项目,着力建设“语言资源库”、“语言文化博物馆”“‘语言通’智能服务”三大工程,取得了诸多丰硕成果,具体包括18个语言数据库(集)、11个应用系统。其中,18个语言数据库(集)包括:世界语言基本信息库、一带一路国家语言文化核心资源集、中国周边国家(6国)语言资源集、用于语言识别的世界语言资源集、海外华语资源库、俄汉大规模语汇库与句对库、中阿语言资源集、中俄日韩英对齐4000词汇库、用于句法分析的大规模汉语语料库、汉语国际教育优质学习资源集、全球汉语中介语语料库、面向智能语音教学的汉语中介语语音库、中俄经贸合作信息库与双语合同文本库、冬奥会多语言术语资源库、面向冬奥会的机器翻译资源库、大规模冬奥项目知识图谱资源集、中华经典诗词资源集、汉学研究文献库和人才库等。中心开发的应用系统包括:冬奥术语库系统、冬奥机器翻译系统、智能化冬奥项目问答原型系统、中俄语商通系统、海外华语资源系统、SAIT汉语智能发音教学系统、“文心”智能作文批改系统、全球语言文化资源采录展示系统、《疫情防控外语通》在线查询系统等。本公众号自2020年12月17日起,推出“中心成果”系列文章,陆续介绍中心各项目的资源、系统成果。今日,我们推送《中俄经贸合作数据库及俄汉语智能化综合服务平台》(以下简称“语商通”)项目成果。





 项目介绍 


《中俄经贸合作数据库及俄汉语智能化综合服务平台》项目由语言资源高精尖创新中心特聘研究员傅兴尚教授主持。项目于2017年9月立项,2020年11月开展结项工作。

在数据驱动的时代,知识库和数据库建设是重中之重。目前,支撑中俄语言智能系统开发和应用的语言知识库和语料库规模很小,也很零散。本项目从数据库建设的基础工作出发,在国内外首次系统、全面地建设各层级语言单位大型俄汉双语平行资源库,以支撑自动翻译等语言智能系统(语言通)的研发和升级;在领域应用上,建设经贸领域双语文本数据库,以此支撑知识查询系统(商务通)建设并且实现其在工商界的产业化应用。

项目建设总体目标:“二通”“四库”“四平台”



 资源成果 


1、俄汉平行语汇库:包括词、词组、成语、惯用语、缩略语、专名等语汇400万条;词形词典800万条。俄汉平行语汇库具备数量大、类别全、领域广、层次淸、数据准等特点。
2、俄汉平行句对库:包括600万对。数据对齐精准、翻译质量较高,可用于多种教学、研究和研发目的。3、中俄经贸合作知识库:包括10万条知识点和100万条信息点,涉及经贸国别知识、经贸环境、政策法规、优势领域、企业、商会、协会等工商主体、区域经贸、联邦主体、商务流程指引等,分多层级管理。4、俄汉双语合同库:50万句对,包括法律、贸易、物流、劳务、租赁、科技项目等各类合同文本和政府公文函件。



 技术成果 


项目建成“中俄语商通”系统。

系统主要包括以下四个部分:

1、俄汉语汇互译平台:秒内搜寻,实现自由查询。

2、俄汉自动翻译平台:秒内翻译,实现俄汉互译

3、经贸知识查询平台:秒内查询,满足政府、企业、商会调研和决策。

4、国际移动谈判室APP,可实现线上模拟国际谈判。

(升级中,APP暂时不可扫码访问)




延伸阅读

中心成果 |《面向北京冬奥会的机器翻译》项目资源和系统成果介绍中心成果 |《汉语中介语语料库建设创新工程》项目成果介绍中心成果 |《基于知识图谱的北京冬奥智能问答系统》项目成果介绍
中心成果 |《新选中国名诗1000首:当代诗学名家经典选释系列》项目成果介绍中心成果 | 《中文句法语义分析及其应用》项目成果介绍
中心成果 |《海外华语资源库建设》项目成果介绍


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存