查看原文
其他

新闻出版智能媒体技术重点实验室 被评为“2021年度出版业优秀科技与标准重点实验室”



国家新闻出版署根据对出版业科技与标准重点实验室2021年度建设运行、成果产出等情况的综合考核评价,于3月21日发布了2021年度出版业优秀科技与标准重点实验室名单,北京大学王选计算机研究所牵头的“新闻出版智能媒体技术重点实验室”荣获优秀重点实验室。


新闻出版智能媒体技术重点实验室于2020年再次被中宣部认定为“出版业科技与标准重点实验室”,依托单位为北京大学,具体建设单位为北京大学王选计算机研究所,共建单位为方正阿帕比技术有限公司。

实验室重点研究知识挖掘与服务、内容呈现与表达、数据管理与运营、版权保护与应用、高新技术跟踪与应用等新闻出版关键技术,切合新闻出版领域的未来发展方向,助推出版业创新体系建设,服务出版业高质量发展。



在“计算机辅助自动写稿技术”和“字形计算技术”和方面,重点实验室结合了人工智能与媒体技术,在学术研究和应用方面都取得很好的成果。

1

计算机辅助自动写稿技术

计算机辅助自动写稿技术以自动撰稿为典型需求,研究与其相关的自然语言生成核心技术,构建适用于多语言情感分类的统一情感分类器和特定领域的机器写稿系统。

2021年度围绕自然语言生成关键技术(包括自动文摘、文本复述、语法纠错等)开展研究,构建业界首个面向学术文献领域的文本复述数据集ParaSCI,首次提出文档级文本简化任务及其数据集、评测指标和基准系统,并探索文本复述、文本简化和自动文摘技术的新方法与新路径。

同时,研究团队积极推动技术成果落地应用,与方正电子、华为、蚂蚁金服等企业合作推动文本纠错、自动文摘等技术的转化与应用,2021年度成果转化金额约400万元左右。

2


字形计算技术

字形计算技术近年来一直致力于个性化字库的研究,利用深度神经网络和对抗学习等技术,解决字形计算中的相关基础理论与关键技术问题,研发基于笔画部件拼接与基于风格学习的中文个人字库自动生成系统。用户只需书写少量汉字(可低至200个),系统便可自动生成包含27533个汉字的具备该用户书写风格的GB18030手写体中文字库。这一研究成果使手写体中文个人字库实时生成技术成为可能。

2021年度在矢量字体生成、基于向心文本的任意形状场景文本检测识别、基于强化学习的中文字库自动生成等方面取得重要进展,其中发明专利“一种基于书写风格建模的中文字库自动生成方法”获第二十二届中国专利优秀奖。

该研究团队多方位突破个性化中文字库制作生成的技术瓶颈,研发成功中文字库辅助设计与自动生成相关系统,近年来技术转让费近两千万,显著提升各类字库的制作效率,相关软件/字体产品在华为、腾讯等移动平台上广泛使用。

近期发布

release

—   版权声明  —

本微信公众号刊载的所有内容,由北京大学王选计算机研究所微信自身创作、收集的文字、图片和音视频资料,版权属北京大学王选计算机研究所所有;从公开渠道收集、整理及授权转载的文字、图片及音视频资料,版权属原作者。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存