查看原文
其他

汉坤 • 观点 | 虚拟数字人系列之一 — 概览篇

汉坤 汉坤律师事务所 2022-08-17

作者:汉坤律师事务所 何军丨宋薇丨徐源璟丨周欣丨王媛娇丨孙金龙

以 5G、大数据、云计算、物联网、人工智能、区块链等技术为代表的新一轮信息革命浪潮,带来了技术路线革命性变化和生产模式突破性创新。尽管电影《头号玩家》中人人皆有数字分身的元宇宙世界离我们还较为遥远,但虚拟数字人已经切实出现在我们生活的方方面面。从影视剧中的各类CG人物,到虚拟偶像、虚拟KOL、虚拟主播、虚拟客服,虚拟数字人正当其行。

虚拟数字人根据其应用场景,涉及法律定性、人格权保护、知识产权保护、广告代言合规、演艺活动合规、数据权益与安全、互联网信息服务合规、科技伦理合规等不同法律领域。在本虚拟数字人系列中,我们将通过专题文章的形式,梳理和探讨虚拟数字人当前热点法律问题。

虚拟数字人指存在于非物理世界中,通过计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技创设,并具有“人”的外观、行为、甚至思想(价值观)的可交互的虚拟形象[1]。虚拟数字人的核心在于“拟人性”,即外观、行为和交互方面均具备“人”的特征;但又其名为“数字”人,需要存在于显示设备之上,故区别于具备物理实体的机器人或仿生人。从产业应用角度出发,虚拟数字人可分为身份型虚拟数字人和服务型虚拟数字人两种类型[2]

  • 身份型虚拟数字人强调身份性。根据是否对应特定自然人,又可进一步分为两类:一类是真实自然人在虚拟世界的“分身”,如以谷爱凌为原型的虚拟数字人“Meet GU”,以易烊千玺为原型的虚拟数字人“千喵”;另一类则不对应现实世界中的特定自然人,如“初音未来”、“洛天依”等虚拟偶像;

  • 服务型虚拟数字人强调其功能性,旨在替代真人服务完成内容生产,兼具关怀感和真实感,如虚拟主播、虚拟老师、虚拟AI助手等。

一、虚拟数字人的发展历史


根据《2020年虚拟数字人发展白皮书》,虚拟数字人的发展自20世纪80年代起,可分为萌芽、探索、高速发展和井喷式发展四个阶段[3]

  • 萌芽阶段。20世纪80年代,人们开始尝试将虚拟人物引入到现实世界中,但受技术限制,其制作技术主要以手绘为主。例如于1982年,《超时空要塞》女主角林明美被制作方包装成演唱动画插曲的歌手并制作了音乐专辑,该专辑成功打入当时日本知名的音乐排行榜Oricon,林明美也成为了世界上第一位虚拟歌姬;

  • 探索阶段。21 世纪初,传统手绘逐渐被CG、动作捕捉等技术取代,虚拟数字人出现在《指环王》、《加勒比海盗》、《猩球崛起》等大量影视作品中。2007 年,日本制作公司利用CG 技术合成制作了二次元少女偶像“初音未来”;

  • 高速发展阶段。进入到2016年左右,得益于深度学习算法和AI 技术取得突破,虚拟数字人制作过程大幅简化,智能驱动(定义见下文)的虚拟数字人开始崭露头角。例如,新华社与搜狗于2018年联合发布了全球首个“AI合成主播”,用户输入新闻文本后,屏幕将展现虚拟数字主播形象并进行新闻播报,且唇形动作能与播报声音实时同步[4];

  • 井喷式发展阶段。近三年来,伴随着科学技术全面提升与突破,虚拟数字人朝着智能化、便捷化、精细化、多样化发展,出现了各式各样的虚拟偶像、虚拟分身、虚拟主播、虚拟助手等。如2022年江苏卫视跨年晚会舞台上,“虚拟邓丽君”便与周深共同完成了《大鱼》、《小城故事》和《漫步人生路》三首歌曲的合唱。

二、虚拟数字人的制作技术


虚拟数字人的发展历史,亦是CG(Computer Graphics,计算机动画)、动作捕捉、NLP(Natural Language Processing, 自然语言处理)、CV(Computer Vision,计算机视觉)、语音合成等技术的发展与集成史。在《2020年虚拟数字人发展白皮书》中,中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会作为编写者提炼出了“五横两纵”的虚拟数字人制作技术架构[5]。“五横”是指用于虚拟数字人制作、交互的五大技术模块,分别为人物生成、人物表达、合成显示、识别感知、分析决策。“两纵”是指2D和3D虚拟数字人,其中3D虚拟数字人需要额外使用三维建模技术生成数字形象,信息维度增加,故所需的计算量更大。

资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会《2020年虚拟数字人发展白皮书》

虚拟数字人的交互模块涉及语音语义识别、人脸识别、动作识别、知识库和对话管理等多种复杂技术,因此不是所有的虚拟数字人都有交互功能。而在具有交互功能的虚拟数字人中,根据是否有自然人驱动,又可分为智能驱动型和真人驱动型两种类型。

智能驱动型,又被称为TTSA(Text To Speech & Animation)人物模型,本质上是预先通过AI技术训练得到人物模型,并通过文本驱动生成语音和对应动画[6],如上文提到的新华社“AI合成主播”。而真人驱动型则是由真人来驱动数字人,通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。真人驱动型虚拟数字人早期主要用于影视制作,目前也流行于虚拟偶像行业,用于帮助虚拟偶像完成直播等互动性强的活动,如“洛天依”、“柳夜熙”、“AYAYI”、“A-SOUL”等,而在虚拟偶像背后进行活动的真人则被称为“中之人”。

三、国内虚拟数字人的产业发展


根据《2020年虚拟数字人发展白皮书》,国内虚拟数字人产业链自上到下可以分为基础层、平台层和应用层三层,具体如下所示:

资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会《2020年虚拟数字人发展白皮书》;算力智库《从Web2到Web3——虚拟数字人的价值演进》

基础层为虚拟数字人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。平台层包括软硬件系统(如建模系统、动作捕捉系统)、生产技术服务平台(如渲染平台、解决方案平台)、AI 能力平台(如计算机视觉、智能语音、自然语言处理),为虚拟数字人的制作及开发提供技术能力。应用层是指虚拟数字人技术结合实际应用场景,切入影视、传媒、游戏、金融、文旅、代言、办公协同等各个方面,形成行业应用解决方案,赋能行业领域。

四、虚拟数字人的产业政策与法规监管


虚拟数字人涉及的集成电路、人工智能、虚拟现实和增强现实等数字产业一直是近年来国家大力推广和发展的数字经济重点产业,而伴随着虚拟数字人产业的爆发式增长,越来越多的国家政策中也出现了针对虚拟数字人的鼓励内容,例如:

除了相关的产业鼓励政策,近两年我国也开始从立法层面对虚拟数字人所涉及的法律问题进行回应。例如,根据网信办、公安部、商务部等多部门于2021年4月发布的《网络直播营销管理办法(试行)》,涉及展示虚拟形象的, “直播营销平台应当加强新技术新应用新功能上线和使用管理,对利用人工智能、数字视觉、虚拟现实、语音合成等技术展示的虚拟形象从事网络直播营销的,应当按照有关规定进行安全评估,并以显著方式予以标识。”,“直播间运营者、直播营销人员使用其他人肖像作为虚拟形象从事网络直播营销活动的,应当征得肖像权人同意,不得利用信息技术手段伪造等方式侵害他人的肖像权。对自然人声音的保护,参照适用前述规定。”

此外,2022年1月28日,国家互联网信息办公室发布了关于《互联网信息服务深度合成管理规定(征求意见稿)》公开征求意见的通知,重点明确了深度合成信息内容标识管理制度和深度合成服务提供者主体责任。

虚拟数字人产业链从基础层、平台层到应用层,覆盖的行业众多,伴随着近年来的技术发展迎来爆发式增长,但整体上我国法律法规层面还尚未出台专门的法律法规进行规制和监管。目前虚拟数字人的相关问题集中在法律定性、人格权保护、知识产权保护、广告代言合规、演艺活动合规、数据权益与安全、互联网信息服务合规、科技伦理合规等方面,涉及不同的法律领域。我们将在接下来的系列文章中,以人格权篇、知识产权篇、广告代言与直播带货篇、演艺活动篇、监管合规篇等专题文章的形式,为大家介绍虚拟数字人领域相关的热点法律问题。

注释

[1] 中国传媒大学媒体融合与传播国家重点实验室:《中国虚拟数字人影响力指数报告(2021年度)》

[2] 量子位:《虚拟数字人深度产业报告》

[3] 中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会:《2020年虚拟数字人发展白皮书》

[4] https://www.sohu.com/a/275595600_116334

[5]中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会:《2020年虚拟数字人发展白皮书》

[6]中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会:《2020年虚拟数字人发展白皮书》


何军

+86 10 8525 5558

jun.he@hankunlaw.com

业务领域

私募股权和风险投资、兼并和收购、外商直接投资、境外投资、传媒娱乐、一般公司事务

宋薇

+86 21 6080 0903

wei.song@hankunlaw.com

业务领域

私募股权和风险投资、兼并和收购、外商直接投资、一般公司事务、科技、媒体和电信(TMT)、生命科学与健康

徐源璟 | 汉坤律师事务所

周欣 | 汉坤律师事务所

王媛娇  | 汉坤律师事务所

孙金龙 | 汉坤律师事务所

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存