查看原文
其他

腾讯“数智人”:产业互联的普惠工具,连接B端服务与C端需求

共同虚拟 共同虚拟 2022-07-31


行业围绕数字人的探索,已从内容向技术与应用场景全面拓展。围绕这一方向,更多技术公司、大厂技术部门也陆续下场。

以腾讯为例,旗下的产业互联网、游戏、视频、社交等多个部门都推出了不同类型的数字人产品。这些数字人,一定程度上代表了腾讯不同业务板块在虚实共生趋势下的布局思路与发展方向。

在腾讯数字人版图中,脱胎自游戏《王者荣耀》《QQ炫舞》的虚拟偶像无限王者团和星瞳,是游戏泛娱乐化的典型;与新华社合作的首个数字航天员“小诤”,侧重在探索游戏技术的多场景应用;而虚拟手语主播等,则是腾讯在对产业互联网的布局中,探索服务型数字人技术与应用空间。

日前,共同虚拟与腾讯云小微数智人产品总经理杨丽进行了访谈。腾讯云小微数智人产品由腾讯云小微和PCG AI联合推出,在产品和技术两方面联手,投入产业应用。

去年以来,腾讯云小微已发布基于新一代多模态人机交互技术的全新数智人产品矩阵,包括3D超写实、3D写实、3D半写实、2D真人、2D卡通五种风格,具备文旅导览、金融客服、多语种主播、手语主播等不同身份技能。

在腾讯云小微团队看来,“数智人”区别于一般数字人,前者依托于AI能力,基于腾讯的产业互联网的思维,助力企业数字化转型,例如打造面向细分行业的“数字员工”。数智人产品矩阵,体现的是腾讯面向行业的智能综合解决方案。

事实上,在930架构调整后,CSIG已整合腾讯云、智慧零售、教育、医疗、安全、交通出行等行业解决方案。这意味着腾讯将所有的B端业务全部放在CSIG,由此提出布局产业互联网。而智能应用和产品,则是其助力产业数字化转型的关键。

在杨丽看来,面向B端市场的业务型数智人有广阔的前景。“在很多行业里,数智人不再是一个概念化的产品,而是提升生产效率的工具化方向。数智人作为比较典型的应用场景的服务模式,开始渗透至不同的行业里。”

为此,腾讯也希望通过数智人,面向产业输出自己的智能服务模式。杨丽表示,“从整个服务连接和服务能力上看,腾讯云小微数智人希望在行业服务中创造更多服务模式,并将其推广。”


     

腾讯数智人:
从语音智能到交互智能,
服务产业的普惠工具

腾讯云小微在AI语音领域有长期的积累,基于腾讯的AI能力,包括语音识别、语义分析、自然语言处理、语音合成等底层能力,致力于帮助智能硬件厂商实现语音人机互动和音视频服务能力。

在AI语音交互基础之上,数智人作为腾讯云小微的全新产品,具有拟人化形象,给智能应用带来新的视觉表达方式,将传统抽象的语音AI服务变得更加具象化、智能化。

过去几年,受制于成本、数据、生态等因素,面向产业的智能解决方案长期以解决碎片化需求为主。随着人工智能在产业的加速普及,以及相关数字技术的不断迭代,一些产业场景开始对AI解决方案提出新的需求。

为此,腾讯云智能调整战略架构,由“单点智能”到“全局智能”,探索通过智能底座层、智能平台层、产品和服务层、智能生态层,向各行业输出贴合产业场景需求的智能综合解决方案。


今年腾讯收购搜狗后,搜狗的数智人团队并入,二者在AI技术、产品、应用等方面的资源和能力进一步协同。

杨丽表示,“当时搜狗在数字人上的业务模式和技术探索,是走在国内数字人行业发展的比较靠前的位置,数智人在单点上集合了搜狗的多维AI能力,腾讯则进一步在每一个单点之上提供更好的选择,帮助把一个点扩充到有效的一个面。”

因而,汇聚腾讯云小微和PCG AI技术优势的数智人,作为多模态人机交互系统,更能适应行业场景的各类需求。

据杨丽介绍,单点技术的突破只是手段,腾讯云小微更关注数智人的行业应用价值。“在数智人整个服务方向上,我们更加强调自己是技术能力的底座,以及面向行业拓展的产品演进思路。”

这意味着腾讯云小微对数智人的差异化定位,并非单一产品,而是服务于产业。“让技术和产品对产业产生实质性的影响,从语音智能到交互智能给产业带来一个更加普惠的工具。”

现阶段,数智人正在通过整合语音交互等AI技能,同时连接腾讯的内容和服务生态,以参与到产业中的各类企业进行数字化转型。


    


“数智人”的差异化技术路线:
从语音交互到多模态的AI交互技术

在腾讯云小微看来,“数智人”之所以不同于传统的数字人,是因为数智人完成了从语音交互到交互智能的升级,将传统的语音交互升级为多模态人机交互系统。

此前,语音交互虽作为互联网时代触屏交互后的颠覆性模式,但存在交互方式单一、应用场景有限等问题,缺乏足够的智能化。同时,诸如AI、云计算等语音交互的底层技术仍有待提升。

而腾讯数智人主要依托NLP、知识图谱、视觉等全栈AI底层能力,探索在形象表现力、识别力和感知理解能力方面的提升。

杨丽表示,腾讯云小微和部分市场参与者将数智人定义为IP价值不同,更关注其智能化价值,为此提供的“是一整套比较完整的人机交互解决方案系统”。

首先,在信息获取及转化的感知层上,支持语音识别、视觉识别和情绪识别。

其次,在信息处理与反馈的理解层上,支持自然语言意图理解、会话管理,以及行业知识积累与沉淀。

此外,在信息表达与呈现的表达层上,支持数智人音视频影像合成,以及结合富媒体素材的影像合成。

而这些技术的整合,实现交互模式的多样化和升级,最终目的是促使数智人能够适应更多的场景,匹配更细化的场景需求。

杨丽告诉共同虚拟,从输出表达层来看,将数智人分为三种类型:一是具有智能客服、媒体播报功能的2D数智人,二是应用在车机、车载场景的3D数智人,三是充当陪伴助手的手语数智人。


而在具体场景应用上,数智人已经优先面向金融和媒体行业。

例如,在金融行业,数智人助力平安普惠打造首个金融行业数字员工,两年间已经为500万个用户提供7x24小时的自然可视化的人机智能交互服务,在提升用户服务体验的同时,将审核成本降低60%。

在媒体行业,杨丽介绍,数智人可以在一些文本类内容的基础上,快速的生产和制作一些视频类内容去做传播,帮助行业提升文本处理效率。

除了金融和媒体,数智人还应用在政务、文旅等多个行业,担任审核面签、资讯播报、会展主持、导游导览等多种角色。

针对不同产业场景的需求,腾讯云小微也在推出多样化的数智人形象。目前,腾讯数智人包括3D超写实、3D写实、3D半写实、2D真人、2D卡通五种风格,搭配可定制形象和腾讯海量IP形象授权。


    

“数智人”的价值与产业机会:
立足产业互联,
连接B端服务与C端需求

在研发数智人期间,腾讯云小微也在关注C端市场上出现的数字人产品。

目前国内外C端市场上,相当一部分数字人扮演着网红、模特、主播等角色,部分头部数字人已经展现出超强的吸金力,例如Lil Miquela2020年在Instagram上已赚取超1000万美元,平均每条帖子能够获得约8500美元的收益。

在杨丽看来,这类数字人大多起到概念化的带货和宣传作用,更注重形象和IP的价值。“从整个行业来讲,概念化的普及是第一个阶段,第二个阶段面临的则是数字人以什么样的价值去突破跟迭代,自身的服务能力能够在行业渗透和沉淀下去。”

基于对“全真互联网”和在产业互联网方向的探索,腾讯云小微迈向第二阶段的方式,正是将数智人定位为一种AI结合产业应用的服务模式,主要面向B端市场、服务于产业场景的需求,例如在一些垂直行业里充当“数字员工”的角色。


现阶段,随着消费互联网和产业互联网的发展,线上线下一体化趋势加深、真实世界和虚拟世界正在加速融合。

杨丽表示,“平台跟C端用户之间的结合是一个部分。而在每一个服务场景之下,将B端的企业服务与C端需求连接起来,可能会带来更大的价值,我们认为这种路径也会更快实现。”

也因此,走B端路线的数智人更多考虑的是如何在具体的生产链条里实现智能化服务。一方面,如何解决传统行业存在的痛点,帮助企业优化成本,提升行业的生产效率;另一方面,如何触及到产业服务中的空白市场,去支持原来产业服务没有覆盖到的领域、场景,挖掘产业服务的增量价值。

例如手语领域,杨丽表示,手语行业生产成本高、对从业人员的要求高,很难做到所有媒体内容的实时手语翻译。而数智人能够有效的触达这一领域,给听障群体带来更好的服务。“我们希望能够通过手语应用的补给,让无障碍化的受益服务成为行业标配。”

冬奥会上的AI虚拟手语主播

对腾讯云小微而言,在B端和C端之间发挥连接价值是数智人的重要机会。在杨丽看来,一些产业场景下,以AI能力标准化的模式去服务产业,能够替代传统行业的一些低效的服务模式,通过智能化的解决方案帮助产业数字化升级。

未来,数智人会继续深耕产业应用,但对C端也有考虑。杨丽表示,数智人会先从产业互联网的角度去发挥价值,然后再从C端用户的角度,打造产业应用和个人生活服务体验升级。
































您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存