ACE虚拟歌姬：“工具化”+UGC社区，想要成为音乐版Roblox

Original 东西文娱东西文娱 2022-06-11

收录于合集

#音乐UGC 1 个

#创作引擎 1 个

#ACE虚拟歌姬 1 个

#AI 13 个

#Roblox 2 个

导读

近期，ACE虚拟歌姬宣布完成了数百万美元Pre-A轮融资，知春资本领投，老股东五源资本跟投。

ACE虚拟歌姬由北京时域科技于去年推出，是一款结合了AI歌声合成技术的音乐创作APP，它以AI赋能结合虚拟歌姬的形式，为音乐创作者提供了一个低门槛作曲、作词的平台。

具体来说，ACE虚拟歌姬为用户提供多个AI虚拟歌手，用户可以在ACE的创作工具中，输入歌曲的旋律、歌词，并且选择AI虚拟歌手进行歌曲演唱，“填词玩法”可以让用户在其他用户创作的歌曲旋律上进行二次创作。目前，ACE虚拟歌姬已经达到了上百万的累计用户。

时域科技创始人郭靖日前接受东西文娱访谈时表示，有创作音乐欲望的人可以达到千万级别，而音乐制作长久以来的“高门槛”阻挡了大批有灵感的创作者，AI技术的进步会让音乐制作变得更触手可及。

郭靖表示，目前从创作功能上来看，ACE虚拟歌姬看起来更像是一个移动版的智能化Vocaloid。未来一年里，时域科技一方面将将升级现有创作工具，不止于“AI歌声创作”，要把ACE的创作工具拆分成一个独立的音乐创作引擎ACE Studio，云端化的同时3D化；另一方面，在分发端也就是现在的ACE虚拟歌姬，会对3D化音乐进行分发，不断形成创作与消费的正循环，探索未来音乐消费的新形态。

在时域科技看来，未来，3D虚拟体验会是音乐消费的最终形态。也许，人们可以在虚拟空间中享受音乐，进行交互，甚至实现基于Avatar素材库的UGC生态。

所以，广义地来讲，ACE Studio未来会与传统的DAW（数字音频工作站）和传统的歌声合成引擎一较高低，加上3D体验后，可能还会与3D内容制作引擎有所交集。

郭靖表示，对于北京时域科技而言，工具+社区的产品模式下，公司的目标始终在于致力于用全新的音乐引擎赋能用户进行音乐 UGC 创作和分发，旨在为音乐爱好者提供一个AI赋能的创作平台和社区。随着未来创作与分发生态的成熟，3D音乐体验的落地，时域科技某种程度上有望成为音乐版的Roblox。

ACE虚拟歌姬

工具+社区模式，探索音乐UGC

ACE虚拟歌姬的诞生，始于创始人郭靖对于音乐创作“去工具化”的思考。

作为ACE虚拟歌姬的创始人，郭靖却是Non Tech出身。从数学类专业毕业后，郭靖曾在迅雷、乐逗游戏等公司从事游戏的发行和运营，真正让他着手去做AI的契机，则是2016年的Gap Year。

“那时想要真正看看有哪些新的技术变化，在硅谷见了许多创业者，发现三个热点——VR、AI还有区块链。我在审美上对AI更感兴趣，AI从最开始推动生产力，到后来可以赋能创作，到我们第二次创业时，看到AI生产图像、文字、音乐内容面临着大爆发。”郭靖说道。

在重新自学代码的过程中，郭靖思考着，创造力的本质到底是什么？

郭靖认为，从艺术的发展历史来看，被认为真正能够表达内容的，在古代是极少数的艺术家，你需要经过超长期、非常专业的训练，才能具备技术推开艺术之门。而工具的作用在于，降低门的重量，也就是降低门槛，让更多有才华的人释放从技术的束缚中得以释放。

就音乐创作而言，郭靖自评自己是“一直站在离音乐门槛外一步之遥的人”，从高中时期捧着吉他创作歌曲，到大学组建乐队担任主唱，仍然没有跨过编曲软件的门槛。直到深入学习了编程，郭靖意识到，音乐制作应该难在没有才华上，而不应该是使用工具的熟练度上。

基于此，北京时域科技于去年推出了结合AI歌声合成技术的音乐创作APP ACE虚拟歌姬。产品的出发点就是提供工具降低音乐创作的门槛，促进音乐UGC。

从产品功能来说，用户导入现有BGM后，在播放BGM的同时点击音符录制旋律，配上自作的歌词，通过AI歌声合成技术，虚拟歌姬的演唱让创作者立刻、直观地感受到自己作曲的呈现效果。在制作完成原创歌曲后，创作者可以将其发布在ACE虚拟歌姬的社区平台。

目前，ACE虚拟歌姬的累计用户数达到了上百万，用户以00后、05后为主；创作者数量约为12万，年龄集中在15-22岁的Z世代。在平台上，平均每天会诞生一两千首新歌，曲风涉及古风、二次元、鬼畜等。在TapTap上，ACE虚拟歌姬的评分为9.2，评论数量达到4000。

在ACE虚拟歌姬的优质创作者中首次创作音乐者比例达到了60%，典型如零音乐基础的创作者「與章」已在平台发布超百首原创作品，保留下近30首精选作品。

谈及用户画像，郭靖表示，他们都有一些很好的音乐Sense，也有强烈的音乐创作冲动，虽然一直以来或多或少接触过音乐，比如说唱过歌或谈过琴，但是都没有能够真正编曲，真正把自己的想法变成一个作品，这是他们最主要的特点。

对于外界将其比作移动版Vocaloid的声音，郭靖表示，ACE虚拟歌姬的优势在于更智能化。技术进步在让大家把注意力更少地放在如何工具使用上，而更多地放在如何创作内容上，AI对此有很大的赋能作用。

而据时域科技披露，在目前世界范围内落地的产品中，ACE虚拟歌姬的歌声合成技术达到了全球顶尖的效果，包括了声音延长的自然度和情感丰富度，技术先进与使用便利性上超过其他歌声合成引擎。

据郭靖介绍，当下歌声合成有三个模型：唱法模型、音色模型与声码器模型。一般来说，唱法模型和声码器模型采用的是非深度学习，而ACE却都采用了深度学习。但要知道的是，声码器模型如果采用深度学习，在歌声合成中很难达到稳定可用。而ACE原创了一种结构，借鉴了图像风格迁移的算法思想，用歌声中的基频信号作为最后输出音频的Guidance，解决了这一问题。

也就是说，ACE虚拟歌姬使用了一种有风险，却更有前景的模型，通过团队不断优化，使 AI歌声合成会变得更自然、更逼真，而事实证明这一冒险有了不错的效果。

工具化

打造音乐引擎ACE Studio

目前所展现的ACE虚拟歌姬的AI歌声合成引擎仅仅是音乐UGC生态的起点，郭靖表示，接下来将要把它升级成一个桌面端的音乐创作引擎ACE Studio，达到类似使用石墨文档那样随开随用的状态。

在郭靖看来，目前传统音乐创作的主流工具DAW有诸多问题待解决，如所有DAW几乎都不在中国售卖、需要付费本地下载大量音源、从无到有创作音乐难度太大等等，这些问题导致音乐创作的门槛极高且创作效率低下。接下来，ACE Studio的革新将包括如下特征：

1）重塑设计降低使用门槛

长久以来，编曲的门槛被小部分“专业人士”所建立，要完成一首编曲不仅要精通一到两门乐器和乐理，还要懂得操作复杂的DAW，如Logic Pro、Cubase、Fl Studio等。此外，还有获得音源、请人录音的代价太大等痛点。

对于很多音乐人来说，使用DAW音乐创作软件这件事情本身的门槛几乎与编程差不多，它天然地认为你需要一些庞大而复杂的知识。ACE Studio首先想要降低的是入门爱好者的认知和使用成本，把最重要、精炼的功能放在主要位置，让使用界面更友好。但这并不会将已入门的专业/半专业音乐人排除在外，ACE Studio的设计将更进一步细分目标人群。

2）AI赋能编曲

就如ACE虚拟歌姬的AI歌声合成将歌声数字化降低创作门槛一样，在ACE Studio的构想中，AI同样可以赋能编曲，这也是目前市面上主流DAW，如Logic Pro、Cubase等所没有做到的。像吉他和弦乐这种连续性乐器，很难用采样音源来编曲，所以很多人都选择实录，效率与成本都极高。

“ACE会将AI编曲做成类似于输入法提词的功能，帮助音乐人在创作过程中生成一些旋律碎片，可以多选、修改，可以通过它获得灵感，通过人机合作的方式快速找到想要的东西。”郭靖说道。也就是说，ACE Studio在创造性和智能化的Trade Off中找到了平衡，是做“问答题”还是“选择题”，甚至在选择题上做自由地修改，这些都由创作者自己选择。

3）云技术解放算力束缚

目前编曲与混音工作上使用的VST插件需要强大的算力带动运行，而ACE计划以云渲染技术，减轻算力负担，意味着高配置电脑也许不再是音乐制作的必需品。

“很多老牌厂商有自己的历史包袱，反而我们后来者可以将其简化，只是技术难点有很多。比如音源如果放在云端，你不用下载和加载，就可以使用。”郭靖说。

在郭靖看来，桌面端的音乐创作引擎ACE Studio与ACE虚拟歌姬的关系，相当于剪映与抖音，创作者的创作内容直接可以分发到ACE社区。和目前展现的手机端虚拟歌姬不同，音乐这种从无到有创作性的内容，有一定的复杂性，在桌面端上操作才是更便捷的。

在推广层面，郭靖表示，“ACE社区中约12万创作者中30%的人有强烈的编曲诉求，我们会邀请社区的种子用户来使用ACE Studio。”

“可能早期他们先是用歌声合成的部分，然后用一些简单的编曲，再叠一个音频伴奏加上一些简单的元素，然后形成作品，更加Pattern Base的原创编曲发到ACE里面。这个过程就是一点点将ACE studio从更强大的歌声合成引擎，变成更强大的音乐创作引擎，需要解决很多问题，至少需要一年的时间。”郭靖表示。

对于整个中国音乐创作市场，郭靖认为音乐创作者的数量应该是千万级的，这意味着对于ACE Studio来说还有很大的空间。

未来音乐消费3D音乐体验？

成为音乐版Roblox

正如郭靖总结的，ACE Studio第一步会是去打造一个具备更新一代云架构、可以共享素材的、有歌声合成能力、软件应用性更高的音乐创作引擎。

而接下来更具想象力的是，时域科技要把ACE studio升级为一个能够创造3D音乐体验的工具。

“这可能是我们非常极端的想象，我们认为现在音乐的媒体形态（media format）是音频文件，用音频文件表示音乐，是一种被阉割的音乐，这种形态将在未来原生3D的互联网世界里面改变。目前3D世界的内容只有游戏，我们一直在思考3D世界中的音乐是什么样子的。最好的方式就是从3D虚拟世界出发去创造它。”郭靖这样解释ACE studio的3D化计划。

在郭靖看来，思考这一问题与元宇宙并没有直接的关联。元宇宙可能让外界看到随着技术的成熟，使得这件事情在现实世界落地成为可能。对于时域科技而言，音乐体验3D化的出发点是给音乐找到一个新的表现形式。“2D世界与视频结合这种表现形式，在短视频平台已经做完了，如果能够找到一个独特的音乐体验，一定是在3D世界的。”

“音乐流媒体平台上的用户对一首新音乐的完播率不到15%，而像YouTube和抖音，某种程度上对人们发现新音乐起了很大的作用。” 不过，郭靖认为，以视频为单位的平台远远不够——只是给音乐贴一个视频，音乐仍是视频平台的子集，但这却可以证明音乐需要结合场景，才能让更多人发现。

如何做3D音乐体验？2011年推出的3D音乐体验《Rome: 3 Dreams of Black》给了郭靖启发。

这是一个基于WebGL技术的互动型MV，随着独立摇滚乐团Danger Mouse and Daniele Luppi全新专辑《ROME》的响起，奔跑的动物、随风摇曳的植物让观众进入了一个3D世界，同时观众可以通过角色操控体验整个MV的故事，完成一场关于梦境的旅行。

在郭靖的想象中，未来的音乐场景化，可能包含的元素有虚拟人，将来每个歌手和音乐人都会拥有自己的Avatar，并且在一个类似舞台的空间中表演，听众可以进入这个空间，与其进行交互与社交。

所以倒推回工具，对于创作者而言，创作者未来可能可以基于ACE studio进行3D音乐体验的创作，在Avatar、特效、场景库等素材库中选择材料，完成3D创作。

郭靖表示，打造音乐引擎的这一年，ACE将同步测试自制的3D音乐体验，将以全新APP的形式进行MVP测试，着重观察用户的完播率。如果某一种体验能够让一首歌的完播率达到50%-70%，那就证明这种3D音乐体验模式有利于人们发现新音乐。

这让ACE虚拟歌姬未来的模式，某种程度上有望成为音乐版Roblox。

在3D游戏平台Roblox的逻辑下，创作端与分发端是统一的，ACE Studio也将遵循这一生态。从创作端来看，Roblox对入门者做到了“去工具化”，同时保留了自主编码的空间。ACE Studio用户将以AI能力和pattern借鉴作为工具，在平台中进行音乐创作，也保留了用户自主修改的空间。从分发端来看，创作者制作的游戏直接在Roblox上线，并不借助于第三方平台。同样，用户在ACE Studio中制作的音乐和pattern也将直接发布于同一平台上。

郭靖表示，一直以来，无论评价时域科技为音乐版的Roblox还是音乐版的快手，他们的本质都是一样的——创造一种全新的工具赋能音乐创作者去创造一种全新的内容形态，这个全新的内容形态被证明有消费性，最终形成了UGC创作与消费的正循环。

“技术只是一个单点，它往往具有时间优势、先发优势，但很难形成壁垒，系统才是壁垒。对于我们而言，这个系统是一个UGC的系统，当创作者与消费者都在构成一个双边网络，就会形成马太效应。”谈及核心竞争力，郭靖表示。

李光耀：过早翘起尾巴与美国对抗是中国厄运的开始！

谁会想到，裁员会裁到总编辑头上

太讽刺：搞宣传的，倒台了！

@所有人，今日起全部免费领取

公告：将付尔乐收入师门

ACE虚拟歌姬：“工具化”+UGC社区，想要成为音乐版Roblox

您可能也对以下帖子感兴趣

李光耀：过早翘起尾巴与美国对抗 是中国厄运的开始！

谁会想到，裁员会裁到总编辑头上

太讽刺：搞宣传的，倒台了！

@所有人，今日起全部免费领取

公告：将付尔乐收入师门

生成图片，分享到微信朋友圈

ACE虚拟歌姬：“工具化”+UGC社区，想要成为音乐版Roblox

您可能也对以下帖子感兴趣

李光耀：过早翘起尾巴与美国对抗是中国厄运的开始！