作 者丨张赛男、徐蕊
编 辑丨巫燕玲
图 源丨图虫
1982年,动画作品《超时空要塞》中的女主角林明美凭借动人歌声与纯真人设走红,由此成为全球首个虚拟偶像。
2007年,初音未来在VOCALOID语音合成技术的加持下诞生,热度延续至今。
2021年,虚拟美妆达人柳夜熙在发布抖音第一条短视频后即获得300多万点赞,涨粉上百万。
2022年江苏卫视的跨年晚会上,以邓丽君为原型的虚拟人与现场歌手周深实现跨时空同台合唱。
……
虚拟人并非新时代的产物,在元宇宙火热的当下,有了更多的打开方式。
在新的时代背景下,虚拟人出现了哪些新的特征?需要哪些底层技术的支持?又将带来哪些产业链投资机会?本期硬核投研采访了多位业内人士,试图解答上述问题。
图/视觉中国(000681)
虚拟人进化史
根据量子位《虚拟数字人深度产业报告》显示,虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。市面上也多将其称为虚拟形象、虚拟人、数字人等,代表性 的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。
商汤科技移动智能事业群副总裁栾青在接受21世纪资本研究院采访时表示,“虚拟数字人是基于视觉、语音、NLP等技术打造,可以模拟真人的会话、表情和动作,在各种不同的场景进行交互应用。”
“虚拟人模型能够正常运行的背后其实是在不断地得到数据和技术的支撑,其一方面须持续地获得高质量的样本数据进行训练,另一方面也须结合技术的赋能,例如语音合成、多模态交互、深度神经网络渲染等,使得包括面容、表情、声音、肢体动作等在内的整体自然度能够接近真人水平。”海天瑞声相关负责人对21世纪资本研究院说。
不难发现,虚拟人的一个重要特点是:可模拟真人、可交互。多位业内人士对21世纪资本研究院表示,这意味虚拟人“自己会动”,区别于传统游戏中的NPC。
以重现歌手邓丽君为例,2013年,借助数字王国提供的技术方案,《返老还童》视效团队让邓丽君出现在周杰伦“魔天伦”世界巡回演唱会台北站小巨蛋现场,与周杰伦对唱。当时市场的关注度仅限于技术的观赏性。
十年之后,邓丽君受到了不同程度的关注和市场反馈。这一次的江苏卫视跨年晚会,数字王国通过技术让虚拟邓丽君与人们自主进行实时交互,这意味着更复杂的动作实时捕捉、渲染,时间成本相对较高。
万兴科技(300624)旗下视频演示产品万兴录演的产品负责人长飞对21世纪资本研究院分析,“虚拟人经过技术不断发展,经历了早期手工绘制,到电脑绘图、人工智能合成,虚拟人逐渐简化,同时基于自然语言处理、语音识别、计算机视觉等人工智能技术的应用拓展,虚拟数字人正朝智能化、便捷化、精细化、多样化发展。目前虚拟人在外表、行为、交互各方面高度拟人化。”
拆解产业链
结合量子位的测算,若产业应用顺利落地,2030年我国虚拟人市场规模将达到2700亿元,其中身份型虚拟人贡献将超1700亿元。在整个产业链发展升级过程中,优质的投资机会将持续涌现。相较于元宇宙那些过于遥远的概念,“虚拟人”俨然已成为眼下触手可及的赛道。
“随着近两年疫情的原因,视频化成为一种更好的交流表达方式,而其中像一些老师、自媒体、企业等部分人群对外视频时出现不愿意真人出镜,就产生了使用虚拟形象来代替的趋势。”长飞说。
目前,头部互联网公司以虚拟人为切入点悉数入局,加大资本投入。
腾讯、字节跳动、阿里、网易、百度等互联网公司均在虚拟人方向投资布局;大禹网络、次世文化等MCN公司拓宽了虚拟形象的设计和运营业务;蓝色光标(300058)等营销公司则不断加强虚拟人领域的营销服务能力;小红书、抖音等社交平台也对虚拟偶像博主进行布局和引流。
从产业链看,虚拟数字人可以分为上、中、下三个环节。上游产业链为制作内容类、工具类和IP策划类公司,如微软、Houdini、AUTODESK、苹果、阅文集团等。虚拟人诞生前需要内容制作和IP策划以确定其性格、形象,基础设施还包括显示设备、光学器件、传感器、芯片等硬件制造商及建模软件、渲染引擎等软件制造,后期则需要建模绑定、驱动、渲染等技术支持。
中游产业链主要为虚拟数字人厂商,包括软硬件系统、生产技术服务平台和AI能力平台,包括提供语音识别、CG建模、XR等技术的各类企业,如科大讯飞(002230)(002230.SZ)、Avatarworks、腾讯、相芯科技、火山引擎、百度等。
比如天神娱乐(002354)近日在投资者互动平台表示公司近期新设立了控股子公司北京元境数字科技有限公司,其主营业务为打造虚拟数字人制作平台,进行虚拟主播、虚拟偶像等虚拟数字人的开发,服务电竞游戏、品牌营销等领域。
下游产业链包括传媒、游戏、影视、金融、文旅、教育、医疗等各领域,如各类虚拟主持人、虚拟主播、虚拟偶像、智能客服、智能理财顾问、虚拟导游、讲解员等,形成行业整体解决方案,赋能各领域发展。
捷成股份(300182)近日表示,旗下公司已正式推出虚拟人“妙江山”,计划在商业代言、直播、短视频等领域率先尝试商业变现模式。
除了上述产业链系列相关公司外,中信证券(600030)还建议关注Roblox等结合内容IP运营和研发能力于一身的平台型公司;哔哩哔哩、泡泡玛特、芒果超媒(300413)、中文在线(300364)等拥有丰富数字IP资源和优秀运营能力的内容型公司,以及抖音、快手、小红书、微博等虚拟人内容运营平台公司。此外,万润科技(002654)、平治信息(300571)、汤姆猫(300459.SZ)等也均有所关注或布局。
不过,不难看出,当下的A股市场还没有纯正的虚拟人标的,多是在某个产业链环节上特定技术的提供商。
底层技术支撑商机
当下市场产生的对虚拟人的新需求,背后需要一系列的技术支持。而这也衍生出不少投资机会。
智慧芽相关研究员表示,虚拟人作为一个新兴的综合性技术应用领域,主要涉及到图形渲染、动作捕捉、语音识别、自然语言处理、多模态技术、深度学习等技术领域。
以上游为例,通过智慧芽全球专利数据库检索可知,微软及其关联公司共有3000余件适用于虚拟人领域的专利申请,主要集中于语音识别、自然语言处理、深度学习、计算机视觉等领域。Houdini在该领域的技术布局主要集中于计算机图形、动画制作等领域。
而阅文集团是一家以数字阅读为基础,IP培育与开发为核心的综合性文化产业集团。该集团及其关联公司则暂无与虚拟人领域直接相关的专利申请。
在中游环节,智慧芽数据显示,科大讯飞及其关联公司在该领域的技术布局主要集中于语音识别、语音合成、知识图谱、图像识别等技术领域。百度及其关联公司的技术布局主要集中于深度学习、计算机视觉、自然语言处理、图像处理等领域。
在下游,网易在该领域的技术布局主要集中于虚拟角色、触控操作、计算机图形等领域。Bilibili在该领域的技术布局主要集中于虚拟形象、图像渲染、语音识别等领域。
长飞进一步分析,虚拟人底层技术包括3D形象设计及建模,模型绑定,人脸、半身和全身的动作捕捉和驱动技术,3D渲染技术等。目前动作捕捉和驱动,3D渲染技术的壁垒都比较高,这里面虚拟人又分卡通3D虚拟人和高仿真虚拟人,特别是后者,对于动作精细化程度和整个技术流程的计算复杂度高,算法效果实时性要求高,要做好都是比较难的。
据悉,万兴目前在3D形象设计和建模上已经有较丰富的经验,同时由博士主导的AI/3D/AR/VR技术团队,已能实现视频实时头像3D卡通化,并实现人脸和身体的动作捕捉技术,应用端3D渲染能力等。
作为技术提供方的商汤科技,处于产业链的中上游。栾青对21世纪资本研究院表示,“数字人的技术难点在于表情和动作的精准表达、流畅自然。落地过程中的难点则在于与不同的应用场景进行适配。”
据悉,商汤的SenseMARS Agent数字人经过不同领域的知识数据库训练,已应用于购物中心、银行、线上客服、博物馆、展馆、旅游景区、机场等多种行业和领域。比如在交互方面,基于商汤的AI技术,SenseMARS Agent数字人可以实现口型准确、动作逼真,并与真人之间进行智能对话等交互应用。
而A股上市公司海天瑞声则是一家人工智能数据及相关数据服务的提供商。
其相关负责人表示,“虚拟人目前的应用比较前沿化,其最终呈现的状态需要在特征化、多样化、高匹配度的训练数据支撑下才能得以实现,即更好的数据才能训练出更为逼真的虚拟人。”
显然,在一定程度上被视为元宇宙基建的虚拟人赛道,未来的成长空间留给了外界很多想象。
本期编辑 黎雨桐 实习生 林曦莹
本文首发于微信公众号:21世纪经济报道。文章内容属作者个人观点,不代表易科物联立场。投资者据此操作,风险请自担。