21世纪经济报道记者张子桐上海报道。
编辑评论/注释
元宇宙,这个源自科幻小说的概念,已经成为现实世界中的流行语。围绕这一新理念,一场产、学、研的实践正在进行。在数字化转型中,超宇宙能否担当大任?这些新概念如何在中国背景下落地?南财合规科技研究院数字娱乐研究组策划了《瞭望元宇宙》系列报告,以期为业界和大众提供一个了解元宇宙的敲门砖。
数字人作为元宇宙的“原住民”,近年来成为业界和学术界讨论的焦点。目前业界普遍认为,数字人的大规模应用依赖于高逼真效果、良好的生产效率和可控的成本。但与此同时,终端的运算叠加计算能力的要求对实时云渲染能力提出了挑战。在本系列的第六篇文章中,我们将讨论超宇宙运行的底层技术及其背后的实际工业应用。
近年来,随着人工智能、虚拟现实等新技术的快速发展,虚拟数字人开始进入普通人的生活。除了新颖的外观和灵动的交互效果,业界也在挖掘更多数码人的潜力。
“未来数字人的发展呈现出从静态到动态、从2D到3D、从卡通到写实、从单向到多向互动的趋势。”《蔚领时报》创始人兼CEO郭建军在接受21世纪经济报道记者专访时表示,数字人领域已经度过了婴儿期,进入快速成长阶段,将在不久的将来迎来爆发。这也意味着行业开始进入商业变现探索的关键阶段,标准化将逐步建立。
但在丰富的想象之外,一些落地问题依然困扰着从业者和用户。未来,数字人能否实现高实时性、高灵活性和对落地场景的高适应性,并与人类有效互动,仍需时间验证。
面对质量和成本的双重问题,中国人工智能产业发展联盟发布的《虚拟数字人发展白皮书》显示,“虚拟数字人”一词源于1989年美国国家医学图书馆发起的可视人计划(YHP)。2001年,以“中国数字虚拟人体的科学技术问题”为主题的香山科学大会174次学术研讨会提出了“数字虚拟人体”的概念。
但在当时,这些“虚拟数字人”主要是指人体结构的可视化,在三维空间中显示人体解剖结构的大小、形状、位置以及器官之间的空间关系。与目前讨论的元宇宙中的“原住民”数字人有很大不同。
五年来,得益于深度学习算法的突破,数字人的生产流程得到有效简化,虚拟数字人步入正轨。
同时也引起政策层面的关注。
2022年8月,北京市经济和信息化局出台全国首个数字人产业专项扶持政策(3354 《北京市促进数字人产业创新发展行动计划(2022—2025年)》)。055-79000提出,要抓住以数字人为代表的互联网3.0创新应用产业机遇,发挥国际科技创新中心建设优势,打造数字人产业新高地。
055-79000提出发展目标。“到2025年,北京将培育1-2家收入超过50亿元的头部数字人企业,10家收入超过10亿元的重点数字人企业,建设10个校企实验室和企业技术创新中心,建设5个以上共性技术平台,培育20个数字人应用标杆项目,建设2个以上特色数字人园区和基地。”
但行业现状似乎离《计划》提出的目标还有很大差距。21世纪经济报道记者从多个渠道了解到,目前一些企业仍会遇到渲染质量低、产品成本高等问题
JD.COM集团副总裁、京东智能产品与服务部总裁何晓东在接受21世纪经济报道记者采访时表示,数字人是数字原生技术和人机交互过程中最有前景的形态之一。但在实际应用过程中,一些数字人的动作非常死板,只能起到展示的作用,而不能提供实际的业务交互。
以何晓东的银行场景中的数字人为例。如果数字人想要处理好整个银行业务,他需要克服几个非常困难的问题。“首先是需要避免噪音,因为银行柜台是一个嘈杂的地方。其次,银行数字人需要与后台业务支撑系统有效对接,必须能够解决多家银行的具体业务问题。”何晓东举例说,转账、取款、修改密码等业务活动,都意味着数字人在知识推理、语音推理等方面都要达到很高的标准,所以这些方面的同步也是一个很大的挑战。
郭建军,三个商业模式,在采访中也表达了类似的观点。他说,数字人成熟的背后,一方面是技术整合的能力,一方面是IP运营的能力。“数字人是一个产业链很长的行业。既需要底层引擎技术的发展,也需要上层工具和制作管道的优化,以满足数字人良好的形象、高制作效率和可控成本的三重效果。”
IP运营能力体现在数字形象建设的理念和经验上。郭建军表示,目前行业的普遍情况是技术生产比较自信,运营思维相对缺乏。在这方面,蔚领时代正在探索的一条道路是,——选择更专业的生态合作伙伴进行商业化。
最近,蔚领时报和娱乐企业海西传媒集团成立了一家独立公司——微海灿娱乐,并推出了西蒙数字人“吉峰”。郭建军表示,后续合作将集中在互动数字IP的矩阵构建和虚拟空间的打造上。
值得一提的是,利用契合特定场景的IP,加速表演数字人的创新,也是《计划》计划的主要任务之一。提出“推动技术人才和艺术人才联合创新,加快数字人IP孵化,培育创作者经济。同时,打造精品数字品牌,支持数字人参与广告营销和品牌代言,加强数字人运营管理,树立传播正能量的数字形象。”
事实上,IP运营、客服、流量变现是目前数字人的三大主要商业模式。
腾讯云近日发布的《计划》指出,内容/IP数字人主要依靠数字人的商业IP运营实现商业变现,而功能服务交付给客户实现变现,虚拟替身则需要结合虚拟空间的设置和规则实现流量变现。
“数字人的生产成本和周期随着定制的减少而降低。三种数字人的生产方式和周期也有差异。内容/IP数字人更多的是以项目为主,以定制为主。面向服务是产品与定制的结合,在一般产品上进行定制开发;虚拟化身更多的是一个产品体系。用户使用平台工具产品制作数字图像,并在相应的虚拟场景中进行活动。一般来说,内容/IP数字人的成本和周期是最高的,虚拟化身数字人的成本和周期是最低的。”
大规模应用取决于可控成本。“数字人的大规模应用有三个必备条件:逼真度高、生产效率高、成本可控。”在郭建军看来,虽然影视级别的真实感效果相比传统的线下渲染还有待提高,但目前行业内应用的实时渲染技术在制作效率、成本可控、数字人的交互性等方面都有优势。
科技部信息通信专家、上海市科技创新研究院院长何
“在创造元宇宙的过程中,会构建一个世界的秩序和逻辑,但这个世界是否存在引力,有多大,都是目前技术需要探索的方向。同时,虚拟世界的逻辑需要规律和算法来生成。其中,如何有效地让数字人在视觉和听觉之外,通过触觉感知与用户互动,也是业界面临的难题。”
“未来的超现实世界将以可视化为特征。而这需要海量的图形操作。”郭建军认为,VR/AR终端将成为元宇宙的入口,但终端的运行依赖于计算能力的高速运行。其中,实时云渲染能力解决了将超现实世界带入终端体验的问题。
“只有云端的实时渲染达到很高的标准,才能真正带来足够逼真、互动、沉浸的画质。这是蔚领时代GaaS(图形即服务)时代到来的逻辑基础。”
郭建军认为,未来支持实时云渲染的底层技术主要是云原生技术,比如多GPU协同渲染,C/S架构实现的单个进程输出几十个视频流供几十个玩家播放的技术。“这些创新的云原生技术是未来元宇宙的支撑。同时,围绕云游戏的流能力和云虚拟化能力也是未来元宇宙所需要的。”
“一个可喜的现象是,我们看到头部渲染引擎的技术发展很快,现在已经开始应用影视特效。”郭建军说。
除了云原生技术,3D重建技术的发展也为数字人的大规模落地带来了更多可能。
以上《计划》指出2D数字人和3D数字人的创作/建模方式不同。2D数字人的本质是生成图像,所以主要的方式是利用深度学习技术,基于视频生成和真人一样的图像,技术比较成熟。
“3D数字人需要建立3D模型,主要采用传统的手工建模、静态扫描建模(相机阵列扫描建模)、动态光场或AI建模(3D重建技术)生成3D模型。目前,手动建模和静态扫描建模技术已经成熟并得到广泛应用。利用3D重建技术或者动态光场重建,可以大大节省建模时间,提高建模效率,是未来重要的布局方向。”报道指出。
科大讯飞总裁吴小如表示,机器如果想更自然地与人类互动,需要通过听觉、视觉、语义和各种传感器的结合来获取更多有用的信息。AI感知模式必须从单一模式发展到多模式,逐渐拟人化。
2021年10月,科大讯飞正式发布AI虚拟人交互平台,该平台具备多模式感知、多维表达、情感渗透、自定义四大交互特性。可以赋能客户不同业务场景的AI虚拟人,提供一站式AI虚拟人应用服务。
“科大讯飞推出的数字人,已经开始结合视觉、手势、视线、语音,实现数字虚拟人交互的多维表达。”吴小如在接受21世纪经济报道等媒体采访时表示。
出品:南财合规科技研究院数字娱乐研究组
策划:曹
整体规划:万物不静
研究员:朱维京、蔡、孙瑜、吴立阳、张梓潼。
作者:张子桐
设计:陈杉
更多信息请下载21金融APP。