“也许在漫长的发展过程中,一些关键技术被突破了,大家会充分重视,但其实背后有更大的困难。这些因素导致一些技术和概念在短时间内失败,被大众遗忘。但事实上,正在努力的人还在努力。”
“如果有一天我的数字人会聊天了,它说了不该说的话,那是谁的责任?”
2月25日,在人工智能开发者全球先锋大会(GAIDC)的间隙,Unity中国区技术总监孙志鹏接受了澎湃技术(www.thepaper.cn)并谈到了AIGC(生成式人工智能)和超宇宙的未来趋势。
孙志鹏认为,ChatGPT作为一种“能力”的发布,可能会给大众带来一些问题,创作平台有审核的责任,但如何审核,“我觉得其实可以通过一些技术手段来实现。”
Unity China是开发者提供3D引擎的平台,也是元宇宙底层技术的开发者。孙志鹏表示,元宇宙中内容的创作原本是由专业的开发者通过专业的工具来完成的,AIGC赋予了每个人创作内容的能力。
Unity中国参加了2023全球人工智能开发者先锋大会。
枪只能放在训练有素的士兵手里。
澎湃科技:2022年,DALL-E、ChatGPT等人工智能工具让AIGC成为科技领域最热的名词,国内很多企业赶上了浪潮。你认为2023年这个领域的发展趋势是什么?
孙志鹏:有两个方面。第一,人工智能模型会越来越大。二、人工智能在多模态方向的工作(多模态信息,包括文字、图片、视频等。)还会继续。最近上面两个方向在大模型的指挥下做了一件非常“出格”的事情,引起了很大的反响。模型越大,它能产生的模式就越多。目前我们看到最多的还是文字和图片两种模式,未来会加入3D内容,包括3D数字人。
现在的语言模型本身需要“掌握”两部分知识,语言知识和关于世界认知的知识。关于语言的知识可以只用少量的数据来训练,而关于世界认知的知识可以用来推动多模态领域的研究。比如我可以用文字,图片,视频来描述我在上海的日子。但无论什么模式,都表达了我和上海的关系。也就是说,知识的关系是跨模态的,知识的表达可以根据每个模态的需要进行分配。就像多模态工作中发现的经验一样,BeiT v3模型的结构也体现了这个结论。大语言模型可以通过增加语言模态和添加更多模态来推动未来3D内容和脚本的制作。不仅仅是语言模型开发者,未来还会有更多领域的人加入,这是2023年的趋势。
澎湃技术:Unity也是一个内容平台。目前各平台对UGC(用户生成内容)的监管已经“不堪重负”。你认为在AIGC时代,人工智能产生的内容会对平台产生什么样的影响?
孙志鹏:一个大模型能产生的模态越多,对人的影响可能就越大。当只能产生文字时,交流效率可能是有限的。但未来必然会产生各种模式的内容,比如图片、视频、3D内容等。会带来远远超过文字的影响力和传播力。所以监管是必须的,但同时人工监管的成本真的太高了。
目前我们正在进行数字人的制作过程,我们会考虑,如果有一天我的数字人会聊天,他们应该说的话由谁来负责?因此,将ChatGPT作为一种“能力”向公众发布可能会有问题。创作平台有审核的责任,但我觉得如何审核其实可以通过一些技术手段来实现。
比如ChatGPT为什么能体贴,按照InstructGPT(ChatGPT的前身,基于GPT-3)的描述,是因为先在训练中加入了上万的人工数据(问答数据),然后用大量的人来筛选结果,最后用一个奖励模型来加强学习。使得ChatGPT不仅具备了GPT-3.5带来的语言能力(相比github上增加了大量代码“语料库”的GPT-3),还融合了人工智能的强化训练和人类对AI偏好的训练。无数人可能向ChatGPT提问上万次。在这个过程中,ChatGPT的能力会不断加强,这些人的意志会被带入AI。
所以开发和培养AI的人是重点。如果被训练的人加入更多的主要表达善意的数据,那么他们的善意偏好就会被加入到大模型中。如果问题的来源是善意的目的,那么有很大概率会得到善意的结果。
最近还有一个趋势,就是人们不直接问大模型的问题,而是把自己的诉求告诉另一个语言模型,它先理解你的诉求,然后生成一个“无问题的问题”。一个“没有问题”会得到一个“没有答案”。如果一个大模特足够有创意,就不应该让人导演。如果是枪,就不要直接让人用,而是让一个训练有素的士兵拿着枪,然后有人指挥这个士兵,这个士兵有基本的判断善恶的能力。比如杭州有人用ChatGPT写了一个不限行车辆的档案。那么人工智能需要从一开始就判断,作为一个法律公民,写不存在的政府文件是否合理。
AIGC将把生产过程的进化带到元宇宙。
澎湃技术:AIGC的流行可能在某种程度上减少了元宇宙的体积。你怎么看待两者的关系?
孙志鹏:有起伏很正常。当我们刚做出一些成绩的时候,人们可能会过度乐观,认为ChatGPT这么厉害。我们已经迎来了通用人工智能的曙光,但还很遥远。比如现在人工智能的推理能力其实很差。
但这些乐观主义者其实涵盖了我们对技术的期望,描绘了一个更美好的未来,给开发者一个目标。如何实现这个目标是手段问题,AIGC可能就是这个手段,两个概念接踵而至。
也许在漫长的发展过程中,突破了一些关键技术,大家会充分重视,但其实背后有更大的困难。这些因素导致一些技术和概念在短时间内失败,被大众遗忘。但其实该努力的人还在努力。虽然人可能没有太多耐心,过于乐观,但是一个行业的人,只要坚持做自己认为对的事情就可以了。
AIGC带给元宇宙的是生产过程的进化。元宇宙所描述的形态是如此庞大,以至于传统的制作工艺并不适合。AIGC可以赋予创作者权力。人工智能本质上是给人更多的计算能力去支配,然后激发人的创造力。以前专业开发人员耗时耗力的事情,现在可以轻松实现。只要会说话就可以画画建模。做这个事情本身就用了更多的计算能力,消耗了更多的资源。同时,随着AIGC的使用越来越多,计算能力将变得更加廉价,超宇宙的发展也将从中受益。
澎湃技术:未来作为元宇宙核心技术的发动机技术会有怎样的发展?2023年的超宇宙产业有哪些机遇和挑战?
孙志鹏:关于元宇宙,大家一直在讨论制作过程。这在过去实际上是专业工程师的工作。比如如何开发Unity引擎本身以前就是小众。毕竟做工具的人只是少数,在创作生态中用工具做内容的人更多。一个更有效的生产数字内容的过程可以在元宇宙中诞生。
比如,一个平台在自己的元宇宙中定义了新的内容生产模式,在这个宇宙中生产内容,在这个宇宙中消费内容。像Unity这样的引擎所要做的就是适应。比如某公司买了Unity Pro,只用了20%的功能,却花了100%的钱。额外的功能实际上可能会影响个人的生产效率。因此,未来通过解耦和模块化的能力,引擎将为元宇宙提供特定场景下的生产流程,并使其在特定领域足够高效,这是发展的重点。另外,引擎升级后,引擎支持的内容会更美观。
一般来说,发动机应该是一套乐高积木。用户可以根据自己的想法制作工具和场景。同时砖更精致,质量更好,所以做出来的东西也会变得更好。如果我们将引擎的功能进行合理的分解,那么超宇宙开发者将通过与自身需求的有机结合,创造出更高效的生产流程。