A16Z 合伙人:未来的社交体验会像《西部世界》那样吗?

神译局2021-05-10
网上的东西都是虚拟的,你把握不住。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:人与人基于文字、语音和视频的社交网络正在慢慢变得乏味。越来越多的厂商正开始憧憬基于虚拟世界的社交体验。而《西部世界》也许就是这类愿景的终极蓝图(只是过于敌托邦)。Jonathan Lai提出,要想实现这样的愿景,UGC和AI可能是构建虚拟世界的两大基础。而乌托邦的虚拟世界演进到最后可能会是回归初心:让我们找到现实世界社交体验的那种随机性和偶然性。原文发表在A16Z博客上,标题是:Meet Me in the Metaverse

划重点:

虚拟世界是持久的,有自己的经济与身份系统的,无限可扩充的虚拟空间

虚拟世界将从以活动为中心的有目的互动转到以人为中心的自发性的互动

内容创作要经历4个发展阶段

UGC和AI可能是构建虚拟世界的两大基础

关于如何构建“虚拟世界”(Metaverse):也就是持久的,有自己的经济与身份系统的,无限可扩充的虚拟空间,有着众多相互竞争的愿景。Facebook Horizon是其中一个,这个雄心勃勃的愿景赌的是将会在VR中实现。Epic Games则围绕着《堡垒之夜》对一个以游戏为中心的方案加倍下注。但是,关于虚拟世界最令人兴奋的部分不在于它的范围或基础设施,而在于它在重塑我们跟亲人朋友互动的方式方面的潜力

虚拟世界里面将会出现新的社会形态。云端流媒体和AI方面的进展让跟朋友互动的新形式成为可能,比方说,进入到持久性虚拟世界,从而在事先毫无计划的情况下发现新朋友和新体验的能力。这代表着我们社交和娱乐方式出现微妙而重要的转变:从以活动为中心的有目的互动转到以人为中心的自发性的互动

我们已经在类似《侠盗猎车手》(Grand Theft Auto)之类的开放世界沙盒视频游戏里面瞥见这种自发交互的微光,但是这些体验仍受到专业创作内容供应有限的限制。但是在两个关键趋势:UGC(用户生成内容)的激增与AI不断渗透到创作者工具等领域的推动下,对真实世界的意外发现进行建模的,完全涌现式的社交体验将成为规范。当我们采用新办法去创作内容时,我们还将解锁新型的社交体验

内容创作的4个阶段

培育虚拟世界需要整个世界的努力

今天,我们正处在上面那个金字塔的第1到第2阶段。电视,电影,音乐以及游戏等绝大部分流行娱乐都是由大型的创意专业人员团队创作的。这些产品大多数都是为了单独一类受众而制作的,这意味着就算朋友增加了,体验基本上也没有变化。

多人游戏为推动社交娱乐的发展做出了最大的贡献。《魔兽世界》,《英雄联盟》等游戏在共享世界中吸引了数百万的玩家。然而,即便是这些游戏也存在根本的社会局限性。当今的多人游戏会话规模有限——甚至像《堡垒之夜》这样的现代游戏,一个服务器实例最多也只能支持100个并发玩家。在游戏内的社交活动也往往集中在特定的活动上面,比如《堡垒之夜》的战斗大逃杀模式或音乐会。

像《侠盗猎车手3》(Grand Theft AutoThe Witcher 3)等开放世界游戏引入了非结构化的玩法,也就是玩家可以自由探索虚拟世界,并按照他们选定的任任意顺序去追逐目标。尽管这朝着自发体验迈出了一步,但这些世界的范围也会受到专业团队可创作的内容数量的限制。

《巫师3》让玩家扮演开放世界里面的怪物猎人去玩游戏。资料来源:WCCFtech

在这方面,构建虚拟世界的最大挑战之一,是需要弄清楚怎么才能创作出足够的高质量内容来维系这个世界。要填充《头号玩家:绿洲》(Ready Player One’OASIS)里面的那种复杂世界需要大量的内容。如果是靠专业开发来创建这类内容的成本会非常惊人。众所周知,《星球大战:旧共和国》花了EA2亿多美元,而且需要由800多人组成的一支团队工作了六年,最后才能模拟《星球大战》宇宙里面的几个世界。相比之下,一个真正的虚拟世界很可能要由几个像《星球大战》这样规模的虚拟世界星系来组成。

用户生成内容为经济高效地扩充内容生产提供了一种有前途的解决方案。YouTube和Twitch等平台在组织庞大内容库方面比任何专业工作室都要更快,更高效。凭借着3100万位频道创作者社区,YouTube可每天提供超过10亿小时的视频。2019年,Twitch的600万创作者直播了超过100亿小时的视频。这些平台充分利用了社区的集体创造力,创造出一个不断旋转的内容飞轮。

然而,UGC平台本身也面临着挑战。考虑到要创作的内容量巨大,维持高质量的门槛可能会很困难。由于用户需要学习新工具和编程技能,因此内容创作者在数量上往往会被消费者的规模远远超过。YouTube 3100万名创作者仅占其20亿月活用户群的1.2%。类似Unity和Unreal之类的3D游戏引擎尽管功能强大,但学习起来可能很难。比方说,如今Unity的月活创作者只有150万,跟全球27亿游戏玩家相比仅占一小部分。

由一小部分人类创作者去创作UGC,尽管这相对于专业创作的工作室内容中已经是迈出了有意义的一步,但这很可能只是构建虚拟世界及其新的社会系统所需的一方面。

让人工智能成为共同创作者

为了在虚拟世界内实现新兴的社会体验(类似于我们在现实世界里发现体验的方式),用户生成内容无论是在数量上还是在质量都需要极大提高。

为此,内容创作的下一个重大发展将会是朝着AI辅助人类创作转变(第3阶段)。如今只有极少数人可以成为创作者,而这种由AI提供辅助的模式会让内容创作完全大众化。借助于AI工具,人人都可以成为创作者。这种工具可以将高级指令转换为可投入生产的资产,从而极大地减轻编码、绘图、动画等工作的负担。

我们已经在行动中初步了解到这一点。在Siri联合创作者Tom Gruber的带领下,Lifescore已经开发出一个自适应的音乐平台,通过它用户可以实时动态地创作音乐。当人类作曲家把一组音乐的“源材料”输入给LifeScore之后,人工智能大师马上就会做出修改,改进以及混编来进行表演。去年5月,LifeScore首次亮相是为Twitch互动电视系列剧《Artificial》进行自适应配乐,观众可以根据自己对剧情发展的感受来对音乐施加影响。

Twitch的系列剧《Artificial》的观看者可以通过表明自己的情绪状态来实时影响配乐。

AI的文章创作工具已经非常强大。Roblox就运用了机器学习把用英语开发的游戏自动翻译成包括中文、法语和德语在内的八种其他语言。AI Dungeon利用GPT-3自然语言模型来理解脚本,并后续若干段落内容,从而为有抱负的作家和《龙与地下城》地下城主之流扫清障碍。AI还可以把文字变成自然发音的有声故事,从而让内容创作者编写一次故事就能把音频版本发布到任何连接的设备上。

Roblox利用机器学习把用英语开发的游戏自动翻译成其他语言。

在文字和音频之后,图形才是最后的前沿阵地。由于资产规模和计算需求呈指数级增长,所以AI驱动的图形创作要比文本和音频更具挑战性。不过,我们已经看到一个诱人未来的迹象,在那个世界里,创作者将能够运用AI对 3D角色和世界进行完全渲染。英伟达最近就推出了Maxine。这是一个AI视频会议平台,平台利用了生成对抗网络(GAN)来分析人的脸部,然后通过算法对视频通话进行动画处理。这种模型可以实现动态效果,比方说模拟的眼神交流和实时语音翻译。RCT的Morpheus Engine的做法更加雄心勃勃,它可以利用深度强化学习技术把自然世界对象库里面的文本渲染成3D资产和动画。下面这张动图演示的是AI对文字“一个人在走路”的实时动画渲染:

虽然我们仍处在早期阶段,但AI工具已经具备让内容创作大众化,并让人类创作者得以专注于更高级别的设计和讲故事的的潜力。随着这些工具的采用,UGC的数量和质量都会得到提高。慢慢地,随着AI模型的改进,AI创作的新兴内容的质量甚至有朝一日可能会超越人类创作内容的水准,从而为我们如何在虚拟世界中进行社交和消遣铺平道路。

自发的社会体验将会成为新规范

在AI驱动的虚拟世界里,丰富的内容供应近乎无限,相应地,我们的社交方式也会不断发展。随着各种世界触手可及,社交活动将从有目的性转变为以人为中心。我们无需围绕着特定娱乐活动制定计划(这在今天往往如此),而是可以自由地去跟朋友一起探索虚拟王国,然后放手交给AI去填补其余部分

这种行为模式的一个类比可以是YouTube。现如今,可以在不必确切知道自己打算观看什么视频的情况去访问YouTube。你可以随意浏览几乎所有用户生成内容的目录。类似地,虚拟世界会成为社交体验的YouTube。在这里,我们可以在不需要任何日程安排的情况去聚会和发现新的体验。觉得这种说法过于牵强?可是你知道吗?美国的青少年观看YouTube的时长就比在Netflix上花费的时间要长。

通过将云端流媒体直播与AI驱动的角色相结合,还会创造出自发且具有互动的社交体验新格式。Facebook和Genvid最近就推出了Rival Peak,这是一个实验性的电视真人秀节目,里面数字化参赛选手是由AI驱动的,观看节目的观众可以通过投票实时去确定每位参赛选手的行为。

Rival Peak在Facebook上的观看者可以通过投票实时对角色进行指导。资料来源:Facebook

《西部世界》是自发社交体验的另一个例子(只不过它的反乌托邦意义更加明显),用户可以跟朋友一起进入这个世界,并体验跟每一次游览都不一样的,独特的,个性化之旅。在这部HBO的系列剧里,造访公园的人类会跟用不同性格和背景编程出来的人造“接待员”互动。接待员会对来宾的行为做出动态反应,其结果是一个涌现叙事(Emergent Narratives, 指通过为玩家提供创作故事的环境来完成叙事),以及根据来宾累计的选择实时进行演变的世界。

我们的朋友本身也会在虚拟世界里面不断地进化。现如今,大多数的游戏都会明确地把人类玩家与执行预定对话的非玩家角色(NPC)区分开来。而在虚拟世界里,NPC演进的下一步有可能是机器人(bot),驱动它们的,是具备自然语言处理能力以及与云端连接的数据的AI。跟《西部世界》里面栩栩如生的招待员类似,我们未来的新朋友很有可能是一个AI。

我们已经目睹了这种跟AI友谊的早期预览版。类似PandorabotsReplika这样的公司已经创作出可以作为人类朋友或浪漫伴侣的智能情感AI机器人。在神经网络的支持下,这些机器人会通过文字消息高跟人类朋友聊天,玩游戏,甚至写歌,写诗。通过将艺术与GPT-3相结合,Fable Studio正在开发一种完全动画形式的AI虚拟角色,人类可以在Zoom视频通话当中跟它们进行实时对话。

Lucy是一个完全动画形式的AI虚拟角色,用户可以通过Zoom,Facebook以及Google Hangouts与之交谈。资料来源:Fable

在一个让人感觉越来越孤独的世界里,跟AI的这种关系给人带来的希望在于,它们能够随时随地提供非主观的精神支持。尽管这种关系从伦理上来说也许会很复杂,但它的潜在需求是真切的:比方说,目前就有超过700万人在使用Replika。

随着时间的流逝,虚拟世界将会被具备情感智能AI角色占据,它能为我们创造真正逼真的社交体验。具有讽刺意味的是,虚拟世界的最终演进其实反而可能把人类的社会行为带回到作为根源的现实世界——让陌生人(或机器人)之间的偶遇与特殊友谊成为可能。

尽管我们在追求虚拟世界的过程中仍然存在着许多挑战,但用户生成内容和AI有可能会是构建互连的虚拟世界星系的基础。

然而,关于虚拟世界的最令人兴奋的地方不在于我们怎么用技术去构建,而在于它在改变我们的社交方式方面的潜力。从长期来看,由于AI在建构世界中承担着更大的作用,在虚拟世界里面的社交互动会不断演变,会更加接近现实世界的随机性和偶然性。在不久的将来,我们向家人朋友发出见面邀请可能只需要一句话:“我们虚拟世界见!”

译者:boxi。

+1
7

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

下一篇

Leetcode的面试题是不是花架子?

2021-05-10

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业