Meta: 用十年寻找下一代计算平台

Meta Connect 2024 发布会这两天引发了很多讨论。我自己也在 Twitter 上写了一些总结,结合最近 Zuckerberg 的访谈,我发现,有必要重新整理一下过去几年这家公司的路线图。

我花了一个上午仔细阅读了过去几年对 Meta 关键人物的访谈和分析材料,做了一些摘录放在这里。

移动 OS 时代的困境

在移动互联网阶段,Zuckerberg 认为自己受到了来自 OS 平台的诸多限制。在 Acquired 的访谈中,他提到如果没有这些平台的限制,Meta 可能能够赚到「双倍」的利润。

对于 Meta 而言,移动互联网上两个主要的操作系统带来了不同的挑战:

  • iOS 的垂直整合:苹果采取垂直整合策略,对所有应用抽取 30% 的分成。但对 Meta 影响最大的是苹果推出的 App Tracking Transparency (ATT)。这个功能表面上是出于隐私保护的考虑,但实际上严重影响了 Meta 以广告为主的商业模式。
  • Android 的生态系统:Zuckerberg 曾经尝试与 HTC 合作开发基于 Android 的设备,但很快就失败了。他后来发现,谷歌基于安卓的开源系统,实际上建立了一整套包括账号、支付、基础应用等在内的配套服务。这使得 Meta 想通过在安卓之上添加一层软件和硬件的方式来竞争变得几乎不可能。

如果没有碰到这些困境,Zuckerberg 或许不会选择探索现在这条路。

Oculus、Quest 和 Reality Labs

在移动时代碰到的种种限制让 Zuckerberg 学到了很多教训,他开始寻找下一代的计算平台:在 2014 年收购了 VR 头显厂商 Oculus。

收购完成后,继续向前的路线并没有立即明确。内部存在两种观点:一种是做一个高端的 PC 或游戏机配件,价格更贵但支持更强大的计算能力,Oculus 原来的团队很多支持这条路线,早期产品 Rift 也是这个路线的代表;另一种是做价格便宜、成本低但销量大的独立设备,代表人物是后来离职的 John Carmack,他推动了 2018 年发布的 Oculus Go,可以认为是独立廉价设备路线的初代机。

最终还是第一种路线取得了胜利。2019 年,初代 Quest 发布,售价 399 美元。2020 年,Reality Labs 成立,Andrew Bosworth 担任负责人,后来成为现在的 Meta 的 CTO。2021 年,Facebook 宣布更名为 Meta。

Reality Labs 每年预算达到上百亿美元。在 2020 年代初让 Meta 承受了巨大的资本市场压力,投资人不理解为什么要少这么多钱投入一个短期看不到任何成效的项目上,也不再相信 Zuckerberg 讲的 Metaverse,Meta 股价在 2022 年 10 月底跌破 100 美元。Zuckerberg 很快宣布 2023 年为 Meta 的 Year of Efficiency,启动大幅度的裁员、组织架构调整。

从财报披露来看,Meta 2023 年的 Year of Efficiency 对 Reality Labs 的影响是温和的:Reality Labs 在 2023 年第四季度首次突破 10 亿美元季度收入,实现增长。然而,Reality Labs 继续报告重大亏损。2023 年第四季度亏损 46.5 亿美元,而 2022 年第四季度亏损 42.8 亿美元。Meta 增加了对 Reality Labs 的 AI 投资,但巨额亏损仍然持续。

Bosworth 在和 Ben Thompson 的访谈中认为,在 Year of Efficiency 之前,RL 内部就已经在做路线选择,2020 年底发布的 Quest 2 已经证明了他们选择独立 + 低成本设备 + MR 的路线决策。这一代产品的最低配版本起步价格首次达到了 299 美元。

我喜欢这个问题。那是在效率年到来之前。我认为这并不罕见,你会经历这些扩张时期,你会想,“我们还不知道什么是重要的,我们真的不知道什么技术是正确的技术,我们不知道什么操作系统是正确的操作系统,我们还不知道什么权衡是重要的”。因此,如果你想在一定时间内充满信心地取得成功,那么并行处理大量事情是值得的。

说实话,我们在 Quest 2 中取得了转折,尤其是当我们看到了混合现实时。这开启了这个过程,现在你已经达到了混合现实的地步,我们的元宇宙部门非常专注,对什么是好的有着非常清晰的愿景,有非常清晰的能力来辨别这是道路,这不是道路。因此,您可以更加高效地利用资源,使用并行路径列表,只需快速处理更重要的事情。

2022 年推出的 Quest Pro 实验性的推出了薄底镜头,售价高达上千美元,虽然反响一般,但对后续 Quest 3 铺垫了很多技术准备。

2023 年的 Quest 3 基于 Quest Pro 进一步完善了硬件规格,销量达到新高(据称在百万台)。本次发布的 Quest 3s 就是基于 Quest 3 的一个「青春版」,希望冲击更高的销量。同时,和 Ray-ban 合作的智能眼镜也获得不错的市场反响。

Apple 在 2023 年推出的 Vision Pro 一定程度上坚定了 Meta 在路线选择上的信心。Bosworth 这样讲道:

我喜欢 Vision Pro — 人们不会相信我 — 我喜欢他们走极端。就像,“如果我们把这个拨盘转到 11,让系统的其余部分保持原样,会怎么样?”,你明白为什么我们没有这样做,只是在重量和成本方面。是的,这就是把这个拨盘转到 11 所需要的。

当竞争对手推出产品时,你唯一真正担心的是他们已经取得了你没有的突破。他们已经解决了一些问题,一些你还没有解决的技术问题,因为这样他们就有可能在一段时间内保持优势,直到你能打败他们。所以我认为每当一种设备问世时,人们都会有这样的感觉:“哦,太好了,这都是用我们所知的材料制成的,这都是用我们可以接触到的技术制成的。”

Meta 很清楚,自己需要更快的达到用户规模的临界点,才有机会进一步和 Apple 在软件和内容上竞争。Vision Pro 的高端路线使得它在推出时没有太多可以匹配的应用和内容。Meta 则在 Quest 2 和 3 的成功基础上进一步探索如何构建开发者生态。

AI 带来的再次加速

VR 和元宇宙叙事最大的挑战就在于内容制作的成本。解决这个问题的路径无非是游戏、视频和社交。前两者 Meta 并不擅长,需要开发者生态,而社交则是它很擅长的,所以他们先后推出了 Horizon Worlds 和 Codec Avatar,本质上是构建一个虚拟世界,让用户在其中互动,从而支撑 Quest 生态。

Bosworth 认为,AI 在内容生成、虚拟形象、动作追踪等方面具有极大的推动作用:

人工智能最能拯救我们的地方是 Horizon Worlds,我希望每个人都能创造一个世界,但 3D 设计并不是一件小事 ... 无论你做得有多便宜,这都是不简单的,除非我能用语言描述它并让它出现,今天我们谈到了这一点。我们在舞台上谈到了 NPC——NPC 是一件很繁琐的事情,如果没有它,你的游戏就很难做。现在,你可以用人工智能来做。同时,在 AR 上,我们使用的人工智能是传感方面。

他提出,这个问题和自动驾驶很类似,都是在空间中进行模拟和计算:

你需要一个设备来具备一些常识,没有更好的词来形容。它需要理解一些……我不能教它每一件事,而且……我永远也做不到。人类在世界上的经验太丰富了。这就是自动驾驶汽车教给我们的。事实证明,自动驾驶汽车在交通中遇到的随机情况数量如此之多,如此之大,长尾如此之长,以至于当你试图死记硬背时,你几乎无法到达那里。所以对于我们耳机来说,我们的架构图中一直有一个我们有时称之为指挥的概念。这个代理的概念可以感知你的注意力和意图,了解你想要完成的事情并帮助你。

这里隐含了一个很重要的观点:在已有的计算平台上(比如手机),AI 生成的内容更可能成为现存内容生态的补充,而很难支撑一个新的内容平台。这就是为什么我们看到大量的 AI 文字、视频生成应用更多是为了企业或创作者经济服务的。无论是在位平台、创作者还是普通消费者,都难以接受大规模的 AI 生成内容冲击现有生态的利益分配。

而对于新的计算平台而言,既得利益少很多,内容稀缺,人们更能接受 AI 生成的虚拟形象在这个空间中大量存在,占据主导地位。这里很有可能给生成式 AI 留出更大的机会。

Zuckerberg 的视角看,AI 的两种重要场景是:

基于这些假设,我们试图了解其中哪些东西对人们最有用。其中一条主线是帮助人们和创作者使用人工智能制作更好的内容。所以这一点非常清楚。让有抱负的创作者或高级创作者能够非常轻松地制作出比他们原本能够制作的更好的东西。这可以采取这样的形式,“好吧,我女儿正在写一本书,她想要配上插图,我们坐下来一起与 Meta AI 和 Imagine 合作,帮助她想出一些图片来说明它。”这就像她以前没有能力做到这一点。她不是平面设计师,但现在她有了这个能力。我认为这会很酷。

然后有一个版本,在这个系统中有各种各样的人工智能代理。我认为这是我们对人工智能的愿景与大多数其他公司之间的巨大差异。是的,我们正在将 Meta AI 打造为您可以构建的主要助手。这有点像谷歌、OpenAI 或其他人正在开发的单一助手,但这并不是我们的主要工作。我们的主要愿景是,我们认为将会有很多这样的助手。每家企业,所有数亿家小企业,就像他们今天有网站、电子邮件地址和社交媒体账户一样,我认为他们未来都会拥有一个人工智能来帮助他们与客户互动,将销售和客户支持等功能结合起来。

如果说第一条路线已经体现在 Quest 生态中的话,那么第二条路线将更多体现在新发布的 Orion 中。

Orion 和 Full AR

Zuckerberg 在发布会上演示的 Orion 眼镜是最引人瞩目的,他将其称为 Full AR。这个设备可以认为是 Quest 头显设备和 Ray-Ban Meta 眼镜的结合体,在硬件和软件定义上更可强大,也更具有移动性。

在 The Verge 的访谈中讲道:

总体而言,对于 Reality Labs 来说,有一段时间,很多人认为所有的预算都用于虚拟现实和混合现实。实际上,我认为我们已经公开表示,我们的眼镜项目比虚拟现实和混合现实项目预算更多,但这适用于所有项目。这就是 Full AR,这就是无显示眼镜,这就是我们将在 Ray-Ban 上进行的所有工作,我们刚刚宣布扩大与 EssilorLuxottica 的合作伙伴关系

他认为,眼镜可能成为下一个十亿用户级别的计算平台。

因此,眼镜变得越来越有用,我认为这也会随着时间的推移增加需求。它如何与手机互动?就像你说的,我认为人们不会很快放弃手机。我的想法是,当手机成为主要的计算平台时,我们并没有放弃电脑。我们只是有所转变。我不知道你有没有这种经历,但在 2010 年代初的某个时候,我注意到我会坐在电脑前的办公桌前,拿出手机做事。

我们不会扔掉手机,但我认为,慢慢地,我们会开始用眼镜做更多的事情,更多地把手机放在口袋里。这并不意味着我们已经不再需要电脑,而且我认为我们也不会在短时间内不再需要手机,但有一条非常清晰的路径,那就是你将使用眼镜做越来越多的事情。随着时间的推移,我认为眼镜也将能够由腕戴式可穿戴设备或其他可穿戴设备供电。

所以,10 年后有一天你醒来,甚至不需要随身携带手机。现在,你仍然会拥有一部手机,但我认为更多时候,人们会把它放在口袋里或包里,或者最终,有时,会把它留在家里。我认为眼镜将逐渐成为我们进行计算的主要方式。

眼镜这个界面有它的局限性:尽管 Orion 展示了强大的手势操作能力,但它仍然不是太适合做大量输入。这也是为什么 AI 可能扮演更重要的角色,语音输入和 agents 更适合在这个场景下完成任务。在手机上,Apps 生态更加分裂和孤立,可能成为 Agents 的限制。

Meta 还有更多实验室里的产品没有拿出来,预计还有 3-5 年时间再迭代数代才可能真正普及到普通消费者手中。

Bosworth 说,第三代产品其实就是你在做第一代产品的时候希望的能有的样子。这一点在 Quest 上已经应验了。如果 Orion 算是初代,那么它的三代的确很令人期待。

从收购 Oculus 开始,到 Orion 推出,很巧,这条路刚好走过十年。

"Living in the Future"

Andrew Bozworth 在 Meta 官方博客上发表了一篇题为 Living in the Future 的文章,其中写道:

我们在过去一年中看到的转变表明,人工智能将成为人机交互的主要方式。新设备的出现为人们提供了舞台,它们可以以前所未有的方式感知、理解和与周围的世界互动。
我们的人工智能雷朋 Meta 眼镜展示了一条这样的道路。我们的新 Meta AI 助手结合了视觉和语言理解,从您的角度看世界,并与您一起理解它。我们正在眼镜上测试新的多模式人工智能功能。启用此功能后,它们可以翻译您正在阅读的外语,或为您拍摄的照片想出一个有趣的标题。而且它们可以解放双手,您无需拿出手机或操作应用程序。
我们相信,尖端人工智能最强大的表现之一将是能够理解您周围的世界并帮您度过一天的助手,最终无需提示。眼镜是实现这一目标的理想设备——它们可以从您的视角看世界、听世界,它们已经被社会所接受,可以全天佩戴,让您完全沉浸在当下。
在 Reality Labs,我们投入了多年的研究来研究推进这一目标所需的技术——例如超低功耗、始终开启的传感器和能够理解您的环境的机器感知系统。我们不仅在这里开创了一种新型设备——我们将在未来几年推动它的发展。

Elsewhere

Altimeter Capital 的投资人 Freda Duan 认为,Ray-Ban Meta 有可能成为像 AirPods 那样的爆款产品,后者已经销售了上亿对,是目前可穿戴硬件领域销量最高的产品,其次是 Apple Watch,销量为 4000 万只。

她比较 Ray-Ban Meta 和 Ray-Ban Stories(初代产品):

新品:Ray-Ban Meta 包含内置 AI 辅助。
改进:音频音量增加 50%,低音增加 2 倍;增强媒体质量和舒适度;更多款式和颜色;充电盒更快。
相同:价格;电池寿命;开放式耳机。
Ray-Ban Stories 售出 30 万副,每月使用率仅为 10% 以下,退货率很高。

以及回顾了其它竞争对手在这个领域的尝试:

$GOOGL 眼镜(2013 年):使用不到一年,销量不到 10 万台。
定价过高,高达 1,500 美元;没有制造合作伙伴;出于安全和隐私方面的考虑,市场尚未做好准备。
$SNAP 眼镜(2016 年):导致 $SNAP 损失 4000 万美元,销量不到 30 万台。
功能类似于 Meta 的 Ray-Ban,但缺乏更广泛的应用集成(只能将视频传输到 $Snap 应用,而不能传输到手机的相册),导致库存过剩。

这次的不同之处:

1/ AI 集成:市场对 AI 助手的兴趣日益高涨。人们想要一些新东西!
2/ $META 的生态系统锁定:正如
@boztank
所说,“通过 WhatsApp 和 Messenger,人们可以使用 Meta AI 助手。但您无法通过 AirPod 获得它。”

@boztank 就是 Meta 的 CTO Andrew Bozworth。


References