AI 杂记 7:通往通用之路
20 世纪的那些大企业,最喜欢用的名字就是 General,而今天,Open 则更受青睐。谁知道,它们实际上是一个意思。
在 Sora 最火热的同时,我想起一个问题:类似 Perplexity 这样的产品是不是还有价值?或许这个问题不大恰当,因为两者没有什么可比性。而它唯一的合理性在于,Scaling Laws 驱动下的模型似乎是越大越好的,多模态、世界模型和 AGI 这些庞然巨物,可能会吞下其它的小鱼小虾。
在生态系统中,即便两个物种不处于同层,上层仍有可能吃掉下层。多年以来,iOS 就吃掉了很多本来处于 App Store 生态中的第三方应用开发者的生存机会。类似的情况也广泛存在于其它的生态系统中,奉行软硬件一体的苹果公司早年吃够了被第三方开发者抛弃的苦,始终没有放弃推出第一方应用的努力,但更多情况下,生态中的上层位置更容易发现有利可图的机会,也在研发、分发等资源上占尽优势。
像浏览器这样的位置,无论是在 iOS 还是 Android 上,都是生态拥有者牢牢占据的存在。即便开放如 Android,其 WebView(也就是在第三方应用中打开网页的界面)默认保留为自家的 Chrome。在这个意义上,Android 其实更像是 Chrome 的启动器,而 Chrome 则更像是 Google 搜索的启动器。这样的植入方式,隐秘而巧妙,在承诺开放的同时,也占据了最有利的位置。
多层叠加的技术栈构成了密不透风的商业栈。Android 已经是世界上最大的操作系统,Chrome 也是世界上最大的浏览器,Google 也守住了世界上最大的搜索引擎的位置。现在,Gemini 也在延循类似的方式走向世界最大的 AI 应用的位置:它在替代原有的 Ok Google 的入口,成为嘴边可以随时唤醒的 AI 助手。
有趣和有用,是 toC 产品最简单的分类方法。在这两个方向上,已经有 character.ai 和 perplexity.ai 两个产品初步证明了自身的 PMF,但他们也将面临商业模式的问题。而能对齐模式造成摧毁性打击的,更可能是在其上游出现降维打击的对手:OpenAI 可能在 ChatGPT 提供更及时、更优质的知识库索引,Google 可能利用自身强大的分发渠道(搜索、Andorid、Chrome)更快的触达用户。
高频打低频是这种降维攻击最常见的做法。很多时候,高频被视为是在战略上做出的预先选择,但从我的经验看,战略选择其实只是聪明人的概念游戏,真正困难的在于兑现这种选择的禀赋、时机或者干脆就是运气。先发优势往往体现在抢先在竞争开始之前就占据最优势的地形,而这有需要强大的资源支撑和领导 - 执行能力。这些因素往往互为因果,说不清谁能带来谁,偶然和运气甚至更有解释力。
类似 perplexity.ai 这样的产品,优势在于性能和成本效率更高,特别是与 GPT-4 这样的大模型相比,显然更接近于消费者普遍能接受的响应速度。这也符合颠覆式创新的原理:用成本更低但是性能够用的产品撬动细分市场,最终实现颠覆。这家公司在 1 月份刚刚宣布了新的融资,也只有几千万美元,和这个领域动辄十亿美元的融资额相比,竟然相差出 2 个数量级,更不用提 Altman 那个 7 万亿。
投资人 Elad Gil 在 X/Twitter 发表了一连串的问题,其中 提出了一个 2x2 矩阵,以性能/成本为纵轴,通用性/智能为横轴。在这个矩阵中,perplexity.ai 大概处于偏左上的部分,Sora 可能在右下,右上方则是 GPT / Gemini 这样模型想要逐步逼近的地方。