09.23.24: LLM 更像是一种商品
在降低了每周发布频率之后,我很快发现每周的 Linknotes 已经快要容纳不下这么多好文章了。虽然在长途旅行和假期之间切换状态容易让人陷入懈怠情绪,但在 Readwise 里保存的文章经常能让我在一个兔子洞里钻很久都走不出来。
长篇写作是一个深不可测的兔子洞,篇幅有可能是写作能力的一项重要指标。对我而言,5000 字(中文)就是一个门槛,超过这个门槛的写作要花费多得不成比例的精力,而 2000 字以内则是可以随便写写的范围。区别并不完全在于需要查找多少资料,而在于作者是否能在迷宫般的结构中保持清醒。大部分的废稿单独拿出来都是很好的短篇,但它们很可能会把读者带上一条歧路。
这实际上很像现在 AI 产业的现状:主线并不清晰,要去向哪里也是模糊的,很容易在错综复杂的线索中迷失方向。如果你关注这个行业的话,就会感觉自己像是在读一本 1000 页的长篇外国小说,里面充满了记不住的人名,以及他们之间说不清道不明的关系。
现在很少有人再去争论开源 vs. 闭环、long-context vs. RAG 这些路线问题了,Self-Play RL 已经成了新的 buzzword,搞不懂这些单词也没有关系,因为还会出现新的,短暂的存留在人们的嘴边,最终消失在公共记忆中。
Microsoft 365 的发布会得到的关注不多,但是 Satya Nadella 却出人意料的讲了一句大模型已经商品化了的论断。模型之战终将有个结局,就像当年的直流电和交流电一样,最终没有人记得 Nikola Tesla 是那场分歧的胜利者,而他的对手 Thomas Edison 更为人所知的发明是电灯泡,后者还被认为是通用电气的创始人,是电气时代最成功的掘金者。
在商品化的过程中,开源模式为理解商业模式增加了很大的复杂性,往往是后来者会采取的策略:它借助社区的力量,降低开发成本,同时又对企业客户足够透明,进而可以在价值链的其它地方赚取增值服务的收益。对于 Meta 而言,开源意味着终结无谓的竞争;对于 GitLab 而言,则意味着获得上台竞争的机会。
商品化同时意味着这些变化:价值堆栈中的某些局部战争宣告结束,而在另一些地方,新的竞争则会变得更加激烈,直到新王降临,尘埃落定。
本周的 Linknotes 带来:
- Mark Zuckerberg 在 Acquired 播客上的精彩访谈,我在 X 上分享了这集播客的前半部分的 笔记。
- 投资人 Kevin Xu 分享 GitLab 和 GitHub 在 AI 编码领域的竞争关系,更大的背景是大模型的商品化推动界面战争加剧。
- Meritech Capital 探讨 AI 如何可能推动 SaaS 走向更大的发展。
- 从 Roland Allen 的新书中节选的 Moleskine 笔记本的传奇故事,看它如何在数字时代征服了创意人士的心。
- 畅销书作家 Mark Manson 为 Will Smith 撰写自传的经验,顺带思考了 AI 在写作过程中可能扮演的角色。
我近期还会就 AI 编程这个话题分享我的一点思考,这是一个火热的赛道,我认为它或许不仅仅应该被局限在能够提高多少工程师的工作效率。如果你关心这个话题,可以关注后续更新。
另外,我在乱翻书播客上与潘乱、阑夕和 Junyu 讨论了 RSS 这个有点古老的话题,但我是站在 newsletter 这一边的。节目估计在几周后播出。
Linknotes
The Mark Zuckerberg Interview - Fall 2024 - Special 扎克伯格的特别访谈
Acquired,一个有关伟大公司及其背后的故事和剧本的播客,在有着 6000 名观众的 Chase Center 现场与 Mark Zuckerberg 进行了一个多小时的对谈。
在简单寒暄之后,主持人 David Rosenthal 抛出了这样的一个问题:
If you knew what you knew today, what's up? If you knew what you know today, would you have started Facebook?
如果你知道今天所知道的事情,你会怎么做?如果你知道今天所知道的事情,你会创建 Facebook 吗?
Zuckerberg 没有完全准备好,但他调整了一下思路,很快做了如下的大段陈述:
Yeah, so thanks, I'm excited about them too. So you know, at Meta we've been building social experiences for 20 years now, and originally it took the form of a website, then mobile apps. But the thing is I never thought about us as a "social media company. We're not a social app company, we are a social connection company. We talk about...what we're doing is building the future of human connection, and that's not only going to be constrained over time to what you can do on a phone, right, on a small screen. So when you think about - when we got started, we were like a handful of kids. We weren't able, we didn't have the resources, the time, to go define whatever the next computing platform is. And also, Facebook originally got started around the same time as a bunch of the early smartphones and those platforms got started. So we didn't really get to play any role in developing that platform. And one of the big themes I think for the next chapter of what we do is I want to be able to build what I think are sort of the ideal experiences, not just what you're allowed to build on some platform that someone else built, but what is actually, if you can think from first principles, what is the ideal social experience. So I think what you would like to have is not a phone that you look down at, that kind of takes your attention away from the things and the people around you, not just a small screen. I think what you ideally have is glasses and through the glasses there's one part of it where the glasses they can see what you see and they can hear what you hear and in doing so they can be kind of the perfect AI assistant for you, because they have context on what you're doing.
是的,谢谢,我也对此感到很兴奋。你知道,在 Meta,我们已经构建社交体验 20 年了,最初它采用的是网站的形式,然后是移动应用程序。但问题是,我从未将我们视为“社交媒体公司”。我们不是一家社交应用公司,而是一家社交联系公司。我们谈论的是……我们正在做的是构建人类联系的未来,而这不会随着时间的推移而仅限于你在手机上可以做的事情,对吧,在小屏幕上。所以,想想看——当我们刚开始的时候,我们就像一群孩子。我们没有能力,也没有资源,也没有时间去定义下一个计算平台是什么。而且,Facebook 最初是在一批早期智能手机和那些平台诞生的同时开始的。所以我们并没有真正参与开发那个平台。我认为我们下一章的一个大主题是,我希望能够构建我认为理想的体验,而不仅仅是你被允许在别人建立的平台上构建的东西,而是实际上,如果你能从第一原则思考,什么是理想的社交体验。所以我认为你不会想要一部低头看的手机,因为它会分散你对周围事物和人的注意力,而不仅仅是一个小屏幕。我认为你最理想的是眼镜,通过眼镜,眼镜可以看到你看到的东西,可以听到你听到的东西,这样它们就可以成为你完美的人工智能助手,因为它们知道你正在做的事情。
Zuckerberg 花了很多篇幅介绍了他们在做的智能眼镜产品,但他真实的意思是,Meta 并不会停留在某一个具体的产品形态上,而是会不断寻找下一个计算平台。主持人 Ben Gilbert 抓住了这一点,问道:为什么 Meta 能够表现得如此出色,我的意思是,它是世界上最有价值的公司之一,经历了多次迭代,经历了多次技术浪潮,你知道,也许我们可以列举一下人们说 Facebook 和 Meta 太糟糕了,但今天的情况并非如此。
的确,从社交网络时代的 MySpace、Twitter、Instagram、Snap,到短视频的 TikTok 和现在的 ChatGPT,Meta 也从 Facebook 改名为今天的 Meta,这个名字体现了这家公司多年以来不断变幻的版图。
Zuckerberg 坚持认为,Meta 力图构建人类连接(human connections)的愿景没有变化,但他希望 Meta 能够比竞争对手学习更快,他强调公司中技术主导的力量,快速学习的能力。Ben Gilbert 引用了一个未具名的说法:
有人对我说,马克之所以能成为优秀的战略家,是因为他把公司当成回合制战略游戏来玩,他只是确保自己比其他任何人都有更多回合,确保自己从每个回合中学到的东西都比下一个玩家多。
Zuckerberg 对这个说法感到非常认同。Gilbert 继续阐释:
但确实感觉你下注的方式就像,如果我们有出色的工程技术,那么就可以解决速度问题。这就像多次迭代或多次击球,然后……
Zuckerberg 回应说:
Well, great engineering and speed and iteration are actually two different values. They're not necessarily at odds, but I think there are a lot of great engineering organizations that try to build things that are super high quality and have good competence around that. But there's a certain personality that goes with taking your stuff and putting it out there before it's fully polished.
You want to put stuff out early enough so you can get good feedback. You obviously want to test things that are reasonable hypotheses. So if it's so ineffective, then you're not testing a good hypothesis. That doesn't work. But I do think a lot of the conversations that we have are like okay, well, we can get this to be a lot better if we work on it for another couple of months or whatever. And I do just think that you want to really have a culture that values shipping and getting things out and getting feedback more than needing always to get great positive accolades from people when you put stuff out. Because I think if you want to wait until you get praised all the time, you're missing a bunch of the time when you could have learned a bunch of useful stuff and then incorporated that into the next version you were going to ship.
嗯,伟大的工程、速度和迭代实际上是两个不同的价值观。它们不一定是矛盾的,但我认为有很多伟大的工程组织试图构建超高质量的东西,并在这方面拥有良好的能力。但是,在完全完善之前就拿出你的东西并把它拿出来,这需要一定的个性。
你想尽早把东西拿出来,这样你就能得到很好的反馈。你显然想测试那些合理的假设。所以如果它是如此的低效,那么你就没有测试一个好的假设。这是行不通的。但我确实认为,我们进行的许多对话都是这样的,好吧,如果我们再花几个月或更长时间研究它,我们可以让它变得更好。我确实认为,你真的希望有一种重视交付、交付和获得反馈的文化,而不是总是需要在你发布东西时得到人们的积极赞誉。因为我认为,如果你想等到你一直受到表扬,你就会错过很多时间,而你本可以学到很多有用的东西,然后把它们融入到你要发布的下一个版本中。
这其实不是「回合制战略」,而近乎于「即时战略」。
关于「从其它公司那里学习」,这通常被指摘为是「抄袭」:
You know, we're not embarrassed about learning from things that other people discovered that were good first, and then we build a better version of it [laughter from audience] and, um, I mean, I think that that's...you know, no one company is going to invent everything, right? I think if you don't invent anything, then it's hard to to kind of be a successful company. But but I do think that there's a mix of this. There are more smart people outside of your company than inside your company. If you're not learning from what's going on in the market, then you're missing a lot of opportunities to get valuable signal from people in the community and customers about what they want you to be doing.
你知道,我们并不羞于从别人发现的优秀事物中学习,然后我们再构建一个更好的版本 [观众笑声],嗯,我的意思是,我认为这是……你知道,没有一家公司会发明一切,对吧?我认为如果你什么都不发明,那么就很难成为一家成功的公司。但我确实认为这两者是混合的。公司外部的聪明人比公司内部的聪明人多。如果你没有从市场上发生的事情中学习,那么你就会错过很多机会,无法从社区和客户那里获得有价值的信号,了解他们希望你做什么。
之后对话转入了两个具体的技术问题:一是 Meta 是最早使用 LAMP 开源框架构建核心业务的大型科技公司,二是 Meta 最初在移动应用上使用了 HTML5 而非原生移动开发的技术路线,这些问题都被纳入了学习 - 迭代这个思考框架中化解。
之后,他们谈到了 Zuckerberg 作为具有「超级投票权」的创始人,Zuckerberg 认为只有创始人拥有对公司的控制权才有可能做一些长期正确的事情,他讲到了 Oculus 和 Reality Labs 的例子,认为在这些平台上的投资源于在移动互联网上不能拥有自己的平台(如 iOS 或 Android)的痛苦:
There is the thing about controlling our own destiny. It's strategically valuable. You know we did this calculation or estimate at some point where it's like how much money do we lose from our core family of apps to the various like taxes that the platforms have to like, when they tell us we can't run the ad business the way that we think we should be able to. When they tell us we can't ship certain products, so that way people use the things less or like them less, and it's hard to exactly estimate it. But I think we might be twice as profitable if we own the platform or something. So I think from that perspective that's worth a lot, just from a pure dollars perspective, which is not primarily how I come at this stuff. But even now I've learned a thing actually since the Yahoo days. So now I at least am able to.
I might not be able to convince all the investors that we should be investing to the extent that we are in Reality Labs if I didn't control the company, but at least I can sort of articulate a case for why I am confident that it's going to be good over time, why I'm confident that it's going to be good over time. But for me it's always been way more about the product experience and what you can enable and build.
控制我们自己的命运是一件很重要的事情。它具有战略价值。你知道,我们在某个时候做过这样的计算或估计,比如当平台告诉我们不能按照我们认为应该的方式经营广告业务时,我们会因为各种税收而损失我们的核心应用系列多少钱。当他们告诉我们不能发布某些产品时,人们会更少地使用或不喜欢它们,这很难准确估计。但我认为,如果我们拥有平台或其他东西,我们的利润可能会翻倍。所以我认为从这个角度来看,这很有价值,只是从纯粹的金钱角度来看,这不是我主要考虑这个问题的方式。但即使是现在,我实际上从雅虎时代开始就学到了一些东西。所以现在我至少能够做到。
如果我不控制这家公司,我可能无法说服所有投资者,我们应该像投资 Reality Labs 那样进行投资,但至少我可以清楚地说明为什么我相信它会随着时间的推移而变得更好,为什么我相信它会随着时间的推移而变得更好。但对我来说,它始终更多地与产品体验以及你可以启用和构建的内容有关。
对于 Meta 而言,Reality Labs 的代价是昂贵的,但这个叙事在最近得到了扭转,Meta 的市值也在逐渐宽松的资本市场环境中达到了新高。
访谈的「最后一个问题」来自 Ben Gilbert:您可能需要稍微回顾一下,但考虑到我们今天生活的世界不同,您对今天的创始人有什么建议,而不是试图“模仿” 2004 年的马克·扎克伯格?
在 Zuckerberg 再一次以「从别人的成功和失败中学习」作为回答之后,他收到了一件专门为他设计的 T 恤衫,他说:
I used to only wear one type of shirt. Now I've moved on.
我以前只穿一种衬衫。现在我已经改变了。
这句话的双关意味让整场对谈有了一个完美的结束。
PS: Acquired 播客片头曲是 Who Got the Truth? 其中一位创作者也出现在了 Live 现场。
GitLab, GitHub, the AI Model Divide GitLab、GitHub 和 AI 模型的分野
在讨论 GitLab 和 GitHub 这两家公司的时候就,Kevin Xu 有着独特的视角:他是前者的投资人,也在后者任职过。
在 AI Coding 这个领域,Cursor 吸引了太多目光,而 GitHub 和 GitLab 却没有得到足够的重视。Kevin Xu 分享了最近的一些变化:
- GitLab 开始采用 Claude 作为其 AI Coding 产品 Duo 的默认模型,取代了 Google 的 Vertex。Google 仍然持有 GitLab 6% 的股份。Anthropic 则被认为与 Amazon 关系更加密切。
- GitHub Copilot 宣布开放预览访问 OpenAI o1 模型的能力,这显然与 Microsoft 与 OpenAI 的密切关系有关。
- 在 Microsoft 365 的发布会上,Satya Nadella 说 AI models have become more of a commodity,这句话或许会让一些 AI 研究者嗤之以鼻,但它对产业界会有深远影响。
GitLab 本身像是 GitHub 的一个开源替代,而 GtiHub 自身也可以认为是在 Git 基础上构建的一层 wrapper(我知道,这些说法并不准确,但考虑到今天对 wrapper 这个词的广泛使用,我这么说可能也没有太大的问题)。
Xu 如此概括 GitLab 的商业模式:
In a nutshell, GitLab today is a “glue” of many different open source projects, each solving a discrete problem in the software development process – hosting source code, deploying code, testing code, securing code, etc. GitLab glues all these existing developer tool projects (many probably started on GitHub) into a coherent enough platform to sell to companies who want all these solutions, but would prefer that someone else who knows what they are doing do the gluing, rather than doing it in-house. And they would be happy to pay for it. Those companies ended up being large enterprises with limited IT expertise – a great type of buyers. This “open source glue” approach is a key reason why GitLab sports one of the best gross margins in the industry today – a whopping 91%!
简而言之,如今的 GitLab 是许多不同开源项目的“粘合剂”,每个项目都解决了软件开发过程中的一个独立问题——托管源代码、部署代码、测试代码、保护代码等。GitLab 将所有这些现有的开发工具项目(许多可能都是在 GitHub 上开始的)粘合成一个足够连贯的平台,出售给那些想要所有这些解决方案的公司,但更希望让其他了解他们在做什么的人来做粘合工作,而不是自己做。而且他们会很乐意为此付费。这些公司最终成为了 IT 专业知识有限的大型企业——一类很好的买家。这种“开源粘合剂”方法是 GitLab 拥有当今业内最高毛利率之一的关键原因——高达 91%!
商业模式分析有助于我们理解价值链中到底什么在起作用。基于同一个开源的代码版本管理系统 Git,竟然可以长出两家开发者工具赛道上的巨头来——特别是在 GitHub 已经如此成功情况下,还能出现 GitLab。
GitHub 被 Microsoft 收购后,仍然保持了在开发者社区中的领头地位,但同时也不可避免的和 Azure + OpenAI 生态产生了更深的绑定关系。
GitLab 采取了典型的开源竞争策略,商业价值创造也因为开源而被迫后移,通过提供一系列看起来技术含量不高,但能创造客户价值的「粘合」功能来获利。好处是:它能够保持足够的灵活性,选择更多、更好的 AI 模型。
这里的竞争关系错综复杂:
- GitHub Copilot 坚持使用 OpenAI 模型,而 GitLab Duo 则使用 Google Gemini 模型,直到最近切换为 Claude。
- GitLab Duo 前段时间还宣布停止支持 OpenAI 模型, 原因尚未确定。
- GitLab Duo 允许用户使用两个不同的模型进行代码补全(completion)和代码生成(generation),这个设计也在 Cursor 等 AI 代码编辑其中很常见。
- GitHub 推出了 Models 产品,提供 OpenAI 之外的更多模型,但这些选择也仅限于与 Microsoft 生态不产生直接竞争的模型。
Xu 认为:到目前为止,这种与模型无关的特性对 GitLab 这样的更为中立的厂商有利。我们面临的是,云计算巨头之间的 AI 模型分歧沿着竞争断层线展开。为什么会出现这种分歧?好吧,模型可能是一种商品,但云生态系统锁定非常有价值。最好的模型,即使只是六个月的“最佳”,也可能足以吸引更多客户,最终将他们锁定在模型之下的其余云中。
有趣之处在于,让模型变为商品的始作俑者恐怕正是 OpenAI 和 Microsoft 自己,正是他们引发了全球范围的大模型军备竞赛。
Xu 引述 Satya 的话说:
在 Satya 称模型“更像是一种商品”的同一个视频中,他用另一个短语来表达“副驾驶”对他的意义:AI 的 UI。这一观察的隐含意义在于,UI 层才是有意义的差异化所在,也是价值被捕获的地方,而不是模型层。
这也和我在 7 月份的《界面的机会》一文写到的高度一致: