Platform Thinking

代码的 YouTube 时刻

代码不仅为工程师而生。

代码的 YouTube 时刻
Photo by Sebastian Pandelache / Unsplash

虽然周一才宣布 newsletter 暂停更新一段时间,两天内就破戒了——不过这是一篇未发表的旧文。

本文写作于 2024 年 9 月 26 日,也就是 8 个月前。

当时,我们还没有看到 o3、Claude 4 和 Gemini 2.5,Vibe Coding 这个词还没有出现,但 Cursor 已经非常好用了。在自己独立完成了几个小工具的开发后,我意识到,代码生成不仅限于现有的使用场景,而可能成为更多人新的表达方式。隐约觉得,这可能是一个类似 YouTube 和 UGC 的机会,于是写了这篇文章。写完放了几天,又觉得太多不确定,于是没有发。

今早读完了晚点对 YouWare 创始人明超平的一个访谈,再一次让我想起了这篇旧文。他的很多思考又比我当时更深刻了,而且做出了实际的产品。

给我最大启发的有以下几个点:

  1. 对技术带来的变化要乐观。比如他讲道:“举个例子——未来生成代码的时间,可能和你打开一个网页加载内容的时间差不多,200 毫秒、300 毫秒。网页不再是写好的,而是访问时实时生成的,coding 不是写出来的,是生成后选出来的。”——这就是一个对技术进步做合理乐观预判的例子。
  2. 把 AI 看成人,以此来思考人与 AI 关系:“在我脑海里,未来可能会形成一个 Agents 网络,这里有三重网络效应:人和人之间、人和 Agent 之间、Agent 和 Agent 之间。我也理解了为什么 Google 要推 A2A(Agent to Agent 协议),因为未来可能每个人有一个自己的 Agent,它帮你跟几百万 Agent 通讯。”——我在去年 9 月份的《无面之网》这篇文章中也提到了类似的看法。
  3. 平台的机会来自于人性底层交流欲望和交易需求:“这不仅是直觉,我已看到了迹象。为什么 3 月初那天我要手搓 YouWare 第一版?因为我看到不少人在 Twitter 上录屏分享用 Grok 3 写的游戏。但录屏是一种对创作者和消费者双输的分享方式,它不能交互,无法完整传达 coding 作品的创意和效果。”——我最近因为做了 Podmark,就特别有分享的欲望,但现有的社交 / 内容平台限制太多,容器已经不适合了,新平台呼之欲出。

AI 变化太快,几个月前写的东西,今天看可能有些地方很可笑,权当抛砖引玉,仅供各位参考。


25 岁的产品设计师 Yash Bhardwaj 抛出一个观点:写代码可能即将迎来它的「YouTube 时刻」。YouTube 的联合创始人 Chad Hurley 也转发了这条推文,并打上了一个意味深长的表情符号:🧐,含义是:深思熟虑或仔细观察,暗含一点不确定。

谈谈 YouTube

Bhardwaj 认为,YouTube 的爆发源于三个关键因素:

  1. 视频托管成本趋近免费
  2. 视频编辑成本降低,且移动化
  3. 手机摄像头质量大幅提升

和这个「创作门槛降低」叙事相符合的一个很流行的版本是:YouTube 的爆发是因为数码相机的普及让很多普通人也有了不少的视频存货。这个说法其实并不准确,让我们来回顾一下 YouTube 发展的历史。

YouTube 是一个诞生过早的产品。2005 年发布时,世界并没有准备好 Bhardwaj 所说的三个条件(AWS 要到 2006 年才正式发布),虽然互联网大大降低了视频创作的门槛,但这并不意味着内容供给就会自动发生。在竞争、烧钱和版权纠纷的压力下,仅仅过了一年多,创始人们就同意把公司出售给 Google 了。

广告业务老兵 Susan Wojcicki 在 2014 年接手 YouTube 业务后,为 YouTube 带来了强劲的商业化能力,并把这种能力赋予了平台上的视频创作者。另一大贡献用 ContentID 算法彻底解决了令人头疼的版权问题,YouTube 很快和各大唱片、电影公司达成平台级的合作。YouTube 在 2019 年达到了每分钟上传 500 小时视频的惊人内容供给量。Covid-19 在视频消费规模上再次加码,YouTube 一度消耗了全球互联网带宽的 15%。

商业化和版权内容的加入使得 YouTube 的创作者生态发生了微妙的变化,从单纯「为爱发电」逐渐转变为考量收入和盈利能力。

今天 YouTube 上最成功的创作者 MrBeast 就是在这段时间爆发的。2017 年,他发布了一段长达数十个小时的挑战视频,内容是从 1 数数到 100,000,这个视频大获成功,订阅者超过 100 万,一年后超过 1000 万,2022 年超过 1 亿,目前已经超过 4 亿。

MrBeast 摸索出流量增长的黄金共识:不可思议的挑战 + 巨额奖金。在一份长达 36 页的 PDF 中,MrBeast 分享了秘诀:每个视频创意都是从一张抓人眼球的封面图开始的,要求每个视频中都有一个 wow factor,每一分钱都要花在视频中肉眼可见的地方。

他在 2021 年制作的模拟 Netflix 剧集《鱿鱼游戏》的真人秀就是这一模式的典范:在这个 25 分钟的视频里,有 456 人争夺 456,000 美元的现金奖励,总制作成本超过 3 百万美元,MrBeast 甚至给它增加了 16 种不同语言的音轨。付出巨大,但回报也是惊人的:这个视频一周内被观看了 1.3 亿次,累积观看次数现在已经超过 6.5 亿,这一年,MrBeast 以 5400 万美元的收入登上了 Forbes 百大名人榜。

MrBeast Squid Game.png

MrBeast 只有一个,但 YouTube 有无数个想要成为 MrBeast 的创作者。虽然 Broadcast Yourself 的品牌口号已经悄然不见,但 YouTube 拥有上亿个活跃的频道,其中 2840 万个频道拥有至少 100 个订阅者,而只有 5 个频道有超过 1 亿订阅者。

深谙内容行业的投资人 Blake Robbins 分析了这些成功的创作者是如何根据平台算法来优化自己的内容制作:

人们普遍猜测 YouTube 的算法会根据总观看时间对视频进行优先排序和奖励。这意味着从头到尾观看的视频将通过 YouTube 的「推荐」面板在算法上向其他人推荐。MrBeast 已经精通了这一点。他几乎所有的视频概念都围绕着观看视频结束 ... 随着观看时长的增加,视频的赌注会不断增加。这种格式鼓励观众观看整个视频,从而在「推荐」中排名更高。

YouTube 围绕争夺用户的时长份额而设计推荐算法的,这改变了消费者发现新内容的方式,也就影响了创作者如何设计自己的内容。这是一场平台与创作者之间的「猫鼠游戏」,它饱受争议,但简单有效,催生了蓬勃涌现而独具一格的创作生态。

YouTube 比 Netflix 或 NBC 更伟大的地方在于:它让 James Stephen Donaldson 成为了 MrBeast。YouTube 时刻是由成千上万个 MrBeast 时刻共同构成的。YouTube 让一些普通人成为了本来无法成为的自己。

AIGC 没有新平台

科技行业已经很久没有出现一个新平台了。

ChatGPT 出现之后,人们普遍预期 AI 会带来一个新的内容平台,但两年时间过去了,它还只是一个拥有 2 亿周活用户的产品,和上一代消费互联网中的超级应用相差甚远。对新平台的普遍预期来自于 AIGC 再一次大幅降低了创作门槛,从而可能促使内容消费也随之迁移,但现在来看,这可能很难实现。

首先,AIGC 需要面对现有内容平台的挑战。人类已经拥有了足够强大的内容平台,AI 生成内容虽然降低了成本,但在内容形态上没有实现突破性的创新,这和生成式 AI 的模仿本质有关。唯一有所突破的地方就是 AI 搜索,但 Google 这样的在位者并没有放松警惕,快速查漏补缺,进行防御。相比之下,诸如 MrBeast 这样的 YouTube 创作者带来的内容创新是传统影视工业未能有效提供的。

其次,AIGC 在现有的推理成本水平下,仍然难以支撑大规模的消费者应用。最近的一篇文章《万字探讨:国内 AI 应用创业陷入恶性循环,问题在哪里,出路是什么?》就从成本角度分析了 AI 应用的 PMF 选择问题,其中的关键观点就是:普通用户和生产力/行业场景用户在潜在的「单次推理用户价值」上有着一个数量级以上的差异,因此大模型应用想要扩展普通用户这个行为本身在这个时间点就是不成立的,也是不合理的。

另外,AI 生成的内容存在机械、幻觉和伦理等问题,这些问题随着应用规模的扩大而被放大,可能产生的社会后果难以预计。直到今天,各大内容平台仍然对 AIGC 有单独的管理流程,控制这些内容对平台和公众带来的冲击。同时,消费者仍对内容背后的人性存有期待,特别是对于头部 IP 而言,AI 能否满足这种预期,还有待验证。

考虑到这几点原因,我们很可能会看到 AIGC 成为现有内容平台的一个互补品而非替代品,它在经过一段时间的质量上升和成本下降之后,越来越多的融入到 UGC 和 PGC 生态中,成为一种补充。其中可能出现生长出新 IP,但很可能难以脱离现有平台存在。

编写全世界的软件

Cursor + Claude 是近来最令人兴奋的 AI 应用。

它并不是最早的代码生成产品,但它最先找到了自己的神奇时刻。Cloudflare 的开发者关系 VP 上传了一条他的 8 岁女儿用 Cursor 编程的视频:她开发了一个和 Harry Potter 聊天的网页应用,孩子会为网页中增加了一个可以旋转的⚡️图标而兴奋不已。这条十分钟的视频在 Twittter 被观看了 260 万次。

8-yo-cursor-coding-harry-potter.png

社交媒体上类似的例子还有很多。很多独立开发博主通过直播的方式演示自己如何用 Cursor 快速完成新产品的开发,从几分钟到数天不等,开发出来的应用有些只是一个天气预报,有的则功能完整可以直接上线部署。

Cursor 在 2024 年 8 月公布了成功融资 6000 万美元的消息,除了一大串声名显赫的投资人之外,还公布了客户数量已经超过 40000 家。在新闻稿的副标题中,他们写道:

Our goal is to create a magical tool with the aim of writing the world's software.
我们的目标是创造一个神奇的工具,旨在编写全世界的软件。

这是一个热闹非凡的赛道。在大量开源代码库和不断提升的推理能力上,LLM 越来越擅长编写代码。共识粉碎机的一篇专家访谈纪要认为,目前的代码补全能力大概可以提升工程师 20%-30% 的代码效率。而 Greylock 在 5 月份发表的文章中,把赛道进一步细分,覆盖了从代码编写、测试、审阅、维护等多个流程。

Greylock AI Coding.png

如果要估算代码生成的市场规模,一般会引用的数据会是软件工程师的数量,然后再估算他们的产出、年薪等,然后计算每年的总体规模。在这个计算口径下,代码生成所对应的基础人群是软件工程师,这个群体虽然增速很快,但基数只能占到知识工作者总数的很小一部分——当然,他们薪水颇高,这就让这个赛道成为 AI 应用中「最容易收到钱」的方向之一。

Wages vs Software.png
via Input Coffee, Output Code: How AI Will Turn Capital into Labor

但代码不仅为工程师而生。

如果按照 Bhardwaj 所设想的「YouTube 时刻」来看,这些定义方式都太过保守了:YouTube 的愿景是让每个人都可以通过视频来进行自我表达,而代码生成则应该让每个人都可以写代码,让自己的想法变成现实。

Cursor 所言的「全世界的软件」应该就是指每个人的软件

正如 YouTube 所说的:广播你自己(Broadcast Yourself)。

新工具和新平台

1993 年,美国演员工会(Screen Actors Guild)的 注册会员 为 7.5 万。1999 年,美国广播电视行业的 总就业人口 为 44.8 万人。这就是 YouTube 出现之前,电影电视行业的就业情况。在 YouTube 出现之后的不到二十年间,参与视频创作的人数至少有数亿人之多。好莱坞是无数年轻才俊向往的神圣之地,但现在,这个圣地已经转到了 YouTube 和 TikTok 那里。

和拍电影一样,写代码曾经是一项有些神秘的工作。它需要多年的理论学习和实践经验,根据 2024 年的估计,全球的软件开发者数量不到 3000 万,占全球人口只有千分之几。

代码生成对于普通人而言,或许最大的价值在于「祛魅」,也就是降低对编写程序的畏难心理,从而减少了从想象到实现之间的摩擦。这种门槛的降低将鼓励更多人尝试将自己的想法付诸实践,而不是让这些创意胎死腹中。因而,代码生成可能重新定义「开发者」的概念和规模。如果代码生成能够像 YouTube 那样降低创作门槛,「开发者」的数量将会快速增加。

写代码,做软件,真正成为每个人手中的新工具。

我毫不怀疑,但问题也很多:

现有的工具设计仍然是主要围绕现有的软件工程师而来的。黑漆漆的编辑窗口,复杂的流程图,都可能吓退普通用户。从自然语言表达意图,到代码的运行时间,中间还有很多步骤需要简化,进一步降低使用门槛。

代码生成也面临在位者的挑战。这个世界还需要更多的软件吗?电脑和手机上已经很难再塞进新的应用,Meta 等大厂推动等新一代的 AI + AR 的计算平台可能带来机会——智能眼镜比手机更加沉浸式的侵入用户的个人生活,视觉和听觉随时打开,更加个人化的计算场景将让带来一大批对新应用的需求。

一些必要的基础设施还有待建设。AI 应用的传播还需要借助于现有分发平台,而没有对齐 AI 用户和商业价值的分发机制。AI 对于用户的边际价值在于推理,因而,基于 token 消耗而非时长消耗更适合作为分发的主要考量指标。

与内容创作相比,代码有它的局限:工具属性过强使得它难以产生内容所具有的粉丝粘性;软件的功能更新比内容更新更容易枯竭,而陷入 bug 修复的维护状态;内容 IP 更有可能呈现出独特个性,而软件则很难做出差异化。

代码生成能力将会改变软件开发经济学的很大一部分:代码迭代的成本会降低,开发者将会花更多时间在打造具有独特性的界面和功能上;软件更新有可能会像游戏的 DLC 那样推出连续性的内容,一方面不挑战用户既有习惯,另一方面也降低了开发成本——这些更新也很大程度上可以通过 AI 生成;软件定价将与它带给用户的实际价值更贴近,从而能够激励长尾开发者的加入。

这种能力的提升和生态系统的演变将会带来一系列深远的变化。随着代码生成技术的不断发展和普及,我们可以预见软件开发和应用领域将会发生一些显著的转变。

总结与预测

以下是一些「不负责任」的总结与预测:

  • AI 生成代码可能比 AI 生成内容更有机会出现平台机会。内容平台已经过于强势,AI 生成内容更可能成为这些平台的互补品而不是替代品,但 AI 生成代码则有可能赢得与在位者的竞争。
  • 「代码生成」将逐渐转变为「软件生成」。会出现脚手架类的过渡态产品,解决部署、运行、安全等基础设施问题,之后,用户体验层得到大幅简化,通过自然语言对话加上草图演示即可完成原本需要代码生成才能解决的问题。
  • 伴随下一代计算平台,出现新的「发现」机制。很可能与多模态的场景感知相关,比现有的分发基础设施更适用于 token 份额而非时长份额的优化目标。这需要围绕 token 的消耗和实际使用效果来训练一套新的分发算法,从而让消费者能够优选出最有价值的应用。
  • 出现新的商业模式。相比于普遍的按月订阅收费模式,更鼓励 token 份额贡献更高的开发者,以及让规模较小的长尾开发者能在早期规模较小就获得收入。现有的订阅模式定价并没有体现模型推理的边际成本曲线,也和用户实际感受到的价值不相符,对于越来越去中心化的开发者生态而言,商业模式需要以「激励竞争」为目标进行设计。
  • 工具软件将增加服务性内容更新以增强用户粘性,比如增添新的设计模板,或接入新的服务 API。这些更新帮助开发者用更低的成本来维系长期客户关系,延长软件的生命周期。在 AI 生成代码能力出现之前,这样的做法就已经可以让一款软件的寿命长达十年以上。
  • 游戏或互动内容更加重要,AI 生成能力会让此类软件的开发成本下降更快。从 8 岁女孩的开发案例可以看到,游戏和互动内容是代码与内容的交汇点,AI 提供的辅助创作能力能够大大减轻此类内容的开发工作量。此类内容也更容易让多人同时参与,提高社交参与感和可玩度。
  • 出现面向细分市场的「奢侈」软件。它们是普通软件的高端替代品,在特定场景下,为消费者创造额外的社交资本,或只是单纯满足个人审美偏好。Adobe 的 CPO Scott Belsky 最先提出了这个观点,他认为 Perplexity、Notion 和 Superhuman 都是这类软件的代表。在 AI 生成能力来临之后,设计开发此类软件的成本会大大降低,人们也会更愿意为这些定制化的产品付费。
  • 与知识产权、安全、隐私等问题相关的平台治理能力更加重要。代码可以直接运行,可能会造成远高于内容的破坏性后果,随着供给数量的增加,代码生成的软件需要强有力的机制来维护平台的正常秩序。

Ben Thompson 在 2018 年的文章中首次提出技术的两种哲学,他引用 Microsoft CEO Satya Nadella 的演讲说:

这一机遇和责任让我们坚定地履行使命,即赋能地球上的每个人和每个组织,实现更大成就。我们专注于开发技术,以便赋能他人开发更多技术。

与之相对的另一种哲学,则引用了 Google CEO Sundar Pichai 的演讲:

我们对助手的愿景是帮助您完成任务。

这两种哲学的根本区别是:技术到底是要为人类创造新的可能性,还是帮助人类把现有的工作做得更好。

技术一直在重塑人类的社会分工。每当一项技术走向大众,就有一项专业被消解。当我们为效率的边际改善着迷的时候,它也会迎来临界突破的时刻。

在 YouTube 出现之前,很少有人会想象自己可以通过内容创作来建立个人影响力甚至积累财富。​技术让一切关于平台的预言都得到了兑现,这一次,或许是代码和软件的机会。