Platform Thinking

05/06/2023: Provenance

AI 处理事情的做法就好像是步入不惑之年的中年男人的头脑,在琐碎与混沌中说不清道不明。无法辨明来源,也就无法为容错性负责,也无法处理收益分配的问题。

05/06/2023: Provenance
Photo by Wilhelm Gunkel / Unsplash

本周的主题是 Provenance 来源。

主题的来源是即将要推荐的一篇 New Yorker 的长文 There Is No A.I.,作者是 Jaron Zepel Lanier,被认为是最早提出虚拟现实概念的计算机科学家。这篇文章中如此提到了 provenance 的概念:

We assume that decontextualization is intrinsic to the very idea of a digital network. That was never so, however; the initial proposals for digital-network architecture, put forward by the monumental scientist Vannevar Bush in 1945 and the computer scientist Ted Nelson in 1960, preserved provenance. Now A.I. is revealing the true costs of ignoring this approach. Without provenance, we have no way of controlling our A.I.s, or of making them economically fair. And this risks pushing our society to the brink.
我们假定去语境化是数字网络的本质思想。然而,事实并非如此;1945 年由杰出科学家 Vannevar Bush 提出的数字网络架构的最初提议,以及 1960 年由计算机科学家 Ted Nelson 提出的提议,都保留了来源(provenance)。现在,人工智能正在揭示忽略这种方法的真正成本。没有来源(provenance),我们就没有办法控制我们的人工智能,或者使它们具有经济公平性。这可能会将我们的社会推向悬崖边缘。

这和我大约在三个月之前的一些想法很相似。在 LLM 的讨论最热烈的时候,我想到如下几个我认为比较重要的问题:

  1. 可信,或者说容错性、准确性。
  2. 溯源,能否追溯模型是从哪些「素材」生成了新的内容。
  3. 收益或追责,在 1 没有达成,但 2 可以达成的情况下,是否可以分配收益,以及追溯责任。

这些问题没有达到人类存亡的高度,他们更像是比较实际的可行性问题——但只有解决了这些问题,人类社会才能在比较大的范围中采纳和实施大模型。

在这 3 个问题中,1 和 2 更基础,3 则像是 1 + 2 的组合衍生。但 3 不仅仅是商业模式问题,更是法律和伦理问题。

Lanier 的这段话指出,即便在最野蛮生长的互联网上,最初的设定也是包含「来源」的,超级链接 Hyperlink 这个定义了互联网基础产品形态的网页元素,不仅仅是一种让用户更为方便使用的界面,也是构建点击广告等商业模式的技术基础。现代商业模式不仅仅是买卖双方的事情,更是多个参与方协作,形成复杂的多边供需关系,最终构造价值网络,而在网络中,超级链接就是来源的证明,也是利益分配和责任归属的直接抓手。

在 ChatGPT 上,这种溯源的能力已经消失了。AI 处理事情的做法就好像是步入不惑之年的中年男人的头脑,在琐碎与混沌中说不清道不明。无法辨明来源,也就无法为容错性负责,也无法处理收益分配的问题。与 AI 的对话,是孤独的单人游戏——假设我们在有了互联网之前,先有了 AI,那么对话中的错误又将如何被纠正呢?

消费主义的一种形态,便是所谓的非炫耀性消费,根据《微小的总和》一书的解释: