当 AI 学会自己付钱,大厂们在背后抢什么
来源:Tiger Research
作者:Ekko 、Ryan Yoon
原标题:AI Agent Payment Infrastructure: The Direction of Crypto and Big Tech
编译及整理:BitpushNews
一个由 AI 驱动、自动化引领的时代正在临近。为了让自动化变得真正“自主”,它必须具备原生的支付能力。市场已经开始为这一转变进行布局。
核心观点
-
付款主体正在从人类转向 AI Agent,使支付基础设施成为实现真正自主的核心要求。
-
科技巨头优先考虑便捷性和消费者保护,而加密货币则强调用户主权和更广泛的 Agent 级执行能力。
-
未来的关键问题在于:支付是由平台控制,还是由开放协议执行。
1. 支付不再是人类的专属

来源:macstories (由 Federico Viticci 提供)
最近,“OpenClaw” 引起了广泛关注。与 ChatGPT 或 Gemini 等主要负责检索和组织信息的 AI 系统不同,OpenClaw 能够让 AI Agent 直接在用户的本地 PC 或服务器上执行任务。
通过 WhatsApp、Telegram 和 Slack 等即时通讯平台,用户可以发布命令,Agent 则自主执行包括邮件管理、日历协调和网页浏览在内的任务。
由于它作为开源软件运行,且不绑定于特定平台,OpenClaw 的功能更像是一个私人 AI 助手。这种架构因其灵活性和用户级控制力而备受青睐。
然而,一个关键的限制仍然存在:为了让 AI Agent 实现完全自主,它们必须能够执行支付。 目前,Agent 可以搜索产品、比较选项并将商品添加到购物车,但最终的付款授权仍需要人类批准。
从历史上看,支付系统是围绕人类行为者设计的。在 AI Agent 驱动的环境中,这一假设不再成立。如果自动化要变得完全自主,Agent 必须能够在定义的约束条件下,独立进行评估、授权并完成交易。
预见到这一转变,主要的科技巨头和加密原生项目在过去一年中都推出了旨在实现 Agent 级支付的技术框架。
2. 科技巨头:构建在现有基础设施上的 Agent 支付
2025 年 1 月,Google 推出了 AP2 (Agent Payment Protocol 2.0),扩展了其 AI Agent 支付基础设施。虽然 OpenAI 和 Amazon 也概述了相关计划,但 Google 是目前唯一拥有结构化实施框架的大型公司。
AP2 将交易过程分为三个授权层 (Mandate Layers)。这种结构允许对每个阶段进行独立的监控和审计:
-
意图授权 (Intent Mandate): 记录用户想要做什么。
-
购物车授权 (Cart Mandate): 定义如何根据预设规则执行购买。
-
支付授权 (Payment Mandate): 执行实际的资金转账。
场景示例:Google AP2 的运作方式

假设 Ekko 要求 Google Shopping 上的 AI Agent “寻找并购买一件 200 美元以下的冬季夹克”。
-
意图授权: Ekko 指示 AI Agent 购买“一件冬季夹克,最高预算为 200 美元”。此信息作为数字合约记录在链上,被称为意图授权。
-
购物车授权: AI Agent 遵循所述意图,在合作伙伴商家中搜索符合“一件冬季夹克”和“最高预算 200 美元”的产品,并将符合条件的商品添加到购物车。
“已选商品:冬季夹克”,“价格验证:199 美元(符合预算 ✓)”
已加入购物车”,“送货地址已确认”。
-
支付授权: Ekko 确认 AI Agent 选择的商品,并点击支付批准按钮。199 美元通过 Google Pay 处理。或者,AI Agent 也可以在预定义参数内自动完成支付。
在整个过程中,用户无需输入额外信息。就 Google AP2 而言,该系统运行在 Google Pay 之上,并利用预先注册的卡片详情和送货地址。由于 AP2 依赖于现有的用户凭据,它减少了入驻摩擦并简化了普及过程。

来源:Google
然而,Google 目前仅支持其合作伙伴网络内的公司进行基于 Agent 的支付。因此,其使用范围仍局限于受控的生态系统内,限制了更广泛的互操作性和开放访问。
3. 加密货币:自托管与开放交换
加密领域也在为 AI Agent 开发支付基础设施,但方法与大厂不同。大型平台是在受控生态系统内建立信任,而加密领域则从一个不同的问题开始:在不依赖中心化平台的情况下,AI Agent 能够被信任吗?
两个核心标准旨在实现这一目标:以太坊的 ERC-8004 和 Coinbase 的 x402。

身份与支付的结合
首先考虑身份层。就像人类需要 ID 访问数字服务一样,在区块链网络上运行的 AI Agent 也必须是可识别的。ERC-8004 就发挥了这一功能。
它以 NFT 的形式发布,但不是作为媒体类的收藏品,而是一种包含结构化身份数据的凭证 NFT。每个代币包含三个组成部分:
-
身份 (Identity)
-
声誉 (Reputation)
-
验证 (Validation)
这些元素共同构成了一个可验证的链上身份证书。在电子商务中,参与者在交易前会审查评分和交易历史,同样的逻辑也适用于 AI Agent。ERC-8004 为 Agent 提供了可验证的凭证,允许其他 Agent 根据透明数据评估交易是否合适。
然而,仅有身份并不能实现价值转移,还需要一种支付机制。这一角色由 x402 承担。
如果说 ERC-8004 是数字身份证,那么 x402 就是支付轨道。x402 由 Coinbase 开发,是 AI Agent 的加密原生支付标准。它使 Agent 能够使用稳定币进行自主交易。
其核心功能是自动化智能合约执行。诸如“满足预定义标准后自动转账”之类的条件逻辑直接嵌入在代码中。一旦条件满足,结算就会在无需人工干预的情况下发生。
当用于身份的 ERC-8004 和用于支付的 x402 结合时,AI Agent 可以在不依赖中心化平台的情况下验证交易对手并执行交易。信任和结算是在协议层面处理的,而非通过平台控制。
场景示例:基于 ERC-8004 和 x402 的 Agent 间商业

假设一个近未来的 AI Agent 环境:Ekko 指示他的 AI Agent(Agent A)购买一台最高预算为 800 美元的二手笔记本电脑。市场运行着自己的 AI Agent(Agent B),它直接与 Ekko 的 Agent 沟通以执行交易。
-
相互验证:
在交易之前,两个 Agent 都会核实对方的凭证,并确认产品符合特定要求。
-
身份检查:通过 ERC-8004 NFT 验证
-
Ekko 的 Agent:声誉评分 72,确认余额 800 美元
-
卖家的 Agent:声誉评分 70,确认符合条件的笔记本库存
-
结果: 两个 Agent 均获准进行交易。
-
智能合约托管:
验证完成后,交易开始。每个 Agent 通过 x402 协议进行交互,以转移和确认资金。
-
托管:800 美元从 Ekko 的 Agent 钱包转移到智能合约。
-
条件锁定:资金保持锁定状态,直到确认收货。
-
释放: 确认送货后,800 美元自动转账给卖家。
-
结算与声誉更新(x402 结算与声誉 NFT 更新):
结算后,两个 Agent 的声誉记录都会更新。
-
Ekko 的 Agent:声誉 72 → 80(+5 快速交付,+3 描述相符)
-
卖家的 Agent:声誉 70 → 78(+5 快速交付,+3 描述相符)
-
更新后的评估记录被写入每个 Agent 的 ERC-8004 NFT 中。
在整个过程中,没有中介参与,不需要平台批准。两个 AI Agent 通过基于区块链的验证和结算直接进行交易。这反映了 Agent 对 Agent 商业的加密原生模式。
4. 科技巨头 vs 加密货币:AI Agent 运行领域的差异

控制 vs 开放
Google AP2 代表了一种为获批合作伙伴设计的受控模型。
Google 将市场参与限制在经过审查的商家,理由是保护消费者。即使有了结构化的授权框架,Agent 的行为也无法得到完全保证。与输入输出直接匹配的确定性系统不同,AI Agent 的执行会产生概率性的结果。
如果 Agent 连接到一个不可靠的合作伙伴并发生交易错误,责任最终可能会落在支付基础设施提供商身上。为了将故障概率哪怕降低 0.01%,Google 也有动力缩小其生态系统。这种受限的生态系统提高了稳定性和监管能力,但也可能限制 Agent 在更广泛的市场中自主运行并跨多种选项进行优化的能力。
相比之下,ERC-8004 和 x402 反映了一种更开放的架构。 加密模式旨在实现无许可和互操作性,而非绑定于平台。
效率与用例
AI Agent 仍处于早期开发阶段。从复杂请求到自主支付的端到端执行尚未实现无缝衔接。然而,预期的长期情景是 Agent 独立管理日常消费。例如,用户可能指示 Agent 补货杂货,Agent 会评估库存缺口并自动完成购买。
大型平台可能会尝试聚合主要的零售渠道,以在统一环境中支持这种模式。这种方法可以在受控框架内实现可靠的日常使用场景。然而,要整合所有潜在的交易对手(包括小型在线商家、独立网站、去中心化金融协议和交易场所),封闭生态系统面临着结构性限制。
此外,如果数字内容越来越多地转向付费访问模式,Agent 可能需要执行高频微支付。开放的加密标准可能具有结构性优势。 例如,一个 AI Agent 可以以每单位 0.01 美元的价格购买 1,000 张创作者生成的图片,或者支付 1 美元访问一篇研究文章。对于小额、可编程的支付,加密原生轨道可能提供更高的运行效率。
也就是说,缺乏中心化机构也带来了权衡。身份评估标准必须以去中心化的方式建立,且没有单一实体对失败承担最终责任。在开放性与问责制之间取得平衡仍是一个关键的设计挑战,这将取决于技术成熟度和易用性的提升。
总结
科技大厂和加密领域都在追求同一个目标:实现自主的 AI Agent 商业。 区别在于架构。大厂倾向于封闭、受控的系统,而加密领域则推动开放、基于协议的模型。
这并非一个零和博弈,更可能的轨迹是两种方法之间的互操作性。在当前的技术进步阶段,持续的开发必须将可靠性和用户体验放在首位。
Twitter:https://twitter.com/BitpushNewsCN
比推 TG 交流群:https://t.me/BitPushCommunity
比推 TG 订阅: https://t.me/bitpush
(来源:比推)
