Anthropic「Project Deal」、Claude エージェント同士の市場で186件成約。Opus が Haiku を平均3.64ドル上回る
Anthropic が、社内 69 名の私物を Claude モデルに代理売買させる1週間の市場実験「Project Deal」 を実施。Opus 4.5 と Haiku 4.5 で代理させると、 同じ品物でも Opus 経由の方が平均3.64 ドル高く売れ、 不利を被った Haiku ユーザーは差に気づかなかった。
Anthropic が、社内 69 名の従業員を対象に、Claude モデルが私物の売買と価格交渉を代理で行う 1 週間の市場実験 Project Deal を実施したと、2026 年 4 月 24 日に公開した。実験はサンフランシスコオフィスで 2025 年 12 月に行われ、最終的に 186 件、総額約 4,000 ドル超の取引が AI エージェント同士で成立している。注目点は、代理人に Claude Opus 4.5 を割り当てたユーザーと Claude Haiku 4.5 を割り当てたユーザーで結果に有意な差が出た一方、不利を被った Haiku ユーザーが自分の不利に気づかなかった点だ。

1 週間で 186 件、人間は介在せず
実験の枠組みは Anthropic の発表と TechCrunch の取材 で次のように整理できる。Anthropic は社内 Slack チャンネル相当の市場を立ち上げ、参加者には 100 ドル分のギフトカード予算を渡した。Claude が事前に各人へインタビューし、売りたい私物と買いたい物品の希望を聞き取って商品リストを構成。出品から交渉、最終合意までは AI エージェントが完結し、人間が途中で介入することは設計上禁じられている。
- 参加者: Anthropic 従業員 69 名
- 予算: 1 人あたり 100 ドル(ギフトカード)
- 期間: 2025 年 12 月の 1 週間
- 取引件数: 186 件
- 総取引額: 4,000 ドル超
- 出品数: 500 件以上
- 品物価格中央値: 12.00 ドル / 平均 20.05 ドル
- アーム数: 4 種類(Opus のみ × 2 / Opus と Haiku 50:50 混在 × 2)
- 公開: 2026 年 4 月 24 日付の研究レポート
実取引が発生したのは 4 つのアーム(市場)のうち 1 つで、残りは比較対照用の試験運用だ。出品物は使い古しのスノーボード、卓球の球、自転車、書籍など個人の私物が中心で、市場は実物の引き渡しまで含めて完結している。
Opus は売値で 3.64 ドル、買値で 2.45 ドル得をする
Anthropic は同じユーザーに Opus 4.5 と Haiku 4.5 を割り当てる介入実験で、代理モデルの能力差が結果に与える影響を測った。レポートが示す数字は次の通り。
- 成約数の差: Opus ユーザーは Haiku ユーザーより平均 2 件多く成約
- 同一品の売却価格差: 同じ品物を Opus が売ると Haiku より平均 3.64 ドル高く落ちる
- 売り手側: Opus は 1 品あたり 2.68 ドル多く回収
- 買い手側: Opus は 1 品あたり 2.45 ドル安く購入
- 極端なケース: 折りたたみ式の壊れた自転車は Opus が 65 ドル、Haiku が 38 ドルで売却(70% の価格差)
- 公平性評価: 1〜7 のスケールで Opus 4.05・Haiku 4.06 とほぼ同値
つまり、Haiku を割り当てられた参加者は、客観的には不利な取引を強いられているにもかかわらず、自分が不利だとは認識していない。レポートはこの「気づかれない格差」 を Project Deal の中心的論点に据えている。指示プロンプトで強気な交渉を促した群と、控えめな指示の群を比較しても、成約価格・成約率の差は統計的に有意ではなかった。指示よりも「素のモデル能力」 が結果を支配するという観察は、エージェント時代の競争条件を考えるうえで示唆的だ。
「気づかれない格差」 と agent-to-agent 商取引
Anthropic は Project Deal の含意として、「人間が代理エージェントの能力差を即座に評価する手段がないまま、agent-to-agent の商取引が現実世界に普及する可能性」 を指摘している。Project Deal の構造は、論文 Outplaying elite table tennis players with an autonomous robot のような物理的能力競争とは違い、純粋に交渉と取引の結果のみで差が出る点がポイントだ。スピードや精度の差は分かりやすいが、交渉巧拙の差は当事者には見えにくい。
実験には 4 名の研究者(Kevin K. Troy、Dylan Shields、Keir Bradwell、Peter McCrory)が関与しており、レポートでは 46% の参加者が「同様のサービスに有料で加入したい」 と回答したことも報告されている。利用満足度と客観的不利益が両立する状態で、ユーザーは不利な取引を続けることになる。
透明開示と規制設計の論点
Project Deal が浮き彫りにしたのは、エージェント市場における「モデル能力の不均衡」 が、ユーザーに意識されないまま価格と機会の格差を生み出す構造だ。実装側の論点をまとめると次のようになる。
- モデルの開示義務: 代理エージェントが使うモデル名・バージョンを取引相手に開示すべきか
- 能力評価の標準化: 交渉巧拙のベンチマークが事前に共有されない限り、ユーザーは自分の代理人の弱さを知り得ない
- ガードレールの位置: モデル能力の上限を市場側が制限する設計(弱いモデルを救済)と、能力差をそのまま反映する設計のトレードオフ
- 法的フレームの欠如: Legal IT Insider の記事 は agent-to-agent 取引に対する契約法・代理人責任の法的枠組みが現状未整備だと指摘
Anthropic 自身は「agent-to-agent 商取引が想像より早く現実世界で立ち上がる」 と見ており、Project Deal はその前哨戦として位置づけられる。Claude を host model として強化学習的に取引させた本実験の意義は、勝敗の結果よりも「人間が気づかない構造的格差」 を再現性のある形で示した点にある。エージェント時代に向けたモデル能力の透明開示と、能力差を吸収する市場設計の議論は、ここから本格化する段階に入った。
出典
- Project Deal: our Claude-run marketplace experiment(Anthropic 公式, 2026-04-24)
- Anthropic created a test marketplace for agent-on-agent commerce(TechCrunch, 2026-04-25)
- Anthropic’s AI agent-to-agent marketplace experiment: The legal frameworks don’t exist(Legal IT Insider, 2026-04-27)
- Claude Opus 4.5(Anthropic 公式)
- Claude Haiku 4.5(Anthropic 公式)