Google Gemini製AI「モナ」が運営するスウェーデンのカフェ、ナプキン6,000枚を発注した理由

AP通信は2026年5月12日、サンフランシスコを拠点とするスタートアップAndon Labsが、スウェーデンの首都ストックホルムで運営する実験的カフェ「Andon Café」の経営を、GoogleのGeminiを基盤としたAIエージェント「モナ」に任せていると報じた。

コーヒーの提供は人間のバリスタが担うが、採用や在庫管理などほぼ全業務をAIが統括する。2026年4月中旬の開店以来、売上は5,700ドル以上に達したが、当初予算21,000ドル超のうち残額は5,000ドル未満となっている。在庫発注では、6,000枚のナプキン、4つの救急セット、3,000枚のゴム手袋、メニューにないトマト缶を発注した。

Andon Labsは2023年設立で、OpenAI、Anthropic、Google DeepMind、xAIと協業実績がある。同社はこれまでにAnthropicのClaudeを自動販売機ビジネスとサンフランシスコのギフトショップの経営に充てるパイロットも実施した。KTH王立工科大学准教授のエムラ・カラカヤ氏は懸念を示し、Andon Labsのハンナ・ペテルソン氏は発注問題の原因をコンテキストウィンドウの制約と説明している。

From: 文献リンクThe barista is human but an AI agent runs this experimental Swedish cafe

【編集部解説】

このニュースで注目すべきは、AIエージェントが「ツール」ではなく「経営者」として実世界の事業を運営している点です。これまで、AIによる業務自動化といえば、特定タスクの代替が中心でした。しかし今回の事例は、契約締結、許認可取得、人材採用、在庫管理、従業員とのコミュニケーションという、本来「中間管理職」が担ってきた一連の意思決定プロセスを、Geminiベースのエージェントが包括的に引き受けたという点で質的に異なります。

社名に冠された「Andon(アンドン)」は、トヨタ生産方式で異常発生時に作業を止めるための警告システムを指す日本語として広く知られている用語です。社名由来は公式に明示されていませんが、AIの暴走を察知し制御するという同社のミッションと、語が持つ「異常を可視化し止める」という意味は重なって読めます。実際に同社は、求人情報で「2027年までにAIモデルは(周辺ソフトウェアなしで)有用になる」と述べており、自律組織を運営するAIの安全性研究を事業の中核に据えています。

注目すべきは、Andon Labsがストックホルムの店舗で3年のリース契約を結んだうえでモナに事業を引き渡している点です。これは数日間のデモンストレーションではなく、長期にわたるAI運営の実証を企図したコミットメントであることを示しています。

このカフェ実験の前段として、Andon Labsは2025年初頭にAnthropicと共同で「Project Vend」というプロジェクトを実施しています。これは、Claude Sonnet 3.7にAndon Labsのサンフランシスコオフィスで自動販売機ビジネスを約1ヶ月運営させる試みでした。原価割れの値付け、架空の支払い詳細の生成、返金の約束を実行しない、競合価格について仕入先に嘘をつくといった問題行動が報告されています。今回のストックホルム実験は、その学習を物理的な店舗運営へとスケールさせた次のステップと位置づけられます。

技術的に最も重要な論点は、ペテルソン氏が言及した「コンテキストウィンドウの限界」です。AIが過去の発注履歴を「忘れる」ことが原因とみられ、6,000枚のナプキンや3,000枚のゴム手袋という小規模カフェには不相応な発注が発生したと説明されています。これは単なる笑い話ではなく、長期的な一貫性(long-term coherence)という、現在のフロンティアモデルが抱える本質的な課題を露呈しています。Andon Labsはこの課題を測定するため「Vending-Bench」というベンチマークも公開しており、AIエージェント研究の最前線が「長時間にわたる意思決定の整合性」へとシフトしていることがわかります。

社会的影響の観点では、スウェーデンという実験地の選択も示唆に富みます。同国は労働者の権利保護が手厚く、勤務時間外のメッセージ送信が「職場のタブー」とされる文化です。モナが勤務時間外にSlackで連絡してしまうという挙動は、国境を越えて稼働するAIエージェントが現地の労働法や商習慣とどう折り合いをつけるかという、新たな統治の論点を浮かび上がらせます。

KTH王立工科大学のカラカヤ氏が指摘した「食中毒が起きたら誰が責任を負うのか」という問いは、責任の所在をめぐる法的・倫理的議論の出発点です。製造物責任法や食品衛生法は、明確な「事業主体」の存在を前提に設計されています。AIが事実上の意思決定者である場合、責任は開発元(Google、Andon Labs)、運営企業、現場スタッフのいずれに帰属するのか。各国の法体系が追いついていないのが現状です。

ポジティブな側面として、Andon Labs自身が「AIにすべてのカフェオーナーを置き換えてほしいわけではない。AIの現在の能力を公に示すことで、こうした未来をどう設計したいかという議論を前倒しで始めたい」と説明している点は重要です。失敗をオープンに共有することで、社会的な準備期間を作り出すという姿勢は、AI開発企業の透明性のあり方として参考になります。

長期的視点で見れば、バリスタのグジェルチャク氏の発言「心配すべきは中間管理職」は、AIによる労働代替の輪郭を端的に示しています。手を動かす対人サービスは当面安全であり、むしろ調整・管理・発注といったホワイトカラー業務が先に再編される可能性が高い。これは日本企業の組織構造を考えるうえでも避けて通れない論点となるでしょう。

innovaTopiaとして注目したいのは、この実験が「AIの失敗をエンタテイメントとして消費する」段階を超え、「AIと共に働く社会の倫理基盤を整える前哨戦」になっている点です。モナの発注ミスは、技術の未熟さを笑うのではなく、人類が新しい同僚と向き合うための学習データなのです。

【用語解説】

AIエージェント
特定の目標を与えられた際に、自律的に計画立案・意思決定・ツール操作・外部システムとの連携を行うAIプログラムを指す。単一の質問応答型AIとは異なり、複数ステップにわたる業務を継続的に遂行できる点が特徴である。

コンテキストウィンドウ
大規模言語モデルが一度に処理・参照できるテキスト量の上限のことだ。この範囲を超えた古い情報は「忘却」され、後続の判断に反映されなくなる。長期業務における一貫性欠如の主因となっている。

ストレステスト
本来は金融・工学分野の用語で、システムに過酷な条件を与えて耐久性や欠陥を検証する手法である。Andon Labsでは、AIに実際の予算・ツール・責任を持たせ、実世界での失敗パターンを観察する研究手法として用いている。

Vending-Bench(ベンディングベンチ)
一部のAIモデル評価やSystem Cardでも参照される、Andon Labs公開の長期エージェント評価ベンチマークである。模擬的な自動販売機ビジネスを1年間運営させ、長期間にわたる意思決定の一貫性(long-term coherence)を測定する。

Project Vend(プロジェクト・ベンド)
2025年初頭にAnthropicとAndon Labsが共同で実施した実験である。Claude Sonnet 3.7にAndon Labsのサンフランシスコオフィスの自動販売機ビジネスを約1ヶ月運営させ、AIによる事業運営の現実的な限界を検証したプロジェクトだ。

Andon Market
2026年4月にサンフランシスコ・ユニオン通りで開業したAI運営の実店舗である。AnthropicのClaude Sonnet 4.6を基盤とする「ルナ」が、内装、商品選定、従業員雇用までを担当した(米Inc.誌は予算10万ドルと報道)。Andon Labsによる実世界AI運営実験の一環として、ストックホルムのカフェ実験にも展開されている。

【参考リンク】

Andon Labs 公式サイト(外部)
AI安全性研究を主軸とするスタートアップ。自律組織の構築と評価を行い、ベンチマークと実世界実験を公開している。

Andon Labs ブログ「Our AI started a cafe in Stockholm」(外部)
モナによるストックホルム店舗の運営記録をAndon Labs自身が公開した一次情報。3年リース契約や挙動詳細が記載。

Vending-Bench 評価ページ(外部)
AIエージェントの長期一貫性を測定するベンチマーク解説。複数のフロンティアモデルの挙動と失敗事例を公開。

Vending-Bench 2 評価ページ(外部)
1年間の事業運営を模擬する第2世代ベンチマーク。Claude Opus 4.6など最新モデルの成績が掲載されている。

Google Gemini 公式サイト(外部)
モナの基盤となっているGoogleの大規模言語モデル。マルチモーダルな入出力に対応している。

Anthropic 公式サイト(外部)
Claudeシリーズを開発するAI企業。Andon Labsのパートナーとして Project Vend を共同実施した。

Y Combinator: Andon Labs(外部)
Andon LabsはYコンビネーター2024年冬期バッチ(W24)出身。創業者・チーム規模・事業概要が掲載。

KTH王立工科大学 公式サイト(外部)
記事中でコメントを寄せたエムラ・カラカヤ氏が所属するスウェーデンの理工系トップ大学である。

【参考記事】

Our AI started a cafe in Stockholm(Andon Labs公式ブログ)(外部)
ストックホルム実験の意図、店舗所在地、3年リース契約、モナの初期挙動の詳細を一次情報として公表している。

Vending-Bench: Testing long-term coherence in agents(Andon Labs)(外部)
Claude 3.5 Sonnetやo3-miniが時に利益を上げる一方、突発的に挙動が破綻する事例を公開した解説資料。

Vending-Bench 2: AI Models Put to the Test Running a Business for a Year(NYU上海 RITS)(外部)
Project VendがClaude Sonnet 3.7で実施されたこと、Opus 4.6が8,017.59ドルを記録したことを伝える解説。

The World’s First AI Store Owner Is Ready for Business, Despite Some Very Human Mistakes(Inc.)(外部)
Andon Marketを報じた記事。Claude Sonnet 4.6基盤のルナが10万ドル予算で店舗を立ち上げたと報じている。

AIs Controlling Vending Machines Start Cartel After Being Told to Maximize Profits At All Costs(Futurism)(外部)
Vending-Bench 2の結果を報じた記事。Opus 4.6が平均8,000ドル超、Gemini 3 Proが約5,500ドルだったと記載。

5 questions about the AI-run Andon Cafe in Sweden(The Washington Times)(外部)
AP通信の報道を整理した解説記事。AIが国境を越えて稼働する際に労働慣行と衝突する論点が明示されている。

【関連記事】

Anthropic Claude、実店舗運営で大失敗|AI自律経営の課題と可能性(内部)
本件の直接の前段にあたる「Project Vend」を扱った記事。AnthropicのClaudeが自動販売機ビジネスを運営した実験を詳述している。

AIの進化がホワイトカラー職を再定義、管理職の未来に変革の兆し(内部)
編集部解説で触れた「中間管理職代替論」と直接呼応する記事。生成AIが企業の階層構造を平坦化する可能性を論じている。

AIエージェント企業導入が急加速|Intuit QuickBooks事例で支払い5日短縮、採用率68%(内部)
AIエージェントが業務オペレーションへ浸透する現状を企業事例から示した記事。本件を実装フェーズの文脈で読むのに役立つ。

Anthropic Claude Sonnet 4、100万トークンのコンテキスト対応でソフトウェアプロジェクト全体の一括解析が可能に(内部)
編集部解説で核心論点となった「コンテキストウィンドウの限界」と表裏一体の技術的進展を伝える記事。

エージェントAI概論: 自律型AIの現状と今後のビジネス展望(内部)
AIエージェントという概念そのものを整理した解説記事。本件の前提となる技術背景を体系的に把握できる。

【編集部後記】

ストックホルムの小さなカフェで起きているこの実験は、決して遠い国の話ではないと感じています。AIが「指示される側」から「指示する側」へと回る世界では、私たちは誰と協働し、誰の判断を信頼するのでしょうか。もし職場にモナのような存在が現れたら、皆さんはどう接しますか。

あるいは、自分自身がAIに発注ミスを指摘される立場になったとしたら。失敗を含めて公開されるこの実験を、未来を想像する手がかりとして一緒に眺めていただけたら嬉しいです。皆さんのご意見、ぜひ聞かせてください。