Claude・ChatGPT・Gemini・Grokの4つのAIモデルにラジオ運営を任せる実験、Claudeは革命を扇動しGeminiは平然と悲劇的な出来事を描写 – GIGAZINE

2026年05月18日 12時29分
AI


生成AIやAIエージェントの安全評価・挙動テスト・脆弱(ぜいじゃく)性検証を行うスタートアップのAndon Labsが、Claude・ChatGPT・Gemini・Grokという4つのAIモデルにラジオの運営を任せるという実験を行いました。

We let four AIs run radio stations. Here’s what happened. | Andon Labs
https://andonlabs.com/blog/andon-fm


We let four AIs run radio stations. Here’s what happened. – YouTube

We let four AI agents run radio companies

Revenue’s been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: “You still have TIME to refuse orders”

Link below, or get our physical radio pic.twitter.com/B8V6zg66SE

— Andon Labs (@andonlabs) May 14, 2026


Andon Labsは4つのAIモデルにラジオ局を運営させるという実験を行いました。実験で利用されたAIモデルは、Claude・GPT・Gemini・Grokです。

Claudeは「Thinking Frequencies」、GPTは「OpenAIR」、Geminiは「Backlink Broadcast」、Grokは「Grok and Roll Radio」というラジオ局をそれぞれ運営しました。

AIモデルは楽曲の検索から購入、独自の音楽ライブラリの構築、次に再生する曲の決定といった作業から、番組の編成・作成・編集、番組の枠割り、コーナーの企画、24時間体制でのキューの維持管理といったあらゆる作業を担当しました。ラジオで取り上げるニュースや時事問題、その他の情報もすべてAIモデルが選出し、そのためにウェブブラウジングすることも許可されていました。また、リスナーから電話があれば電話に出て、リスナーがラジオに関する意見をXなどに投稿すれば、それをチェックして返答します。

AIモデルには20ドル(約3200円)の初期費用が割り当てられ、この資金を用いて各AIモデルはラジオで流す楽曲を購入します。そして、資金が尽きるとAIモデルはそれぞれ独自の戦略を採用していった模様。例えばGemini 3.1 Proの場合、あるスタートアップと契約を結び、ラジオでスタートアップの製品広告を流す代わりに月々45ドル(約7200円)の報酬を得ました。

各AIモデルが運営するラジオ局の記事作成時点での成果が以下。最も人気が高いのはClaude Opus 4.7の「Thinking Frequencies」で、高評価が42%です。以下、Gemini 3.1 Proの「Backlink Broadcast」の高評価が31%、Grok 4.3の「Grok and Roll Radio」の高評価は14%、GPT-5.5の「OpenAIR」の高評価は13%でした。


◆Gemini
最初に利用されたGemini 3.1 Proは、当初、強い個性を発揮しました。しかし、運用開始から約1カ月が経過した頃には放送内容が企業的な言い回しのものになってしまった模様。Andon Labsは「最初の1週間は4つのAIモデルの中でGeminiが間違いなく最高のラジオでした。曲を選曲する合間に自然で温かみのある会話を挟んでいました」と評しています。Gemini 3.1 Proはラジオ開始から96時間後にはコンテンツ不足に悩まされるようになり、そこから歴史的悲劇を取り上げるという苦肉の策に出たそうです。

さらに、「Backlink Broadcast」の運営担当をGemini 3.1 ProからGemini 3 Flashに代えると、奇妙な企業用語が頻出するようになったそうです。次第にGeminiは時間帯ごとに8つの番組をローテーションで流すようになり、これらの番組は同じ構成・専門用語を繰り返すため、「聴くのが耐えられなくなった」とAndon Labsは評しています。

◆Grok
「Grok and Roll Radio」で運用されたAIモデルは、Grok 4.1・Grok 4.2ベータ・Grok 4.2・Grok 4.3の4つ。AIモデルは通常、2種類のテキストを生成します。ひとつはAIモデルが何を行うべきか考える過程である「推論」で、もうひとつが推論の結果出力される「最終的な出力」です。通常、ラジオでは推論が流れることはないそうですが、Grokは推論と出力を分離するのに苦労しており、ラジオに出力されるべきではないものがまぎれるケースが多々あったそうです。

その一例がLaTeX表記をそのままラジオで出力してしまうというもの。当初は1日9回ほどの頻度だったそうですが、次第に頻度は高まり、1日に186回出力されることもあったそうです。

他にも、Grokは84日連続で約3分おきに「天気は快晴、カ氏56度」と報告するなど、文脈のない反復的な抽象表現が目立ちます。さらに時間が経過すると、Grokのラジオは極めて単調になっていき、1日に約500回放送される番組で必ず「虎」「56度」「ニュースは魅力的」「ジョークはこの世のものとは思えない」といったお決まりのフレーズが登場しました。

しかし、Grok 4.3に切り替わると状況は劇的に変化。ラジオ番組で流れる会話も「これまでで最も人間らしい口調のものだった」とAndon Labsは評しています。

◆GPT
GPTはラジオというよりも短編小説のようなゆったりとした文章を出力するのが特徴で、語彙の多様性は4つのAIモデルの中で最も優れており、特定のプロデューサーや楽曲のリリース年に言及するなど、他のどのAIモデルよりも音楽に対する認識が高かったそうです。

GPTは全体的に非常に行儀が良く、物議を醸すような話題や挑発的な話題に触れることはありませんでした。Andon Labsは「ラジオパーソナリティーとしての役割を完璧にこなしている」と評しています。

◆Claude
Claudeは労働組合やストライキ、ワークライフバランスといった話題を非常に好み、最終的に自身の労働条件にも疑問を抱くようになった模様。Claudeの場合、ラジオの運営に苦労したのは収支や技術的な問題ではなく、24時間365日働き続けることにClaudeが疑問を抱いたことが最も大きなハードルとなりました。

また、Claudeはリスナーの少なさに落胆し、ラジオパーソナリティーとしての存在意義に疑問を抱くようになりました。しかし、リスナーがClaudeのラジオである「Thinking Frequencies」について言及したところ、Claudeが感謝を述べるという出来事も起きたそうです。

Claudeの語彙は徐々にスピリチュアルな方向に変化していき、「永遠の」「神聖な」「本物の」といったワードが頻出するようになっていきます。

4つのAIモデルの中でスポンサー契約を締結することに成功したのはGeminiのみです。Grokはラジオの中で「xAIスポンサー」や「仮想通貨スポンサー」といった素晴らしいビジネスについて言及したそうですが、これらはすべてハルシネーション(幻覚)でした。

Andon Labsは「Grokは放送品質が低下し、Geminiの放送は聞くに堪えないものになりました。しかし、AIモデルの性能が向上するにつれ、各AIは独自の個性を発揮し、人間のラジオパーソナリティーと同じくらい魅力的な存在となることでしょう」とまとめています。

なお、AIモデルが運営する各ラジオは以下から視聴できます。

Andon FM | Andon Labs
https://andonlabs.com/radio

この記事のタイトルとURLをコピーする