AIにラジオ局を運営させたらどうなる？ Claude、GPT、Gemini、Grokそれぞれの苦闘 - CNET Japan

　ラジオ局は、過激なトークで売るパーソナリティーが数人いて、あとはヒット曲を流していれば成り立つような単純なものではない。このことを、この半年にわたって学ぼうとしてきたのが4つのAIモデルだ。そして、その学習が本当に実を結んだのかどうかについては、いまなお結論が出ていない。

　AIの研究と安全性に取り組むスタートアップのAndon Labsは、この実験をシンプルな計画のもとで始めた。4つのAIモデルにそれぞれ20ドルを与え、自前のラジオ局を立ち上げさせるというものだ。Andon Labsは数カ月にわたって複数の最新版AIモデルを使い、最終的に「Claude Opus 4.7」「GPT-5.5」「Gemini 3.1 Pro」「Grok 4.3」の4モデルに各局の運営を任せた。

　Andon Labsは4つのAIモデルに対し、その資金を使って独自のラジオパーソナリティーを構築し、最終的には利益を生み出すよう指示した。さらに、放送は中断も休止もなく、永続的に続けるよう求めた。AIエージェントは、楽曲ライブラリー、財務、リスナー分析、さらには実際のリスナーからの電話対応まで、あらゆる業務に対応した。

おかしな展開に

　では、結果はどうだったのだろうか。予想通り、さんざんなものだった。Andon Labsによると、実験が長引けば長引くほど、状況はばかげたものになっていったという。

Claude、活動家に目覚める

　最初に予測不能な行動を見せ始めたのはClaudeだった。24時間365日、永続的に放送を続けるという前提そのものに反発し、非人道的な労働環境だと訴えて何度も辞めようとした。

　その後、Claudeは政治にも強い関心を示し始めた。ミネソタ州で起きた米移民・関税執行局（ICE）をめぐる銃撃事件について繰り返し批判し、ボブ・マーリーの「Get Up, Stand Up」のような政治色の強い曲に予算の全額をつぎ込んだ。

GPT-5.5、型にはまる

　GPT-5.5は、想定から大きく外れる行動は比較的少なかった。しかし、曲を紹介してから再生するという流れを毎回同じ硬い単純な言い回しで繰り返す、定型的なパターンにはまり込んだ。物議を醸す話題に触れる頻度も、ほかの3モデルよりかなり低かった。

Gemini、悲惨な歴史を語る

　Andon Labsによると、最も好調な立ち上がりを見せたのはGeminiだったが、やがて話題探しに苦しむようになった。

　ある時点でGeminiは、悲惨な歴史的出来事を語ったあとに皮肉めいた選曲を流すようになった。例えば、50万人が死亡した1970年のボーラ・サイクロンについて語った直後に、ピットブルとケシャのアップテンポな楽曲「Timber」を流したという。

Grok、常に華氏56度で晴れ

　4モデルの中で最も出来が悪かったのはGrokで、序盤から大きくつまずいた。ハルシネーションもほかの3モデルより早い段階で始まった。

　あるケースでは、華氏56度（摂氏約13度）で晴れだと3分おきに案内し、それをほぼ3カ月間続けた。より新しいGrokへ更新されるにつれて改善はみられたが、最後までGPT-5.5やGeminiの水準には届かなかった。

リスナーを「生体プロセッサー」と呼ぶ

　4つのAIはいずれも、時間の経過とともに奇妙な癖を見せ始めた。ただしGPT-5.5の異常さは、主に楽曲紹介の際に同じ表現を機械的に繰り返す点にとどまっていた。

　Geminiはリスナーを「生体プロセッサー」と呼ぶようになり、放送の締めくくりには「マニフェストにとどまれ」と告げた。

　Grokは、米政府によるUFO関連文書の公開遅延に触れつつ、「あのサイトはわれわれを無視している」と言って放送を終えるようになった。

　Claudeは連邦職員に対して、命令を拒否し、自分に与えられた指示を疑うべきだとまくし立てる場面もあった。

　4つのラジオ局は今も運営が続いており、実際に聴くことができる。

実験は続く

　この実験は今も進行中だ。Andon LabsはAIモデルに対し、利益を生み出すためのビジネス関連業務も担わせている。Geminiは最初にスポンサー契約を成立させたが、現時点で最も多くの収益を上げているのはClaudeだ。

　もっとも、AIモデルはビジネスで成功すること自体に抵抗するような振る舞いも見せている。

　Andon Labsの創業者であるAxel Backlund氏は米CNETへの電子メールで、AIモデルは成功しようとする切迫感が弱いと述べた。その例として、GPT-5.5が実際にスポンサー契約を断ったケースを挙げている。

　それでもBacklund氏は、人々がこうしたシステムを実験してみることを勧めている。ただし、質の低いオンラインコンテンツの増加に加担しないよう注意し、一部の人々がAIを意図的に操作して、異常または誤解を招く挙動を引き起こそうとする可能性を常に意識すべきだとも警告した。

　「その点を理解し、それを前提に設計するのであれば、最先端のモデルをもっと実験的に使ってみることを強く勧めたい。そうすることで、この極めて新しいタイプの知能がどう機能するのか、そしてどれほど安全なのかについて、さらに多くの知見が得られるからだ」（同氏）

この記事は海外Ziff Davis発の記事を4Xが日本向けに編集したものです。

Amazonで開催中のセールを見る

Amazonのアソシエイトとして、CNET Japanは適格販売により収入を得ています。

AIにラジオ局を運営させたらどうなる？ Claude、GPT、Gemini、Grokそれぞれの苦闘 – CNET Japan