
Sakana AIが複数のAIモデルを束ねる新システム「Sakana Fugu(サカナ・フグ)」を発表し、一部ベンチマークで米Anthropicの最先端モデル「Claude Mythos Preview(クロード・ミュトス)」級、もしくはそれを上回る性能をうたったことがわかりました。
東京発のAIスタートアップSakana AIは6月22日、複数の大規模言語モデル(LLM)を内部で連携させ、利用者には単一モデルのように提供する新システム「Sakana Fugu」の提供を始めたと発表しました。 同社は、米Anthropicのフロンティアモデル「Claude Fable 5」や「Claude Mythos Preview」に比肩、あるいは一部タスクで上回る性能を備えると説明し、日本発の“集合知”型AIとして国内外の関心を集めています。
Sakana Fuguは、複数のクローズドモデルとオープンモデルを「エージェントプール」として束ね、タスクの内容に応じて最適な組み合わせを自動選択する仕組みです。 利用者側はOpenAI互換の単一APIを呼び出すだけでよく、どのモデルをどの順番で使うかといったオーケストレーションは、すべて内部で完結する構造になっています。 料金は月額20ドルからのサブスクリプションと従量課金の両方が用意されており、既存の生成AIサービスと同様の価格帯で導入できるとされています。
上位版「Fugu Ultra」は、コーディングや推論、科学分野のタスクなどを対象とするベンチマーク「Terminal-Bench 2.1」で、Anthropicの「Claude Fable 5」を上回るスコアを記録したと説明されています。 また、複雑な図表の読解能力を測る独自指標「Charxiv Reasoning」では、「Claude Mythos Preview」を超える性能を示したとし、「一部タスクではミュトス越え」をアピールしました。 一方で、Sakana AI側は、ベンチマークの結果があくまで自社の測定環境に基づくものであり、全ての利用シーンで優位性を保証するものではないと注釈を付けるなど、慎重な姿勢も見せています。
Sakana AIはこれまでも、既存モデルを組み合わせて新たなモデルを生み出す「モデルマージ」の技術などで注目されてきました。 6月にはリサーチ業務に特化したエージェント型サービス「Sakana Marlin」を提供開始しており、長時間の自律的な調査を可能にする独自探索技術「AB-MCTS」を強みに掲げています。 今回のSakana Fuguは、こうしたモデル運用の知見をインフラレベルに落とし込んだものであり、同社が掲げる「複数モデルの集合知」を事業の中核に据える動きが一段と鮮明になった形です。
規制と供給リスクをにらむ日本発プラットフォーム 企業のAI戦略に波及も
Sakana Fuguが注目される背景には、国外フロンティアモデルへのアクセス制約という地政学的リスクがあります。米Anthropicの最新モデル「Fable 5」や「Mythos 5」については、米政権による安全保障上の懸念から、輸出規制や提供制限が強化され、各国の研究機関や企業が影響を受けています。 Sakana AIは、規制や政策の変更によって特定ベンダーのAPIへのアクセスが一夜にして断たれる可能性を指摘し、重要インフラや金融、行政が単一の海外モデルに依存する構造は「現実的な弱点」になり得ると強調しています。
Sakana Fuguは、内部のエージェントプールに国内外の複数モデルを取り込み、性能と供給リスクのバランスをとる「オーケストレーション層」として機能することを目指しています。 将来的には、同社が開発する独自モデル「Namazu」シリーズやオープンウェイトモデルも順次追加し、規制環境の変化に応じて構成を柔軟に入れ替えられるようにする方針です。 これにより、企業側は「どのモデルを採用するか」ではなく、「どのプラットフォームを入り口にするか」という選択に軸足を移せる可能性があります。
国内AI市場では、OpenAIやAnthropicといった海外勢に比べ、日本発のフロンティアモデルや基盤サービスは依然として少数にとどまっています。 そのなかで、Sakana AIが“集合知”型モデルを掲げ、海外モデルと競合し得る性能と、供給面のリスクヘッジを同時に訴求したことは、企業のAI調達戦略に新たな選択肢を提示する動きと言えます。 今後、国内の大企業や公共セクターがどこまでこうした日本発プラットフォームを採用していくのか、規制強化と技術革新のはざまで、その動向が注目されます。