AGIが人間の知性に到達するために足りないものとは?

2
会員(無料)になると、いいね!でマイページに保存できます。
共有する
Google DeepMindは、汎用人工知能(AGI)への進捗を客観的に測定するための新しい認知フレームワークを発表した。従来の単一的な評価基準を見直し「知性」を10の独立した認知能力に細分化することで、AIモデルの能力を体系的かつ包括的に評価し、真の理解力や推論力を測る手法を提唱している。

(画像:ビジネス+IT)
AGIが人間並みになるために必要な「10の認知能力」
Google DeepMindが発表した論文「Measuring Progress Toward AGI: A Cognitive Framework」に基づく本フレームワークは、人工知能の知能を「知覚」「生成」「注意」「学習」「記憶」「推論」「メタ認知」「実行機能」「問題解決」「社会的認知」という10の独立した認知能力に分解して定義している。従来のベンチマークテストを用いた一元的な評価手法では、AIが学習データの暗記に基づくパターンマッチングで回答しているのか、真の論理的推論によって導き出しているのかを判別することが困難であった。
例えば、コーディングタスクにおいて推論能力が高く記憶能力が低ければ論理的に導出していると評価でき、逆であればパターンマッチングに依存していると判断できる。今回のフレームワークは、各タスクがどの認知能力を要求するかを細分化して個別に測定することで、暗記によるベンチマーク汚染を検出し、モデルの真の実力を測る設計となっている。また同社の研究では、現在の最先端AIモデルが人間のように各認知能力をバランスよく発達させているわけではなく、評価軸によって能力水準が極端に変動する「凸凹な認知プロファイル」を持つことが事実として示された。

【図版付き記事はこちら】Google DeepMindがAGIに至る10の認知フレームワーク発表(図版:ビジネス+IT)
この特性を複数の指標で可視化することにより、現在のAIが弱点とする領域を明確化し、プロダクト設計や今後の開発における注力分野を特定することが可能になる。これは、2023年に同社が発表した段階的な「Levels of AGI」による分類から一歩進み、多軸的なプロファイリングへと評価基準を成熟させるものである。
さらにGoogle DeepMindは本発表に合わせて、データ分析プラットフォームのKaggleと連携したグローバルハッカソンを開始した。「学習」「メタ認知」「注意」「実行機能」「社会的認知」の5つの認知能力領域に焦点を当て、真の理解力を測定するための新しい評価指標の設計を世界の開発者から募っている。
このコンペティションには総額20万ドルの賞金が設定されており、提出期間を経て2026年6月に結果が発表される。こうした多軸的アプローチの導入は、これまで抽象的な議論にとどまっていたAGI到達への進捗評価を、具体的な数値と科学的根拠に基づく実証的な測定へと移行させる枠組みである。
AGIが人間レベルになるには何が足りないのか?
AGIが人間レベルの知性に到達するには、現在のAIシステムが抱える深刻なボトルネックの解消が不可欠である。まず解決すべきは、ある領域で超人的な能力を発揮しながら別の平易なタスクで幼児以下となる能力の不規則な分布、すなわち「ギザギザな能力(Jaggedness)」の解消である。大量の訓練データが存在する読み書きや数学では高い熟練度を見せる一方、人間にとって自明な基本的認知タスクで失敗する現状は、能力の全体的な底上げが急務であることを示している。
この続きは
会員限定(完全無料)です
ここから先は「ビジネス+IT」会員に登録された方のみ、ご覧いただけます。
今すぐビジネス+IT会員に
ご登録ください。
すべて無料!今日から使える、
仕事に役立つ情報満載!
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
完全無料
登録料・月額料なし、完全無料で使い放題!
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!
Googleで見つけやすく

評価する
いいね!でぜひ著者を応援してください
会員(無料)になると、いいね!でマイページに保存できます。
AI・生成AIのおすすめコンテンツ
関連タグ
タグをフォローすると最新情報が表示されます