米Google、ノートPCで動作する軽量マルチモーダルAI Gemma 4 12B公開 ローカル動作する軽量性とより大規模なモデルに匹敵する性能|ビジネス+IT

ローカル動作する軽量性とより大規模なモデルに匹敵する性能

Google preferred source

2

会員(無料)になると、いいね!でマイページに保存できます。

共有する

米Googleは2026年6月3日、テキスト、画像、音声を直接処理できるオープンウェイトのマルチモーダルAIモデル「Gemma 4 12B」を発表した。パラメータ数は約120億で、16GBのメインメモリを搭載した一般的なノートPC上でローカル動作する軽量性を維持しながら、より大規模なモデルに匹敵する性能を持つ。

photo

(画像:Google blog)

 米Googleは2026年6月3日、新たなオープンウェイトモデル「Gemma 4 12B」を公開した。画像や音声の入力に対応するマルチモーダル機能を備えつつ、パラメータ数を約120億に抑えた中規模モデルである。最大の特徴は、16GBのメインメモリ(VRAMまたはユニファイドメモリ)を搭載したコンシューマー向けのノートPC上で、完全にローカルな環境で動作する点にある。

 従来のマルチモーダルAIは、テキスト、画像、音声を処理する際、各データ形式に対応した独立したエンコーダーを用いてデータを変換してから言語モデルに入力する手法が主流であった。この方式はモデル全体のサイズを肥大化させ、推論時の遅延やデータ処理におけるメモリ消費量の増加を招く要因となっていた。Gemma 4 12Bは、このエンコーダーを完全に排除した「エンコーダーレスアーキテクチャ」を同ファミリーの中規模モデルとして初めて採用した。画像や音声のデータを単一のトランスフォーマーコアへ直接入力して処理する構造を確立したことで、メモリ使用量を大幅に削減し、低遅延での推論を実現している。

画像

【図版付き記事はこちら】Googleより16GBのノートPCで動作する軽量AIモデル「Gemma 4 12B」リリース(画像:ビジネス+IT)

 本モデルは、エッジデバイス向けの小型モデルと、高性能サーバー向けの巨大モデルの間に存在する空白を埋めるプロダクトとして位置づけられている。小型軽量な設計でありながら、同シリーズのより大規模なモデル「Gemma 4 26B」に迫る推論性能をベンチマークテストで記録した。さらに、ローカル推論の速度を最大化する目的で、専用のマルチトークン予測(MTP)モデルも併せて公開されている。

 ライセンスにはApache 2.0を採用しており、商用および研究目的での利用が可能となっている。Hugging Faceなどのプラットフォームを通じてモデルデータが提供されるほか、llama.cpp、MLX、Ollamaといったローカル環境用の各種推論エンジンとの互換性も確保されている。これにより、外部のクラウドインフラやAPIに依存することなく、機密性の高いデータを保護しながら、自律的なエージェント機能や高度なマルチモーダル処理を個人のデバイス上で構築および実行する環境が提供される。

Googleで見つけやすく

Google preferred source

評価する

いいね!でぜひ著者を応援してください

会員(無料)になると、いいね!でマイページに保存できます。

AI・生成AIのおすすめコンテンツ

関連タグ
タグをフォローすると最新情報が表示されます