Microsoftが「AIへの質問1回の消費電力量は電子レンジを数秒動かす程度」と主張、従来推定の最大20分の1 - GIGAZINE

2026年06月16日 14時10分
AI

Microsoftは2026年6月15日、大規模言語モデルに質問を1回送った際の消費電力量の推定範囲はおよそ0.16～0.60Whで、40WのPCを約15～60秒動かす電力量に相当するという分析結果を発表しました。従来推定の約20分の1～4分の1に収まるとのことです。

Scaling AI with 8 to 20x energy efficiency | The Microsoft Cloud Blog
https://www.microsoft.com/en-us/microsoft-cloud/blog/2026/06/15/scaling-ai-with-8-to-20x-energy-efficiency/

Microsoft Copilotにメールの要点を尋ね、会議資料を要約させ、プログラムの修正案を作らせるたびに、データセンターでは大規模言語モデルによる計算が実行されます。AIサービスの利用者が増える中で、質問1回に必要な電力や冷却用水を正確に把握することが、データセンターの建設計画や電力網への影響を考える上で重要です。

AIへの入力を読み取り、回答を少しずつ生成する処理は「推論」と呼ばれます。文章は「トークン」という細かな単位で処理され、質問や回答が長いほど計算量も増加します。

そのため、AIの消費電力を考える際には処理するトークン数が重要な指標になります。ただし、同じ量の文章を扱う場合でも消費電力が一律に決まるわけではなく、利用する半導体の性能や同時に処理する質問数、データセンターの冷却効率によって必要な電力量は変化します。

同じAIモデルでも、GPUを少数の質問に使う実験環境と、多数の質問をまとめて処理する本番環境では1件当たりの消費電力が変わります。Microsoftによると、過去の推定には複数の質問をまとめて計算する「バッチ処理」や、大量の利用者がいる環境でGPUを効率よく稼働させる仕組みを十分に反映していない例があったとのこと。測定対象にGPUだけを含めるのか、CPUや冷却設備まで含めるのかという違いも推定値のばらつきを生んでいました。

Microsoftの研究チームは2000億パラメーター超の大規模モデルを8基のNVIDIA H100を搭載したサーバーで動作させた場合について、半導体が1秒間に処理できるトークン数、サーバー1台の消費電力、施設全体の電力効率を示すPUEなどを組み合わせ、本番規模の運用を想定して消費電力を推定しました。

回答が中央値で約300トークンとなる一般的な質問では、消費電力量の中央値は1件当たり0.31Whでした。推定範囲の中央50％は0.16～0.60Whで、1000Wの電子レンジを約0.6～2秒動かす電力量に相当します。冷却などに伴う水の消費量は質問1回当たり0～0.067mLと推定され、中央値は小さじ約100分の1以下でした。

従来推定ではAIへの質問1回に数Whの電力が必要とされることが多く、(PDFファイル)ChatGPTの質問1回はGoogle検索の約10倍の電力を消費するとの見方も広く引用されてきました。しかしMicrosoftは、本番環境でのGPU利用率やバッチ処理を考慮すると、こうした推定は実際より4～20倍大きかった可能性があると主張しています。

ただし、質問1回の負荷が常に小さいわけではありません。複数段階の推論や長いコードの生成などで回答が中央値5000トークンに達する場合、消費電力量の中央値は3.91Whとなり、一般的な質問の約13倍に増加しました。AIが長時間考えるような処理では、回答の長さが電力消費を大きく左右します。

1日10億件の一般的な質問を処理する場合、基本条件で必要な電力は約0.7GWhと試算されており、さらに効率化を適用すると約0.3GWhまで減少する見込みです。全体の10％を長い推論が必要な質問に置き換えると約1.7GWhまで増えますが、効率化後は約0.8GWhに抑えられるとのこと。

Microsoftはさらに、小型モデルへの振り分けや処理基盤の最適化、次世代GPUや独自AIチップの活用を組み合わせることで質問1回当たりのエネルギー効率を近い将来に8～20倍改善できると推定しています。MicrosoftはAIの利用拡大に伴って電力や水の消費が同じ割合で増えないよう、モデルや処理基盤、半導体の各段階で効率化を続けると述べています。

この記事のタイトルとURLをコピーする

Microsoftが「AIへの質問1回の消費電力量は電子レンジを数秒動かす程度」と主張、従来推定の最大20分の1 – GIGAZINE