x86時代の終焉か。NVIDIAの完全自社設計CPU「Vera」が叩き出したIntel、AMDを凌駕する驚愕のベンチマーク | XenoSpectrum

情報技術の歴史において、過去数十年にわたり揺らぐことのない一つの絶対的なルールが存在した。「効率のArm、絶対性能のx86」という暗黙の棲み分けである。スマートフォンや軽量なクラウドインスタンスは消費電力に優れるArmアーキテクチャが支配し、大規模なデータベースや高負荷な演算処理の心臓部には、IntelやAMDが製造するx86アーキテクチャのプロセッサが鎮座してきた。

しかし、生成AIの爆発的な進化が、この静かな均衡を根底から揺さぶっている。AIのパラダイムは現在、単にプロンプトへテキストを返すだけの段階から、自ら計画を立て、複数のソフトウェアツールを駆使し、複雑なタスクを自己完結させる「Agentic AI(エージェント型AI)」の領域へと足を踏み入れている。この自律的なAIエージェントの制御において、ボトルネックとなるのは並列処理を得意とするGPUの演算力ではない。無数のエージェントが生成する膨大な分岐条件を瞬時に判断し、外部APIを叩き、データベースにアクセスし、システム全体のタスクを統括する「強力で応答性の高いCPU」の存在が不可欠となっているのだ。

既存のx86アーキテクチャは、シリコンの微細化の壁を迂回するため、小さなチップ(チップレット)を基板上で繋ぎ合わせてコア数を増やす手法を採用してきた。これは製造コストを下げる合理的なアプローチである反面、チップ間の通信遅延(レイテンシ)や消費電力の増大という物理的限界に直面している。発熱を抑えながら、いかにしてAIエージェントの思考速度に追従するCPUを構築するか。この巨大な技術的問いに対し、AIハードウェアの絶対的王者であるNVIDIAが導き出した回答が、完全自社設計のコアを採用した次世代データセンター向けCPU「Vera」である。

本稿では、Linuxのハードウェア検証において世界で最も権威のあるメディアの一つ「Phoronix」が実施したVeraの初期ベンチマーク結果を紐解く。そこで明らかになったのは、Armアーキテクチャが「効率の良さ」という言い訳を捨て去り、純粋な暴力とも言える演算性能でx86のフラッグシップモデルを正面からねじ伏せたという、歴史的な下克上の記録である。

01.微細化の壁を打ち破る。モノリシックダイと広帯域が仕掛ける構造的包囲網02.容赦なき数値の暴力。ベンチマークが語る「Agentic AI」基盤の正体03.インフラの再定義。NVIDIAが狙う「200億ドルの心臓部」強奪戦04.熱とシリコンの果てなき闘争。x86陣営の反撃と次なる戦端微細化の壁を打ち破る。モノリシックダイと広帯域が仕掛ける構造的包囲網

前世代のCPU「Grace」において、NVIDIAは英Arm社が設計した「Neoverse V2」コアをそのまま採用していた。これは迅速に市場へ参入するための合理的な選択肢であったが、独自の最適化には限界があった。今回投入される「Vera」は、NVIDIAの社内エンジニアチームが一から設計を練り上げたカスタムコア「Olympus(オリンパス)」を88基搭載している。Armv9.2命令セットアーキテクチャに準拠しつつ、空間的マルチスレッディングにより176スレッドの並列処理を実現し、AIの推論計算で多用されるFP8(8ビット浮動小数点数)処理をハードウェアレベルでネイティブサポートするよう鍛え上げられている。

Veraのアーキテクチャ設計における最大の眼目は、「遅延の徹底的な排除」にある。現在のAMD EPYCやIntel Xeonは、小さなシリコン片を巨大なパッケージの上でパズルのように並べる設計を採用している。これは例えるなら、複数のビルを渡り廊下で繋いだ巨大企業のオフィスのようなものである。部署(コア)を増やすのは簡単だが、別のビルにいる社員と書類(データ)のやり取りをする際、どうしても物理的な距離によるタイムラグが生じてしまう。

対照的に、NVIDIAはVeraを単一の巨大なシリコン塊(モノリシックダイ)として製造する道を選んだ。すべてのコアを広大なワンフロアに配置し、その間を「第2世代Scalable Coherency Fabric」と呼ばれる秒間3.4 TB(テラバイト)ものデータを転送できる超高速な社内ネットワークで直結したのだ。チップレット設計の弱点である通信のボトルネックを、シリコン製造の難易度を上げることで力技でねじ伏せている。

さらに、プロセッサの各コアにはGraceの2倍となる2MBのL2キャッシュが割り当てられ、全体で164MBという広大なL3キャッシュが用意された。そこに直結されるメインメモリには、一般的なサーバーで用いられるRDIMMではなく、スマートフォンなどで使われる省電力・超広帯域メモリを極限までチューニングした「LPDDR5X」を採用。最大1.5 TBの容量をサポートするSOCAMM2フォーマットで実装されている。これにより、Veraはシステム全体で1.2 TB/sという、従来の汎用サーバーの常識を覆すデータ転送帯域幅を獲得した。AIモデルの重みデータや複雑なデータベースのインデックスを、一切の渋滞なくCPUの演算ユニットへと叩き込むことが可能になる。また、最新規格であるPCIe Gen 6およびCXL 3.1への対応も果たしており、周辺機器とのデータパイプラインにも死角はない。

vera-cpu-pcb-phoronix.webpテストベンチに組み込まれたNVIDIA Vera CPUのプロトタイプ基板。巨大なヒートシンクの下には、88基のOlympusコアと広帯域LPDDR5Xメモリが単一のパッケージ内に高密度で統合されており、チップレット設計に見られる分散配置とは一線を画している。(Credit: Phoronix.
https://www.phoronix.com/review/nvidia-vera-benchmarks)
容赦なき数値の暴力。ベンチマークが語る「Agentic AI」基盤の正体

机上の設計思想がどれほど優れていようとも、市場が評価するのは実際のソフトウェアを実行した際の絶対的な処理能力である。Phoronixが公開した一連のベンチマークテストは、AIの学習コードのコンパイルから、データベースのクエリ処理、高解像度ビデオのエンコードまで、現代のデータセンターで要求される多種多様なワークロードを網羅している。

テスト環境には、現時点で市場に存在する最強のx86プロセッサが用意された。Intel陣営からは128コアを誇る最新の「Xeon 6980P(Granite Rapids)」。AMD陣営からは、動作クロックを驚異の5.0GHzまで引き上げた64コアの「EPYC 9575F」や、周波数特化の「EPYC 9475F」、そして128コアのフラッグシップ「EPYC 9755(Turin)」などが比較対象として並べられた。

結果は、多くの業界関係者の予測を大きく裏切るものとなった。Phoronixが実施した全テスト結果の幾何平均(Geomean)によれば、Veraは前世代のGraceに対して実に63%(1.63倍)の性能向上を達成。最高峰のAMD EPYC 9575Fを約10%上回り、IntelのフラッグシップであるXeon 6980Pに対しては55.3%という圧倒的な大差をつけて勝利を収めた。

各ワークロードの結果を分解すると、Veraが現代のデータセンターにおいていかに実利をもたらすかが鮮明に浮かび上がる。

1. 開発サイクルの劇的な短縮(コードコンパイル)
ソフトウェア開発者の生産性に直結するコードコンパイルのテストにおいて、Veraは圧倒的な適性を示した。特に膨大なファイル群をビルドするNode.jsのコンパイルでは、前世代のGraceの半分の時間で処理を完了させ、5.0GHz駆動のEPYC 9575Fと並ぶコアあたりの最高性能を記録した。さらに驚くべきは、Arm64アーキテクチャ上でx86_64用カーネルをクロスコンパイルするテストにおいて、全プロセッサ中で最速の20秒というタイムを叩き出したことだ。継続的インテグレーション・継続的デリバリー(CI/CD)パイプラインを回す大規模な開発現場において、このコンパイル速度の向上はエンジニアの待機時間を直接的に削減し、企業に莫大な人件費の節約をもたらす。

2. I/Oバウンドワークロードの解放(Stream / 7-Zip / Zstandard)
メモリ帯域幅を計測する「Stream」ベンチマークにおいて、1.2 TB/sのLPDDR5Xメモリを搭載したVeraは他を寄せ付けない数値を記録した。これは大規模言語モデル(LLM)の推論において、GPUへデータを供給する際のボトルネックが解消されることを意味する。
また、データの圧縮・展開能力を問う7-ZipやZstandard(Zstd)のテストでは、88コアのVeraが128コアのXeon 6980Pを軽々と抜き去った。特にZstdの圧縮レベル3(リアルタイム処理向け)やレベル19(最大圧縮)において最高のパフォーマンスを示した事実は、クラウド事業者のビジネス構造に直結する。Agentic AIは、外部ツールから取得した膨大なJSONデータやログを絶え間なく圧縮・展開しながら処理を続ける。ここの速度と圧縮率が向上すれば、クラウド事業者はストレージ容量とネットワーク転送量の双方を大幅に削減でき、システム全体のTCO(総所有コスト)を劇的に押し下げることができる。

3. エンタープライズとAIエコシステムの制圧(Python / Java / ClickHouse)
AI開発の事実上の標準言語であるPythonの実行速度や、エンタープライズバックエンドの根幹をなすJava(OpenJDK)のテストでも、VeraはAMDの最新世代に匹敵、あるいは凌駕する成績を収めた。
極めつけは、リアルタイム分析データベース「ClickHouse」の処理速度である。膨大なログデータから瞬時にインサイトを抽出するこのデータベースにおいて、Veraはモノリシックダイの低遅延と広帯域メモリの暴力をいかんなく発揮し、すべてのx86プロセッサを置き去りにするトップスコアを記録した。Agentic AIが自らの行動履歴を参照し、短期記憶としてデータベースにアクセスする際、ClickHouseのようなシステムの応答速度はエージェントの「思考の速さ」そのものとなる。

4. メディアストリーミングの再定義(SVT-AV1エンコード)
オープンソースのビデオエンコーダ「SVT-AV1」を用いた4K 10-bit映像のエンコードテストにおいて、VeraはAMD EPYCのZen 5コア群と互角以上の激しいトップ争いを繰り広げた。Soraをはじめとする動画生成AIが普及する現在、リアルタイムで生成された高解像度ビデオを遅延なくエンコードし、エンドユーザーへ配信する能力は、次世代ストリーミングプラットフォームの必須要件となる。

インフラの再定義。NVIDIAが狙う「200億ドルの心臓部」強奪戦

NVIDIAがVeraによって証明したのは、Armアーキテクチャの限界突破という技術的快挙にとどまらない。同社はこれまで、「GPUというAIの心臓部を提供する企業」という立場にあった。CPUやシステム全体の制御はIntelやAMDに委ねるという構造を長らく受け入れてきたのである。

しかし、Veraの登場により、NVIDIAはデータセンターのコンピューティングリソース全体を単一のアーキテクチャで支配する「フルスタックのプラットフォーマー」へと変貌を遂げつつある。業界の観測によれば、NVIDIAは本年度だけでVeraやGraceといったCPU事業から200億ドル規模の収益を上げる計画を立てており、これは総額2,000億ドルとも言われるサーバー向けCPU市場(Total Addressable Market)を根本から侵食する動きである。

すでにOpenAI、SpaceX、Anthropic、Oracleといった世界トップクラスのAI企業やクラウドプロバイダーの元には、次世代プラットフォーム「Rubin」の中核をなすVera CPUを搭載したラックが直接持ち込まれ、稼働に向けた検証が進められている。AIエージェントがネットワーク空間を飛び回り、自律的に判断を下すAgentic AIの時代において、データセンターの基盤インフラは「いかに効率よくGPUへデータを送り込めるか」というNVIDIA中心の設計思想へと強制的に書き換えられようとしている。

geometric-mean-of-all-test-results-vera-cpu.webp全テスト結果の幾何平均(Geomean)を示すグラフ。Veraは前世代から63%という劇的な飛躍を遂げ、高クロックで駆動するAMDの最新サーバー用CPUすらも凌駕する結果を残した。(Source: Phoronix.
https://www.phoronix.com/review/nvidia-vera-benchmarks/11)
熱とシリコンの果てなき闘争。x86陣営の反撃と次なる戦端

これほどまでに華々しいデビューを飾ったVeraであるが、実運用に向けた課題がすべて解決されたわけではない。

今回のプレリリース版ハードウェアにおけるテストでは、NVIDIAの要請によりCPU単体の詳細な消費電力の計測やクロック周波数のモニタリングが制限された(Linuxカーネル側でのACPI CPPC v4による電力管理チューニングが進行中であるためとされる)。Vera単体のTDP(熱設計電力)は450Wに設定されており、これにLPDDR5Xメモリの消費電力約50Wを加えると、システム全体の消費電力は500Wに達する。これはIntel Xeon 6980P単体や、高クロックなAMD EPYCと同等の発熱量である。

巨大なモノリシックダイに88個の高密度コアを詰め込む設計は、チップレット設計のような通信遅延を排除できる反面、シリコンウエハーの一箇所に強烈な熱が集中する「ホットスポット」の問題を引き起こしやすい。密閉されたサーバーシャーシの内部で高負荷の処理が長時間続いた際、スロットル(熱暴走を防ぐための意図的な速度低下)が発生せずにカタログスペック通りの性能を維持できるのか。そして、ワット当たりの処理性能(電力効率)でx86陣営に対して明確な優位性を示せるのかは、年内の量産モデルでの厳密な再検証を待つ必要がある。

さらに、巨大な単一シリコンを欠陥なく製造することは、歩留まり(良品率)の悪化に直結し、製造コストを跳ね上げる要因となる。一般のエンタープライズ用途や、低コア数を求めるエッジコンピューティング環境に向けて廉価なバリエーションを展開することは、現在のNVIDIAのラインナップ戦略からは見えてこない。

そして何より、追撃を受けるx86陣営も沈黙しているわけではない。AMDは2026年後半に向けて、次世代アーキテクチャ「Zen 6」を採用したコードネーム「Venice」の量産立ち上げをすでに開始している。Intelもまた、次々世代の「Diamond Rapids」でアーキテクチャの大規模な刷新を予定している。さらに、データセンター向けArmチップの領域では、QualcommやArm自身がAgentic AI特化のプロセッサ開発を急ピッチで進めている。

長らく続いた「効率のArm、性能のx86」という古い常識は、NVIDIAの放った一撃によって完全に粉砕された。Agentic AIという無限の演算力を要求する新たな怪物を前に、シリコンバレーの天才エンジニアたちは再び物理法則の限界に挑む熾烈な総力戦へと突入していく。Veraの登場は、来るべき新たな半導体冷戦の、ほんの序章に過ぎない。