Intelが長らく推し進めてきたプロセスの微細化とアーキテクチャの刷新が、ついにデータセンター市場において一つの結実を迎えた。同社が発表した「Xeon 6+」(開発コード名: Clearwater Forest)は、データセンター向けCPUとして初めてIntel 18Aプロセスを採用した製品群である。これまでのSierra Forestで培われたEコア(Efficient-core)専用設計をさらに進化させ、前世代からコア密度と電力効率を飛躍的に向上させている。この進化の核心にあるのが、Intel 18Aで導入された新しいトランジスタ構造であるRibbonFETと、シリコン裏面からの電力供給技術であるPowerViaの組み合わせだ。
RibbonFETは、従来のFinFETに代わるGate-All-Around(GAA)構造を採用し、チャネルを通る電流をより厳密に制御することを可能にした。これにより、漏れ電流の低減と駆動電流の向上が図られ、より低い電圧での動作が実現されている。一方のPowerViaは、電力配線と信号配線を分離し、シリコンの裏面から電力を供給する技術である。これまでチップ表面に混在していた配線を分離することで、セル利用率が90%以上に向上し、標準セルの高密度化と信号ルーティングの最適化が達成された。
これらの製造プロセスの進化は、熱制約が厳しいデータセンター環境において決定的な意味を持つ。サーバーラックの電力上限が固定されている中でより高い性能を引き出すためには、漏れ電流による無駄な発熱を抑える必要がある。RibbonFETとPowerViaは、チップ内部の配線抵抗や熱の偏りを物理的に回避し、より多くのコアを同じシリコン面積に押し込める基盤を提供している。これにより、前世代を遥かに凌ぐワット当たりのパフォーマンスが実現されている。
さらに特筆すべきは、Clearwater Forestが採用している高度なパッケージング技術である。このチップは単一のシリコンダイではなく、複数のタイルを組み合わせたディスアグリゲート(分散型)アーキテクチャを採用している。具体的には、Intel 18Aで製造された12基のコンピュートタイル、Intel 3で製造された3基のベースタイル、そしてIntel 7で製造された2基のI/Oタイルで構成されている。これらのタイルは、9μmのバンプピッチを持つ「Foveros Direct 3D」技術によって立体的に積層され、さらに「EMIB 2.5D」技術によって水平方向に接続されている。異なるプロセスノードで製造された最適なチップレットを組み合わせることで、製造歩留まりの向上と設計の柔軟性を確保しつつ、データ転送における電力消費を極限まで抑えることに成功している。
01.288コアの「Darkmont」がもたらす高密度コンピューティング02.Agentic AI時代におけるCPUの復権288コアの「Darkmont」がもたらす高密度コンピューティング
Clearwater Forestのフラッグシップモデルとなる「Xeon 6990E+」は、驚異的なスペックを誇る。1つのソケットに最大288基の「Darkmont」Eコアを搭載し、ベースクロック2.2GHz、最大ターボクロック3.2GHzで動作する。L3キャッシュは576MBと極めて大容量であり、L2キャッシュもコアクラスターごとに潤沢に配置され、合計で864MBに達する。TDP(熱設計電力)は450Wと前世代のSierra Forest(最大330W)から上昇しているものの、コア数の大幅な増加を考慮すれば、依然として高い電力効率を維持している。Intelの検証によれば、Xeon 6990E+は前世代のフラッグシップであるXeon 6780E(144コア)と比較して、平均で2.26倍の性能向上を達成している。
この圧倒的なコア数は、特定の機能を取捨選択した結果として実現されている。Darkmontコアは、Pコア(Performance-core)に搭載されているHyper-ThreadingやAVX-512、AMXといった高度な命令セットをサポートしていない。これは、浮動小数点演算を多用するHPC(ハイパフォーマンス・コンピューティング)ワークロードではなく、多数の軽量なプロセスを並列処理するクラウドネイティブなアプリケーションや、マイクロサービス、Webスケールのワークロードに的を絞った設計意図の表れである。命令セットの簡素化によって生み出されたシリコン上の余裕は、より多くのコアと大容量のキャッシュに割り当てられた。また、AVX-512を省いた分、I/OダイにはQAT(QuickAssist Technology)やDSA(Data Streaming Accelerator)などのハードウェアアクセラレータが合計16基搭載されており、暗号化やデータ圧縮、ロードバランシングを効率的にオフロードする仕組みが整えられている。
競合であるAMDのEpycプロセッサとの比較においても、Intelは明確な自信を示している。Intelの発表によれば、288コアのXeon 6990E+は、AMDの192コアを搭載するEpyc 9965と比較して、スレッド当たりの性能で平均30%上回り、スレッド・ワット当たりの性能でも同等の優位性を持つ。AMDが同時マルチスレッディング(SMT)を採用し、192コアで384スレッドを処理するのに対し、Intelは完全な物理コアの数で勝負するアプローチをとっている。SMTは1つの物理コアのリソースを論理的に分割するため、キャッシュ競合やコンテキストスイッチでペナルティが生じやすい。一方でIntelの288物理コアアプローチは、各スレッドが独立したハードウェアリソースを専有するため、レイテンシが予測可能であり、スループットが安定するという構造的な強みを持っている。
Agentic AI時代におけるCPUの復権
近年、テクノロジー業界の関心は専らGPUによる大規模言語モデルの学習と推論に集中していた。しかし、複数のAIエージェントが自律的にタスクを分割し、外部のAPIやデータベースと連携しながら複雑な処理を実行する「Agentic AI(自律型AI)」の台頭により、CPUの役割が再定義されつつある。Agentic AIのワークロードにおいては、モデル自体の推論処理よりも、情報収集のためのWebスクレイピング、Pythonコードの実行、SQLクエリの処理といった周辺タスクがシステム全体のリソースを大きく消費する。これらのタスクは高度なベクトル演算能力を必要とせず、むしろ膨大な数のリクエストを並列かつ低遅延で処理する能力が求められる。
まさにこのような並列処理能力において、288コアを備えるXeon 6+は理想的なプラットフォームとなる。Intelは、AIインフラストラクチャにおけるボトルネックが、演算能力そのものから、オーケストレーションや同時実行性、データ移動の効率性へとシフトしていると指摘している。Agentic AIを効率的にスケールさせるためには、単一の強力なアクセラレータに依存するのではなく、多数のCPUコアがコントロールプレーンを担い、タスクの割り当てと結果の統合を高速に行う必要がある。Xeon 6+は、その設計思想の根底からAgentic AIのワークロードに適合するように構築されている。
さらにIntelは、CPU単体での性能向上にとどまらず、システム全体としての最適化を進めている。Xeon 6+の発表と同時に、200GbEの帯域幅を提供するネットワークアダプタ「Intel Ethernet E835」や、LPDDR5xメモリを採用して480GBの大容量メモリ帯域を確保したAI推論アクセラレータ「Crescent Island」の開発状況も公開された。計算ノード内のデータ処理、ノード間ネットワーク、専用の推論処理など、Agentic AIの実行に必要なすべてのコンポーネントをIntelのエコシステム内で提供するという戦略が明確に示されている。
これらの連携メカニズムは、総所有コスト(TCO)の削減に直結する。Intel Ethernet E835はRDMA(RoCEv2/iWARP)機能を備え、CPU負荷を下げつつノード間の通信遅延を抑制する。一方のCrescent Islandは、巨大なコンテキストをメモリ内に保持しながら並列に推論を実行する。Xeon 6+がこれらの司令塔となり、ネットワークのパケット処理やデータ変換を高速に捌くことで、推論からデータ収集、そして次のアクション決定までのサイクルタイムが大幅に短縮される。ハードウェアの各層が緊密に連携することで、ラック単位での電力消費量が削減され、従来型のサーバー群を少数の高密度システムへと集約することが可能になる。
XenoSpectrum を応援する
最後までお読みいただきありがとうございます。XenoSpectrum は独立した視点の記事を無料で公開し続けるため、読者の皆様のご支援を受けて運営しています。
いつも応援ありがとうございます。独立した記事制作を続けるため、追加の一回ご支援も受け付けています。
サポーターになる ¥580/月〜 一回だけ応援する