Intel Arc Pro B70、NVIDIA RTX 4000比でAI推論処理量が最大2.24倍に — BigGo ファイナンス

AIプラットフォーム企業のRableUpは18日、Intelの新型ワークステーション向けGPU「Arc Pro B70」が、NVIDIAの「RTX PRO 4000 Blackwell」と比較して、大規模言語モデル(LLM)の推論処理量で最大2.24倍の性能を記録したとするベンチマーク結果を公開した。

AI市場の中心がモデル学習から推論およびエージェンティックAIサービスの運用へと移行する中で、GPUに搭載されたメモリ容量の重要性が高まっている。特に長時間の会話コンテキストを維持し、複数のタスクを並列処理する必要があるエージェンティックAI環境では、以前の推論結果を保存する「KVキャッシュ(Key-Value Cache)」が中核的な役割を果たす。KVキャッシュが不足すると、既存データの削除や再配置の過程で処理量が急減したり、応答遅延が発生する可能性がある。

RableUpは、自社のエンタープライズAIインフラ運用プラットフォーム「Backend.AI」上で、Intel Arc Pro B70とNVIDIA RTX PRO 4000 Blackwellを対象にvLLMベンチマークテストを実施した。テストはIntel Xeon w9-3475X CPUとUbuntu 25.10のOS環境で行われた。

Intel Arc Pro B70は今年3月に発売されたワークステーション向けGPUで、Xe2コア32基と32GBのGDDR6 ECCメモリを搭載する。最大367 INT8 TOPS(毎秒1兆回演算)の性能を提供し、大容量AIモデルを分割せずに実行できる点が差別化要素だ。一方、比較対象のNVIDIA RTX PRO 4000 Blackwellは、CUDAコア8960基、24GB ECC GDDR7メモリ、672GB/sのメモリ帯域幅を備えている。

Qwen3 8Bモデルを用いた8Kコンテキストテストでは、Arc Pro B70は同時リクエスト数が増加しても毎秒処理量が着実に上昇した。これに対しRTX PRO 4000 Blackwellは、同時リクエスト数が16件に達するとメモリ不足により処理量が急減した。この区間において、Arc Pro B70は188.2 tok/sの出力処理量を記録し、NVIDIA製品の83.9 tok/sに対して2.24倍の性能を示した。コンテキスト長を32Kまで拡張した環境では、特定の区間で最大4倍以上の処理量の差が発生した。

より大規模なGPT-OSS 20Bモデルのテストでも同様の傾向が確認された。Arc Pro B70は同時リクエスト32件の環境でも安定した性能を維持し、NVIDIA製品より25%高い処理量を記録した。RableUpによれば、実際のベンチマークにおいてArc Pro B70のKVキャッシュ利用可能容量は、RTX PRO 4000 Blackwellと比較して平均2.1倍の水準に達したという。

コスト効率の面でもArc Pro B70の優位性が際立つ。Arc Pro B70の販売価格は1,099ドル(約18万円)で、2,199ドル(約36万円)のRTX PRO 4000 Blackwellの半額である。RableUpは、処理量とGPU価格を合わせて考慮したドル当たりのトークン出力効率が、同時リクエスト環境において最小4.48倍から最大8.78倍にまで高まると分析している。ただし、単一ユーザーの低負荷環境における消費電力は140W水準のNVIDIA製品が優位だが、マルチユーザーの高負荷環境ではB70のワット当たりトークン効率が上回ることが示された。

今回のベンチマーク結果は、特定のモデルと推論環境で測定されたものであり、AI学習性能やすべてのワークロードにおいて同等の優位性を意味するものではない。AIエコシステム全体におけるNVIDIAの影響力は依然として圧倒的である。CUDAを中心に構築された開発環境と豊富なソフトウェアサポートは、AMDやIntelなどの競合他社が短期間で追いつくのが難しい参入障壁として機能している。

しかし、オープンソースベースのIntel AIフレームワーク「OpenVINO」をはじめ、vLLM、llama.cppなど主要なAIフレームワークのIntel GPUサポートが拡大している。RableUpは、既存のIntel Gaudi 2・3 AIアクセラレーターのサポートに続き、Arcグラフィックスラインアップへとサポート範囲を拡大しており、Backend.AIプラットフォームはエッジデバイスからデータセンターフリートまで単一のコントロールプレーンで統合管理される。RableUpの関係者は「開発チームがインフラの再構築なしにハードウェアを選択できる柔軟性を提供する方針だ」と述べた。

業界では、AIエージェントの普及に伴い、演算性能だけでなくメモリ容量とコスト効率が重要になる傾向の中で、Arc Pro B70がAI推論市場における実用的な代替手段として定着する可能性が高いと見ている。