X「x-algorithm」を解説|Grok基盤で変わった推薦設計

アルゴリズム公開の戦略的背景と「For You」フィードの進化

2026年5月15日、X(旧Twitter)のレコメンドアルゴリズム「x-algorithm」に対する大型アップデートが、複数のメディアで報じられました。xAI が GitHub で公開しているこのリポジトリは、2026年1月の初回公開以降も更新が続いており、SNS のプラットフォーム戦略を考えるうえで重要な事例となっています。アップデートの概要は「xAI『x-algorithm』5月15日アップデート|Xの推薦システムに『Grox』と広告モジュールが追加」で報じたとおりですが、本記事ではそこから一歩踏み込み、アルゴリズムの内部構造そのものを読み解いていきます。

このアルゴリズム公開の背景には、ガバナンス上の動機があると指摘されています。EU は2025年12月、デジタルサービス法(DSA)の透明性義務違反として X に1億2000万ユーロ(約204億円)の制裁金を科しており、本番システムのコードを公開することは、規制当局や広告主に対する透明性の担保という意味を持ちます。ただし、制裁金がコード公開の「直接的な契機」であると断定できる一次情報はなく、本稿では公開を後押しした文脈の一つとして整理します。

現代の意思決定者にとって、アルゴリズムの透明性は倫理的な論点であると同時に、広告主の信頼維持と法規制リスクの回避に直結する経営課題でもあります。本記事では、システムアーキテクトの視点から、公開された「For You」フィードの構造的本質を出典元であるリポジトリの記載に基づいて読み解き、Grokベースの新しい設計が従来のSNS推薦システムから「何を変えたのか」を明らかにしていきます。

システムアーキテクチャの四核:Home Mixer / Thunder / Phoenix / Candidate Pipeline

X の推薦システムは、Rust によるパフォーマンスと、Python による機械学習の柔軟性を組み合わせた設計です。GitHub 上の言語構成比は更新ごとに変動するため固定値の引用は避けますが、本稿執筆時点ではおおむね Rust が6割強、Python が4割弱を占めています。ミリ秒単位のレスポンスを実現するため、以下の4つのコンポーネントが機能的に疎結合化されています。

コンポーネント役割と技術的特徴Home Mixerオーケストレーション層。フィード構築の全工程を統括する。Query Hydrators を通じて、ユーザーのエンゲージメント履歴やフォローリストといったユーザーコンテキストを集約する。Thunder低遅延インメモリ・ストア。フォローしているアカウントの最近の投稿(インネットワーク)を管理する。Kafka からのイベントをリアルタイムに処理することで、外部データベースを介さずにサブミリ秒単位での候補抽出を可能にしている。Phoenix多機能 ML エンジン。Grok ベースのトランスフォーマー。グローバルコーパスからの「検索(Retrieval)」と、抽出された候補に対する「ランク付け(Ranking)」の二重機能を担う。Candidate Pipeline再利用可能なフレームワーク。推薦工程を部品(Source、Hydrator、Filter、Scorer、Selector、SideEffect)として定義・管理する。並列実行や共通のモニタリング基盤を提供し、システム全体の堅牢性とスケーラビリティを担保する。

なお、このアーキテクチャのスループットについて、技術解説記事(Ajit Singh 氏による解説)では、1日あたり5億件規模の投稿から約1,500件の候補に絞り込み、200ミリ秒未満でランク付けすると説明されています。ただしリポジトリの README にこれらの具体的な数値の明示はなく、第三者解説に基づく参考値として扱う必要があります。

技術的パラダイムシフト:「手作業による特徴量設計」からの脱却

今回の設計思想で最も野心的なのは、README が明言する「手作業で設計された特徴量(hand-engineered features)の全廃」です。正確には、README は「すべての手作業特徴量と大半のヒューリスティックを排除した」と記しています。

従来のシステムでは、「フォロワー数が多いアカウントを優遇する」「画像や動画の有無で加点する」といった、人間の経験則に基づくルールが数多く組み込まれていました。新アルゴリズムはこうした手作業の特徴量を廃し、Grok-1 から移植されたトランスフォーマーアーキテクチャを用いた「Phoenix」に判断の大半を委ねています。

この「脱・手作業」がもたらす戦略的価値は、以下の2点に集約されます。

予測精度の向上:人間が言語化しにくいユーザーの微細なエンゲージメント履歴や、投稿間の多次元的な関連性を AI が自ら学習し、よりパーソナライズされた推薦を可能にします。

インフラの単純化:複雑な手動ルールの管理に伴う技術的負債を軽減します。README も、データパイプラインと配信インフラの複雑性を大幅に低減すると述べています。

2026年5月アップデートの主な追加要素

リポジトリは2026年1月の初回公開以降も継続的に更新されており、2026年5月15日のアップデートは187ファイル・18,000行超の追加を伴う大規模なものでした。READMEにも「Updates — May 15th, 2026」という専用セクションが設けられ、変更点が明記されています。ここで重要なのは、誰の投稿をどの順番で出すかというランキングの根幹(エンゲージメント予測、負のシグナル、アカウントの多様性確保)は1月の初回公開時点から大きく変わっておらず、今回新たに加わったのは「投稿の中身を読む」コンポーネントだという点です。主な追加要素は以下のとおりです。

Grox(コンテンツ理解パイプライン):今回新設された、投稿の中身を解析するコンポーネント。中核にVLM(ビジョン言語モデル)を据え、テキストだけでなく画像や動画フレームまで解析できる点が特徴です。担う役割は大きく三つで、(1) 投稿の品質スコアリング——価値がありバズる可能性があるかを0〜1で採点する「バンガースコア」を算出し、コード上は「0.4以上」をポジティブ判定の閾値とする、(2) 低フォロワーアカウントを中心としたスパム検出、(3) 暴力的メディア・成人向けコンテンツ・スパム・違法/規制行為・ヘイト/ハラスメント・暴力的発言・自殺/自傷の7カテゴリにわたる安全性・規約違反の検出、です。

広告ブレンディング(Ads Blending):フィードへの広告挿入と配置の最適化を扱うモジュール(home-mixer/ads)。ブランドセーフティのトラッキングを通じて、デリケートなコンテンツの近くを避けた広告配置を目指します。

推論パイプライン(phoenix/run_pipeline.py):検索(retrieval)からランキングまでを一気通貫で実行するスクリプト。エクスポート済みのチェックポイント、事前計算済みのコーパス、ユーザーの行動シーケンスを読み込み、まず候補を上位200件程度に絞り込み(retrieval)、続いて各アクションのエンゲージメントモデルでスコア付け(ranking)して上位を表示します。開発者はモデルを自前で訓練することなく、推論の流れを手元で再現できます。

※ バンガースコアの「0.4以上でポジティブ判定」は公開コードで確認できますが、そのスコアが最終的なランキングにどの程度影響するかを示すコードは、現時点で公開リポジトリには含まれていません。「0.4未満は表示されない」「0.4以上はブーストされる」といった断定は避けるべきです。また同梱モデルの埋め込み次元数やレイヤー数については、リポジトリ直下の README と phoenix 配下の README とで数値の表記に揺れがあり(例:256次元と128次元)、確定情報として扱う際は最新のリポジトリ構成での確認を推奨します。

エンゲージメントベースのスコアリング:複数アクションの予測と「候補分離」

ランキングロジックについて、かつて流布した「いいね=1点、リポスト=20点」といった固定点数方式は、手書きルールに依存していた2023年の部分公開版に由来するものであり、現在の Grok ベースのシステムとは設計が異なります。古い解説を引用する際は、出典の年代に注意が必要です。

現在の Phoenix モデルは、いいね(favorite)、返信、リポスト、引用、クリックなどのポジティブな反応に加え、「興味なし」「ミュート」「ブロック」「報告」といったネガティブな反応を含む15種類のアクションについて、ユーザーがその行動をとる確率を個別に予測します。最終スコアは、これらの予測値に重みを掛け合わせて合計する「Weighted Scorer」によって算出されます。ポジティブなアクションには正の重みが、ネガティブなアクションには負の重みが与えられます。

技術的な特徴として「候補分離(Candidate Isolation)」が挙げられます。

メカニズム:アテンション機構において、候補となる投稿同士は互いに参照(アテンド)できないようマスキングを施す一方、ユーザーコンテキストや履歴には参照できるようにしています。

戦略的意図:これにより、ある投稿のスコアが「同じバッチに含まれる他の投稿」に左右されなくなります。スコアの一貫性が高まり、計算結果をキャッシュ可能にすることで、大規模トラフィック下での高速処理に寄与します。

透明性とガバナンス:EUデジタルサービス法(DSA)とオープンソースの意義

X がアルゴリズムを公開し続ける背景には、2025年12月の DSA 制裁金に象徴される透明性要求への対応があると考えられます。コードを公開することは、規制当局や広告主に対し、議論の土俵を「閉ざされた弁明」から「公開されたコードの精査」へと移す手段になります。

ただし、「オープンソース化」は「完全な透明化」と同義ではありません。公開されているのはあくまでサンプルコードであり、本番環境で使用される学習データや学習済みの重みパラメータは非公開です。phoenix の README も、サンプル実装は「特定のスケーリング最適化を除いて内部で使用されるモデルを代表するもの」と注記しており、外部からはシステムの「骨組み」までしか見えないという限界は残ります。

それでも、本番稼働中のレコメンドアルゴリズムをここまで公開する例は主要 SNS では異例であり、プラットフォーム・ガバナンスの議論の前提を変えうる動きといえます。

ブラックボックスから「読めるアルゴリズム」への転換

ここまで見てきたとおり、Grokベースの推薦システムが変えたものは、技術スタックそのものよりも「設計の前提」です。人間が書いたルールの束をトランスフォーマー1つに置き換え、「いいねは何点」式の固定点数表という俗説を退けて15種類のアクション確率を予測するモデルへ移行し、ブラックボックスを検証可能なコードとして公開する——この三つの転換が、今回のアップデートの方向性を象徴しています。

X のレコメンドアルゴリズム公開は、SNS という社会インフラが「見えない力」によって運用される状態からの一歩の脱却を示しています。Grok ベースの AI モデルを採用し、手作業の特徴量を廃した設計は、技術的な選択であると同時に、アルゴリズムを客観的な検証の対象へと押し上げました。

ユーザーや開発者は今後、タイムラインを単に消費するだけでなく、その背後にある論理を「読めるインフラ」として捉え直すことが可能になります。この透明性への一歩が、デジタル社会におけるプラットフォームの信頼性を再定義する鍵となるかどうかが、今後問われていきます。

本記事の要点

「脱・手動設計」によるモデルの純粋化:固定の点数表(レガシーな誤解)ではなく、Grok ベースのトランスフォーマーが15種類のユーザーアクションを多次元的に予測する設計。

戦略的透明性:DSA 制裁金に象徴される規制環境を背景に、コード公開を通じて運営の「検証可能性」を高める動き。

ハイブリッド・アーキテクチャ:Rust と Python を使い分け、Kafka を用いたリアルタイム処理と Phoenix による AI 推論を統合した、低遅延・高精度の設計。

【用語解説】

企業・組織・サービス

X
旧Twitter。本記事が扱う「For You」フィードを擁する、リアルタイム型のSNSである。

xAI
イーロン・マスクが設立したAI企業。Grokを開発し、Xの推薦アルゴリズムにも自社技術を提供している。

x-algorithm
Xの「For You」フィードを動かす推薦システムの中核コード。xAIがGitHubで公開しているリポジトリの名称である。

Grok
xAIが開発する大規模言語モデル。x-algorithmのランキングモデルは、このGrokの技術を基盤としている。

Grok-1
xAIが公開したGrokのオープンソース版。Phoenixのトランスフォーマー実装は、これを移植したものである。

GitHub
ソースコードを公開し、開発者が共同で開発するためのプラットフォームである。

DSA(デジタルサービス法)
EUのオンラインプラットフォーム規制。違法コンテンツ対策やアルゴリズムの透明性などを大手事業者に義務づける。

技術用語・概念

For Youフィード
Xの「おすすめ」表示面。ユーザーごとに最適化された投稿が並ぶ。

レコメンドアルゴリズム(推薦システム)
大量のコンテンツから、表示するものを選んで並べ替える仕組みの総称である。

Home Mixer
フィード全体を組み立てるオーケストレーション層。候補の取得から最終出力までを統括する。

Thunder
フォロー中アカウントの最近の投稿を、外部データベースを介さず高速に提供するインメモリの投稿ストアである。

Phoenix
x-algorithmの機械学習の中核。投稿の「検索」と「ランク付け」の二つの機能を担うGrokベースのモデルである。

Candidate Pipeline
推薦処理をSourceやFilterなどの部品として組み立てる、再利用可能なフレームワークである。

Query Hydrators
Home Mixerの一部。ユーザーのエンゲージメント履歴やフォローリストなど、判断に使う文脈情報を集める処理である。

Kafka
大量のイベントデータをリアルタイムに流通させる分散型の基盤。Thunderはここから投稿イベントを受け取る。

トランスフォーマー
系列データの文脈を捉えるAIの基盤構造。生成AIの中核技術であり、x-algorithmではランキングに用いられる。

インネットワーク/アウトオブネットワーク
前者はフォロー中アカウントの投稿、後者はフォロー外から見つけ出した投稿を指す。

グローバルコーパス
X上の投稿を広く集めた巨大なコンテンツ群。フォロー外の投稿を検索する対象となる。

手作業で設計された特徴量(hand-engineered features)
人間が経験則で定めた評価指標。x-algorithmはこれを廃し、判断をAIに委ねている。

ヒューリスティック
経験則に基づく簡便な判定ルールである。

Weighted Scorer
複数の行動予測値にそれぞれ重みを掛けて合計し、最終的な関連性スコアを算出する仕組みである。

候補分離(Candidate Isolation)
ランキング時に、候補となる投稿どうしが互いに影響し合わないようにする仕組み。スコアが安定し、キャッシュが効く。

アテンション(機構)
トランスフォーマーが、入力のどの部分に注目するかを決める計算の仕組みである。

埋め込み
ユーザーや投稿の特徴を、計算機が扱いやすい数値ベクトルに変換したものである。

Grox
直近のアップデートで加わったコンテンツ理解のコンポーネント。スパム検出や投稿カテゴリ分類などを担う。

広告ブレンディング(Ads Blending)
フィードに広告を挿入し、その位置を最適化する仕組みである。

run_pipeline.py
検索からランキングまでを一気通貫で実行するスクリプト。学習済みモデルがあれば推論を手元で再現できる。

【参考リンク】

X (外部)
旧Twitter。本記事が扱う「For You」フィードを擁する、世界的に利用されているリアルタイム型のソーシャルプラットフォームである。

xAI (外部)
イーロン・マスクが設立したAI企業。Grokを開発し、Xのレコメンドアルゴリズムにも自社の中核技術を提供している。

x-algorithm(GitHub) (外部)
Xの「For You」フィードを動かす推薦システムの中核コードを公開した、本記事の対象リポジトリである。

grok-1(GitHub) (外部)
xAIが公開したGrok-1のオープンソース版。x-algorithmのトランスフォーマー実装は、ここから移植されている。

GitHub (外部)
ソースコードの公開と開発者間の共同作業を担うプラットフォーム。今回のアルゴリズム公開の舞台となった。

Rust (外部)
x-algorithmの主要言語。高速性とメモリ安全性を高い水準で両立したシステムプログラミング言語である。

Python (外部)
x-algorithmの機械学習処理に用いられているプログラミング言語である。

Apache Kafka (外部)
大量のイベントを高速に流通させる分散型データ基盤。Thunderが投稿イベントを受け取る仕組みに使われている。

※ 本記事は2026年5月18日時点のリポジトリ内容に基づく。同リポジトリは更新が続いているため、最新の構成はGitHubで確認することを推奨する。

【参考動画】

【関連記事】

xAI「x-algorithm」5月15日アップデート|Xの推薦システムに「Grox」と広告モジュールが追加
本記事が掘り下げる2026年5月15日アップデートの全体像を伝えるニュース記事。Grox・広告モジュール・推論パイプラインの追加内容を概観できる、本記事のベースとなる一本である。

オープンソースAIエージェント「Hermes Agent」に接続可能に — xAIが狙う開発者層
同じく2026年5月15日のxAIの動きを扱った記事。Grokをオープンソースのエージェント基盤へ接続する戦略を取り上げており、xAIの周辺動向として参考になる。