AIスタートアップSizzleの最高経営責任者(CEO)、ジェローム・ペゼンティにはメタ・プラットフォームズが4月18日「Llama 3」を公開したことを祝う理由がいくつかあった。Llama 3は誰でもダウンロードして実行し、開発に使える強力なオープンソースの大規模言語モデル(LLM)だ。

ペゼンティはメタのAI部門責任者を務めた経験があり、会社に対して技術を公開し、誰でも開発に使えるようにすべきだと度々提言していたと言う。とはいえ、この発表がペゼンティにとって喜ばしい最大の理由は、彼の立ち上げたスタートアップで、OpenAIの所有する業界トップの文章生成モデル「GPT-4」に非常に近い性能をもつ人工知能(AI)モデルを利用できるようになるからである。しかも、それは運用コストがはるかに安く、外部からの調査や修正に開かれているモデルなのだ。

モデルが公開されたことについて「本当に画期的だと感じています」とペゼンティは話す。ペゼンティが創業したスタートアップのSizzleはAI講師を提供するもので、生徒向けの問題集やカリキュラムを作成するために「GPT-4」をはじめ、オープンソース型とクローズドソース型のどちらのAIモデルも使用している。同社の開発者らは、OpenAIのモデルが担っている大部分をLlama 3で置き換えられるかどうかを検証するという。

オープンソースモデルの競争力

Sizzleの話は、AIのパワーバランスに大きな変化が起きようとしていることを示しているのかもしれない。OpenAIは「ChatGPT」で世界を変え、それを契機にAIへの投資が加速し、200万人以上の開発者が同社のクラウドAPIを使用するようになった。

しかし、オープンソース型モデルに競争力があることが証明されれば、開発者や起業家はOpenAIやグーグルが提供する最新モデルに利用料を支払うのをやめてLlama 3、あるいは昨今続々と登場している性能の高いオープンソース型モデルのいずれかに乗り換えるかもしれない。

「非常に興味深い競争になるでしょう」。Llama 3のようなオープンソース型モデルと「GPT-4」やグーグルの「Gemini」のようなクローズドソース型モデルとの競争について、ペゼンティは語った。

メタが提供している前モデルの「Llama 2」も広く使われたが、最新モデルではより品質の高い訓練データを使用することで性能を高めていると同社は説明している。冗長または要領を得ないコンテンツを除外する新しい技術を開発し、使用するデータセットの最適な組み合わせを選択することで訓練データの質を高めているという。

Fireworks.aiなどのクラウドプラットフォームでLlama 3を実行するコストは、API経由で「GPT-4」を使用するコストの20分の1で済むとペゼンティは話す。また、クエリに非常に早く応答するようLlama 3を設定することも可能だ。これはSizzleのような、異なるプロバイダーのAIモデルを活用するサービスを開発している人にとっては重要な点である。「遅延、コスト、精度のバランスが重要です」

オープンソースのモデルは目覚ましい速度で次々と登場している。わたしがスタートアップのDatabricksを訪れ、最終段階まで開発が進んでいる大規模言語モデル「DBRX」を見させてもらったのは、つい数週間前のことだ。このモデルはオープンソース型モデルとしては最高品質と言われていたが、その称号はいまやLlama 3のものである。DatabricksのCEOのアリ・ゴドシも、Llama 3を「画期的」と評し、より大きくなったモデルは「GPT-4の精度に近づいており、オープンソースのモデルはクローズドソースのものと平等に競えるようになった」と話している。