OpenAIの新しい画像透かし、AI生成の偽物を見分けやすく-その仕組みとは - ZDNET Japan

　OpenAIが、同社の画像エコシステム全体にコンテンツに関連する来歴シグナルを導入すると発表した。言い換えれば、AIが生成した画像にAI生成であることを示すタグを付けるということである。

　これは新しい話ではない。OpenAIやその他のAIツールは2024年以降、AI生成画像にメタデータを埋め込んできた。問題は、そのメタデータタグがかなり簡単に無効化できてしまうことだ。新しい点は、OpenAIが洗練された新技術を用いて、画像IDのセキュリティ対策を強化していることである。

　これには多くの要素が絡んでいる。全体像をつかむために、紀元前440年までさかのぼり、ある人物の「変な髪形の日」の話から始めよう。

ステガノグラフィーとは何か

　ステガノグラフィーとは、暗号化された情報を人目につかないように埋め込む手法であり、基本的にはメッセージの暗号的な意図がすぐには分からないように隠す技術である。別の言い方をすれば、誰かあるいは何かが暗号を運んでいると気付けば、暗号解読の半分は成功したようなものだ。

　現代の研究によると、紀元前5世紀、ハリカルナッソス出身のHerodotusは、全9巻から成る「歴史」の中で次のような話を伝えている。「紀元前440年ごろ、Histiaeusは最も信頼する助手の頭をそり、髪が再び伸びると見えなくなるメッセージを入れ墨した。その目的は、ペルシャ人に対する反乱を扇動することだった」。こうした手法はどうやら第2次世界大戦の時代にも使われていたらしい。

　テレビの刑事ドラマで、一見普通のメモの文章を数文字おきに読むと隠されたメッセージが現れる場面を見たことがあるなら、それはテキスト型のステガノグラフィーの事例だ。暗号としては弱い。だが、メモの中にメッセージがあると知らなければ、解読しようとは思わないかもしれない。

　ステガノグラフィーは長年、デジタル画像の中で、画像を構成する何百万ものピクセルの間にテキスト情報を埋め込むために使われてきた。これにより、送信者は人目につく場所に画像を埋め込むことができる。作成者は所有権や来歴情報を改変が非常に困難な方法で画像に埋め込むことができる。

　ステガノグラフィーについては後ほど再び説明する。OpenAIの発表の鍵となる技術だからだ。

　その前に、時間を先に進めよう。ただし、そこまで遠くには行かない。次に訪れるのは2024年だ。

メタデータを見せて

　OpenAIは2024年以降、「DALL-E 3」「ImageGen」「Sora」で生成された画像にメタデータを埋め込んできた。「Content Credentials」のようなツールを使えば、そのデータを検証できる。Googleの「Nano Banana」やその他の画像生成AIツールも、生成画像に何らかのメタデータを埋め込んでいる。

　例を挙げよう。左側が「ChatGPT」で生成した画像、右側がNano Bananaで生成した画像だ。見て分かるように、メタデータは適切に取得されており、Content Credentialsで表示できる。

（提供：Screenshot by David Gewirtz/ZDNET）

　一方で、それぞれの画像のスクリーンショットを撮影すると、ピクセルは取り込まれるものの、基となるメタデータは取り込まれない。その場合、Content Credentialsは単に「問題が発生」と表示した。画像の取り込みによって、元の画像ファイルに関連付けられていたメタデータは完全に消えてしまった。

残念ながら、データは確認できず（提供：Screenshot by David Gewirtz/ZDNET）

　OpenAIやGoogleが修正しようとしているのは、まさにこうした課題の1つである。

　OpenAIは、以前から取り組みを進めてきたとし、Soraや「Voice Engine」で透かしを採用したほか、運用を通じて、正確性と信頼性のテストと研究を継続してきたと述べた。

標準化されたメタデータ形式

　OpenAIは、同社が、標準化団体Coalition for Content Provenance and Authenticity（C2PA）に準拠する措置を講じたと説明。C2PA準拠となることで、プラットフォームに対し、コンテンツに付加した来歴情報を読み取り、保存し、伝達するための信頼できる手段を提供するとしている。

　これを詳しく見ていこう。C2PAには「C2PA適合性プログラム」があり、同プログラムは製品が「C2PA Content Credentials」仕様に準拠して、C2PAデータを正しく生成・検証するために必要な一連のセキュリティ要件を満たしていることを確認するものだ。

　言い換えれば、コンテンツのメタデータは標準化され、安全であり、有用な情報を十分に保持しているということである。OpenAIは同社の全ての画像サービスでこうした取り組みを行っている。同社の広報担当者によれば、ChatGPTをはじめ、「OpenAI API」や「Codex」などによって生成された全ての画像には、こうした来歴情報が含まれているという。

OpenAIの新しい画像透かし、AI生成の偽物を見分けやすく–その仕組みとは – ZDNET Japan