日本語の正確な描画や一貫性のある複数の画像を生成可能
7
会員(無料)になると、いいね!でマイページに保存できます。
共有する
米OpenAIは2026年4月21日、新たな画像生成AIモデル「ChatGPT Images 2.0」を発表した。画像生成プロセスにWeb検索と推論機能を組み込み、最新情報を反映した正確な出力を行う。日本語を含む多言語テキストの高精度な描画や、一貫性を保った複数画像の同時生成に対応し、複雑な視覚タスクを処理する。

(画像:ビジネス+IT)
米OpenAIが公開した「ChatGPT Images 2.0」は、新アーキテクチャ「gpt-image-2」を採用した基盤モデルである。画像生成プロセスに思考能力(Thinking capabilities)を導入し、生成の過程で必要に応じてWeb検索を実行する。最新の情報を取得した上で要素間の関係性を推論し、図解や地図などの正確性が求められるビジュアルを出力する。選択したモードに応じて推論に割く時間を調整する仕組みを備えており、競合モデルと同様の事前推論アプローチを採用している。
モデル自体の知識カットオフは2025年12月に更新されている。情報の要約から文章生成、ビジュアル化までを一貫して行うエンドツーエンドの制作にも対応し、テキストの生成から構造化された図や画像への変換までを単一のプロセスで完結させる。テキストの描画能力も大幅に向上した。英語に加え、日本語、中国語、韓国語などの非ラテン文字を正確に生成画像内に反映する。細かな文字やUI要素、複雑なレイアウトの配置に対応し、ポスターや漫画、インフォグラフィックなど言語要素を伴う画像を作成できる。

【図版付き記事はこちら】OpenAIが新画像生成モデル「ChatGPT Images 2.0」を発表OpenAIが新画像生成モデル「ChatGPT Images 2.0」を発表
(図版:ビジネス+IT)
解像度は最大2Kに対応し、アスペクト比は横長の3:1から縦長の1:3まで指定可能となっている。また、1回のプロンプト入力で一貫性を保った画像を複数同時生成する機能も追加された。最大8枚から10枚の画像を一度に出力でき、同一キャラクターが登場する連続した漫画のページや、部屋の改装案、サイズの異なるソーシャルメディア用画像セットなどを一括で処理する。
サム・アルトマンCEOは発表のライブ配信において、本モデルへの進化をGPT-3からGPT-5への飛躍に相当すると説明した。高度な思考機能を用いた生成は、ChatGPT Plus、Pro、Businessの各プランのユーザー向けに提供される。さらに出力画像には、AI生成物であることを示すC2PA規格のコンテンツ認証情報が自動的に付与され、各種規制に向けた透明性の確保にも対応している。
評価する
いいね!でぜひ著者を応援してください
会員(無料)になると、いいね!でマイページに保存できます。
AI・生成AIのおすすめコンテンツ
関連タグ
タグをフォローすると最新情報が表示されます