OpenAI、画像生成AI「ChatGPT Images 2.0」発表 思考機能を初搭載、日本語描画も大幅向上

米OpenAIは4月21日(現地時間)、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて「思考(thinking)」機能を搭載し、生成前に構図や整合性を検討してから出力する仕組みである。日本語を含む非ラテン文字の描画精度も大きく向上したという。

新モデルはAPIでは「gpt-image-2」として提供される。指示追従の精度を高め、オブジェクト同士の位置関係や細部を保ったまま複雑なレイアウトを描画できるようになった。インフォグラフィック、スライド、UIモックアップ、漫画など、文字とデザインが密に組み合わさる用途で性能を発揮するとされる。

対応アスペクト比は3:1の超横長から1:3の超縦長まで拡大し、API経由で最大2K解像度の出力に対応する。思考モードを有効にすると、Web検索を用いて最新情報を取り込みながら、1度のプロンプトで最大8枚の画像を連続して生成でき、キャラクターやオブジェクトの一貫性を保てる。

日本語、韓国語、中国語、ヒンディー語、ベンガル語など非ラテン文字の描画精度が向上し、教育コンテンツや多言語広告制作での活用が見込まれる。アイコン、UI要素、小さな文字など従来モデルが苦手としてきた要素にも対応が強化された。

提供範囲は、同日からChatGPT、Codex、APIの全ユーザーに展開される。Enterprise向けも近日提供予定としている。思考モードと拡張出力はChatGPT Plus、Pro、Businessの各有料プランで利用可能となる。

https://openai.com/index/introducing-chatgpt-images-2-0/

関連記事

最新ニュース記事

  1. 物価高と魚離れを救う。シェアNo.1企業が語る「魚肉ソーセージ」再ブレイクの理由

  2. Google、Androidに「フェイク通話検出」機能——AIなりすまし詐欺を防ぐ業界初の保護

  3. Microsoft、常時稼働型AIエージェント「Scout」を発表——Microsoft 365に統合し業務を自律遂行

  4. OpenAI、「Codex」を業務プラットフォームへ拡張——Webアプリ共有「Sites」や役割別プラグインを追加

  5. YouTube、対話型AI検索「Ask YouTube」と生成AI「Gemini Omni」を発表——Shorts動画のリミックスや複雑検索が可能に

  6. シュクレイ、伊勢丹新宿店に新ミルフィユ専門店「MILLI MILLI(ミリミリ)」出店 ブランド力と「顧客体験」で勝負

  7. 乳幼児のRSウイルス重症化を防ぐ「母子免疫ワクチン」 原則無料の定期接種開始から1カ月半、現場の期待と課題

  8. 発酵性食物繊維で“腸活”を提案 「KINNOE518フェス」で給食型イベント開催

  9. タイミー、BPOサービス「Timee BPO」を正式提供開始——1,340万人基盤から即戦力ワーカーを最短翌日アサイン

  10. Runway、日本に本格進出 東京オフィス開設と40億円超の初期投資を発表

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場