米Googleは10月16日(現地時間)、画像生成AIモデル「Imagen 3」の日本語対応を含む新機能を「Gemini」アプリに追加したことを発表した。これにより、今年の「Google I/O」で発表された最新のAI技術が、日本のユーザーにも利用可能になった。
最新画像生成モデル「Imagen 3」の特徴
「Imagen 3」はGoogleの最新画像生成モデルで、前バージョンである「Imagen 2」から大幅に性能が向上している。ユーザーは「Gemini」アプリに数単語を入力するだけで、写実的な風景やアート作品のような油絵、ユーモラスなクレイアニメのような画像まで、多彩なスタイルの画像を簡単に生成できる。特に、これまでのAIが苦手としていた画像内への文字の組み込み指示にも対応しており、より高精度な生成が可能である。
また、「Imagen 3」はさまざまなベンチマークで他の画像生成モデルと比較し、性能面で優位性を示している。フォトリアリズムにおいてはこれまでのモデルを超え、よりリアルで自然な画像生成が実現された。さらに、画像に余計なアーティファクトが少なくなり、ユーザーが望む高精度の結果を提供する。安全性についても、透かし機能「SynthID」を搭載し、不正利用を防ぐための対策も万全である。
日本語対応による利用拡大と企業向け機能
今回のアップデートにより、「Gemini」アプリは日本語入力にも対応し、画像生成機能がさらに使いやすくなった。この機能は「Gemini」のAdvanced、Business、Enterpriseプランで利用可能となり、個人ユーザーだけでなく、企業やプロフェッショナルも活用できる。日本語を使ったプロンプト入力によって、広告やデザインなど、さまざまなビジネスシーンでも迅速に高品質な画像を生成できる点が注目される。
https://blog.google/intl/ja-jp/company-news/technology/gemini-imagen-3-gem