米Googleは現地時間12月16日、4K解像度に対応した次世代動画生成AI「Veo 2」を発表した。OpenAIが同月9日に「Sora」の一般提供を開始したことを受け、動画生成AI分野における競争がさらに激化している。
「Veo 2」は、最大4K(4096×2160ピクセル)の高精細な動画を生成できるAIモデルで、2分以上の長尺映像にも対応している。Googleは「現実世界の物理現象や人間の動き、表情のニュアンスを高度に再現する」と説明し、AI生成コンテンツの表現力向上をアピールする。
リアルな映像美と高いプロンプト適合性
従来の動画生成AIでは、指の数が過剰になる「幻覚現象」や不要なオブジェクトの混入が問題とされてきた。しかしVeo 2ではこれらの現象が大幅に抑えられ、自然な映像表現が可能となった。作例では、ゆっくりとズームするカメラが顕微鏡を覗く科学者を捉えるシーンや、水面を歩くフラミンゴの映像など、動きのあるシチュエーションでも高い一貫性を示した。
また、「18mmレンズ」「ボケ味」「低角度」などの映画撮影の専門的指示にも対応。例えば、「浅い被写界深度」を指定すれば、背景をぼかしながら被写体にピントを合わせた映像が生成されるなど、プロンプトへの忠実度も向上している。
競合モデルを超える性能
ベンチマークテスト「MovieGenBench」において、GoogleはVeo 2がOpenAIの「Sora Turbo」を含む他の動画生成AIを上回る性能を記録したと発表。ただし、複雑なシーンや急激な動きの一貫性維持には課題が残されており、今後の改善が期待される。
安全性と利用拡大への取り組み
Googleは「Veo 2」の出力に、AI生成であることを識別可能な透明な透かし「SynthID」を組み込んでおり、不正利用や誤情報拡散を防ぐ取り組みも強化している。現在、Veo 2はGoogleの動画生成ツール「VideoFX」に導入され、同日から利用申請が可能となった。2025年にはYouTube Shortsや「Vertex AI」への展開も予定されている。
Imagen 3も改良、新たなAIモデルへ
同時にGoogleは、画像生成AI「Imagen 3」の新バージョンを発表。生成される画像は明るさや構図が改善され、ベンチマーク「GenAI-Bench」では他のモデルを上回る性能を示したという。
動画・画像生成AI分野において、GoogleとOpenAIの競争は今後さらに加速すると見られている。