Google DeepMind、リアルタイム対話型環境生成AI「Genie 3」発表

Google DeepMindは8月5日、テキストプロンプトから対話型環境をリアルタイムで生成する汎用ワールドモデル「Genie 3」を発表した。同モデルは720p解像度で24フレーム毎秒の速度で動的な世界を生成し、数分間にわたって一貫性を保持する能力を持つ。

Genie 3は従来のGenie 1およびGenie 2から大幅に進化を遂げ、初めてリアルタイム対話を可能とした世界モデルとなった。火山地帯でのロボット走行、ハリケーン接近時のフロリダ海岸、深海でのクラゲ追跡など、多様な環境を生成できる。また、日本の禅庭園や古代アテネ、ヴェネツィアの運河といった地理的・時間的境界を超えた場所の探索も実現する。

技術的な革新として、自動回帰的フレーム生成において、1分前の関連情報を参照する長期視覚メモリ機能を搭載した。これにより、ユーザーが同じ場所を再訪問した際も環境の一貫性が維持される。従来のNeRFsやGaussian Splattingとは異なり、明示的な3D表現に依存せず、フレームごとに動的で豊かな世界を創造する点が特徴だ。

同社は10年以上にわたってシミュレーション環境の研究を pioneering してきており、リアルタイム戦略ゲームのエージェント訓練から、オープンエンド学習やロボティクス向けシミュレーション環境開発まで手がけてきた。ワールドモデルはAGI(汎用人工知能)への重要なステップとして位置づけられ、AIエージェントが豊富なシミュレーション環境の無制限カリキュラムで訓練することを可能にするとしている。

https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

関連記事

最新ニュース記事

  1. Google、「検索 Live」を日本で提供開始――200以上の国・地域でAIモードのマルチモーダル検索が解禁

  2. Apple、企業向け統合プラットフォーム「Apple Business」を発表——MDM・メール・Mapsの広告機能を一本化、4月14日から無料提供

  3. OpenAI、動画生成アプリ「Sora」を6カ月で終了——Disneyとの10億ドル提携も白紙、コスト圧縮とIPOを優先

  4. AnthropicのClaude Codeに「自動モード」登場——AIが危険操作を自律判断、開発者の承認疲れを解消

  5. GO、高輪ゲートウェイ駅に首都圏初の「アプリのりば」を開設――JR東日本と実証実験を開始

  6. ニコニコ動画、縦型ショート動画機能「ニコニコショート」を4月15日より提供開始 流れるコメントで一体感のある視聴体験を実現

  7. Google、AIデザインツール「Stitch」を大幅刷新——「バイブデザイン」と無限キャンバスで構想からプロトタイプまで一気通貫

  8. Googleが「パーソナルインテリジェンス」を無料ユーザーへ開放 GeminiがGmailや写真と連携し個人最適化回答を実現

  9. LayerXがARR100億円を達成、AIエージェント事業が成長を牽引

  10. AnthropicがClaude Coworkに「Dispatch」機能を追加——スマートフォンからデスクトップAIエージェントをリモート操作

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場