xAIは17日(米国時間)、最新のAIモデル「Grok 3」を発表した。イーロン・マスク氏は「地球上で最も賢いAI」と強調し、競合のGPT-4oやGemini-2 Proを超える性能を持つと主張している。Xの有料プラン「Premium+」に契約しているユーザー向けにすでに提供が開始されており、新たなサブスクリプションサービス「SuperGrok」でも利用可能。
ベンチマークで高評価を獲得
Grok 3は、前世代のGrok 2と比較して10倍のトレーニングを実施。数学、科学、コーディングの分野において、主要な競合モデルよりも高いスコアを記録した。コンパクトな「Grok 3 mini」でも同等以上のパフォーマンスを発揮するという。
また、推論能力を強化した「Grok 3 Reasoning」と「Grok 3 mini Reasoning」も発表。AIMEやGPQAといったベンチマークにおいて、o3-mini(high)、Gemini-2 Flash Thinking、DeepSeek-R1などの競合モデルを上回る結果を示した。xAIは、これによりGrok 3がより正確な結論を導き出せると強調している。
高度な検索機能「DeepSearch」を搭載
Grok 3では、AIを活用した高度な検索機能「DeepSearch」も導入。ユーザーの質問に応じて、多数のWebサイトから情報を収集・分析し、短時間で的確な回答を提示する。通常のWebサイトだけでなく、X上の情報も活用する仕組みを採用している。
AI開発の新たなステージへ
Grok 3の開発には、20万台のGPUを用い、92日間にわたる事前学習を実施。これによりGrok 2の15倍の演算能力を実現した。さらに、AIモデル開発において知識を抽出する蒸留(distillation)を防止するため、推論プロセスの一部を見えにくくする対策も講じられている。
また、xAIはGrok 3のさらなる機能拡張も予告。音声モード(voice mode)を1週間から数週間以内に追加予定としており、AIの利用範囲を広げる方針だ。
Grok 3は、Xの有料プラン「Premium+」(月額2590円)のユーザーに提供されるほか、「SuperGrok」(月額30ドル)の契約者は追加の推論モデルやDeepSearchを利用できる。今後、Grok 2のオープンソース化も検討されており、AI開発のさらなる進化が期待される。