カラクリ、日本初のコンピュータ操作AI「KARAKURI VL」を公開

カスタマーサポート向けAIを開発するカラクリ株式会社は9日、日本企業初となるComputer-Using Agent(CUA)モデル「KARAKURI VL」を公開した。

経済産業省とNEDOが推進するGenerative AI Accelerator Challenge(GENIAC)第2期で開発されたもので、日本語画像読解タスクにおいて国内最高性能を記録した。

CUAは自然言語指示でコンピュータ操作を完全自動化できる次世代AI技術。従来は海外モデルが中心であり、日本語環境への対応に課題があった。カラクリは縦書き横書き混在の日本語UIや複雑な図表に対応する独自技術を搭載。マウスクリックやキーボード操作を実行し、人間と同様にアプリケーションを操作可能とした。開発にはQwen2.5-VLを基盤とし、AWS Trainiumでの大規模学習に成功。国際ベンチマーク「OSWorld」を翻訳・改変した400タスク以上の日本語版「OSWorld-JP」を開発し、評価基準を確立したことも特筆される。

代表の小田志門は「日本語業務環境に最適化されたAIで、企業の現場課題を解決する礎になる」と語る。一方、実用化にはガードレール技術の高度化や、各企業の操作パターン学習が不可欠とされる。カラクリは今後、音声入力にも対応するオムニモーダル化や強化学習による性能向上を進め、ベテランオペレーター同等の業務遂行を可能にするAIへと成長させる方針。公開デモは期間限定で視聴可能。

関連記事

最新ニュース記事

  1. Anthropic、エージェント開発を10倍加速する「Claude Managed Agents」をパブリックベータで公開

  2. GeminiアプリにNotebookLMと同期する「notebooks」機能——プロジェクト別に情報を一元管理

  3. Google、AI音声アシスタント「Gemini for Home」の早期アクセスを日本向けに開始——スマートカメラの映像検索や複雑なスマートホーム操作に対応

  4. Google Finance、AI搭載で100カ国以上に拡大——銘柄質問・テクニカル分析・決算ライブ聴取を一体提供

  5. Meta、AI部門MSL初のモデル「Muse Spark」を発表——WhatsApp・Instagramへ順次展開、並列エージェントで高度推論を実現

  6. Anthropic、AIサイバーセキュリティ連合「Project Glasswing」を始動——未公開モデル「Claude Mythos Preview」が主要OSの脆弱性を数千件発見

  7. GMOインターネットグループ、日本最大のヒューマノイド研究開発拠点を渋谷に開設——フィジカルAI事業を本格始動

  8. マネーフォワード、バックオフィスを自律処理するAIサービス「マネーフォワード AI Cowork」を7月提供へ 経理・労務・法務を同僚AIが代行

  9. 採用AIは「効率化」から「質の向上」へ 導入企業の9割が本質業務に回帰、未導入層との格差が拡大

  10. 流通業界初の「流通ISAC」設立へ——アサヒ・NTT・三菱食品ら9者がサイバーセキュリティで業界横断連携

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場