カラクリ、日本初のコンピュータ操作AI「KARAKURI VL」を公開

カスタマーサポート向けAIを開発するカラクリ株式会社は9日、日本企業初となるComputer-Using Agent(CUA)モデル「KARAKURI VL」を公開した。

経済産業省とNEDOが推進するGenerative AI Accelerator Challenge(GENIAC)第2期で開発されたもので、日本語画像読解タスクにおいて国内最高性能を記録した。

CUAは自然言語指示でコンピュータ操作を完全自動化できる次世代AI技術。従来は海外モデルが中心であり、日本語環境への対応に課題があった。カラクリは縦書き横書き混在の日本語UIや複雑な図表に対応する独自技術を搭載。マウスクリックやキーボード操作を実行し、人間と同様にアプリケーションを操作可能とした。開発にはQwen2.5-VLを基盤とし、AWS Trainiumでの大規模学習に成功。国際ベンチマーク「OSWorld」を翻訳・改変した400タスク以上の日本語版「OSWorld-JP」を開発し、評価基準を確立したことも特筆される。

代表の小田志門は「日本語業務環境に最適化されたAIで、企業の現場課題を解決する礎になる」と語る。一方、実用化にはガードレール技術の高度化や、各企業の操作パターン学習が不可欠とされる。カラクリは今後、音声入力にも対応するオムニモーダル化や強化学習による性能向上を進め、ベテランオペレーター同等の業務遂行を可能にするAIへと成長させる方針。公開デモは期間限定で視聴可能。

関連記事

最新ニュース記事

  1. YouTube、対話型AI検索「Ask YouTube」と生成AI「Gemini Omni」を発表——Shorts動画のリミックスや複雑検索が可能に

  2. シュクレイ、伊勢丹新宿店に新ミルフィユ専門店「MILLI MILLI(ミリミリ)」出店 ブランド力と「顧客体験」で勝負

  3. 乳幼児のRSウイルス重症化を防ぐ「母子免疫ワクチン」 原則無料の定期接種開始から1カ月半、現場の期待と課題

  4. 発酵性食物繊維で“腸活”を提案 「KINNOE518フェス」で給食型イベント開催

  5. タイミー、BPOサービス「Timee BPO」を正式提供開始——1,340万人基盤から即戦力ワーカーを最短翌日アサイン

  6. Runway、日本に本格進出 東京オフィス開設と40億円超の初期投資を発表

  7. AnthropicがAI初心者でも使える「Claude for Small Business」を発表――QuickBooksやPayPalと連携し15の業務ワークフローを自動化

  8. Google、Android向け新AI機能群「Gemini Intelligence」を発表——複数アプリ横断タスク自動化で端末を「インテリジェンスシステム」へ

  9. NTTドコモビジネス、AIエージェント経済圏の信頼基盤「属性情報レジストリ」のプロトタイプを開発

  10. NTT、触覚を伝えずに「柔らかさ」や「粘り気」を再現する世界初の錯覚手法を考案

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場