カラクリ、日本初のコンピュータ操作AI「KARAKURI VL」を公開

カスタマーサポート向けAIを開発するカラクリ株式会社は9日、日本企業初となるComputer-Using Agent(CUA)モデル「KARAKURI VL」を公開した。

経済産業省とNEDOが推進するGenerative AI Accelerator Challenge(GENIAC)第2期で開発されたもので、日本語画像読解タスクにおいて国内最高性能を記録した。

CUAは自然言語指示でコンピュータ操作を完全自動化できる次世代AI技術。従来は海外モデルが中心であり、日本語環境への対応に課題があった。カラクリは縦書き横書き混在の日本語UIや複雑な図表に対応する独自技術を搭載。マウスクリックやキーボード操作を実行し、人間と同様にアプリケーションを操作可能とした。開発にはQwen2.5-VLを基盤とし、AWS Trainiumでの大規模学習に成功。国際ベンチマーク「OSWorld」を翻訳・改変した400タスク以上の日本語版「OSWorld-JP」を開発し、評価基準を確立したことも特筆される。

代表の小田志門は「日本語業務環境に最適化されたAIで、企業の現場課題を解決する礎になる」と語る。一方、実用化にはガードレール技術の高度化や、各企業の操作パターン学習が不可欠とされる。カラクリは今後、音声入力にも対応するオムニモーダル化や強化学習による性能向上を進め、ベテランオペレーター同等の業務遂行を可能にするAIへと成長させる方針。公開デモは期間限定で視聴可能。

関連記事

最新ニュース記事

  1. 乳幼児のRSウイルス重症化を防ぐ「母子免疫ワクチン」 原則無料の定期接種開始から1カ月半、現場の期待と課題

  2. 発酵性食物繊維で“腸活”を提案 「KINNOE518フェス」で給食型イベント開催

  3. タイミー、BPOサービス「Timee BPO」を正式提供開始——1,340万人基盤から即戦力ワーカーを最短翌日アサイン

  4. Runway、日本に本格進出 東京オフィス開設と40億円超の初期投資を発表

  5. AnthropicがAI初心者でも使える「Claude for Small Business」を発表――QuickBooksやPayPalと連携し15の業務ワークフローを自動化

  6. Google、Android向け新AI機能群「Gemini Intelligence」を発表——複数アプリ横断タスク自動化で端末を「インテリジェンスシステム」へ

  7. NTTドコモビジネス、AIエージェント経済圏の信頼基盤「属性情報レジストリ」のプロトタイプを開発

  8. NTT、触覚を伝えずに「柔らかさ」や「粘り気」を再現する世界初の錯覚手法を考案

  9. 市場シェア30%。SNSを席巻する「AIインフルエンサー」が年収数千万を稼ぐ現実。2026年、ブランドが人間に見切りをつける日

  10. OpenAI、サイバー防衛AIイニシアチブ「Daybreak」発表——GPT-5.5-CyberとCodexでソフトウェアを設計段階から保護

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場