カラクリ、日本初のコンピュータ操作AI「KARAKURI VL」を公開

カスタマーサポート向けAIを開発するカラクリ株式会社は9日、日本企業初となるComputer-Using Agent(CUA)モデル「KARAKURI VL」を公開した。

経済産業省とNEDOが推進するGenerative AI Accelerator Challenge(GENIAC)第2期で開発されたもので、日本語画像読解タスクにおいて国内最高性能を記録した。

CUAは自然言語指示でコンピュータ操作を完全自動化できる次世代AI技術。従来は海外モデルが中心であり、日本語環境への対応に課題があった。カラクリは縦書き横書き混在の日本語UIや複雑な図表に対応する独自技術を搭載。マウスクリックやキーボード操作を実行し、人間と同様にアプリケーションを操作可能とした。開発にはQwen2.5-VLを基盤とし、AWS Trainiumでの大規模学習に成功。国際ベンチマーク「OSWorld」を翻訳・改変した400タスク以上の日本語版「OSWorld-JP」を開発し、評価基準を確立したことも特筆される。

代表の小田志門は「日本語業務環境に最適化されたAIで、企業の現場課題を解決する礎になる」と語る。一方、実用化にはガードレール技術の高度化や、各企業の操作パターン学習が不可欠とされる。カラクリは今後、音声入力にも対応するオムニモーダル化や強化学習による性能向上を進め、ベテランオペレーター同等の業務遂行を可能にするAIへと成長させる方針。公開デモは期間限定で視聴可能。

関連記事

最新ニュース記事

  1. NTTドコモビジネス、スタジアム運営DX支援開始

  2. OpenAI、健康特化の「ChatGPT ヘルスケア」発表

  3. Stella AI for Biz、スマホで議事録生成が可能に

  4. 投資家の4割がAI活用!2026年不動産投資「5大トレンド」

  5. あなたの街のスーパーが消えていく?倒産件数1.5倍増

  6. 2026年景気「やや明るい」も油断禁物?インフレ懸念が過去最高に

  7. TV局スタジオが起業バトルの舞台に!東海テレビ発”熱狂”の新規事業ピッチイベント

  8. 「キャリアはDIY」時代に、上司の支援は追いつくか――マンパワーグループが“新原則”を提示

  9. ChatGPTの回答が“炎上の火種”に? GMO NIKKO、生成AIの誤情報を検知・是正する風評対策を提供開始

  10. 会社の忘年会、参加したいのは“3人に1人”――若手ほど前向き、理想は「19時開始・21時解散」

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場