イレブンラボ、高精度STT新モデル「Scribe V2」発表

AI音声技術のグローバルリーダーであるElevenLabs(イレブンラボ)は1月20日、音声認識(STT)の最新モデル「Scribe V2」を発表した。字幕・キャプション制作や大規模文字起こしに最適化された次世代モデルとして、長尺・複雑な音声でも精度と安定性を維持する設計となっている。

Scribe V2は90以上の言語に対応し、業界標準ベンチマークにおいて最低水準のWER(単語誤り率)を記録。日本語モデルにおいても他社主要モデルを凌駕する認識精度を実証している。

主要機能として、最大100個の単語・フレーズを指定できる「Keyterm Prompting」を搭載。社内用語や製品名、医療・法律・技術用語など専門性の高い領域での精度向上を実現する。また「Entity Detection」機能では、個人情報や決済情報、医療データなど最大56カテゴリを自動検知し、マスキングとタイムスタンプ付与が可能だ。

同一音声ファイル内で言語が切り替わるケースでも自動判定して文字起こしを行うほか、話者分離、単語レベルのタイムスタンプ、笑い声や拍手などの音イベントタグ機能も標準搭載される。

セキュリティ面では、SOC 2、ISO 27001、PCI DSS Level 1、HIPAA、GDPRなどの要件に対応。Scribe V2は本日より、同社のAPIおよびプロダクトから利用可能である。

関連記事

最新ニュース記事

  1. DeepL、リアルタイム音声翻訳APIを提供開始 コンタクトセンターの多言語対応を効率化

  2. Apple、Xcode 26.3で「エージェンティックコーディング」対応 AIが自律的に開発工程を支援

  3. OpenAI、macOS向け「Codex」アプリ提供開始 複数AIエージェントを統合管理

  4. 相談相手はAI?三菱UFJが「AI行員」本格導入へ

  5. 「HVAC&R JAPAN 2026」初出展で見えたAQUAの成長戦略──ハイアールと挑む日本の空調BtoB市場の現実と可能性

  6. 2026年注目「フィジカルAI」AWSが9億円規模で日本企業を支援へ

  7. 民間病院の6割が赤字、医療機関の倒産・廃業が2年連続で過去最多更新

  8. Google Calendar、Geminiで最適な会議時間を自動提案

  9. 40代ビジネスマンが突然「仕事に手がつかなくなる」理由――それは能力低下ではなく、キャリア構造の問題かもしれない

  10. ChatGPTが18歳未満を自動判定!誤認されたら自撮りで解除

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場