イレブンラボ、高精度STT新モデル「Scribe V2」発表

AI音声技術のグローバルリーダーであるElevenLabs(イレブンラボ)は1月20日、音声認識(STT)の最新モデル「Scribe V2」を発表した。字幕・キャプション制作や大規模文字起こしに最適化された次世代モデルとして、長尺・複雑な音声でも精度と安定性を維持する設計となっている。

Scribe V2は90以上の言語に対応し、業界標準ベンチマークにおいて最低水準のWER(単語誤り率)を記録。日本語モデルにおいても他社主要モデルを凌駕する認識精度を実証している。

主要機能として、最大100個の単語・フレーズを指定できる「Keyterm Prompting」を搭載。社内用語や製品名、医療・法律・技術用語など専門性の高い領域での精度向上を実現する。また「Entity Detection」機能では、個人情報や決済情報、医療データなど最大56カテゴリを自動検知し、マスキングとタイムスタンプ付与が可能だ。

同一音声ファイル内で言語が切り替わるケースでも自動判定して文字起こしを行うほか、話者分離、単語レベルのタイムスタンプ、笑い声や拍手などの音イベントタグ機能も標準搭載される。

セキュリティ面では、SOC 2、ISO 27001、PCI DSS Level 1、HIPAA、GDPRなどの要件に対応。Scribe V2は本日より、同社のAPIおよびプロダクトから利用可能である。

関連記事

最新ニュース記事

  1. YouTube、対話型AI検索「Ask YouTube」と生成AI「Gemini Omni」を発表——Shorts動画のリミックスや複雑検索が可能に

  2. シュクレイ、伊勢丹新宿店に新ミルフィユ専門店「MILLI MILLI(ミリミリ)」出店 ブランド力と「顧客体験」で勝負

  3. 乳幼児のRSウイルス重症化を防ぐ「母子免疫ワクチン」 原則無料の定期接種開始から1カ月半、現場の期待と課題

  4. 発酵性食物繊維で“腸活”を提案 「KINNOE518フェス」で給食型イベント開催

  5. タイミー、BPOサービス「Timee BPO」を正式提供開始——1,340万人基盤から即戦力ワーカーを最短翌日アサイン

  6. Runway、日本に本格進出 東京オフィス開設と40億円超の初期投資を発表

  7. AnthropicがAI初心者でも使える「Claude for Small Business」を発表――QuickBooksやPayPalと連携し15の業務ワークフローを自動化

  8. Google、Android向け新AI機能群「Gemini Intelligence」を発表——複数アプリ横断タスク自動化で端末を「インテリジェンスシステム」へ

  9. NTTドコモビジネス、AIエージェント経済圏の信頼基盤「属性情報レジストリ」のプロトタイプを開発

  10. NTT、触覚を伝えずに「柔らかさ」や「粘り気」を再現する世界初の錯覚手法を考案

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場