イレブンラボ、高精度STT新モデル「Scribe V2」発表

AI音声技術のグローバルリーダーであるElevenLabs(イレブンラボ)は1月20日、音声認識(STT)の最新モデル「Scribe V2」を発表した。字幕・キャプション制作や大規模文字起こしに最適化された次世代モデルとして、長尺・複雑な音声でも精度と安定性を維持する設計となっている。

Scribe V2は90以上の言語に対応し、業界標準ベンチマークにおいて最低水準のWER(単語誤り率)を記録。日本語モデルにおいても他社主要モデルを凌駕する認識精度を実証している。

主要機能として、最大100個の単語・フレーズを指定できる「Keyterm Prompting」を搭載。社内用語や製品名、医療・法律・技術用語など専門性の高い領域での精度向上を実現する。また「Entity Detection」機能では、個人情報や決済情報、医療データなど最大56カテゴリを自動検知し、マスキングとタイムスタンプ付与が可能だ。

同一音声ファイル内で言語が切り替わるケースでも自動判定して文字起こしを行うほか、話者分離、単語レベルのタイムスタンプ、笑い声や拍手などの音イベントタグ機能も標準搭載される。

セキュリティ面では、SOC 2、ISO 27001、PCI DSS Level 1、HIPAA、GDPRなどの要件に対応。Scribe V2は本日より、同社のAPIおよびプロダクトから利用可能である。

関連記事

最新ニュース記事

  1. メルカード、シンガーソングライターtuki.と初のコラボライブ開催 抽選で1100名を無料招待

  2. AIアバターが受付を担う「AI PRIME ACTOR CLOUD」登場、82言語・24時間対応で人件費75%削減へ

  3. LINEヤフー、AIエージェント新ブランド「Agent i」始動 LINE・Yahoo!からワンタップでアクセス

  4. Anthropic、ビジュアル制作AI「Claude Design」公開 プロトタイプや資料を対話で作成

  5. NEC、地域金融機関12行が参画する「サイバーセキュリティ共同センター」を提供開始 業界横断の共助モデルで対策高度化

  6. ソフトバンク、AI搭載スマホ「Natural AI Phone」を4月24日発売 アプリを横断するシームレス操作を実現

  7. ソフトバンク、国産LLM「Sarashina」を活用した生成AIサービスを6月提供開始 データ主権対応クラウド「Cloud PF Type A」上で展開

  8. 既婚者の約9割「旅行は夫婦関係に良い変化をもたらす」 エアトリ調査、GW旅行先1位は北海道

  9. OpenAI、Codexを「スーパーアプリ」へ刷新 PC全アプリ操作・自律タスク・画像生成を一体化

  10. OpenAI、創薬特化AIモデル「GPT-Rosalind」を発表 ゲノム解析から実験計画まで支援

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場