DeepLは2026年2月2日、リアルタイムの音声文字起こしと翻訳を可能にする「DeepL Voice API」の一般提供を開始した。開発者は自社アプリケーションに、音声ストリーミング、文字起こし、最大5言語への即時翻訳機能を統合でき、多言語コミュニケーションの質と効率を高められる。

同APIは、音声でのやり取りが業務の中心となる業界での活用を想定して設計されており、コンタクトセンターやビジネス・プロセス・アウトソーシング(BPO)事業者を中心に初期導入が進む見通しである。言語別の人員配置が求められてきた従来の運用を見直し、より柔軟な体制構築を可能にする。
コンタクトセンターでは、リアルタイム音声文字起こしと翻訳をオペレーションに組み込むことで、スーパーバイザーが顧客と担当者の会話内容を即座に把握できる。担当者も言語の違いを意識せず対応でき、異なる言語話者への引き継ぎや翻訳を介したテキスト対応に依存する必要がなくなる。
運用面では、正確な文字起こしと翻訳データを活用し、品質チェックや研修を効率化できる。拠点間での評価基準の平準化や、担当者のスキル・知識差に関するフィードバックの改善にもつながる。言語の壁による通話時間の長期化や再連絡、誤解に起因するコスト増を抑え、顧客体験の向上を後押しする。
DeepLの最高製品責任者(CPO)であるゴンサロ・ガイオラス氏は、「言語の壁は、顧客が重要な課題解決を求める際の大きな障害となってきた。DeepL Voice APIは、コンタクトセンターをコストセンターから、顧客体験を通じて価値を生み出す領域へと変えていく」とコメントしている。
DeepL Voice APIの導入により、企業は言語力ではなく専門性を軸とした人材配置が可能となる。多言語対応スタッフが限られる夜間や週末、祝日でも一定のサービスレベルを維持でき、採用の選択肢を広げつつ運用コストの最適化を図れる点も強みである。
また、今回の発表には音声から音声へのリアルタイム翻訳機能を体験できる6週間の早期アクセスプログラムも含まれる。2月中旬から提供予定で、担当者は翻訳された音声をリアルタイムで聞きながら顧客対応を行えるようになる。
DeepL Voice APIは2月2日より、DeepL API Pro契約者向けに提供を開始した。テキスト翻訳で評価を高めてきたDeepLは、音声領域への本格展開を通じ、企業の多言語コミュニケーション基盤としての存在感を一段と強める構えである。

