Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

2026.04.03
2026.04.07
DX・AI テクノロジー

Microsoftは2026年4月2日、自社開発の音声認識AIモデル「MAI-Transcribe-1」のパブリックプレビューを開始した。同時に音声生成モデル「MAI-Voice-1」、テキスト→画像生成モデル「MAI-Image-2」の3モデルをMicrosoft Foundryおよびデベロッパー向けのMAI Playgroundで公開した。

MAI-Transcribe-1は主要25言語に対応した音声認識（Speech-to-Text）モデルだ。業界標準ベンチマーク「FLEURS」での評価では、単語誤り率（WER）3.8%を達成し、OpenAI Whisper large-v3、GPT-Transcribe、Google Gemini 3.1 Flash-Liteを上回り、対応25言語中11言語でトップの精度を記録した。GPU処理コストは競合製品比で約50%削減されており、エンタープライズ向けにコスト効率が高い設計となっている。

https://microsoft.ai/news/today-were-announcing-3-new-world-class-mai-models-available-in-foundry/

同モデルはバックグラウンドノイズ、低品質音声、複数人が同時に話す状況など、現実の過酷な収録環境での利用を想定して構築されている。ビジネス向けの主な活用シーンとしては、会議のリアルタイム文字起こし、コールセンターの通話分析、動画字幕の自動生成、アクセシビリティ対応、音声エージェント構築などが挙げられる。

音声生成モデルMAI-Voice-1は1枚のGPUで60秒分の表現豊かな音声を1秒未満で生成できる。MAI-Image-2はテキストから画像を生成するモデルで、Arena.aiの画像モデルリーダーボードで第3位にデビューした。Microsoftは、これらのモデルがすでにCopilot、Bing、PowerPointなどの自社製品に組み込まれていると説明している。

BIZNEWS365

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

関連記事

「個人開発×AI」記事が前年同期比15.5倍、Qiitaが技術トレンド分析を発表——AIは「ツール」から「自律的なパートナー」へ

マイクがお気に入り？　3D巨大猫『新宿東口の猫』の新作動画『ねこ＆エコー編』　9月29日放映スタート！

OpenAI、動画生成アプリ「Sora」を6カ月で終了——Disneyとの10億ドル提携も白紙、コスト圧縮とIPOを優先

恋愛感情が味に!?「恋AIパン」発売

DeepL、リアルタイム音声翻訳APIを提供開始　コンタクトセンターの多言語対応を効率化

法人向けChatGPT「ChatPro」　SSO認証対応へ

LINEヤフー、広告画像生成AIを提供開始　テキスト入力だけで画像生成「LINE Creative Lab」

新東名高速で大型トラックの自動運転実証実験を開始、2026年の社会実装を目指す

Google、AI音声アシスタント「Gemini for Home」の早期アクセスを日本向けに開始——スマートカメラの映像検索や複雑なスマートホーム操作に対応

MLBワールドシリーズ第5戦、ドジャース優勝シーンに視聴者熱視線！　REVISIOが注目度データを公開

GensparkがAIチャット無制限化と自律型エージェントを同時発表

ソフトバンクGとOpenAI、AIサイバー防御サービス「Patching as a Service」を提供開始——重要インフラを狙う高度化した攻撃に対抗

最新ニュース記事

累計40万件突破の100円保険「熱中症お見舞い金」がLINEに登場！手軽な備えと歩く習慣で猛暑を乗り切る

KDDI、ポップカルチャー体験拠点「POP Culture Style IKEBUKURO」をオープン　AI技術×アニメ文化で新たなエンターテインメント空間を演出

辻希美、5人の子育てで実感した肌ケアの大切さ　専門医と考える小児アトピー性皮膚炎の治療選択肢

LINEとPayPay、2026年夏にアカウント連携開始送金・割り勘・ポイント統合へ

LINE、トーク内でAIエージェント「Agent i」呼び出し可能な新機能 2026年内提供へ

Anthropic、新モデル「Claude Sonnet 5」を発表コーディングと業務自動化で高い自律性

SIE、PS向け新作ディスク生産を2028年1月に終了ダウンロード版に一本化

LINEヤフー、Yahoo!ニュースにプレスリリース掲載サービス「ニュースPR」を開始 1掲載3万円でAI記事化も

Anthropic、輸出規制解除受け「Claude Fable 5」再展開サイバー安全対策を強化

富士フイルム、「写ルンです」40周年で新製品防水モデルと黒白フィルムモデルを投入

365AIニュースセンター最新記事

不登校からの復学へ！お子様の心を動かす7つのきっかけ

入学できないことも？「フリースクール入学拒否問題」の現実とその対処法

フリースクール中学校・通信制高校生の卒業後の進路：進学以外の就職という選択肢

中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

不登校脱出への道？フリースクールの魅力と注意点-親子で考える新たな一歩-

Amazonが「プライムデー夏祭り」を六本木で開催！

甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定！「もろこしチーズバーガー」新登場

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

関連記事

最新ニュース記事

累計40万件突破の100円保険「熱中症お見舞い金」がLINEに登場！手軽な備えと歩く習慣で猛暑を乗り切る

KDDI、ポップカルチャー体験拠点「POP Culture Style IKEBUKURO」をオープン AI技術×アニメ文化で新たなエンターテインメント空間を演出

辻希美、5人の子育てで実感した肌ケアの大切さ 専門医と考える小児アトピー性皮膚炎の治療選択肢

LINEとPayPay、2026年夏にアカウント連携開始 送金・割り勘・ポイント統合へ

LINE、トーク内でAIエージェント「Agent i」呼び出し可能な新機能 2026年内提供へ

Anthropic、新モデル「Claude Sonnet 5」を発表 コーディングと業務自動化で高い自律性

SIE、PS向け新作ディスク生産を2028年1月に終了 ダウンロード版に一本化

LINEヤフー、Yahoo!ニュースにプレスリリース掲載サービス「ニュースPR」を開始 1掲載3万円でAI記事化も

Anthropic、輸出規制解除受け「Claude Fable 5」再展開 サイバー安全対策を強化

富士フイルム、「写ルンです」40周年で新製品 防水モデルと黒白フィルムモデルを投入

365AIニュースセンター最新記事

不登校からの復学へ！お子様の心を動かす7つのきっかけ

入学できないことも？「フリースクール入学拒否問題」の現実とその対処法

フリースクール中学校・通信制高校生の卒業後の進路：進学以外の就職という選択肢

中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

不登校脱出への道？フリースクールの魅力と注意点-親子で考える新たな一歩-

Amazonが「プライムデー夏祭り」を六本木で開催！

甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定！「もろこしチーズバーガー」新登場

ログイン

パスワード再設定

KDDI、ポップカルチャー体験拠点「POP Culture Style IKEBUKURO」をオープン　AI技術×アニメ文化で新たなエンターテインメント空間を演出

辻希美、5人の子育てで実感した肌ケアの大切さ　専門医と考える小児アトピー性皮膚炎の治療選択肢

LINEとPayPay、2026年夏にアカウント連携開始送金・割り勘・ポイント統合へ

Anthropic、新モデル「Claude Sonnet 5」を発表コーディングと業務自動化で高い自律性

SIE、PS向け新作ディスク生産を2028年1月に終了ダウンロード版に一本化

Anthropic、輸出規制解除受け「Claude Fable 5」再展開サイバー安全対策を強化

富士フイルム、「写ルンです」40周年で新製品防水モデルと黒白フィルムモデルを投入