Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

2026.04.03
2026.04.07
DX・AI テクノロジー

Microsoftは2026年4月2日、自社開発の音声認識AIモデル「MAI-Transcribe-1」のパブリックプレビューを開始した。同時に音声生成モデル「MAI-Voice-1」、テキスト→画像生成モデル「MAI-Image-2」の3モデルをMicrosoft Foundryおよびデベロッパー向けのMAI Playgroundで公開した。

MAI-Transcribe-1は主要25言語に対応した音声認識（Speech-to-Text）モデルだ。業界標準ベンチマーク「FLEURS」での評価では、単語誤り率（WER）3.8%を達成し、OpenAI Whisper large-v3、GPT-Transcribe、Google Gemini 3.1 Flash-Liteを上回り、対応25言語中11言語でトップの精度を記録した。GPU処理コストは競合製品比で約50%削減されており、エンタープライズ向けにコスト効率が高い設計となっている。

https://microsoft.ai/news/today-were-announcing-3-new-world-class-mai-models-available-in-foundry/

同モデルはバックグラウンドノイズ、低品質音声、複数人が同時に話す状況など、現実の過酷な収録環境での利用を想定して構築されている。ビジネス向けの主な活用シーンとしては、会議のリアルタイム文字起こし、コールセンターの通話分析、動画字幕の自動生成、アクセシビリティ対応、音声エージェント構築などが挙げられる。

音声生成モデルMAI-Voice-1は1枚のGPUで60秒分の表現豊かな音声を1秒未満で生成できる。MAI-Image-2はテキストから画像を生成するモデルで、Arena.aiの画像モデルリーダーボードで第3位にデビューした。Microsoftは、これらのモデルがすでにCopilot、Bing、PowerPointなどの自社製品に組み込まれていると説明している。

BIZNEWS365

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

関連記事

地図サービスを提供するジオテクノロジーズが未来予測可能な独自プラットフォーム「GPP」を展開

OpenAI、最先端コーディングAI「GPT-5.2-Codex」提供開始

AIアナウンサー、沖縄の放送局で活躍へ！多言語ニュース配信の新時代

ストリーミングやPC作業の効率性を高める「Loupedeck Live S」が、2月1日より一般発売を順次スタート

ChatGPTが最新ウェブ検索機能を搭載、情報収集がより便利に

Canva社、画像生成AIを活用した新機能を大幅アップデート

ランサーズ、生成AI支援サービスを発表。実証された成果を基に、企業の生産性向上を後押し

【コラム】テスラのロボタクシー、インパクトある発表の裏に潜む技術的課題と市場の冷ややかな視線

YouTube、2026年の戦略発表　AI活用と青少年保護を強化

ChatGPT内で使えるアプリ機能が登場

楽天、新AIソリューション「未来購買予測」を提供開始！広告配信精度向上、企業マーケティング活動を支援

窓ガラスを活用した新型基地局、NECとAGCが実証実験　景観と持続可能性を両立

最新ニュース記事

流通業界初の「流通ISAC」設立へ——アサヒ・NTT・三菱食品ら9者がサイバーセキュリティで業界横断連携

Google Pixel 10a、日本で4月14日発売——7万9900円に据え置き、日本限定色「Isai Blue」も登場

電通、業種・推し活など特化型AIペルソナを開発——「AI For Growth Talk」に搭載し生活者インサイトの高速探索を実現

Claude、Microsoft 365コネクターを全プランで提供開始——SharePoint・Teams・Outlookのデータをそのまま活用

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

トヨタ、米国生産のタンドラ・ハイランダーを日本発売　新制度活用で日米貿易摩擦に対応

LINEヤフー、赤坂トラストタワーに新オフィス開設　週3出社移行でハイブリッドワークを強化

楽天「Rチャンネル」、AIで自治体の動画制作を効率化——地域創生支援サービスを提供開始、ふるさと納税PRにも対応

松尾研究所、プログラミング未経験者向けデータサイエンス講座「GCI 2026 Summer」を4月開講——全15回・オンラインで実践力を習得

ECCとEfekta、新オンライン英語学習「ECC Online Hyper Lessons」発表　没入型体験で実践シーンを再現

365AIニュースセンター最新記事

不登校からの復学へ！お子様の心を動かす7つのきっかけ

入学できないことも？「フリースクール入学拒否問題」の現実とその対処法

フリースクール中学校・通信制高校生の卒業後の進路：進学以外の就職という選択肢

中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

不登校脱出への道？フリースクールの魅力と注意点-親子で考える新たな一歩-

Amazonが「プライムデー夏祭り」を六本木で開催！

甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定！「もろこしチーズバーガー」新登場

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

関連記事

最新ニュース記事

流通業界初の「流通ISAC」設立へ——アサヒ・NTT・三菱食品ら9者がサイバーセキュリティで業界横断連携

Google Pixel 10a、日本で4月14日発売——7万9900円に据え置き、日本限定色「Isai Blue」も登場

電通、業種・推し活など特化型AIペルソナを開発——「AI For Growth Talk」に搭載し生活者インサイトの高速探索を実現

Claude、Microsoft 365コネクターを全プランで提供開始——SharePoint・Teams・Outlookのデータをそのまま活用

Microsoft、自社開発の音声認識AIモデル「MAI-Transcribe-1」を公開——25言語でWhisperを超える精度、GPU費用は半減

トヨタ、米国生産のタンドラ・ハイランダーを日本発売 新制度活用で日米貿易摩擦に対応

LINEヤフー、赤坂トラストタワーに新オフィス開設 週3出社移行でハイブリッドワークを強化

楽天「Rチャンネル」、AIで自治体の動画制作を効率化——地域創生支援サービスを提供開始、ふるさと納税PRにも対応

松尾研究所、プログラミング未経験者向けデータサイエンス講座「GCI 2026 Summer」を4月開講——全15回・オンラインで実践力を習得

ECCとEfekta、新オンライン英語学習「ECC Online Hyper Lessons」発表 没入型体験で実践シーンを再現

365AIニュースセンター最新記事

不登校からの復学へ！お子様の心を動かす7つのきっかけ

入学できないことも？「フリースクール入学拒否問題」の現実とその対処法

フリースクール中学校・通信制高校生の卒業後の進路：進学以外の就職という選択肢

中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

不登校脱出への道？フリースクールの魅力と注意点-親子で考える新たな一歩-

Amazonが「プライムデー夏祭り」を六本木で開催！

甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定！「もろこしチーズバーガー」新登場

ログイン

パスワード再設定

トヨタ、米国生産のタンドラ・ハイランダーを日本発売　新制度活用で日米貿易摩擦に対応

LINEヤフー、赤坂トラストタワーに新オフィス開設　週3出社移行でハイブリッドワークを強化

ECCとEfekta、新オンライン英語学習「ECC Online Hyper Lessons」発表　没入型体験で実践シーンを再現