Microsoft、音声も文章も自社で生成へ──高速AI音声「MAI‑Voice‑1」と応答特化LLM「MAI‑1‑preview」公開

2025年8月28日(現地時間)、Microsoftは初の自社開発AIモデルとなる「MAI‑Voice‑1」「MAI‑1‑preview」を正式に発表しました。これにより、音声対応や自然な対話性能を自社で強化し、OpenAIへの依存を減らすAI戦略の方向性が明らかになりました。


注目の新モデル:音声と文章、それぞれの役割とは?

MAI‑Voice‑1:高速・自然なAI音声生成

  • 約1分の音声を1秒以内で生成できる高性能な音声モデルで、少ないGPUリソースでも動作可能です。
  • すでに Copilot Daily のニュース読み上げやポッドキャスト形式の対話生成に活用されており、Copilot Labsで声質や話し方の調整も可能です。

MAI‑1‑preview:応答性重視のLLM

  • 約15,000台の高性能H100 GPUを使って訓練された、Microsoft初の基盤モデルです。
  • 指示に従った応答性能が高く、LMArenaでの公開検証も始まり、今後のCopilot機能への統合も見込まれています。

背景:なぜ今、自社モデルなのか?

  • 自前モデルでのAI展開により、コストや性能を自社で最適化できる体制を整備中。OpenAI依存の軽減へと動いています。
  • 高性能モデルでも効率の良い設計で、少ないGPUリソースでも実用的な性能を確保する“スマート設計”が企業の強みです。

実用シーンでの活用例と今後の展望

  • 日々の情報提供や会話AIとして、ZA VMAI‑Voice‑1が“声のAIアシスタント”として活躍する場面は増えていきそうです。
  • MAI‑1‑previewは、文章生成や質問応答など、Copilot機能の応答品質を向上させるキーモデルとなり得ます。
  • 今後、Microsoftはこれらを活用した複数の専門モデルを連携させることで、柔軟なAI用途に対応した総合的なAIエコシステムを目指しています。

まとめ:Microsoft、AI戦略を自社モデルで加速

Microsoftの「MAI‑Voice‑1」と「MAI‑1‑preview」発表は、自社AI開発による独自のサービス展開への第一歩です。高速音声生成と高度な応答性能を武器に、AIを通じた新たなユーザー体験が広がることが期待されます。今後は、これらのモデルを活用したAI機能の幅広い展開が注目されます。


引用元:https://microsoft.ai/news/two-new-in-house-models/

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です