マイクロソフト転がったLive Interpreter API をパブリック プレビューで公開し、Azure Speech Translation プラットフォームを拡張します。この新機能により、音声をリアルタイムで自動的に検出して翻訳するため、入力言語を事前に選択する必要がなくなります。これは、話者が会話の途中で切り替わる場合にも当てはまります。
Microsoftによれば、このサービスは人間の通訳レベルの遅延を実現しながら、自然な響きのパーソナル音声テクノロジーによりトーン、ペース、スタイルを維持します。
それで、さらに何があるでしょうか?ライブインタープリターAPI76 の入力言語と 143 のロケールをカバー、市場で最も包括的な翻訳サービスの 1 つとなっています。自動化された継続的な言語識別に加えて、通訳者レベルの速度、低遅延の翻訳、および音声保存コントロールエンタープライズ用途向けに設計されています。
Microsoft は、この API は多言語の Teams 会議、コンタクト センター、教室、グローバル ライブ イベントの強化に役立つと述べています。これにより、参加者は会話の流れを失うことなく、好みの言語でシームレスに対話できるようになります。
企業にとっては、言語メニューやセッションの再起動を行わずに、海外の顧客にサービスを提供するのに役立ちます。一方、教育者にとっては、学生の母国語で講義を確実に受講できるというメリットがあります。さらに、クリエイターにとっては、ブランドの個性を維持しながら、世界中の視聴者にライブ ストリーミングを提供できるようになります。
Live Interpreter API は現在パブリック プレビューで利用可能であり、開発者は Microsoft のクイックスタートガイド多言語音声翻訳に。










