AssemblyAI
ストックにはログインが必要です
音声エージェント向け、ストリーミング対応で最も正確な音声認識モデル。
Artificial Intelligence
Developer Tools
Audio
概要
Universal-3 Pro Streamingは、音声エージェント向けのリアルタイムSTTで最も正確です。エンティティ検出・話者ラベル・コードスイッチングを備え、難所である不発話・英数字・ノイズ環境にも対応します。1つのAPIで99言語以上をサポート。新機能としてリアルタイム話者ディアリゼーションとグローバル言語対応を追加しました。従来のストリーミングでは解決できなかったエッジケースを網羅します。
投票数: 70