Scribzy
ストックにはログインが必要です
リアルタイムストリーミング対応のAI搭載音声文字起こし
Artificial Intelligence
Productivity
Audio
概要
リアルタイムストリーニング対応のAI音声文字起こしサービス。
主な特徴
- リアルタイム文字起こし
- 話者分離(タイムスタンプ付き)
- ノイズ抑制で音声品質向上
- 複数ファイルの一括アップロード
- 全文検索・TXT/SRT/VTT/JSON形式でエクスポート
- 自動言語検出で99言語以上対応
- Webhook連携による自動化
開発背景と技術的ポイント
既存ツールの課題を克服するためゼロから構築。音声タイプを自動検出して最適な処理へルーティングする部分が難所で、数ヶ月の試行錯誤を経て実現。リアルタイム性の確保とGPU推論の両立には多くの微調整を要した。
想定ユーザー
会議・インタビュー・ポッドキャスト・字幕制作など、さまざまな用途に適している。
投票数: 1