Scribzy logo

Scribzy

リアルタイムストリーミング対応のAI搭載音声文字起こし

Artificial Intelligence Productivity Audio

概要

リアルタイムストリーニング対応のAI音声文字起こしサービス。

主な特徴

  • リアルタイム文字起こし
  • 話者分離(タイムスタンプ付き)
  • ノイズ抑制で音声品質向上
  • 複数ファイルの一括アップロード
  • 全文検索・TXT/SRT/VTT/JSON形式でエクスポート
  • 自動言語検出で99言語以上対応
  • Webhook連携による自動化

開発背景と技術的ポイント

既存ツールの課題を克服するためゼロから構築。音声タイプを自動検出して最適な処理へルーティングする部分が難所で、数ヶ月の試行錯誤を経て実現。リアルタイム性の確保とGPU推論の両立には多くの微調整を要した。

想定ユーザー

会議・インタビュー・ポッドキャスト・字幕制作など、さまざまな用途に適している。

投票数: 1
← 投稿一覧に戻る