VoxCPM logo

VoxCPM

リアルな声を実現するトークナイザーなしのTTS

Artificial Intelligence GitHub Open Source Audio

VoxCPMとは?

VoxCPMは、最新のオープンソースのトークナイザーなしTTS(テキスト読み上げ)モデルです。

特徴

  • トークナイザーなし: 音声を連続空間でモデル化し、離散トークンの制約から解放されます。
  • 表現力豊か: 文脈に応じた生成機能により、テキストを読み上げる際のトーンを変えることが可能です。例えば、物語を語るようにも、ニュースを伝えるようにもなります。
  • リアルな音声クローン: ゼロショット音声クローン機能によって、音色だけでなく話者の独特のアクセントや感情も再現します。

使用環境

VoxCPMは一般消費者向けのGPUでも効率的に動作し、誰でも簡単に利用することができます。

投票数: 9
← 投稿一覧に戻る