KittenTTS logo

KittenTTS

最先端のテキスト音声化モデル | 25MB | ブラウザで動作

Artificial Intelligence GitHub Open Source Audio

KittenTTSの概要

KittenTTSは、超コンパクトでありながら高い表現力を持つオープンソースのテキスト音声化(TTS)モデルです。特に開発者やハッカーに適しており、あらゆるデバイスでAIを簡単に活用できます。

特徴

  • 8つの声: 4つの女性音声と4つの男性音声を搭載。
  • 軽量モデル: プレビュー版は約1500万パラメータ、25MB未満で動作。
  • 多様なデバイス対応: Raspberry Piやスマートフォン、古いラップトップでも動作し、GPUは不要。
  • オープンソース: 誰でも利用できる無料モデル。

将来の展望

現在は英語に対応しており、多言語サポートも計画中です。効率的なモデルに興味がある方や、インディーズ製品への利用に最適なプラットフォームです。

投票数: 9
← 投稿一覧に戻る