
KittenTTS
ストックにはログインが必要です
最先端のテキスト音声化モデル | 25MB | ブラウザで動作
Artificial Intelligence
GitHub
Open Source
Audio
KittenTTSの概要
KittenTTSは、超コンパクトでありながら高い表現力を持つオープンソースのテキスト音声化(TTS)モデルです。特に開発者やハッカーに適しており、あらゆるデバイスでAIを簡単に活用できます。
特徴
- 8つの声: 4つの女性音声と4つの男性音声を搭載。
- 軽量モデル: プレビュー版は約1500万パラメータ、25MB未満で動作。
- 多様なデバイス対応: Raspberry Piやスマートフォン、古いラップトップでも動作し、GPUは不要。
- オープンソース: 誰でも利用できる無料モデル。
将来の展望
現在は英語に対応しており、多言語サポートも計画中です。効率的なモデルに興味がある方や、インディーズ製品への利用に最適なプラットフォームです。
投票数: 9