
MiMo-Audio
ストックにはログインが必要です
オーディオ言語モデルは少数ショット学習者です
Artificial Intelligence
GitHub
Open Source
Audio
概要
XiaomiのMiMo-Audioは、オープンソースの音声知能において重要な進展をもたらしました。これまでの依存関係からの脱却を図り、1億時間以上のデータを用いてプレトレーニングされています。最近の出現と文脈内学習機能を持つオーディオモデルとして、新たな時代を築いています。
特徴
- 少数ショット学習: 大規模ラベル付きデータセットの制約を克服し、効果的なパフォーマンスを発揮。
- 新しいアーキテクチャ: 最新のプレトレーニングアーキテクチャを採用。
- オープンソース: トークナイザーや評価スイートなど、全スタックがオープンソース。
これにより、「LLaMAの瞬間」と呼ばれる新しい可能性がオープンソースオーディオモデルにもたらされ、今後の展開が期待されています。興味のある方はリンクからぜひ体験してみてください。
投票数: 7