
Aya Vision
ストックにはログインが必要です
Cohereからの多言語・マルチモーダルAI
Artificial Intelligence
Open Source
Photo & Video
概要
Cohere For AIが提供するAya Visionは、オープンウェイトの多言語マルチモーダルAIモデルです。主に以下の特長を持っています。
- 多言語対応: 23の言語をサポートし、英語に偏らない性能を実現。
- マルチモーダル: テキストだけでなく、画像や動画も処理可能。
- 性能面での優位性: 8Bおよび32Bモデルは、Llama 3 90Bのようなより大規模なモデルよりも多言語マルチモーダルタスクで優れた性能を発揮。
- 利用可能なプラットフォーム: Hugging FaceやKaggleでオープンに利用でき、WhatsAppでも無料で試すことができる。
さらに、特にマルチリンガルマルチモーダル性能を評価するための新たなベンチマーク、Aya Vision Benchmarkも準備中です。これにより、AIが異なる文化や言語のニュアンスを理解し、多言語を単に追加するだけでないAIの実現を目指します。
投票数: 145