Aya Vision logo

Aya Vision

Cohereからの多言語・マルチモーダルAI

Artificial Intelligence Open Source Photo & Video

概要

Cohere For AIが提供するAya Visionは、オープンウェイトの多言語マルチモーダルAIモデルです。主に以下の特長を持っています。

  • 多言語対応: 23の言語をサポートし、英語に偏らない性能を実現。
  • マルチモーダル: テキストだけでなく、画像や動画も処理可能。
  • 性能面での優位性: 8Bおよび32Bモデルは、Llama 3 90Bのようなより大規模なモデルよりも多言語マルチモーダルタスクで優れた性能を発揮。
  • 利用可能なプラットフォーム: Hugging FaceやKaggleでオープンに利用でき、WhatsAppでも無料で試すことができる。

さらに、特にマルチリンガルマルチモーダル性能を評価するための新たなベンチマーク、Aya Vision Benchmarkも準備中です。これにより、AIが異なる文化や言語のニュアンスを理解し、多言語を単に追加するだけでないAIの実現を目指します。

投票数: 145
← 投稿一覧に戻る