
Qwen3-VL
ストックにはログインが必要です
鮮明な視界、深い思考、広い行動
Artificial Intelligence
Open Source
Photo & Video
概要
「Qwen3-VL」は、Qwenチームが開発した最先端のビジョン-言語モデルで、特に以下の分野での性能が際立っています。
- 視覚エージェントタスクの向上:スマートフォンやPCのGUIを実際に操作できる能力
- 長時間動画の理解:256K(最大1Mまで拡張可能)のコンテキストウィンドウを利用
- 空間推論:様々な視覚的な文脈を理解し処理する力
また、Qwenは新しいテキストモデル「Qwen3-Max」を発表し、コーディングとエージェントスキルを強化しています。このリリースには、アップグレードされた「Qwen3-Coder」、リアルタイム翻訳機能、新しい安全モデルシリーズも含まれ、Qwen3シリーズはマルチモーダル能力と知能の両方で最高の性能を達成しています。
投票数: 15