
GLM-4.1V-Thinking
ストックにはログインが必要です
ただ見るだけでなく、推論も行うオープンVLM
Artificial Intelligence
GitHub
API
Development
プロダクト概要
GLM-4.1V-Thinkingは、Zhipu AIによって開発された最新のオープンソースの視覚言語モデルです。このモデルは、複雑な推論に特化しており、単なる視覚認識を超えた能力を持っています。
主な特徴
- モデル性能: 9Bモデルは、72BのQwen-2.5-VLモデルと同等、もしくはそれ以上の性能を示す。
- 多様なメディアサポート: 画像や動画を処理でき、しかも64kのコンテキストをサポート。
- オープンソース: 研究のためにベースモデルがオープンソースとして公開されている。
体験できる場所
- デモやAPIも利用可能で、実際のモデルの性能を体験することができます。
投票数: 5