GLM-4.1V-Thinking logo

GLM-4.1V-Thinking

ただ見るだけでなく、推論も行うオープンVLM

Artificial Intelligence GitHub API Development

プロダクト概要

GLM-4.1V-Thinkingは、Zhipu AIによって開発された最新のオープンソースの視覚言語モデルです。このモデルは、複雑な推論に特化しており、単なる視覚認識を超えた能力を持っています。

主な特徴

  • モデル性能: 9Bモデルは、72BのQwen-2.5-VLモデルと同等、もしくはそれ以上の性能を示す。
  • 多様なメディアサポート: 画像や動画を処理でき、しかも64kのコンテキストをサポート。
  • オープンソース: 研究のためにベースモデルがオープンソースとして公開されている。

体験できる場所

  • デモやAPIも利用可能で、実際のモデルの性能を体験することができます。
投票数: 5
← 投稿一覧に戻る