GLM-4.6V logo

GLM-4.6V

ネイティブなツール呼び出し機能を備えたオープンソースのマルチモーダルモデル

Artificial Intelligence Open Source Development

概要

128kの文脈窓を備えたオープンソースのマルチモーダルモデル。視覚認識とツール活用をネイティブに結ぶ機能呼び出しを搭載。

主な特徴

  • 視覚情報から直接実行アクションへ橋渡し
  • 画像とテキストの高品質コンテンツを自動生成
  • 製品閲覧・価格比較・買い物リスト作成などのワークフローを独立処理
  • フロントエンドの再現性と視覚対話機能を強化
  • ウェブ検索やコーディングのエージェントワークにも活用可能。将来的な拡張性も高い。

利用方法・入手先

  • Z.ai で試用可能
  • Hugging Face でオープンウェイト公開
投票数: 200
← 投稿一覧に戻る