GLM-4.6V
ストックにはログインが必要です
ネイティブなツール呼び出し機能を備えたオープンソースのマルチモーダルモデル
Artificial Intelligence
Open Source
Development
概要
128kの文脈窓を備えたオープンソースのマルチモーダルモデル。視覚認識とツール活用をネイティブに結ぶ機能呼び出しを搭載。
主な特徴
- 視覚情報から直接実行アクションへ橋渡し
- 画像とテキストの高品質コンテンツを自動生成
- 製品閲覧・価格比較・買い物リスト作成などのワークフローを独立処理
- フロントエンドの再現性と視覚対話機能を強化
- ウェブ検索やコーディングのエージェントワークにも活用可能。将来的な拡張性も高い。
利用方法・入手先
- Z.ai で試用可能
- Hugging Face でオープンウェイト公開
投票数: 200