GLM-Image logo

GLM-Image

密度の高い知識と高忠実度の画像を実現する自己回帰モデル

Artificial Intelligence Open Source Photo editing

概要

GLM-Imageは9Bの自己回帰モデルと7Bの拡散デコーダを組み合わせたハイブリッド生成モデル。ロジックとレイアウトを自己回帰で処理し、芸術表現と高周波ディテールを拡散デコーダに任せる設計。

特徴

  • 知識密度の高い生成に強く、ポスターや図表、正確なテキスト描画に適します
  • オープンソースでT2IとI2Iに対応

性能と展開

  • 英語・中国語のテキスト精度が高い benchmarkを示します
  • ローカル展開は未検証。ハードウェア要件は重めだが、量子化版の登場が期待されます
投票数: 8
← 投稿一覧に戻る