Forge Agent
ストックにはログインが必要です
遅い PyTorch を高速な GPU カーネルに変えるスウォームエージェント
Artificial Intelligence
Developer Tools
Hardware
概要
Forge は PyTorch モデルを自動で最適化された CUDA および Triton カーネルへ変換します。32 台のエージェントが並列に最適化を試し、ジャッジが正確性を検証してからベンチマークします。
特徴
- 任意の PyTorch モデルに対応
- 1 カーネルの無料トライアル
実績
- Llama 3.1 8B: torch.compile より 5x高速
- Qwen 2.5 7B: 4x高速
- SDXL UNet: 3x高速
投票数: 97