トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
FARMER は、情報を失うことなく潜在空間との間で画像をマッピングできる可逆自己回帰フローと、ガウス混合を使用して各潜在トークンの分布をモデル化し、単一段階のピクセル レベル ジェネレーターで正確な尤度を提供する自己回帰 Transformer を組み合わせます。
3つの主要なイノベーションが導入されています。
- 自己教師ありチャネル分割により、潜在特徴が有益 (ZI) グループと冗長 (ZR) グループに分離され、構造と詳細が効率的にモデル化されます。
- リサンプリングベースの分類器不要ガイダンス(CFG)により、画質が向上し、制御可能なサンプリングが可能になります。
- ワンステップAF蒸留は、遅いシーケンシャルリバーサルを単一の高速リバースステップに置き換えることにより、生成を加速します。
ImageNet-256 (クラス条件付き、50k サンプル) では、1.9B patch-8 モデルは FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51 を達成します。+60エポックを過ぎると、推論はAFリバースで22×速くなり(画像あたり0.1689秒→0.0076秒)、全体で約4×速くなります(画像あたり0.2189秒→0.0567秒)。
JetFormer 2.8B(FID 6.64)やTARFlow p8(4.69)を上回り、STARFlow p8と競合する。STARFlow のデコーダー微調整バリアント (FID 2.40) は、依然として強力ですが、多段階セットアップを使用します。

トップ
ランキング
お気に入り

