Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚀 L'équipe Qwen d'Alibaba a lancé Qwen-Image, un modèle MMDiT de 20 milliards de paramètres révolutionnant la génération d'images à partir de texte ! Rendu de texte natif en pixels pour des affiches époustouflantes, support bilingue EN/CN, excelle dans les styles photoréalistes/anime. Plongez dans notre article technique avec un guide complet pour déployer le modèle sur Hyperbolic & Gradio.

Architecture : Combine MLLM (Qwen2.5-VL 7B pour la sémantique), VAE (ajusté pour la reconstruction riche en texte), & 20B MMDiT (correspondance de flux avec ODEs, concaténation diagonale pour une résilience évolutive).
Processus : Prompt → caractéristiques → débruitage → décodage. TI2I avec double encodage pour les modifications.

Innovations : pipeline de données massif (milliards de paires : Nature 55 %, Design 27 %, People 13 %, Synthétique 5 % ; répartitions EN/CN). Apprentissage par curriculum pour la maîtrise du texte. MSRoPE (sur RoPE) pour l'alignement 2D. Multi-tâches T2I/TI2I/I2I. SOTA sur GenEval, bancs de texte !

Vs. GPT-Image-1 : Correspond au photoréalisme, écrase le texte bilingue/multi-lignes, cohérence d'édition (meilleure fidélité dans les objets/poses). C'est l'avantage de l'open-source par rapport à l'API !

Infrastructure GPU : ~24 Go de VRAM estimés (20B x 1.2 en BF16). L'inférence se déroule sans problème sur un seul H100.
Nous avons testé sur le Cloud H100 à la demande de Hyperbolic pour 1,49 $/h, avec un simple script python adapté de la carte modèle officielle pour une interface Gradio interactive.

Lisez notre article complet : détails sur l'architecture, innovations, comparaison, analyse de calcul, code COMPLET et étapes de déploiement sur Gradio. Exécutez Qwen-Image vous-même et partagez vos créations d'images avec nous !
Lisez le blog complet :
Louez des H100 maintenant sur Hyperbolic pour 1,49 $/h :
Lisez notre article complet : détails sur l'architecture, innovations, comparaison, analyse de calcul, code COMPLET et étapes de déploiement sur Gradio. Exécutez Qwen-Image vous-même et partagez vos créations d'images avec nous !
Lisez le blog complet :
Louez des H100 maintenant sur Hyperbolic pour 1,49 $/h :
7,46K
Meilleurs
Classement
Favoris