Ir al contenido principal
Hugging Face Blog

MONET: Rebajando la barrera para la investigación de generación de imágenes de clase mundial.

Jasper Research ha lanzado MONET, el mayor conjunto de datos de texto a imagen de código abierto jamás publicado, construido a partir de 2.900 millones de imágenes y refinado a 104,9 millones de muestras de alta calidad. Este lanzamiento viene acompañado de nano-t2i, una base de código mínima que permite entrenar un modelo de difusión competitivo desde cero en una sola GPU en pocos días. MONET aborda el problema de la brecha de datos que frenaba la investigación en generación de imágenes, ofreciendo un conjunto de datos filtrado, deduplicado y con múltiples subtítulos, diseñado para el preentrenamiento de modelos de texto a imagen a gran escala. El proyecto busca democratizar el acceso a la investigación de vanguardia en IA.

MONETnano-t2iJasper AIgeneración de imágenestexto a imagenconjunto de datoscódigo abierto
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h