Ir al contenido principal
Hugging Face Blog

MONET: Rebajando el listón para la investigación de generación de imágenes de clase mundial.

Jasper Research ha lanzado MONET, el conjunto de datos de texto a imagen abierto más grande hasta la fecha, construido a partir de 2.900 millones de imágenes y refinado a 104.9 millones de muestras de alta calidad. Este lanzamiento, junto con nano-t2i (un código base mínimo para entrenar un modelo de difusión competitivo), busca democratizar la investigación en modelos de texto a imagen, eliminando las barreras de coste y complejidad. MONET es el primer conjunto de datos filtrado, deduplicado y con múltiples subtítulos, diseñado para el preentrenamiento de modelos de texto a imagen a gran escala, y ha demostrado superar a modelos mucho más grandes en benchmarks como GenEval.

MONETJasper AInano-t2igeneración de imágenesconjunto de datostexto a imageninvestigación en IA
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h