Ir al contenido principal

minWM: Framework abierto para modelos de mundo interactivos | Generación de video interactivo en tiempo real para entrenamiento de agentes | Infraestructura de código abierto para simulaciones basadas en modelos de mundo

World Modelsmodelos de mundointeractive videovideo interactivoreal-time AIrobótica IAopen-source framework

Abstract

PROBLEMA: La creación de modelos de mundo que permitan interacción en tiempo real mediante video ha sido tradicionalmente costosa, cerrada y difícil de escalar para investigadores independientes. SOLUCIÓN: Se propone minWM, un marco de trabajo de código abierto y "full-stack" diseñado para la creación y experimentación con modelos de mundo de video interactivos de alta fidelidad. METODOLOGÍA: El sistema integra arquitecturas de difusión latente optimizadas para baja latencia y un pipeline de procesamiento que permite la retroalimentación de acciones del usuario en milisegundos. RESULTADOS: minWM permite generar secuencias de video coherentes que responden a comandos de acción, superando a baselines previos en velocidad de inferencia y accesibilidad del código. RELEVANCIA: Facilita la adopción de modelos de mundo en robótica y simulación, permitiendo a los agentes aprender en entornos virtuales realistas.

Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h