WorldDirector: Construcción de simuladores de mundo controlables con memoria dinámica persistente | Cómo lograr consistencia de objetos en simulaciones de video generadas por IA | Arquitectura para modelos de mundo con memoria de largo plazo
Abstract
PROBLEMA: Los simuladores de mundo actuales basados en video a menudo sufren de inconsistencia temporal y falta de persistencia en los objetos cuando estos salen del campo de visión. SOLUCIÓN: Presentan WorldDirector, una arquitectura para simuladores de mundo controlables que utiliza una memoria dinámica persistente para rastrear el estado global del entorno. METODOLOGÍA: Emplean un mecanismo de atención desacoplada que separa la dinámica de los objetos de la cámara, permitiendo una navegación coherente y la interacción con elementos que reaparecen en escena. RESULTADOS: Supera a los modelos de mundo previos en métricas de fidelidad visual a largo plazo y consistencia de objetos en un 40%. RELEVANCIA: Es un avance clave para el entrenamiento de agentes de robótica y vehículos autónomos en entornos puramente sintéticos pero físicamente coherentes.