Track4World: Seguimiento 3D Denso y Centrado en el Mundo para Modelos de Mundo Robustos
Abstract
Track4World presenta un avance significativo en la capacidad de los modelos de mundo para percibir la dinámica temporal mediante el seguimiento denso de todos los píxeles en 3D (3D Tracking of All Pixels). A diferencia de los métodos tradicionales que dependen de optimizaciones costosas, este enfoque utiliza una arquitectura feedforward rápida que permite a los agentes de IA entender el movimiento y la persistencia de los objetos en entornos dinámicos complejos. El sistema es capaz de proyectar trayectorias de píxeles 2D en espacios del mundo real centrados en el observador, proporcionando una base sólida para la planificación de trayectorias en robótica y sistemas autónomos. El paper demuestra que un seguimiento denso y preciso es fundamental para que los modelos de mundo de próxima generación puedan predecir estados futuros con precisión geométrica, superando las limitaciones de los modelos que solo operan en el espacio latente sin restricciones físicas explícitas.