MolmoMotion: Predicción de movimiento 3D guiada por lenguaje
MolmoMotion es un nuevo modelo de predicción de movimiento 3D que utiliza instrucciones en lenguaje natural para pronosticar cómo se moverán los objetos en un entorno tridimensional. Desarrollado por AllenAI, supera a los métodos existentes y es aplicable en robótica o generación de vídeo. Se lanza junto a MolmoMotion-1M, el mayor conjunto de datos de trayectorias de puntos 3D, y PointMotionBench, un benchmark validado por humanos. MolmoMotion es capaz de representar movimientos complejos de manera eficiente y es el modelo de predicción de movimiento 3D más preciso en PointMotionBench.
MolmoMotionpredicción de movimiento 3Dlenguaje naturalrobóticageneración de vídeoMolmoMotion-1MPointMotionBench
Leer noticia original