VLX-Go: Predicción de puntos de ruta de corto alcance visión-lenguaje para navegación encarnada
VLX-Go es un planificador ligero de puntos de ruta visión-lenguaje diseñado para la navegación encarnada de robots. Recibe entradas visuales, el estado actual y una instrucción en lenguaje natural para predecir puntos de ruta locales de corto alcance, optimizados para que un controlador los ejecute. A diferencia de los VLM de propósito general, VLX-Go se enfoca en traducir directamente el estado visual y del lenguaje en movimiento, lo que le permite el seguimiento de objetivos, la navegación local y la evitación dinámica de obstáculos. Se entrena con datos de trayectoria offline y puede refinarse con retroalimentación de simulador online.
VLX-Gonavegación encarnadarobóticavisión-lenguajepuntos de rutainteligencia artificialOm AI Lab
Leer noticia original