Ir al contenido principal
Hugging Face

Mejorando la robustez de Depth Anything V2 ante la compresión de vídeo

BEAMR-LTD presenta un estudio que demuestra cómo mejorar la robustez del modelo Depth Anything V2 a la compresión de vídeo en pipelines de datos para vehículos autónomos. Utilizando la compresión como técnica de augmentación durante el fine-tuning con LoRA, el modelo 'estudiante' aprende a recuperar mapas de profundidad de alta fidelidad a partir de vídeos comprimidos, reduciendo errores como AbsRel en un 16% y RMSE en un 10,5%. Los resultados destacan mejoras significativas en elementos de seguridad crítica como usuarios vulnerables de la vía (VRU), permitiendo una compresión eficiente sin comprometer la precisión en tareas de percepción. Esta aproximación de auto-destilación preserva el rendimiento en entradas no comprimidas y estabiliza el modelo ante ruido natural.

Depth Anything V2BEAMR-LTDcompresión de vídeovehículos autónomosLoRAestimación de profundidaddata augmentation
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h