22 de abril de 2026

ShadowPEFT: Redes sombra para el ajuste fino eficiente de parámetros | Superando a LoRA en la adaptación de modelos de gran escala | Estrategia de entrenamiento paralelo para optimizar la memoria en LLMs

ShadowPEFTredes sombraparameter-efficient fine-tuningajuste fino eficientemodel adaptationadaptación de modeloscomputational efficiency

Abstract

PROBLEMA: Métodos de adaptación como LoRA, aunque eficientes, a veces no logran capturar la complejidad total de las tareas debido a su estructura de bajo rango estática, lo que limita su capacidad en modelos extremadamente grandes. SOLUCIÓN: ShadowPEFT propone el uso de una 'Red Sombra' (Shadow Network) que opera en paralelo a la red principal durante el ajuste fino, permitiendo una identificación más precisa de los parámetros críticos que necesitan actualización. METODOLOGÍA: La técnica utiliza una arquitectura que desacopla la identificación de gradientes de la actualización de pesos, optimizando solo un subconjunto dinámico de la red. RESULTADOS: ShadowPEFT supera a LoRA y sus variantes en tareas de comprensión de lenguaje natural y generación de código, utilizando hasta un 20% menos de memoria VRAM. RELEVANCIA: Esta técnica permite a organizaciones con recursos limitados ajustar modelos de escala GPT-4 para dominios específicos con alta precisión.

Leer paper original

Volver a Papers IA