AccelOpt: Sistema agéntico para la optimización de kernels de aceleradores de IA | Optimización automática de código de bajo nivel mediante agentes LLM | Cómo usar agentes de IA para mejorar el rendimiento de GPUs y hardware especializado
Abstract
PROBLEMA: La escritura de kernels optimizados para GPUs y nuevos aceleradores de IA es una tarea extremadamente difícil que requiere expertos humanos en hardware de bajo nivel. SOLUCIÓN: AccelOpt es un sistema de agentes basado en LLMs que optimiza automáticamente el código de kernels, aprendiendo de la retroalimentación de rendimiento en hardware real para mejorar sus sugerencias. METODOLOGÍA: Utiliza un ciclo de razonamiento agéntico que escribe código (en Triton/CUDA), mide la latencia, analiza los cuellos de botella de memoria y refina el código de manera iterativa. RESULTADOS: AccelOpt logró superar en rendimiento a implementaciones expertas en bibliotecas estándar en un 12% promedio para operadores tensoriales comunes. RELEVANCIA: Demuestra el potencial de los sistemas agénticos para resolver problemas de ingeniería de software extremada y técnicamente específicos, democratizando la optimización de hardware.