Aprendiendo matemáticas por última vez
Shane Crownelius relata su trayectoria desde odiar los modelos de IA hasta crearlos, enfocándose en versiones diminutas. Desarrolló la arquitectura FANT con innovaciones como SleepGate y SpinorApollonian Memory, que mejoran el rendimiento en tareas matemáticas. Presenta Sparrow, un modelo de solo 1 millón de parámetros que logra un 95,6% en 1900 preguntas de evaluación, superando a modelos como Owl Alpha y Gemma 3 27B en muchas pruebas matemáticas complejas. Invita a la comunidad de Hugging Face a colaborar en su repositorio abierto. Este logro resalta el potencial de modelos pequeños y abiertos en IA especializada.
SparrowFANTSleepGateSpinorApollonian Memorymodelos pequeñosmatemáticasCrownelius
Leer noticia original