CyberSecQwen-4B: Por qué la ciberdefensa necesita modelos pequeños, especializados y ejecutables localmente
Lablab.ai ha lanzado CyberSecQwen-4B, un modelo de lenguaje de 4 mil millones de parámetros especializado en ciberseguridad defensiva, entrenado en un único AMD Instinct MI300X. Este modelo supera al Foundation-Sec-Instruct-8B de Cisco en el benchmark CTI-MCQ y mantiene una precisión cercana en CTI-RCM, con la mitad de parámetros. Se ejecuta localmente en GPUs de consumo de 12 GB, ideal para entornos air-gapped y análisis de datos sensibles sin APIs externas. El artículo detalla el proceso de entrenamiento con ROCm 7, datos de CVE-CWE y planes futuros como variantes de 1B y cuantización GGUF.
CyberSecQwen-4Bciberseguridad defensivaAMD MI300XCTI-Benchmodelos especializadosROCmCVE-CWE
Leer noticia original