MedQA: Ajuste fino de una IA clínica en AMD ROCm — Sin necesidad de CUDA
Harikrishna Sivanand Iyer ha desarrollado MedQA, un modelo de IA para responder preguntas clínicas de opción múltiple, ajustado fino con LoRA sobre Qwen3-1.7B utilizando hardware AMD Instinct MI300X y software ROCm, sin ninguna dependencia de CUDA. El entrenamiento se completó en solo 5 minutos con 2.000 muestras del dataset MedMCQA, demostrando la compatibilidad del ecosistema Hugging Face (Transformers, PEFT, TRL, Accelerate) con ROCm mediante simples variables de entorno. El modelo no solo selecciona la respuesta correcta, sino que proporciona explicaciones clínicas detalladas. Este proyecto, creado para el AMD Developer Hackathon en lablab.ai, está disponible en Hugging Face Hub con una demo en vivo y código en GitHub. Destaca las ventajas de la memoria HBM3 de 192 GB del MI300X para entrenamientos sin cuantización.