Ir al contenido principal
Hugging Face

Darwin-TTS: Le dimos a un modelo TTS el 3% del cerebro de un LLM — Empezó a mostrar emoción

FINAL-Bench lanza Darwin-TTS-1.7B-Cross, el primer modelo de transferencia FFN cross-modal de LLM a TTS, construido en un día sin entrenamiento, datos ni horas de GPU para fine-tuning. Mezclando solo el 3% de pesos del FFN de Qwen3-1.7B en el módulo 'talker' de Qwen3-TTS, gracias a su arquitectura idéntica, el modelo TTS comienza a expresar emoción en el habla. Esta técnica restaura patrones de comprensión lingüística emocional perdidos en el fine-tuning TTS. Abre la puerta a transferencias ligeras de capacidades entre modalidades sin costes elevados, como alternativa a entrenamientos end-to-end masivos.

Darwin-TTSQwen3-TTStransferencia de pesosmodelos TTSemociónFFN blendingcross-modal
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h