Darwin-TTS: Le dimos a un modelo TTS el 3% del cerebro de un LLM — Empezó a mostrar emoción
FINAL-Bench lanza Darwin-TTS-1.7B-Cross, el primer modelo de transferencia FFN cross-modal de LLM a TTS, construido en un día sin entrenamiento, datos ni horas de GPU para fine-tuning. Mezclando solo el 3% de pesos del FFN de Qwen3-1.7B en el módulo 'talker' de Qwen3-TTS, gracias a su arquitectura idéntica, el modelo TTS comienza a expresar emoción en el habla. Esta técnica restaura patrones de comprensión lingüística emocional perdidos en el fine-tuning TTS. Abre la puerta a transferencias ligeras de capacidades entre modalidades sin costes elevados, como alternativa a entrenamientos end-to-end masivos.
Darwin-TTSQwen3-TTStransferencia de pesosmodelos TTSemociónFFN blendingcross-modal
Leer noticia original