Hy3 preview: Un Hunyuan reconstruido, un MoE de 21B activos y una nueva receta de razonamiento
Tencent ha lanzado Hy3 preview, una versión reconstruida de su modelo Hunyuan, un MoE con 295.000 millones de parámetros totales y solo 21.000 millones activos, destacando por su eficiencia en activación. El modelo integra innovaciones arquitectónicas como expertos de tamaños diferenciados y P-Penalty Loss, logrando un rendimiento superior en razonamiento complejo, codificación y comprensión contextual larga. Se ha integrado en productos como Yuanbao y WorkBuddy, mejorando capacidades en investigación profunda, uso de herramientas y escenarios de agentes. Comparado con otros modelos, sobresale en comprensión de textos largos, uso de herramientas y generación de código, con una alta relación costo-rendimiento.
Hy3 previewHunyuanTencentMoE21B activosrazonamientocodificación
Leer noticia original