Ir al contenido principalSaltar al contenido
Hugging Face

GLM-5.2: Diseñado para tareas de largo alcance

GLM-5.2 es el último modelo insignia de Z.AI, diseñado para tareas de largo alcance, con una capacidad de contexto de 1 millón de tokens. Este modelo de código abierto mejora las capacidades de codificación y la arquitectura, incorporando IndexShare para reducir los FLOPs por token. GLM-5.2 supera a su predecesor GLM-5.1 y a otros modelos de código abierto en benchmarks de codificación y rendimiento, siendo el modelo de código abierto mejor clasificado en diversas pruebas. Además, introduce el control del nivel de esfuerzo para equilibrar rendimiento y latencia, y se sirve eficientemente para contextos de 1M de tokens, enfrentando los desafíos de capacidad de KV-cache y gastos generales. También incluye un módulo anti-hack para mejorar el entrenamiento de RL en tareas de codificación de largo alcance.

GLM-5.2modelo de lenguajecontexto largocódigo abiertoIndexSharecodificaciónRL
Leer noticia original
Escríbenos por WhatsApp
Asesor Virtual 24h - Abre el chat para consultasAsesor Virtual 24h