Ir al contenido principal
Hugging Face

DeepSeek-V4: un contexto de un millón de tokens que los agentes pueden usar realmente

DeepSeek ha lanzado V4, con dos checkpoints MoE disponibles en el Hub: DeepSeek-V4-Pro (1.6T parámetros totales, 49B activos) y DeepSeek-V4-Flash (284B totales, 13B activos), ambos con ventana de contexto de 1 millón de tokens. La verdadera innovación reside en su diseño eficiente para inferencia en contextos largos, reduciendo drásticamente los FLOPs y el tamaño del KV cache mediante atención híbrida (CSA y HCA), lo que lo hace ideal para tareas agenticas prolongadas. Incluye mejoras post-entrenamiento como preservación de razonamiento entre llamadas a herramientas, esquema XML para tool calls y la sandbox DSec para entrenamiento RL. Los benchmarks agenticos destacan, superando a modelos frontier en pruebas como Terminal Bench y SWE Verified.

DeepSeek-V4DeepSeek-V4-ProDeepSeek-V4-Flashcontexto 1M tokensagentes IAatención híbridaMoE
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h