DeepSeek V4 ya es una realidad: avances en eficiencia, pero otras IA le han adelantado desde su 'revolución' de hace un año
DeepSeek ha publicado su modelo V4 bajo licencia MIT, destacando mejoras en código y arquitectura optimizada para chips chinos como los Ascend de Huawei. El laboratorio admite estar entre tres y seis meses por detrás de los modelos occidentales punteros. Sufrió retrasos significativos en el entrenamiento al intentar migrar de GPUs NVIDIA, lo que ha permitido que competidores chinos como Doubao, MiniMax y Alibaba ganen terreno. Introduce innovaciones como TileLang y MegaMoE para mayor eficiencia, pero aún depende de hardware NVIDIA para entrenamiento. DeepSeek enfrenta pérdidas de talento y busca financiación externa, cuestionando su posición en la narrativa del open source chino.
DeepSeekV4modelos de lenguajecódigo abiertoIA chinaHuaweiAscend
Leer noticia original