Bienvenida Gemma 4: Inteligencia multimodal de frontera en dispositivo
Google DeepMind ha lanzado la familia de modelos multimodales Gemma 4, ahora disponibles en Hugging Face bajo licencia Apache 2. Estos modelos soportan entradas de imagen, texto y audio, generando respuestas de texto, con tamaños variados desde 2.3B hasta 31B parámetros efectivos. Destacan por su rendimiento en benchmarks de razonamiento, visión y codificación, formando una frontera de Pareto. Son compatibles con múltiples frameworks como transformers, llama.cpp, MLX y mistral.rs, permitiendo despliegue en dispositivos y agentes. Incluyen innovaciones como Per-Layer Embeddings y Shared KV Cache para eficiencia en contextos largos.
Gemma 4Google DeepMindmultimodalHugging Facemodelos de lenguajeIA en dispositivoMixture-of-Experts
Leer noticia original