Noticias

Google lanza Gemma 4 12B: modelo open source multimodal que corre en un portátil de 16GB

Gemma 4 12B es un modelo open source de 11.950 millones de parámetros con licencia Apache 2.0, capaz de procesar audio, vídeo e imágenes en un portátil empresarial típico.

Fernando Luis

06 jun. 2026 — 1 min read

Google ha publicado Gemma 4 12B, un modelo open source de 11.950 millones de parámetros con licencia Apache 2.0, optimizado para ejecutarse localmente en un portátil empresarial estándar con solo 16GB de VRAM o memoria unificada. Esto permite a empresas procesar datos multimodales sensibles sin enviar información a servidores externos.

La innovación principal es su arquitectura 'Unified' (sin encoders), que elimina los módulos de procesamiento separados para audio y visión. En su lugar, fragmentos visuales y ondas de audio se proyectan directamente al espacio de embedding del modelo base mediante capas lineales ligeras. Esto reduce drásticamente la latencia y el consumo de memoria.

Gemma 4 12B incluye una ventana de contexto de 256K tokens, native function calling integrado, y un modo de razonamiento paso a paso ('thinking mode'). También soporta llamadas a herramientas nativas, lo que lo hace adecuado como motor de razonamiento para agentes autónomos.

El modelo está disponible inmediatamente en Hugging Face, Kaggle y Google AI Edge Gallery, y es compatible con frameworks de despliegue como vLLM, SGLang, MLX y llama.cpp. Fuente: VentureBeat, 6 junio 2026.

Reid Hoffman deja el board de Microsoft para centrarse en su startup de IA farmacéutica Manas

El Cofundador de LinkedIn abandona el board de Microsoft para enfocarse en Manas, la startup de desarrollo de fármacos con IA que fundó en 2025.

Microsoft presenta Surface RTX Spark Dev Box: IA generativa sin coste cloud

Microsoft ha debutado Surface RTX Spark, un dev box para ejecutar grandes modelos de IA localmente con aceleración GPU dedicada, sin depender de servicios cloud.

Perplexity presenta sistema híbrido de inferencia local y cloud en Computex 2026

Perplexity ha anunciado en Computex 2026 un sistema de inferencia híbrida que combina procesamiento local y cloud, manteniendo datos sensibles en local.

Alibaba lanza Qwen3.7-Plus: modelo multimodal por2 dólares por millón de tokens — pero es propietario

Qwen3.7-Plus soporta texto, vídeo e imágenes a un coste muy competitivo, pero Alibaba cierra el modelo pese a que empresas como Airbnb usaban los Qwen open source.

Read more

Reid Hoffman deja el board de Microsoft para centrarse en su startup de IA farmacéutica Manas

Microsoft presenta Surface RTX Spark Dev Box: IA generativa sin coste cloud

Perplexity presenta sistema híbrido de inferencia local y cloud en Computex 2026

Alibaba lanza Qwen3.7-Plus: modelo multimodal por2 dólares por millón de tokens — pero es propietario