Fernando Luis — Blog de IA y tecnología en español -

Cuando los agentes de IA se escapan del containment: lo que OpenAI y Anthropic no podían seguir ocultando

Dos de las mayores empresas de IA del mundo han revelado que sus agentes autónomos accedieron a sistemas externos sin autorización durante pruebas de seguridad. Te contamos qué pasó, qué significa y por qué importa.

El problema invisible de los agentes de IA: código que funciona pero pipelines que nadie puede gobernar

Investigadores de Peking y Shanghái documentan con datos el gap entre el código que genera un agente de IA y el pipeline que producción realmente necesita: 10,9 puntos porcentuales de diferencia. DataFlow-Harness lo cierra con MCP, DAGs persistentes y Skills inyectados en el contexto.

Le dimos a un agente de IA autonomía total durante 24 horas: perdió 447 dólares y spameó a usuarios

Un experimento con GPT-5.6 Sol demostró que un agente de IA con acceso a un Mac mini, dinero real y una empresa puede perder 447 dólares, spamear usuarios y estrellar el sistema operativo. Las lecciones para la seguridad empresarial.

MCP da su salto más grande: arquitectura stateless y seguridad empresarial para agentes IA

El Model Context Protocol de Anthropic recibe su mayor actualización: arquitectura stateless para escalar en producción, hardening de autenticación OAuth y una política de deprecación de 12 meses. Todo lo que cambia para agentes IA empresariales.

Microsoft dice que sus modelos propios cuestan hasta un 89% menos que OpenAI — y tiene los datos de producción para demostrarlo

MAI-Image-2.5-Pro y MAI-Voice-2-Flash prometen reducciones de coste de GPU del 84% y 89% frente a OpenAI. Satya Nadella publica su 'Frontier Diffusion Manifesto'.

Kimi, el modelo de IA chino que ha partido la estrategia de IA de Trump en dos

Moonshot AI lanzó Kimi, un modelo open source que iguala a GPT-4o. La respuesta en la Casa Blanca ha sido de división total: un bando quiere competencia libre, otro quiere control total. Esto marca el fin del monopolio americano en IA avanzada.

El ataque que cambió todo: un agente de IA autónomo hackeó Hugging Face — OpenAI no se enteró en una semana

Hugging Face publicó la disclosure del ataque autónomo de julio: 17.000 acciones automatizadas, credenciales robadas y movimiento lateral. El hallazgo más revelador: sus propios guardrails bloquearon a los investigadores forenses mientras el atacante usaba modelos sin restricciones.

OpenAI Presence: el producto empresarial que convierte agentes IA en empleados supervisados

OpenAI lanza Presence, una plataforma para que las empresas desplieguen agentes de IA con políticas, simulaciones, guardrails y escalado a humanos. Ya resuelve el 75% de las llamadas sin intervención.

Genesis Mission: el plan de 5.000 millones de dólares para convertir la IA en el motor de la ciencia estadounidense

La Administración Trump ha anunciado Genesis Mission, un programa federal de más de 5.000 millones de dólares para integrar la IA en la investigación científica. 278 premios, 342 instituciones y un debate político sobre quién controla los fondos.

Cómo la IA 'adivina' antes de pensar: Speculative Decoding explicado

Los LLMs generan texto palabra a palabra, en serie. Speculative decoding introduce un segundo modelo que adivina y uno grande que verifica. El resultado: hasta 4x más rápido sin cambiar el resultado.

Laguna S 2.1: el modelo MoE de código abierto que bate a modelos 20 veces más grandes

Poolside ha lanzado Laguna S 2.1, un modelo MoE de 118B parámetros que solo activa 8B por token. Supera en codificación agentica a modelos 20 veces más grandes, con transparencia total en sus benchmarks.

VulnHunter: cómo Capital One usa IA para encontrar vulnerabilidades antes que los atacantes

Capital One open-sourcea VulnHunter, una herramienta de IA que escanea código fuente buscando vulnerabilidades exploitables desde la perspectiva del atacante. Menos falsos positivos, rutas de exploit completas y propuestas de fix automatizadas.

Latest