RecursiveMAS: cómo compartir embeddings entre agentes de IA reduce el coste un 75%
RecursiveMAS: cómo compartir embeddings entre agentes de IA reduce el coste un 75%. El framework de colaboración multi-agente open source que está cambiando la economía de los sistemas de IA.
RecursiveMAS es un framework multi-agente que escala la colaboración entre agentes de IA mediante recursión en espacio latente. En lugar de tratar cada agente LLM como un módulo aislado, RecursiveMAS convierte todo el sistema multi-agente en una computación recursiva unificada.
El sistema se inspira en la idea de que los agentes heterogéneos pueden compartir estados latentes a través de módulos RecursiveLink ligeros, permitiendo que los agentes iterativamente intercambien, refinen y evolucionen sus estados latentes a través de múltiples rondas de recursión.
El paper, publicado en mayo de 2026, fue seleccionado como Paper of the Day por Hugging Face. Los autores demuestran que compartir embeddings entre agentes reduce el coste computacional total en un 75%, al evitar la redundancia en el procesamiento de información compartida.
Para ejecutar RecursiveMAS, es necesario descargar los checkpoints de cada rol de agente en el sistema multi-agente desde la release de Hugging Face. Los checkpoints están organizados por estilo de colaboración: deliberación, colaboración horizontal, o pooling de recursos.
El estilo Deliberation-Style requiere herramientas de búsqueda externas para que el agente Tool-Caller recupere información. El código detallado para cargar agentes y ejecutar RecursiveMAS en tareas downstream está disponible en run.py.
Las implicaciones prácticas son significativas: un sistema de atención al cliente con 10 agentes puede reducir su factura de compute en un 75% compartiendo embeddings de contexto común, sin sacrificar la especialización individual de cada agente.
Los autores han publicado el código completo del framework bajo licencia open source, junto con los checkpoints de todos los estilos de colaboración, permitiendo que la comunidad reproduzca los resultados y construya sobre la arquitectura.