Morgan Stanley redujo su reconciliación de riesgos a la mitad... haciendo sus agentes MENOS autónomos

Morgan Stanley desplegó agentes de IA en uno de los flujos más críticos del banking: la reconciliación de P&L. El resultado: redujo el trabajo a la mitad. El método counterintuitive: hacer el sistema menos autónomo, no más.

La mayoría de despliegues de IA empresarial se han centrado hasta ahora en asistentes de código y bots de atención al cliente. Morgan Stanley fue un paso más allá: desplegó agentes en uno de los flujos de trabajo más críticos y con deadline más estricto de la banca — la reconciliación de profit & loss (P&L) — y redujo el trabajo a la mitad.

La parte paradójica: lo logró haciendo el sistema menos autónomo, no más.

Así lo contó Todd Johnson, Managing Director de Morgan Stanley, en un evento reciente de VB AI Impact.

Cada día de trading, los desks de Morgan Stanley procesan miles de transacciones en renta variable, deuda y otros instrumentos. Al cierre, los controladores deben conciliar el P&L entre los sistemas de Finance, Risk, Operations y Trade Capture. Cientos de miles de atributos fallan la coincidencia — los llamados "breaks" — y cada uno requiere investigación manual, decisión y sign-off antes de que el número llegue al desk.

Antes: hasta seis horas para un solo book. Con FIXR: entre dos y tres horas. En los 100 controladores que hacen este trabajo, eso suma unas 1.500 horas saved por semana.

Cómo funciona FIXR

El sistema analiza automáticamente los breaks después del cálculo nocturno de P&L y propone resoluciones basadas en reglas aprendidas. Tres agentes especializados trabajan en paralelo:

Un agente interpreta guías previas para desarrollar resoluciones al inicio del día. Otro aprende del comportamiento de los controladores y documenta las reglas que aplican. El tercero convierte patrones repetidos en lógica automatizada y duradera.

Over time, el sistema puede auto-liquidar ciertos breaks que ya conoce, sugerir soluciones para otros menos familiares, pedir ayuda cuando no está seguro, y escalar para investigación humana. Cuando un patrón se resuelve consistentemente del mismo modo, crea una regla fija para toda la firma.

La paradoja de la autonomía reducida

"Es mucho más como un compañero de trabajo que como un copiloto", dijo Johnson. Y ahí está la lección clave: los humanos no salen del loop. Revisan, aprueban o corrigen cada recomendación, y esas decisiones se retroalimentan al sistema para la siguiente ejecución.

"Reconocimos que toda esa inteligencia que está en la mente de un controlador va a ser difícil de meter en un agente el primer día", admitió Johnson. En lugar de intentar automatizar todo de golpe, el sistema aprende iterativamente de las decisiones humanas y las codifica como reglas.

"Still preservas ese elemento de responsabilidad humana incluso cuando empiezas a automatizar. Con el tiempo verás más y más elementos resueltos automáticamente."

Proceso primero, IA después

El equipo de Johnson hizo primero un "process intelligence assessment" exhaustivo antes de tocar nada de IA. Mapeo de workflows, identificación de dónde la automatización — sea agentes, automatización tradicional o simplemente reingeniería de pasos ineficientes — daba más retorno.

"Si podemos arreglar eso primero antes de añadir agentes al problema, entonces sí transformaremos realmente la oportunidad."

Por qué importa para la industria

El caso de Morgan Stanley desafía un assumption común: que más autonomía del agente equivale a más eficiencia. En workflows de alta precisión y alta consecuencia — finanzas, salud, seguridad — la autonomía total requiere un nivel de confianza que es difícil de construir y aún más difícil de mantener ante reguladores y stakeholders.

El enfoque de "autonomía progresiva" — empezar restrictivo, aprender del feedback humano, expandir gradualmente — puede no sonar tan revolucionario como los agentes fully autonomous. Pero produce resultados que las empresas realmente pueden desplegar sin miedo a los errores costosos.

FIXR es, en esencia, un sistema de aprendizaje activo donde el activo más valioso no es el modelo, sino la colección de decisiones humanas que lo mejoran día a día.