La IA no sabe hacer tu trabajo y los que la construyen recién lo están descubriendo
Un estudio de Carnegie Mellon y Stanford analizó 43 benchmarks y más de 72.000 tareas de agentes de inteligencia artificial y encontró que el 84% está enfocado en programación. La clave: eso representa apenas el 7,6% del mercado laboral real
InfobaeSi usted es enfermera, abogado, gerente, contador, maestra, vendedor, periodista o trabaja en recursos humanos, tiene algo en común con la enorme mayoría de la población activa del mundo: los agentes de inteligencia artificial que hoy se promocionan como “el futuro del trabajo” casi no saben hacer lo que usted hace todos los días.
El resultado es incómodo para una industria que lleva años prometiendo transformar el empleo global.
Para hacer la comparación, los investigadores usaron la base de datos O*NET, base oficial del Departamento de Trabajo de Estados Unidos, que cataloga con precisión las 1.016 ocupaciones del mercado laboral: qué hace un auditor contable en su día a día, qué habilidades necesita una enfermera de cuidados intensivos, qué tareas realiza un gerente de recursos humanos, qué actividades definen el trabajo de un juez, un arquitecto, un psicólogo o un mecánico de aviones.
Luego tomaron 43 “benchmarks”, es decir, evaluaciones estandarizadas que utiliza la industria para medir el avance de los agentes de IA, y cruzaron sus más de 72.000 tareas con ese mapa del trabajo real. Lo que encontraron revela una desconexión profunda entre lo que la IA aprende a hacer y lo que el mundo realmente necesita que haga.

El 84% de la IA aprendió a programar. El 92% del mundo no programa.
El hallazgo central del estudio es este: el dominio “Computación y Matemáticas” concentra el 84% de todos los ejemplos con los que se entrenan y evalúan los agentes de IA. Ese sector representa solo el 7,6% del empleo total en Estados Unidos. En América Latina, la proporción es incluso menor.
¿Y el resto? Prácticamente ignorado. Gestión —el sector con mayor capital acumulado en la economía norteamericana, con más de USD 1,3 billones de dólares (es decir, 1.300.000 millones, según la notación tradicional en América Latina) en salarios anuales— aparece en apenas el 1,4% de las tareas evaluadas. El sector legal, con el 70% de sus actividades ya digitalizadas, representa el 0,3%. La salud, con más de 9 millones de trabajadores solo en Estados Unidos, casi no existe en los benchmarks.
Soporte administrativo, ventas, educación, trabajo social, arquitectura, recursos humanos: todos con alta digitalización, todos con millones de trabajadores, todos con presencia marginal o nula en los sistemas de evaluación de la IA.
Por qué pasó esto: la trampa de la facilidad
Los autores del estudio ofrecen una explicación clara para este sesgo: los desarrolladores de IA eligen las tareas que son más fáciles de calificar automáticamente. Un agente que resuelve un bug de código puede ser evaluado en milisegundos: o el programa funciona o no funciona. En cambio, un agente que asesora a un paciente sobre su diagnóstico, negocia un contrato con un proveedor, conduce una evaluación de desempeño o resuelve un conflicto entre colegas, requiere criterios de evaluación mucho más complejos, subjetivos y costosos de implementar.

En otras palabras: la industria de la IA no está entrenando a sus sistemas donde el impacto sería mayor. Los está entrenando donde medir el progreso es más conveniente. Y esa diferencia tiene consecuencias enormes para quienes esperan que la IA transforme su sector.
La habilidad más humana es la más ignorada
El estudio va más allá de los sectores y analiza también las habilidades específicas. Y aquí el hallazgo es quizás aún más revelador.
Piense en cualquier trabajo: el de una maestra que explica matemáticas a 30 niños con distintos ritmos de aprendizaje. El de un médico que le comunica a una familia un diagnóstico grave. El de un gerente que motiva a un equipo desmotivado. El de un abogado que convence a un jurado. El de un vendedor que entiende qué necesita un cliente antes de que el cliente mismo lo sepa. Todos esos trabajos tienen algo en común: requieren interactuar con otras personas de manera compleja, empática y contextual.
Esa habilidad —“interactuar con otros”— es la más extendida en el mercado laboral real y también la más ignorada en los benchmarks de agentes de IA. Los sistemas actuales están afinados para buscar información y ejecutar código. No para coordinar, persuadir, enseñar, cuidar ni negociar.

¿Qué significa esto para usted?
Hay dos formas de leer este estudio. La primera, tranquilizadora: si usted trabaja en salud, educación, derecho, gestión, ventas o cualquier campo que requiera habilidades interpersonales complejas, la IA está mucho más lejos de reemplazarlo de lo que los titulares sugieren. Los agentes actuales sencillamente no han sido entrenados para hacer lo que usted hace.
La segunda lectura es estratégica: los sectores más ignorados por el desarrollo actual de agentes son exactamente los que concentran más empleo y más valor económico. Eso significa que quien logre construir —o adoptar— agentes verdaderamente útiles para la gestión empresarial, la práctica legal, la atención médica o la educación tendrá una ventaja competitiva enorme. Porque hoy ese espacio está casi vacío.
El estudio de Wang et al. termina con una recomendación para los investigadores: diseñen benchmarks que reflejen la realidad del trabajo humano, no la conveniencia del laboratorio. Es un llamado que las empresas que adoptan IA deberían escuchar también. La brecha entre lo que los agentes saben hacer y lo que el mundo necesita que hagan no es un detalle técnico.


