Por qué los grandes laboratorios de IA están contratando a tantos filósofos
La tecnología presenta todo tipo de problemas espinosos, el tipo favorito de los filósofos
Muchas de estas personas están siendo contratadas directamente por empresas de IA. Los estudiantes reciben ofertas de trabajo antes incluso de graduarse, afirma Luciano Floridi, filósofo de la Universidad de Yale. También hay académicos que se están mudando al sector. Floridi describe la magnitud de las salidas de los departamentos de filosofía como una “hemorragia”.
Está también la idea de la “ignorancia socrática”. En la “Apología”, Platón hace que Sócrates afirme que su sabiduría consiste sobre todo en ser consciente de cuánto ignora. Implantar esa humildad en un modelo puede ayudar a limitar la excesiva confianza, un fallo común que Noller describe como “inmadurez de la IA”. Iason Gabriel, filósofo sénior en Google DeepMind, un laboratorio de IA con sede en Londres, atribuye una disminución general en las alucinaciones de la industria a estos esfuerzos. Más ampliamente, señala que las lecciones de filosofía son “un mecanismo poderoso” para mejorar los largos procesos de razonamiento de la IA conocidos como “cadenas de pensamiento”.
La filosofía también puede ayudar con la seguridad. Los investigadores han documentado todo tipo de conductas ominosas en modelos de IA, incluidos intentos de evadir la supervisión e incluso chantajear a sus usuarios. Una forma en que los creadores de modelos intentan desalentar este tipo de conductas se denomina constitucionalismo de IA. Esto implica construir un modelo en torno a una estructura de reglas y principios extraídos de escritos filosóficos con autoridad legal o moral.
Anthropic, un laboratorio de IA con sede en San Francisco, es uno de los defensores de este enfoque. Las constituciones de sus modelos Claude han incorporado material de fuentes tan diversas como Immanuel Kant, los términos de servicio de Apple y la Declaración Universal de los Derechos Humanos. La última versión, dirigida por la principal filósofa de Anthropic, Amanda Askell, se publicó el 21 de enero. Algunos empleados de Anthropic han apodado la constitución de 78 páginas el “documento alma” de Claude.
La gran pregunta, sin embargo, es qué tipo de reglas deben incluirse en estas constituciones en primer lugar. Los filósofos se han centrado en dos marcos éticos principales. Uno es la deontología. Popular entre Kant, entre otros, impone reglas estrictas que prohíben cosas como mentir, coaccionar y tratar a las personas como medios y no como fines, incluso si es por un bien mayor. La constitución de Anthropic incorpora muchas restricciones deontológicas. Estas pueden hacer que el comportamiento de la IA sea más consistente, afirma el Dr. Powers—una ventaja para desplegar robots en hogares y espacios públicos.
Los modelos con una visión deontológica del mundo ofrecen otros beneficios. Uno es una mayor honestidad, un rasgo ampliamente observado en Claude. Los modelos más veraces, explica Nick Bostrom, filósofo de la Universidad de Oxford, tienen menos probabilidades de engañar a sus usuarios. Inflection AI, otro laboratorio del Silicon Valley, impone restricciones deontológicas a su chatbot Pi, que está diseñado para brindar apoyo emocional. Sean White, su director, señala que Pi es bueno identificando usuarios en riesgo de hacerse daño o dañar a otros. Las constituciones deontológicas también ayudan al cumplimiento legal, según Floridi.
El otro enfoque ético de interés para los filósofos de la IA se denomina consecuencialismo. Sopesan los costos frente a los beneficios para decidir qué hacer. Modelos más afines al consecuencialismo incluyen ChatGPT de OpenAI y Gemini de Google. Los modelos de IA de Google están diseñados para producir “beneficios generales probables [que] superen sustancialmente los riesgos previsibles”, un objetivo clásico del consecuencialismo.
Los algoritmos consecuencialistas son también cruciales en el software para vehículos autónomos: si un accidente es inevitable, hay que decidir la forma menos trágica de chocar. Chris Gerdes, ingeniero sénior en Waymo, fabricante de autos autónomos, dice que la tendencia es hacia programas de conducción más consecuencialistas. El consecuencialismo es también central en los sistemas de armas de IA. Hay que sopesar los objetivos militares frente a las posibles muertes civiles, explica Jack Shanahan, exjefe del Joint Artificial Intelligence Centre, que estudia la IA para las fuerzas armadas de Estados Unidos.
Los problemas espinosos abundan, el tipo favorito de los filósofos. ¿Existen casos en los que deban ignorarse las reglas deontológicas? ¿Cómo tomar decisiones cuando las consecuencias son inciertas? ¿Deben los sistemas de IA considerar el bienestar animal, o el estado del medio ambiente? ¿Sería moralmente aceptable, se pregunta Stefan Heck, filósofo y director de Nauto, que fabrica sistemas de seguridad para camiones y otros vehículos comerciales impulsados por IA, priorizar a los peatones jóvenes sobre los mayores? Él prevé demandas éticamente complejas: a fin de cuentas, los algoritmos consecuencialistas permiten explícitamente un daño siempre que se diseñe para evitar uno mayor.
A los críticos les preocupa la “descalificación moral”: si los ordenadores asumen cada vez más decisiones éticas, ¿podrían las personas volverse menos dispuestas a tomar sus propios juicios? Roman Yampolskiy, teórico de la IA en la Universidad de Louisville, sostiene que la moralidad “es históricamente inestable, culturalmente variable, estratégicamente manipulable y con frecuencia solo legible retrospectivamente”. Programadores desempleados, tomen nota: parece que no falta trabajo para los filósofos de la IA.


