Los datos se están agotando e inteligencias artificiales como ChatGPT tendrían un fin
Plataformas como DALL·E 2 y Midjourney también estarían afectadas
Una investigación de Epoch AI, organización que estudia el desarrollo de la inteligencia artificial, asegura que 2026 es el año máximo para el que están diseñados los actuales centros de datos de alta calidad, los cuales reúnen la data para la creación de contenido de estas tecnologías.
Lo anterior, genera una alerta en plataformas como ChatGPT, DALL·E 2 y Midjourney, que usan ese conjunto de información para generar su contenido a través de texto y aprendizaje automático.
Cómo podrían acabarse los datos de la inteligencia artificial
Para que una inteligencia artificial cree una imagen, texto, video o audio necesita de una instrucción, que en su mayoría de veces es escrita, y con esa información toma datos de una base o centro, llamado dataset, para generar el contenido.
El problema de esto es que la data se están consumiendo muy rápido y no se producen de la misma manera. De hecho, los investigadores afirman que la demanda de conjuntos de datos de alta calidad para entrenar modelos de lenguaje IA crece un 50 % cada año, mientras que la generación de esos conjuntos lo hace un 7 %. Un desequilibrio.
La recolección de información para estos dataset se hace de forma pública y a una gran escala para que la plataforma aprenda de forma correcta. Además, en el proceso hay humanos involucrados porque hay un filtro importante para ‘limpiar’ los datos de forma manual y que respondan de manera adecuada a las peticiones de los usuarios.
Los encargados del estudio aseguran que esto es un proceso lento y costoso, y aunque existen herramientas, como la propia inteligencia artificial, usarlas para revisar los modelos conlleva a una alta tasa de riesgos que pueden hacer aún más complicado el proceso.
El 2026 sería el límite para los datos de alta calidad, mientras que los de baja calidad para texto tienen como rango máximo entre 20230 y 2050 y para los de imagen hasta 2060. Por lo que sugieren que debe “mejora drásticamente la eficiencia de los datos o disponer de nuevas fuentes de datos” para compensar la alta demanda que se proyecta habrá, a medida que esta tecnología encuentre más casos de uso.
Es importante tener en cuenta que las plataformas que usan el aprendizaje automático para producir contenido, como las anteriormente mencionadas, también dependen del alcance del algoritmo interno que va avanzando según el uso continúo por parte de las personas.
Qué es ChatGPT
Una de esas plataformas involucradas en esta situación es ChatGPT, que es una inteligencia artificial creada por OpenAI para generar respuestas coherentes a partir de preguntas de los usuarios en texto.
La plataforma ha sido usada por las personas como un buscador, pero también para crear documentos más elaborados como ensayos académicos o correos de trabajo.
Este crecimiento ha llevado a que Microsoft planee incluir esta herramienta dentro de Bing, su buscador web, y para marzo de este año iniciará las pruebas para integrarlo y competir con Google.