Aunque han logrado avances significativos en el campo de la inteligencia artificial (IA) diversos analistas señalan que OpenAI lo ha hecho a costa de “absorber” gran parte de la web escrita, incluyendo archivos completos de importantes editoriales como Axel Springer, Condé Nast y The Associated Press. Esta práctica ha desencadenado tensiones legales y éticas que, aparentemente, la empresa busca aliviar mediante acuerdos con esos mismos conglomerados.
Y es que, a primera vista, resulta desconcertante que OpenAI esté firmando acuerdos con editoriales de las cuales ya ha obtenido contenido sin permiso previo. ¿Qué sentido tiene pagar por algo que ya poseen? Y, más importante aún, ¿por qué las editoriales, algunas de las cuales han mostrado su enojo ante lo que consideran un robo de su trabajo, estarían dispuestas a negociar?
Una posible respuesta a estas preguntas radica en el panorama cambiante de la web. Google, que solía ser la principal fuente de tráfico para muchos sitios web, ha ido reduciendo paulatinamente la cantidad de visitas que redirige fuera de su propia plataforma. Esto pone en riesgo la supervivencia de una gran parte de internet, y podría ser una oportunidad que OpenAI intenta capitalizar.
Los acuerdos con las editoriales
Lo que sabemos hasta ahora es que estos acuerdos permiten a OpenAI acceder a publicaciones con el fin de “enriquecer la experiencia de los usuarios de ChatGPT al añadir contenido reciente y autorizado sobre una amplia variedad de temas”, según afirma un comunicado de prensa sobre el acuerdo con Axel Springer. La clave aquí es el “contenido reciente”: al raspar la web, GPT no puede acceder a información más allá de una fecha determinada, por lo que el acceso en tiempo real podría acercar sus productos a resultados en tiempo real.
Los detalles de estos acuerdos siguen siendo, en su mayoría, desconocidos, posiblemente debido a acuerdos de confidencialidad. Se ha informado que OpenAI ha ofrecido sumas que oscilan entre US$ 1 millón y US$ 5 millones al año a las editoriales, según The Information; sin embargo, estos montos parecen insignificantes en comparación con lo que OpenAI ya ha tomado sin permiso. Entonces, ¿por qué pagar?
Una posibilidad es que estos pagos faciliten el acceso a API, lo que haría más sencillo y actual el proceso de raspar contenido. Otra interpretación es que estos pagos son una forma de evitar demandas que podrían costar mucho más a OpenAI. Ya una importante publicación, The New York Times, ha presentado una demanda acusando a OpenAI de infringir derechos de autor al utilizar su contenido para entrenar modelos de lenguaje sin permiso.
El caso de The New York Times
The New York Times no solo ha demandado a OpenAI, sino que argumenta que el producto creado compite directamente con su trabajo, “robándole” audiencia. Las negociaciones entre el Times y OpenAI fracasaron, posiblemente porque las sumas ofrecidas eran insultantemente bajas, y la empresa se amparó en la defensa de “uso justo”, que permite el uso no autorizado de material protegido por derechos de autor bajo ciertas circunstancias.
Si el Times gana su demanda, podría recibir daños estatutarios que comenzarían en US$ 750 por obra, lo que podría ascender a miles de millones de dólares, considerando que OpenAI ingirió 10 millones de obras en total. Esto podría explicar por qué OpenAI está cerrando acuerdos con otras editoriales: para evitar más demandas similares.
Google y el futuro de la búsqueda en la web
Los acuerdos de OpenAI no solo buscan evitar demandas, sino también mejorar la reputación de la empresa. Además, OpenAI ha lanzado SearchGPT, su propio motor de búsqueda que, aunque aún en fase de prototipo, podría representar una amenaza para Google. Este nuevo motor podría filtrar mejor la información confiable y evitar errores embarazosos que las IA suelen cometer.
Google ha estado perdiendo utilidad para el usuario promedio debido a cambios en su algoritmo que priorizan resultados de IA por encima de fuentes originales. Esto ha enfurecido a los editores, y los acuerdos de OpenAI podrían darles más influencia para negociar con Google en el futuro.