Un análisis de Press Gazette ha descubierto que más del 40% de los 100 principales sitios web de noticias en inglés permiten a todos los rastreadores web de IA peinar sus contenidos para entrenar sus herramientas de IA. Entre los sitios mejor clasificados, más de la mitad han bloqueado el bot de OpenAI para ChatGPT.
Press Gazette comprobó manualmente los archivos robots.txt de los principales sitios web de noticias y descubrió que varios rastreadores web de empresas de IA estaban bloqueados por algunos editores, mientras que otros dejaban sus sitios web abiertos a los robots o negociaban acuerdos de licencia de contenidos.
Sajeeda Merali, directora ejecutiva de la Asociación de Editores Profesionales británicos (Professional Publishers Association), que representa a grandes y pequeñas empresas de medios especializadas, declaró a Press Gazette que los editores que la integran están «muy preocupados» por la falta de transparencia de las empresas de inteligencia artificial a la hora de utilizar los contenidos de los editores para entrenar sus herramientas. La PPA ha escrito a Rishi Sunak para pedir que obligue a las empresas de IA a ser transparentes.
Más información:
Revealed: Which of the top 100 UK and US news websites are blocking AI crawlers >
News publishers divided over whether to block ChatGPT >