Bloqueos a la IA por grandes medios

Alrededor del 79 % de los casi 100 principales sitios web de noticias del Reino Unido y Estados Unidos bloquean al menos uno de los rastreadores utilizados para el entrenamiento de modelos de inteligencia artificial, entre ellos GPTBot, ClaudeBot, Anthropic-ai, CCBot, Applebot-Extended y Google-Extended. Además, el 71 % impide que los bots de IA rastreen sus contenidos para usos de recuperación de información o búsquedas en tiempo real.

Un análisis realizado por la plataforma de relaciones públicas digitales Buzzstream examinó los 50 principales sitios de noticias de ambos países y reveló que el 34 % de los editores bloquea todos los bots de IA, frente a un 14 % que permite el acceso a los 11 rastreadores analizados.

Según explicó a Buzzstream Harry Clarkson-Bennett, director de SEO de The Telegraph, los editores recurren al archivo robots.txt para bloquear los bots porque el intercambio de valor es prácticamente inexistente. “Los grandes modelos de lenguaje no están diseñados para generar tráfico de referencia, y los editores necesitan tráfico para sobrevivir”, señaló.

Entre los rastreadores analizados, el menos autorizado fue el bot de entrenamiento de Anthropic, mientras que Perplexity-User fue el más permitido, seguido de ChatGPT-User.

Más información:

AMI >

Press Gazette >

Enlazar con noticia