Cloudflare bloqueia IA: a guerra dos bots parece estar começando

A Cloudflare bloqueia IA e tem por objetivo proteger sites onde as ferramentas de IA ignoram regras e realizam raspagem de dados.

A Cloudflare bloqueia IA e parece iniciar uma batalha contra as ferramentas que fazem raspagem de dados ignorando as regras e permissões.
Usualmente as ferramentas de IA realizam essa atividade como parte do seu processo de aprendizagem.
Isso tem irritado canais de notícias e de informações, que se sentem roubadas por essas ferramentas.
Cloudflare bloqueia IA: a guerra dos bots parece estar começando
Esse novo controle publicado pela Cloudflare faz parte de uma iniciativa muito maior, que reune diversas ferramentas de proteção com IA.
A ferramenta chamada AI Audit também irá monitorar quais os robôs mais praticam raspagem de dados.
Burlando as regras
Desde os primórdios da internet, todo servidor com o mínimo de organização possui um arquivo chamado robots.txt.
Originalmente esse arquivo é um compilado de regras que dita para os crawlers dos motores de busca se eles podem ou não indexar um determinado site e quais partes do site podem ser indexadas.
Seguindo a mesma semântica, esse mesmo arquivo deveria servir para que os bots de IA não realizassem raspagens de dados.
Porém, grandes portais tem relatado que os bots tem ignorado essas regras e tem scaneado portais de conteúdo inteiro, gerando matérias clonadas e sem os devidos créditos.
O arquivo robots.txt não realiza nenhum tipo de bloqueio, ele apenas é um dicionário de regras, que bons bots devem assimilar e seguir.
O jogo vai virar
Mas o objetivo da Cloudflare não é apenas controlar e/ou proibir o acesso de bots a portais de conteúdo.
Tudo caminha para que em breve a Cloudflare seja uma espécie de marketplace, onde grandes portais iriam vender acessos a seus conteúdos para as ferramentas de IA.
Chegando neste nível de maturidade seria simples exigir controle sobre o tráfego em um determinado portal.