Cloudflare bloqueia IA: a guerra dos bots parece estar começando

Cloudflare bloqueia IA: a guerra dos bots parece estar começando

A Cloudflare bloqueia IA e tem por objetivo proteger sites onde as ferramentas de IA ignoram regras e realizam raspagem de dados.

Cloudflare bloqueia IA: a guerra dos bots parece estar começando
Cloudflare bloqueia IA: a guerra dos bots parece estar começando

A Cloudflare bloqueia IA e parece iniciar uma batalha contra as ferramentas que fazem raspagem de dados ignorando as regras e permissões.

Usualmente as ferramentas de IA realizam essa atividade como parte do seu processo de aprendizagem.

Isso tem irritado canais de notícias e de informações, que se sentem roubadas por essas ferramentas.

Cloudflare bloqueia IA: a guerra dos bots parece estar começando

Esse novo controle publicado pela Cloudflare faz parte de uma iniciativa muito maior, que reune diversas ferramentas de proteção com IA.

A ferramenta chamada AI Audit também irá monitorar quais os robôs mais praticam raspagem de dados.

Burlando as regras

Desde os primórdios da internet, todo servidor com o mínimo de organização possui um arquivo chamado robots.txt.

Originalmente esse arquivo é um compilado de regras que dita para os crawlers dos motores de busca se eles podem ou não indexar um determinado site e quais partes do site podem ser indexadas.

Seguindo a mesma semântica, esse mesmo arquivo deveria servir para que os bots de IA não realizassem raspagens de dados.

Porém, grandes portais tem relatado que os bots tem ignorado essas regras e tem scaneado portais de conteúdo inteiro, gerando matérias clonadas e sem os devidos créditos.

O arquivo robots.txt não realiza nenhum tipo de bloqueio, ele apenas é um dicionário de regras, que bons bots devem assimilar e seguir.

O jogo vai virar

Mas o objetivo da Cloudflare não é apenas controlar e/ou proibir o acesso de bots a portais de conteúdo.

Tudo caminha para que em breve a Cloudflare seja uma espécie de marketplace, onde grandes portais iriam vender acessos a seus conteúdos para as ferramentas de IA.

Chegando neste nível de maturidade seria simples exigir controle sobre o tráfego em um determinado portal.

matrix

ViamaisBLOG
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.