AI ai agent ai bots cloudflare Ferramentas & Plataformas Perplexity web scraping Julie Bort agosto 5, 2025 0 Comentários

Algumas pessoas estão defendendo a perplexidade após a nuvem ‘nomeada e envergonhada’

Quando a Cloudflare acusou o mecanismo de busca da IA, a perplexidade de sites furtivamente de eliminação na segunda-feira, enquanto ignorava os métodos específicos de um site para bloqueá-lo, este não foi um caso claro de um rastreador da Web da IA enlouqueceu. Muitas pessoas vieram em defesa de Perplexity. Eles argumentaram que a perplexidade que acessa sites, desafiando os desejos do proprietário do site, embora controversa, é aceitável. E isso é uma controvérsia que certamente crescerá à medida que os agentes da IA inundam a Internet: um agente que acessa um site em nome de seu usuário será tratado como um bot? Ou como um humano fazendo o mesmo pedido? O Cloudflare é conhecido por fornecer serviços de rastreamento anti-BOT e outros serviços de segurança na web a milhões de sites. Essencialmente, o caso de teste da CloudFlare envolveu a criação de um novo site com um novo domínio que nunca havia sido rastreado por nenhum bot, configurando um arquivo robots.txt que bloqueou especificamente os bots Ai rastreadores da Perplexity e, em seguida, perguntando perplexidade sobre o conteúdo do site. E a perplexidade respondeu à pergunta. Os pesquisadores da CloudFlare descobriram que o mecanismo de pesquisa de IA usava “um navegador genérico destinado a se passar pelo Google Chrome no MacOS” quando seu próprio rastreador na web foi bloqueado. O CEO da Cloudflare, Matthew Prince, postou a pesquisa em X, escrevendo: “Algumas empresas de IA supostamente ‘respeitáveis’ agem mais como hackers norte -coreanos. Hora de nomear, vergonha e bloqueá -los com força.” Mas muitas pessoas discordaram da avaliação de Prince de que esse era um mau comportamento real. Aqueles que defendem a perplexidade em sites como X e Hacker News apontaram que o que o CloudFlare parecia documentar era a IA acessando um site público específico quando seu usuário perguntou sobre esse site específico. “Se eu, como um solicitação humana, um site, então devo receber o conteúdo”, escreveu uma pessoa no Hacker News, acrescentando: “Por que o LLM acessando o site em meu nome estaria em uma categoria legal diferente como meu navegador da Web do Firefox?” Um porta -voz da perplexidade negou anteriormente ao TechCrunch de que os bots eram da empresa e chamou o blog da Cloudflare post um discurso de vendas para o Cloudflare. Então, na terça-feira, a Perplexity publicou um blog em sua defesa (e geralmente atacando Cloudflare), alegando que o comportamento era de um serviço de terceiros que usa ocasionalmente. Evento do TechCrunch São Francisco | 27-29 de outubro de 2025, mas o ponto crucial do post da Perplexity fez um apelo semelhante ao que seus defensores on-line fizeram. “A diferença entre rastreamento automatizado e busca de usuário não é apenas técnico-é sobre quem pode acessar informações na web aberta”, disse o post. “Essa controvérsia revela que os sistemas da Cloudflare são fundamentalmente inadequados para distinguir entre assistentes legítimos de IA e ameaças reais”. As acusações da Peplexity também não são exatamente justas. Um argumento que Prince e Cloudflare usavam para chamar os métodos da Perplexity foi que o OpenAI não se comporta da mesma maneira. “O OpenAI é um exemplo de uma empresa líder de IA que segue essas práticas recomendadas. Eles respeitam os robôs.TXT e não tentam evitar uma diretiva robots.txt ou um bloco de nível de rede. E o agente ChatGPT está assinando solicitações HTTP usando a autenticação da Web Standard Open Standard recém -proposta”, escreveu Prince em seu post. O Web Bot Auth é um padrão suportado pelo Cloudflare que está sendo desenvolvido pela Força-Tarefa de Engenharia da Internet que espera criar um método criptográfico para identificar solicitações da Web do agente de IA. O debate ocorre quando a atividade de bot reformula a Internet. Como o TechCrunch relatou anteriormente, os bots que procuram raspar grandes quantidades de conteúdo para treinar modelos de IA se tornaram uma ameaça, especialmente para locais menores. Pela primeira vez na história da Internet, a atividade de bot está atualmente superando a atividade humana on -line, com o tráfego de IA representando mais de 50%, de acordo com o relatório Bad Bot da Imperva divulgado no mês passado. A maior parte dessa atividade é proveniente do LLMS. Mas o relatório também descobriu que os bots maliciosos agora representam 37% de todo o tráfego da Internet. Essa é a atividade que inclui tudo, desde raspagem persistente a tentativas de login não autorizadas. Até o LLMS, a Internet geralmente aceitava que os sites poderiam e deveriam bloquear a maioria das atividades de bot, dada a frequência com que era malicioso usando o Captchas e outros serviços (como Cloudflare). Os sites também tiveram um incentivo claro para trabalhar com bons atores específicos, como o GoogleBot, orientando -o sobre o que não indexar através do robots.txt. O Google indexou a Internet, que enviou tráfego para sites. Agora, os LLMs estão comendo uma quantidade crescente desse tráfego. O Gartner prevê que o volume do mecanismo de pesquisa cairá 25% até 2026. No momento, os humanos tendem a clicar em links de sites do LLMS no ponto em que são mais valiosos para o site, que é quando estão prontos para realizar uma transação. Mas se os seres humanos adotarem agentes como a indústria de tecnologia prevêem, eles serão – para organizar nossas viagens, reservar nossas reservas de jantar e comprar para nós – os sites prejudicariam seus interesses comerciais, bloqueando -os? O debate sobre X capturou o dilema perfeitamente: “Quero que a perplexidade visite qualquer Conteúdo Público em meu nome quando eu for um pedido/tarefa!” escreveu uma pessoa em resposta ao Cloudflare chamando a perplexidade. “E se os proprietários do site não quiserem? Eles só querem você [to] Visite diretamente a casa, veja as coisas deles ”, argumentou outro, apontando que o proprietário do site que criou o conteúdo deseja o tráfego e a potencial receita de anúncios, para não deixar a perplexidade levar.“ É por isso que não consigo ver ‘Agntic navegar’ realmente funcionando – um problema muito mais duro do que as pessoas pensam. A maioria dos proprietários de sites apenas bloqueará ”, um terceiro previu.

Fonte

Techloop

Algumas pessoas estão defendendo a perplexidade após a nuvem ‘nomeada e envergonhada’

Publicar comentário Cancelar resposta

Você pode ter perdido

Rivian processa para vender seus EVs diretamente em Ohio

Amazon nega o relatório que está fechando o Wearky Podcast Studio

Mobilidade do TechCrunch: Gambit de Holding de Tesla

Perplexidade acusada de raspar sites que bloquearam explicitamente a REI raspando

Conversação de chatgpt vazada mostra o usuário identificado como advogado perguntando como “deslocar uma pequena comunidade indígena amazônica de seus territórios para construir uma barragem e uma planta hidrelétrica”

OpenAI diz que o ChatGPT está a caminho de chegar a 700m de usuários semanais

A verdade sobre invadir a tecnologia agora

Rod Stewart revive Ozzy Osbourne, que empunhava o bastão de selfie em um vídeo nojento da AI

Elon Musk diz que está trazendo de volta o arquivo de Vine

Retornos mensuráveis encontrados para grandes telecomunicações além da economia de custos

Related Posts

Publicar comentário Cancelar resposta

Você pode ter perdido