O Tráfego de Bots Está Aumentando: O Teu Site Está Preparado?

Publicado: por Josh Helmuth
O Tráfego de Bots Está Aumentando: O Teu Site Está Preparado? thumbnail

Para cada humano visitando seu site, existem 3 bots.

Surpreso? Nós também estávamos.

Mas de acordo com nossos dados internos, observamos uma média de 71,5% de tráfego de bots desde janeiro de 2025.

Os rastreadores de IA do ChatGPT (9,16%), Claude (6,09%) e outros LLMs aparecem regularmente nos nossos dados de tráfego de bots, enquanto os bots de motores de busca como o Googlebot representam apenas 7,57% do tráfego.

Não podemos simplesmente bloquear todos porque a maioria dos bots são necessários. Por exemplo, o Googlebot ajuda seu site a aparecer nas buscas, ou o bot ChatGPT cita sua marca como uma fonte em respostas.

Mas se você está vendo picos de tráfego ou entradas de spam nos seus formulários de contato, é nesse momento que você precisa agir.

Quão Ruim Tornou-se o Aumento do Tráfego de Bots?

Aqui está uma análise do tráfego de bots que estamos observando nos sites de nossos clientes na rede DreamHost:

Gráfico de barras mostrando os 10 bots mais ativos na rede da DreamHost, com bots do WordPress, ChatGPT e Amazonbot liderando nos últimos 7 dias.

Os padrões geográficos que observamos também são bastante interessantes.

A Irlanda lidera o tráfego de bots com 40,70% das visitas diárias, seguida por Singapura com 13,04%. Essa concentração geográfica não é apenas coincidência.

A Irlanda sedia as sedes europeias de quase todas as principais empresas de tecnologia dos EUA – Google, Apple, Microsoft, Amazon e Facebook – atraídas pelo acesso à UE, impostos corporativos baixos e uma força de trabalho que fala inglês.

Enquanto isso, Singapura é o centro de data centers da Ásia-Pacífico, com AWS, Microsoft Azure e Google Cloud operando grandes instalações lá para atender os mercados asiáticos com menor latência. Quando rastreadores de IA e serviços em nuvem escaneiam sites, eles geralmente estão operando a partir de fazendas de servidores concentradas nestes dois locais estratégicos.

Nossas descobertas estão bastante coerentes com o Relatório de Bots Maliciosos da Imperva 2025, onde 51% de todo o tráfego da internet agora provém de fontes automatizadas, com 37% classificado como bots maliciosos.

O desafio reside na área cinzenta.

Alguns rastreadores de treinamento de IA (como GPTBot) coletam seu conteúdo para treinar modelos de linguagem sem oferecer benefícios diretos de tráfego de volta ao seu site.

Mas se estes representam “bons” ou “maus” bots depende de como você se sente em relação às empresas de IA que usam seu conteúdo para fins comerciais.

Bons Bots vs. Bots Maliciosos: Qual é a Diferença

Gráfico em forma de rosca mostrando a divisão do tráfego web de 2023: 49% humano, 37% bad bot (aumento de 5%) e 14% good bot (redução de 3,6%) ano a ano.

Nem todo o tráfego automatizado merece ser bloqueado. Você precisa saber quais bots ajudam o seu negócio e quais prejudicam antes de tomar qualquer ação para gerenciar bots no seu site.

Bots Bons Que Beneficiam Seu Site

  • Rastreadores de mecanismos de busca: Por exemplo, Googlebot e Bingbot indexam seu conteúdo para resultados de pesquisa.
  • Bots de mídias sociais: Como FacebookExternalAgent que geram prévias de links quando os usuários compartilham seu conteúdo.
  • Serviços de monitoramento: Estes verificam a disponibilidade e o desempenho do seu site.
  • Rastreadores de busca de IA: Como ChatGPT-User e Perplexity-User que citam seu conteúdo ao responder perguntas de usuários.

Bots Ruins Que Drenam Seus Recursos

  • Raspadores de conteúdo: Estes roubam seus artigos, descrições de produtos e imagens.
  • Bots de spam em formulários: Eles inundam formulários de contato com envios de lixo.
  • Bots de monitoramento de preços: De concorrentes que rastreiam suas estratégias de preços.
  • Bots de acúmulo de inventário: Estes adicionam produtos aos carrinhos sem efetuar a compra.
  • Bots de preenchimento de credenciais: Eles tentam invadir contas de usuários.
Artigo relacionado
How To Stop Web Crawlers and Bots From Slowing Down Your Website
Ler mais

Os Custos Ocultos Que Afetam O Seu Site De Pequenas Empresas

Independentemente do tipo de bot, o tráfego automatizado afeta o seu site em três áreas críticas:

  • Despesas de Hospedagem
  • Riscos de segurança
  • Precisão dos dados

Cada visita de bot consome recursos do servidor como um visitante humano, mas sem qualquer potencial para conversões, engajamento ou receita.

1. Seus Custos de Infraestrutura Continuam Aumentando

Cada solicitação de bot utiliza sua largura de banda, poder de processamento e armazenamento.

Se você tem um site com muito conteúdo ou uma plataforma de e-commerce, é provável que veja isso impactar rapidamente sua carteira.

O projeto Read the Docs reduziu o tráfego em 75% após bloquear os rastreadores de IA e passou de servir 800GB para 200GB diariamente, economizando $1,500 por mês em custos de largura de banda.

Se estás num plano de hospedagem compartilhada, não verás custos diretos.

O tráfego excessivo de bots, no entanto, pode fazer com que seu host reduza o desempenho do site. Atividades de bots mais agressivas podem levar você a precisar de soluções de VPS ou Dedicated Hosting mais cedo do que planejado.

2. Problemas de Segurança e Spam Pioram

Bots maliciosos atacam seus formulários de contato, páginas de login e processos de finalização de compra.

Eles procuram vulnerabilidades, tentam ataques de preenchimento de credenciais e também inundam formulários com submissões de lixo. Como a maioria dos sites possui apenas segurança básica, eles se tornam um alvo atrativo.

Se os seus formulários de contato ou comentários em blogs tiverem entradas de spam, sugiro instalar o Askimet imediatamente para ver se as entradas de spam diminuem. Lembre-se, no entanto, que o Askimet não bloqueia o tráfego de bots.

Você precisa tomar medidas para bloquear bots por conta própria (mais sobre isso em breve).

3. Seus Dados de Análise São Contaminados

O tráfego de Bot atrapalha as análises do seu site.

Quando os bots visitam páginas, eles não interagem com o conteúdo, criando números de tráfego artificialmente altos com zero taxas de conversão.

Esta contaminação torna quase impossível para ti medir o comportamento real do usuário, otimizar funis de conversão ou tomar decisões de marketing baseadas em dados.

E mesmo que o Google Analytics permita filtrar o tráfego para refinar a análise, é difícil distinguir o tráfego de bots dos visitantes humanos regulares.

Receba conteúdo diretamente na sua caixa de entrada

Inscreva-se agora para receber todas as últimas atualizações, diretamente na sua caixa de entrada.

Onde Procurar Tráfego de Bot no Seu Site

Atualmente, não existe uma maneira infalível de identificar todo o tráfego de bots, pois os bots avançados são praticamente indistinguíveis dos visitantes humanos.

Mas existem certos passos que você pode seguir para começar a monitorar.

1. Comece Com o Painel de Controle de Tráfego do DreamHost

Se você está hospedando com a DreamHost, você já está um passo à frente. A aba Tráfego no seu painel DreamHost oferece uma visão clara da atividade do tráfego, incluindo o comportamento dos bots. Você pode monitorar picos, detectar anomalias e acompanhar quantos bots podem estar impactando seu site, tudo sem a necessidade de uma ferramenta de terceiros.

O nosso painel ajuda-te:

  • Distinguir entre tráfego humano e de bot à primeira vista
  • Visualizar tráfego por IP, referenciador ou agente do usuário
  • Identificar padrões cedo para que possa agir rapidamente
Painel de tráfego destacando a atividade de bot ao longo de 7 dias, com fontes de tráfego divididas por IA, mecanismo de busca e bots sociais.

Isso é especialmente útil para usuários que preferem ferramentas integradas a Painéis de controle complicados. Bônus – Não é necessária configuração extra!

2. Explore Com o Google Analytics

Olhe para o seu Google Analytics Painel de controle para estes sinais reveladores de atividade intensa de bots:

  • Picos de tráfego com aumento correspondente da taxa de rejeição
  • Altas visualizações de página com zero tempo na página
  • Padrões de tráfego geográfico incomuns (tráfego repentino de países onde você não opera)
  • Spam de referência de domínios desconhecidos

Vá até RelatóriosTech e use o filtro de tecnologia do GA4 para especificar a tecnologia do usuário.

captura de tela do relatório do Google Analytics

Aqui, você pode começar a filtrar por navegador e sistema operacional, resoluções de tela, dispositivos, versões de aplicativos, etc. O que você está procurando são navegadores incomuns, sistemas operacionais estranhos e resoluções de tela incomuns, como:

  • 1024 x 768
  • 1366 x 768
  • 1600 x 864
  • 800 x 600
  • 1600 x 1200
  • 1024 x 667
  • Não Especificado

Isso reduziria alguns visitantes reais do seu rastreamento, mas você também veria muitas menos entradas de bots nos dados de análise.

Nota: Bots avançados podem usar resoluções normais e as últimas versões de dispositivos para disfarçar sua atividade. Eles são extremamente difíceis de filtrar para análise, a menos que você comece a examinar os visitantes antes que eles possam visualizar seu site.

3. Verifique Seus Registros do Servidor

Se você tem acesso ao seu painel de controle de hospedagem, observe os registros de acesso do servidor para identificar padrões que indiquem tráfego automatizado:

  • Solicitações rápidas de endereços IP únicos.
  • Solicitações para páginas inexistentes (muitas vezes bots sondando vulnerabilidades).
  • Agentes de usuário identificando-se como rastreadores conhecidos (tanto bons quanto ruins).
  • Solicitações sem informações de referenciador.

Muitos provedores de hospedagem, incluindo a DreamHost, oferecem ferramentas de análise de registros em seus painéis de controle. Procure por picos incomuns no uso de largura de banda que não correspondam a campanhas de marketing ou atualizações de conteúdo.

Uma vez que você tenha uma lista de endereços IP que parecem ser infratores repetidos, você pode começar a bloquear os endereços IP diretamente do seu servidor web, como NGINX ou Apache, ou de um CDN.

Glossário DreamHost

CDN

CDN é uma abreviação para u201cRede de Entrega de Conteúdou201d. Refere-se a uma rede de servidores web distribuídos geograficamente (e seus data centers). As entidades que compõem uma CDN colaboram para garantir uma entrega de conteúdo rápida via internet.

Ler Mais

4. Use Ferramentas de Monitoramento de Terceiros

Às vezes, só é possível identificar uma certa quantidade de tráfego. É por isso que existem ferramentas gratuitas de terceiros, como o Cloudflare Analytics (se você utilizar o serviço deles), que oferecem análises detalhadas do tráfego de bots.

Também existem outros aplicativos abrangentes como:

  • Wordfence: Para sites WordPress; identifica tentativas maliciosas de bots
  • Sucuri: Oferece serviços de firewall para websites com detecção de bots
  • MonsterInsights: Fornece relatórios aprimorados do Google Analytics com filtragem de bots

Gerenciando e Bloqueando Bots Maliciosos Sem Prejudicar os Bons

Recomendo ir devagar no bloqueio de tráfego de bots, pois você pode acabar bloqueando usuários reais também. E também é necessário uma abordagem equilibrada que bloqueie o tráfego automático prejudicial enquanto preserva os rastreadores benéficos.

Aqui está como eu implementaria a gestão de bots sem bloquear acidentalmente motores de busca ou serviços legítimos.

Configure Seu Arquivo robots.txt

Seu arquivo robots.txt serve como a primeira linha de defesa contra rastreadores indesejados.

Crie ou atualize o arquivo no diretório raiz do seu site com instruções específicas para diferentes tipos de bot:

# Bloquear rastreadores de treinamento de IA
User-agent: GPTBot
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: Google-Extended
Disallow: /

# Permitir motores de busca
User-agent: Googlebot
Allow: /

User-agent: Bingbot
Allow: /

# Permitir bots de busca de IA que citam fontes
User-agent: ChatGPT-User
Allow: /

User-agent: PerplexityBot
Allow: /

Se você não tem acesso direto ao arquivo robots.txt e utiliza o WordPress, você pode tentar usar o plugin WP Robots Txt que permite editar o arquivo diretamente do seu Painel de controle do WordPress.

Tenha em mente que o robots.txt opera com base em um sistema de honra. Rastreadores bem comportados respeitam essas diretrizes, mas bots maliciosos muitas vezes ignoram o arquivo completamente.

Implemente um Firewall de Site

Para uma segurança de site mais agressiva, implemente um Firewall de Aplicação Web (WAF) que pode bloquear bots no nível do servidor.

Você também tem mais algumas opções como proprietário de uma pequena empresa que gerencia sites de baixo volume.

Plano Gratuito Cloudflare:

  • Fornece capacidades básicas de combate a bots
  • Bloqueia automaticamente o tráfego claramente malicioso
  • Oferece regras de firewall personalizáveis para ameaças específicas

Wordfence (Usuários do WordPress):

  • Inclui recursos de detecção e bloqueio de bots
  • Atualizações de inteligência de ameaças em tempo real
  • Limitação de taxa personalizável para prevenir solicitações em rápida sucessão

Limitação de Taxa no Nível do Servidor

Muitos provedores de hospedagem oferecem recursos de limitação de taxa que automaticamente desaceleram ou bloqueiam endereços IP que fazem muitas solicitações em curtos períodos de tempo. Você pode configurar esses limitadores de taxa para bloquear endereços IP que navegam por muitas páginas em um intervalo de tempo muito curto.

Por exemplo, uma pessoa normal precisaria de alguns segundos para olhar ao redor em uma página antes de clicar em diferentes links. Um bot levaria milissegundos para fazer o mesmo.

Soluções em Plugins para Sites WordPress

Se você está usando o WordPress, tem opções adicionais para gerenciamento de bots:

  • Akismet: Filtra automaticamente comentários e spam de formulários com 99,99% de precisão usando filtragem avançada de IA. Essencial para qualquer site WordPress que aceite submissões de usuários.
  • WP Cerber Security: Oferece proteção abrangente contra bots, incluindo limitação de tentativas de login, bloqueio de IP e algoritmos avançados de detecção de bots.
  • All-In-One Security (AIOS): Oferece recursos de firewall e capacidades de bloqueio de bots adequados para sites de pequenas empresas.

Seu Caminho Completo de Implementação de Proteção Contra Bots

Linha do tempo em quatro etapas mostrando como a proteção contra bots melhora ao longo do tempo, de correções rápidas a defesas avançadas.

Eu dividi este plano de implementação para que ele se encaixe em agendas apertadas e te ajude a ir de zero proteção para uma defesa contra bots funcionando em pouco tempo.

20 Minutos: Vitórias Rápidas

  • Atualizar o arquivo robots.txt
  • Ativar plugins de segurança básicos 
  • Verificar no Google Analytics os padrões de bots

Comece pelo seu arquivo robots.txt, pois é o primeiro passo mais fácil. Acesse o gerenciador de arquivos do seu site (ou use FTP) e crie ou atualize o arquivo robots.txt no seu diretório raiz. Copie a configuração de robots.txt mencionada anteriormente neste artigo e cole-a.

Se estiveres a usar o WordPress, instala e ativa o plugin de segurança Wordfence agora mesmo. A versão gratuita inclui proteção básica contra bots e começará a bloquear o tráfego malicioso óbvio imediatamente.

Abra o Google Analytics para verificar suas fontes de tráfego em busca de padrões incomuns. Procure por países que você não atende, picos súbitos de tráfego ou taxas de rejeição altas com duração de sessão zero.

24 Horas: Camada De Defesa

  • Configure uma conta Cloudflare gratuita
  • Configure a limitação de taxa
  • Adicione CAPTCHA aos formulários
  • Ative a moderação de comentários

Cadastre-se para uma conta gratuita no Cloudflare e adicione seu site. O Cloudflare fica entre o seu site e os visitantes, bloqueando automaticamente o tráfego óbvio de bots antes que ele chegue ao seu servidor. A configuração leva cerca de 30 minutos e inclui a alteração das configurações de DNS, mas o Cloudflare orienta você em cada etapa.

Defina o limite de taxa através do seu host para automaticamente desacelerar ou bloquear endereços IP que fazem muitas solicitações. Configure limites que permitam a navegação normal (alguns segundos por página) mas interrompam rastreadores agressivos (múltiplas páginas por segundo).

Adicione CAPTCHA a formulários vulneráveis usando o plugin reCAPTCHA para WordPress ou Cloudflare Turnstile. Adicione CAPTCHA invisível a formulários de contato, seções de comentários e páginas de registro de usuários para impedir envios automatizados sem incomodar os usuários reais.

Uma Semana: Monitorar e Otimizar

  • Analisar registros do servidor
  • Ajustar regras de firewall
  • Configurar alertas de monitoramento 
  • Bloquear faixas de IP problemáticas

Análise seus registros de acesso ao servidor para identificar padrões de bots específicos para seu site. Procure por solicitações em rápida sucessão de endereços IP únicos, solicitações para páginas inexistentes e strings de agente de usuário suspeitas. A maioria dos painéis de controle de hospedagem inclui ferramentas de análise de registros que facilitam isso.

Utilize esses dados para criar regras de firewall personalizadas no Cloudflare ou no seu plugin de segurança. Por exemplo, se você notar que bots de países específicos estão consistentemente causando problemas, você pode bloquear regiões geográficas inteiras. Ou se certos agentes de usuário continuarem atacando seu site agressivamente, bloqueie essas strings específicas.

Configure alertas de monitoramento para saber quando ocorrerem picos de tráfego de bots. Ferramentas como UptimeRobot ou Pingdom podem alertá-lo sobre padrões de tráfego incomuns, tempos de carregamento lentos ou picos de recursos do servidor que podem indicar um ataque de bot.

Um Mês: Proteção Avançada

  • Implemente a análise comportamental
  • Implemente a limitação de taxa da API
  • Configure o cache do CDN
  • Crie honeypots de bot

Adicione ferramentas de análise comportamental como DataDome ou Imperva que detectam bots ao analisar movimentos do mouse, padrões de digitação e tempo de interação com a página. Estas capturam bots sofisticados que imitam o comportamento humano.

Utilize uma CDN para armazenar em cache recursos estáticos de forma agressiva. Assim, o tráfego de bots atinge o cache, não o seu host, reduzindo a carga de solicitações repetidas.

Uma das minhas técnicas favoritas é criar honeypots para bots. Se você observar muito spam de formulário, adicione um campo oculto ao formulário. Como os bots analisam o HTML da página ao preencher formulários, eles verão esse campo oculto e adicionarão alguns dados a ele. Você pode excluir com segurança todas as entradas de formulário que tenham algum texto no campo oculto, pois um visitante humano não pode vê-lo.

O Futuro da Gestão de Tráfego de Bots

O tráfego de Bots não vai desaparecer. Com 71,5% das visitas à nossa rede provenientes de fontes automatizadas, os robôs agora superam os humanos em 3 para 1 na internet.

Mas enquanto a maioria dos proprietários de sites ainda está tentando entender o que está acontecendo, você tem tudo o que precisa para reverter esse caos de bots para o seu negócio e até se beneficiar dos bons bots.

Siga em frente e comece a implementar sistemas de gerenciamento de bot enquanto sua concorrência ainda está em pânico com o tráfego falso!

Receba conteúdo diretamente na sua caixa de entrada

Inscreva-se agora para receber todas as últimas atualizações, diretamente na sua caixa de entrada.