El Tráfico de Bots Va en Aumento: ¿Está Tu Sitio Web Preparado?

Publicado: por Josh Helmuth
El Tráfico de Bots Va en Aumento: ¿Está Tu Sitio Web Preparado? thumbnail

Por cada persona que visita tu sitio web, hay 3 bots.

¿Sorprendido? Nosotros también.

Pero según nuestros datos internos, desde enero de 2025 hemos visto un promedio de 71.5 % de tráfico generado por bots.

Los rastreadores de IA como los de ChatGPT (9.16 %), Claude (6.09 %) y otros modelos de lenguaje aparecen regularmente en nuestros registros de tráfico de bots, mientras que los bots de motores de búsqueda como Googlebot solo representan el 7.57 % del tráfico.

No podemos simplemente bloquearlos a todos porque muchos bots son necesarios. Por ejemplo, Googlebot permite que tu sitio aparezca en los resultados de búsqueda, o el bot de ChatGPT puede citar tu marca como fuente en sus respuestas.

Pero si estás viendo picos de tráfico repentinos o entradas de spam en tus formularios de contacto, es momento de actuar.

¿Qué Tan Grave Se Ha Vuelto el Aumento del Tráfico de Bots?

Aquí tienes un desglose del tráfico de bots que estamos observando en los sitios web de nuestros clientes dentro de la red de DreamHost:

Gráfico de barras que muestra los 10 principales bots por tráfico en la red de DreamHost, con los bots de WordPress, ChatGPT y Amazonbot liderando durante los últimos 7 días.

Los patrones geográficos que observamos también son bastante interesantes.

Irlanda encabeza la lista con un 40.70 % de las visitas diarias provenientes de bots, seguida por Singapur con un 13.04 %. Esta concentración geográfica no es una simple coincidencia.

Irlanda alberga las sedes europeas de casi todas las grandes empresas tecnológicas de EE. UU. —Google, Apple, Microsoft, Amazon y Facebook— atraídas por el acceso a la UE, los bajos impuestos corporativos y una fuerza laboral de habla inglesa.

Mientras tanto, Singapur es el centro neurálgico de centros de datos en Asia-Pacífico, con AWS, Microsoft Azure y Google Cloud operando instalaciones clave allí para atender a los mercados asiáticos con menor latencia. Cuando los rastreadores de IA y los servicios en la nube escanean sitios web, a menudo lo hacen desde granjas de servidores concentradas en estas dos ubicaciones estratégicas.

Nuestros hallazgos coinciden bastante con el Bad Bot Report 2025 de Imperva, que indica que el 51 % del tráfico en internet proviene ahora de fuentes automatizadas, y el 37 % se clasifica como bots maliciosos.

El reto está en la zona gris.

Algunos rastreadores utilizados para entrenar IA (como GPTBot) recolectan tu contenido para entrenar modelos de lenguaje, sin ofrecer beneficios de tráfico directo a tu sitio.

Pero si estos bots son “buenos” o “malos” depende de cómo te sientas respecto a que las empresas de IA usen tu contenido con fines comerciales. 

Bots Buenos vs. Bots Malos: ¿Cuál es la Diferencia?

Gráfico de barras que muestra la distribución del tráfico web en 2023: 49 % humano, 37 % bots maliciosos (aumentó un 5 %) y 14 % bots buenos (disminuyó un 3.6 %) en comparación con el año anterior.

No todo el tráfico automatizado merece ser bloqueado. Antes de tomar cualquier medida para gestionar bots en tu sitio web, necesitas saber cuáles te benefician y cuáles te perjudican.

Bots Buenos Que Benefician Tu Sitio

  • Rastreadores de motores de búsqueda: como Googlebot y Bingbot, que indexan tu contenido para que aparezca en los resultados de búsqueda.
  • Bots de redes sociales: como FacebookExternalAgent, que generan vistas previas de enlaces cuando los usuarios comparten tu contenido.
  • Servicios de monitoreo: que verifican el tiempo de actividad y el rendimiento de tu sitio.
  • Rastreadores de búsqueda con IA: como ChatGPT-User y Perplexity-User, que citan tu contenido al responder consultas de los usuarios.

Bots Malos Que Agotan tus Recursos

  • Scrapers de contenido: roban tus artículos, descripciones de productos e imágenes.
  • Bots de spam en formularios: saturan tus formularios de contacto con envíos basura.
  • Bots de monitoreo de precios: de competidores que rastrean tus estrategias de precios.
  • Bots que acaparan inventario: agregan productos al carrito sin intención de comprarlos.
  • Bots de ataque con credenciales: intentan acceder a cuentas de usuarios mediante combinaciones de usuario y contraseña filtradas.
Artículo relacionado
Cómo Evitar Que los Crawlers y Bots Ralenticen tu Sitio Web
Leer más

Los Costos Ocultos Que Afectan el Sitio Web de Tu Pequeña Empresa

Sin importar el tipo de bot, el tráfico automatizado impacta tu sitio en tres áreas clave: 

  • Gastos de alojamiento
  • Riesgos de seguridad
  • Precisión de los datos

Cada visita de un bot consume recursos del servidor igual que una visita humana, pero sin potencial alguno de conversión, interacción o ingresos. 

1. Tus Costos de Infraestructura Siguen Aumentando

Cada solicitud de un bot consume ancho de banda, potencia de procesamiento y almacenamiento. 

Si tienes un sitio con mucho contenido o una tienda en línea, es probable que esto afecte rápidamente tu bolsillo.

El proyecto Read the Docs redujo su tráfico en un 75% tras bloquear rastreadores de IA, pasando de servir 800 GB a 200 GB diarios, lo que les ahorró $1,500 al mes solo en costos de ancho de banda.

Si estás en un plan de hosting compartido, puede que no veas un costo directo.

Sin embargo, un tráfico excesivo de bots puede hacer que tu proveedor limite el rendimiento de tu sitio. Una actividad más agresiva incluso puede obligarte a migrar antes de lo previsto a un VPS o un plan de hosting dedicado.

2. Los Problemas de Seguridad y Spam Empeoran

Los bots maliciosos atacan tus formularios de contacto, páginas de inicio de sesión y procesos de pago.

Buscan vulnerabilidades, intentan ataques de relleno de credenciales (credential stuffing) y saturan tus formularios con envíos basura. Como la mayoría de los sitios solo cuenta con seguridad básica, se vuelven un objetivo fácil.

Si notas entradas de spam en tus formularios o comentarios del blog, te recomiendo instalar Akismet de inmediato para reducir el volumen de spam. Eso sí: Akismet no bloquea el tráfico de bots, solo filtra el contenido.

Tendrás que tomar medidas adicionales para bloquear los bots tú mismo (más sobre esto en un momento).

3. Tus Datos de Analítica Se Contaminan

El tráfico de bots altera tus estadísticas web.

Cuando los bots visitan tus páginas, no interactúan con el contenido, lo que infla artificialmente tus métricas de tráfico, pero con cero conversiones.

Esta contaminación hace que sea casi imposible:

  • Medir el comportamiento real de los usuarios
  • Optimizar embudos de conversión
  • Tomar decisiones de marketing basadas en datos

Y aunque Google Analytics permite filtrar tráfico para afinar el análisis, distinguir bots de usuarios reales sigue siendo una tarea complicada.

Recibe contenido directamente en tu bandeja de entrada

Suscríbete ahora para recibir todas las últimas actualizaciones, directamente en tu bandeja de entrada.

Dónde Buscar el Tráfico de Bots en Tu Sitio Web

Actualmente, no existe una forma infalible de identificar todo el tráfico de bots, ya que los bots más avanzados son prácticamente indistinguibles de los visitantes humanos.

Pero hay ciertas acciones que puedes tomar para comenzar a monitorearlo.

1. Comienza con el Panel de Tráfico de DreamHost

Si tu sitio está alojado en DreamHost, ya tienes una ventaja. La pestaña Tráfico en tu panel de DreamHost te ofrece una vista clara de la actividad del sitio, incluyendo el comportamiento de los bots. Puedes monitorear picos de tráfico, detectar anomalías y rastrear cuántos bots pueden estar afectando tu sitio, todo sin herramientas externas.

El panel te permite:

  • Distinguir entre tráfico humano y tráfico de bots de un solo vistazo
  • Ver tráfico por IP, referente o agente de usuario
  • Detectar patrones de forma temprana para actuar rápidamente
Panel de tráfico que resalta la actividad de bots durante 7 días, con las fuentes de tráfico desglosadas por bots de IA, motores de búsqueda y redes sociales.

Esto es especialmente útil para quienes prefieren herramientas integradas en lugar de paneles complicados.

Bonus: ¡No necesitas configuraciones adicionales!

2. Profundiza con Google Analytics

Consulta tu panel de Google Analytics en busca de estas señales de actividad intensa de bots:

  • Picos de tráfico acompañados de un aumento en la tasa de rebote
  • Muchas vistas de página con tiempo cero en el sitio
  • Patrones geográficos inusuales (como tráfico repentino desde países donde no operas)
  • Referencias extrañas de dominios desconocidos (referrer spam)

Ve a Informes → Tecnología y usa los filtros de tecnología de GA4 para segmentar según el tipo de usuario, navegador, sistema operativo y más.

Aquí puedes comenzar a filtrar por navegador, sistema operativo, resolución de pantalla, tipo de dispositivo, versiones de aplicaciones, etc. Lo que debes buscar son navegadores poco comunes, sistemas operativos extraños y resoluciones inusuales como:

  • 1024 x 768
  • 1366 x 768
  • 1600 x 864
  • 800 x 600
  • 1600 x 1200
  • 1024 x 667
  • No especificado

Esto podría excluir a algunos visitantes reales de tu análisis, pero también reducirá significativamente la cantidad de entradas de bots en tus datos analíticos. 

Nota: Los bots avanzados pueden usar resoluciones normales y versiones recientes de dispositivos para disfrazar su actividad. Esos son muy difíciles de detectar, a menos que empieces a filtrar a los visitantes antes de que puedan acceder a tu sitio web.

3. Revisa los Registros de Tu Servidor

Si tienes acceso al panel de control de tu hosting, revisa los registros de acceso del servidor buscando patrones que indiquen tráfico automatizado:

  • Solicitudes rápidas y repetidas desde una sola dirección IP
  • Solicitudes a páginas inexistentes (los bots suelen hacer esto para buscar vulnerabilidades)
  • Agentes de usuario que se identifican como rastreadores conocidos (buenos y malos)
  • Solicitudes sin información de referencia (referrer)

Muchos proveedores de hosting —incluido DreamHost— ofrecen herramientas de análisis de registros dentro del panel de control. Busca picos inusuales en el uso de ancho de banda que no coincidan con campañas de marketing o actualizaciones de contenido.

Una vez que tengas una lista de IPs sospechosas de ser reincidentes, puedes empezar a bloquearlas desde tu servidor web (como NGINX o Apache) o a través de una CDN.

Glosario de DreamHost

CDN

Un CDN es una red de entrega de contenido, mejor conocida por sus siglas en inglés. Se refiere a una red de servidores y sus centros de datos distribuidos en varias regiones. Las entidades que componen un CDN colaboran para servir el contenido de la web de manera más rápida.

Ver más

4. Usa Herramientas de Monitoreo de Terceros

A veces, solo puedes identificar una parte del tráfico. Por eso existen herramientas gratuitas de terceros como Cloudflare Analytics (si usas ese servicio), que ofrecen desgloses detallados del tráfico de bots.

Otras aplicaciones completas que puedes considerar son:

  • Wordfence: Para sitios WordPress; detecta intentos de bots maliciosos
  • Sucuri: Ofrece un firewall para sitios web con detección de bots incluida
  • MonsterInsights: Mejora los reportes de Google Analytics e incluye filtros para tráfico de bots

Gestionar y Bloquear Bots Malos Sin Afectar a los Buenos

Te recomiendo ir despacio al bloquear el tráfico de bots, ya que podrías bloquear accidentalmente a usuarios reales. También necesitas un enfoque equilibrado que bloquee el tráfico automatizado dañino, pero que permita el acceso a rastreadores beneficiosos.

Aquí te explico cómo implementaría una estrategia de gestión de bots sin bloquear por error a los motores de búsqueda ni a servicios legítimos.

Configura Tu Archivo robots.txt

El archivo robots.txt es tu primera línea de defensa contra los rastreadores no deseados.

Crea o actualiza este archivo en el directorio raíz de tu sitio web, incluyendo instrucciones específicas para distintos tipos de bots.

# Block AI training crawlers
User-agent: GPTBot
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: Google-Extended
Disallow: /

# Allow search engines
User-agent: Googlebot
Allow: /

User-agent: Bingbot
Allow: /

# Allow AI search bots that cite sources
User-agent: ChatGPT-User
Allow: /

User-agent: PerplexityBot
Allow: /

Si no tienes acceso directo al archivo robots.txt y usas WordPress, puedes probar con el plugin WP Robots Txt, que te permite editar el archivo directamente desde el panel de control de WordPress.

Ten en cuenta que el archivo robots.txt funciona bajo un sistema de buena fe.

Los rastreadores legítimos respetan estas directrices, pero los bots maliciosos suelen ignorarlo por completo.

Implementa un Firewall Para Tu Sitio Web

Para una seguridad web más sólida, implementa un Firewall de Aplicaciones Web (WAF) que pueda bloquear bots a nivel del servidor.

Como propietario de una pequeña empresa con un sitio de bajo tráfico, también tienes otras opciones viables:

Plan gratuito de Cloudflare:

  • Proporciona capacidades básicas de defensa contra bots
  • Bloquea automáticamente el tráfico malicioso más evidente
  • Ofrece reglas de firewall personalizables para amenazas específicas

Wordfence (usuarios de WordPress):

  • Incluye detección y bloqueo de bots
  • Actualizaciones en tiempo real de inteligencia de amenazas
  • Limitación de velocidad personalizable para frenar solicitudes automatizadas

Limitación de Velocidad a Nivel de Servidor

Muchos proveedores de hosting ofrecen funciones de rate limiting, que ralentizan o bloquean direcciones IP que realizan demasiadas solicitudes en poco tiempo.

Puedes configurar estos límites para bloquear IPs que navegan por muchas páginas en pocos segundos.

Por ejemplo, un usuario real necesita unos segundos para explorar una página antes de hacer clic. Un bot puede hacer lo mismo en milisegundos.

Plugins Para Gestionar Bots en WordPress

Si usas WordPress, tienes opciones adicionales para proteger tu sitio:

  • Akismet: Filtra automáticamente comentarios y formularios de spam con una precisión del 99.99 % usando IA avanzada. Esencial para cualquier sitio que reciba envíos de usuarios.
  • WP Cerber Security: Protección integral contra bots, incluyendo límite de intentos de inicio de sesión, bloqueo de IPs y algoritmos avanzados de detección.
  • All-In-One Security (AIOS):Ofrece firewall y bloqueo de bots, ideal para sitios de pequeñas empresas.

Tu Ruta Completa para Implementar Protección Contra Bots

Línea de tiempo de cuatro etapas que muestra cómo mejora la protección contra bots con el tiempo, desde soluciones rápidas hasta defensas avanzadas.

He dividido este plan de implementación para que se adapte a agendas apretadas y te ayude a pasar de cero protección a una defensa activa contra bots en poco tiempo.

20 Minutos: Ganancias rápidas 

  • Actualiza el archivo robots.txt
  • Activa plugins de seguridad básicos
  • Revisa Google Analytics en busca de patrones de bots

Comienza con el archivo robots.txt, ya que es el paso más fácil. Inicia sesión en el administrador de archivos de tu sitio web (o usa FTP) y crea o actualiza el archivo robots.txt en el directorio raíz. Copia la configuración del archivo que mencionamos anteriormente en este artículo y pégala allí.

Si usas WordPress, instala y activa el plugin de seguridad Wordfence de inmediato. Su versión gratuita incluye protección básica contra bots y empezará a bloquear tráfico malicioso evidente al instante.

Abre Google Analytics y revisa las fuentes de tráfico en busca de patrones inusuales: países a los que no ofreces servicios, picos repentinos de visitas o tasas de rebote altas con duración de sesión cero.

24 Horas: Refuerza tu Defensa 

  • Crea una cuenta gratuita en Cloudflare
  • Configura limitación de velocidad (rate limiting)
  • Añade CAPTCHA a tus formularios
  • Activa la moderación de comentarios

Regístrate en Cloudflare con su plan gratuito y agrega tu sitio web. Cloudflare actúa como intermediario entre tu sitio y los visitantes, bloqueando automáticamente el tráfico de bots más evidente antes de que llegue a tu servidor.

La configuración toma unos 30 minutos e incluye cambiar los registros DNS, pero Cloudflare te guía paso a paso.

Activa la limitación de velocidad desde tu proveedor de hosting para bloquear automáticamente IPs que hagan demasiadas solicitudes en poco tiempo. Configura reglas que permitan una navegación normal (unos segundos por página), pero que detengan rastreadores agresivos (múltiples páginas por segundo).

Añade CAPTCHA en formularios vulnerables usando el plugin reCAPTCHA o Cloudflare Turnstile. Añade CAPTCHA invisibles a formularios de contacto, secciones de comentarios y páginas de registro para detener envíos automatizados sin molestar a los usuarios reales.

Una Semana: Monitorea y Optimiza 

  • Analiza registros del servidor
  • Ajusta las reglas del firewall
  • Configura alertas de monitoreo
  • Bloquea rangos de IP problemáticos

Analiza los registros de acceso del servidor para identificar patrones de bots específicos en tu sitio. Busca solicitudes rápidas desde una sola IP, accesos a páginas inexistentes y cadenas sospechosas de agentes de usuario. La mayoría de los paneles de hosting incluyen herramientas de análisis de registros que facilitan esto.

Usa estos datos para crear reglas personalizadas en el firewall de Cloudflare o de tu plugin de seguridad. Por ejemplo, si ves que ciertos países generan problemas constantes, puedes bloquear esas regiones. Si ciertos user agents acceden a tu sitio agresivamente, bloquea esas cadenas específicas.

Configura alertas de monitoreo para detectar picos de tráfico de bots. Herramientas como UptimeRobot o Pingdom pueden alertarte sobre patrones extraños de tráfico, lentitud en la carga o picos en los recursos del servidor que podrían indicar un ataque automatizado.

Un Mes: Protección Avanzada

  • Implementa análisis de comportamiento
  • Aplica limitación de velocidad en APIs
  • Configura caché mediante CDN
  • Crea honeypots para bots

Agrega herramientas de análisis de comportamiento como DataDome o Imperva, que detectan bots según los movimientos del mouse, patrones de escritura y tiempos de interacción. Esto permite atrapar bots más sofisticados que simulan ser humanos.

Usa una CDN para almacenar en caché recursos estáticos de forma agresiva. Así, el tráfico de bots impacta la caché y no tu servidor, reduciendo la carga de solicitudes repetidas.

Una de mis técnicas favoritas es crear honeypots para bots. Si ves mucho spam en formularios, agrega un campo oculto adicional. Como los bots leen el HTML de la página, verán ese campo y lo llenarán. Puedes descartar automáticamente cualquier envío que contenga datos en ese campo, ya que un visitante humano nunca lo verá.

El Futuro de la Gestión del Tráfico de Bots

El tráfico de bots no va a desaparecer.

Con un 71.5 % de visitas en nuestra red provenientes de fuentes automatizadas, los robots ya superan a los humanos en la proporción de 3 a 1 en internet.

Pero mientras la mayoría de los propietarios de sitios aún intentan entender qué está pasando, tú ya tienes todo lo que necesitas para tomar el control, proteger tu sitio y aprovechar los bots buenos a tu favor.

Así que adelante: ¡empieza a implementar tu sistema de gestión de bots mientras tu competencia aún entra en pánico por el tráfico falso!

Recibe contenido directamente en tu bandeja de entrada

Suscríbete ahora para recibir todas las últimas actualizaciones, directamente en tu bandeja de entrada.

Josh es el Líder de Experiencia del Cliente, responsable de comprender y mejorar la experiencia general de nuestros clientes en DreamHost. En su tiempo libre, le gusta visitar una cervecería local, ver un documental o echar un vistazo a la última tecnología.