Este sitio web usa cookies para mejorar el servicio. Si continúa navegando entendemos que aceptas su uso.

Política de Privacidad

BLOG - DETALLES

Referral Spam: Qué es y cómo evitarlo

Bloquear las visitas generadas por el Referral Spam y filtrarlas correctamente de nuestras estadísticas de Google Analytics

Referral Spam: Qué es y cómo evitarlo

¿Has empezado a recibir de repente muchas más visitas de las habituales desde orígenes desconocidos? Es muy posible que estés siendo victima de REFERRAL SPAM.

En primer lugar vamos a explicar qué es exáctamente el Referral Spam para poder luego entender el porqué de estos 'ataques' y cómo afectan a nuestro sitio web y a sus estadísticas SEO.

QUÉ ES Y CÓMO FUNCIONA EL REFERRAL SPAM

Se trata de un ataque realizado a traves de una REFERENCIA y cuya finalidad es conseguir visitas, clicks, en los sitios atacantes, de los que supuestamente proviene dicha referencia. Pero ¿qué es una REFERENCIA? Una referencia (Referrer) es una cabecera (header) que se hace llegar a una página y que proporciona cierta información. En este caso específico la cabecera proporciona el origen de la visita, que nos aparecerá en las estadísticas proporcionadas por Google Analytics.

Es en este momento en el que el atacante podrá conseguir o no su finalidad: si hacemos 'click' en el origen de la visita estaremos proporcionando a dicho sitio una visita real, orgánica, que ayudará a estos sitios de alguna manera: posicionamiento, ingresos por publicidad, ventas, ... Dependerá de cada caso concreto.

Hay dos tipos de Referral Spam y en ambos casos se generan desde bots para estos fines:

  • Ghost Referral: Visitas fantasma generadas a través del código de seguimiento de Google Analytics.
  • Crawler Spam: Usa un nombre válido de host y por ello debemos tratarlo de forma diferente.

En ambos casos el resultado es el mismo: una falsa visita que falsea nuestras estadísticas. El Crawler Spam genera una referencia 'real' pero sin datos fiables, mientras que el Ghost Spam ni siquiera genera la referencia ya que esta se crea falseada directamente a través del código de seguimiento de Analytics. Al ser visitas sin fines reales y con tiempos mínimos o nulos los resultados de nuestras estadísticas (porcentaje de rebote, tiempo medio de la visita, ...) se verán afectados y proporcionan resultados totalmente falsos ya que estarán enmascarados y mezclados con los datos falsos.

BLOQUEAR DESDE EL ARCHIVO .HTACCESS

El primer paso para evitar el Referral Spam es intentar eliminar y bloquear las referencias falsas, localizando y bloqueando los bots atacantes.

La mejor manera de bloquear el acceso al Referral Spam del tipo 'Crawler' es a través del archivo .htaccess (sólo funciona con este tipo de spam porque necesita que la referencia llegue realmente al sitio).

Tenemos dos opciones:

USANDO EL MOD_REWRITE
RewriteEngine on
RewriteCond %{HTTP_REFERER} semalt.com [NC,OR]
RewriteCond %{HTTP_REFERER} best-seo-solution.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-your-website.com [NC,OR]
RewriteCond %{HTTP_REFERER} sitevaluation.org [NC,OR]
RewriteCond %{HTTP_REFERER} videos-for-your-business.com [NC,OR]
RewriteCond %{HTTP_REFERER} semaltmedia.com [NC,OR]
RewriteRule .* - [F]
USANDO EL MOD_SETENVIF
<IfModule mod_setenvif.c>
SetEnvIfNoCase Referer semalt.com spambot=yes
SetEnvIfNoCase Referer best-seo-solution.com spambot=yes
SetEnvIfNoCase Referer buttons-for-your-website.com spambot=yes
SetEnvIfNoCase Referer sitevaluation.org spambot=yes
SetEnvIfNoCase Referer videos-for-your-business.com spambot=yes
SetEnvIfNoCase Referer semaltmedia.com spambot=yes
Allow from all
Deny from env=spambot
</IfModule>

Con este segundo método establecemos el spambot como spam y quedaría bloqueado.

FILTRAR SPAM DESDE GOOGLE ANALYTICS

El siguiente paso debe ser limpiar los resultados falseados por el Referral Spam de Analytics mediante la creación de filtros que nos permitan localizar y eliminar de los resultados estadísticos las visitas no deseadas, las referencias falsas.

  1. En el apartado 'AUDIENCIA' debemos localizar los 'NOMBRES DE HOST' que han visitado nuestro sitio. Una vez hecho debemos anotar todos aquellos que identifiquemos como spam mediante las Listas Negras de Referral Spam o bien, analizando las características de las visitas para ver si los datos parecen o no legítimos.
  2. Creamos una Vista Limpia de la propiedad (por seguridad) y creamos una vista nueva de la Propiedad para aplicar en esta el Filtro (le daremos el nombre que queramos).
  3. En la sección de Administración de esta nueva Vista, seleccionamos FILTROS --> AGREGAR FILTRO
  4. En 'Tipo de Filtro' seleccionamos 'Personalizado' y lo configuramos: Marcamos 'EXCLUIR', 'Campo del Filtro: Nombre del Host', 'Patrón del Filtro: host_a_bloquear'. Si quisieramos añadir más de un host al mismo tiempo, que será lo normal, usaremos el siguiente patrón: undominio.com|otrodominio.com|tercerdominio.com
  5. Verificamos que el filtro funcione y desde este momento podemos usarlo. Cada vez que usemos la nueva vista creada aparecerán los resultados ya filtrados. Para comparar siempre podremos usar la vista antigua que habíamos guardado por seguridad.

Teniendo en cuenta que las referencias falsas suelen provenir desde los mismos destinos casi siempre, podemos ampliar nuestra vista filtrada con un SEGMENTO para filtrar resultados POR IDIOMAS DE ORIGEN de las visitas. La gran mayoría proviene de Rusia y China, aunque hay otros con menos repercusión. Siempre que no afecte a los resultados reales también podremos aplicar este nuevo segmento:

  1. Entramos en la vista deseada y pulsamos en 'AGREGAR SEGMENTO' (justo encima de la curva de analítica de sesiones).
  2. Pulsamos en 'CREAR SEGMENTO' y, una vez dentro, en 'CONDICIONES'.
  3. Marcamos 'Sesiones', 'Excluir' y en 'Acción de Evento' seleccionamos 'USUARIOS' --> 'IDIOMA'
  4. En el selector que hay a continuación seleccionamos 'ES UNO DE' y escribimos un listado de los idiomas que queremos excluir, un idioma por línea, separados por saltos de línea.

Un ejemplo de cómo quedarían los idiomas usando los que se suelen excluir siempre para evitar el referral spam más usual:

ru-ru

ru

(not-set)

El Referral Spam no parece demasiado grave pero es importante eliminarlo por dos motivos fundamentales: en primer lugar están falseando nuestras estadísticas y en ellas podríamos tener que basar muchas de las acciones de nuestra empresa: campañas publicitarias, secciones más visitadas, origen de las visitas, ... En segundo lugar, está generando un tráfico innecesario a nuestro servidor y no tenemos garantías de que no haya otros motivos relacionados con la seguridad.

En cualquier caso debemos filtrar y bloquear el Referral Spam ya que es algo no deseado en nuestro sitio web y que compromete la funcionalidad de este. Si tienes alguna duda puedes escribirnos a través de nuestro formulario de contacto e intentaremos solucionarlo contigo. Simplemente escríbenos usando el asunto 'Consulta Referral Spam' y nos pondremos en contacto contigo para solucionarlo.

Comentarios del Artículo

COMENTAR

No hay comentarios para este artículo en este momento

Debes estar logueado para poder dejar un comentario.