Quer você goste ou não, o spam é uma grande parte da Internet.

Alguns tipos de spam estão mais interessados em utilizar o espaço de seu servidor para enviar solicitações, enquanto alguns aproveitam os usuários para enviar sobre malwares e vírus nocivos.

Um tipo de spam é chamado de spam de referência e afeta os sites WordPress que não estão preparados. Além disso, ele pode entrar em seu sistema Google Analytics, se antecipando a seus rankings e virando os mecanismos de busca contra você.

Ela nunca irá embora completamente. Mas isso não significa que você não possa lutar contra os spams de referência.

Sua melhor aposta é bloquear spam de referência no Google Analytics e WordPress. Como você faz isso?

Você vai descobrir em apenas um minuto, mas antes, vamos entender um pouco mais sobre as referências de spam e como isso pode afetar seu site.

O que é Spam de Referencia (ou Indicação)?

O spam de referência, ou spam de indicação, é a técnica de fazer repetidas solicitações de sites usando um falso URL de referência, muitas vezes para um site que os remetentes de spam desejam promover.

Dentro do Google Analytics, é o que parece:

Como se parece o spam de referência dentro do Google Analytics
Como se parece o spam de referência dentro do Google Analytics

O spam de referência tem um único propósito: visar os motores de busca.

Na superfície, é assim que funciona:

  • Um spammer tem um website para o qual eles querem aumentar a classificação dos motores de busca.
  • O spammer envia várias solicitações com URLs falsas que se ligam de volta ao site que eles querem anunciar.

Em resumo, eles querem melhorar a forma como os mecanismos de busca vêem seu site sem fornecer conteúdo valioso aos usuários. Portanto, seu site pode publicar acidentalmente alguns dos logs e estatísticas de acesso, ligando-se involuntariamente a este site que o spammer está tentando promover.

Isto significa que seu site está agora vinculado a um site de baixa qualidade, o que pode melhorar a classificação para aquele site de spam como este:

Ainda mais sites de spam no Google Analytics
Ainda mais sites de spam no Google Analytics

Infelizmente, porém, se o Google vir que você está vinculado a um site de lixo eletrônico, sua classificação nos motores de busca pode diminuir no futuro.

Estes bots nunca visitam realmente seu site. Em vez disso, eles apenas bagunçam seu código de rastreamento javascript e enviesam seus dados analíticos como taxa de retorno e outras métricas úteis de engajamento.

Um diagrama mostrando como funciona o spam fantasma e o spam de referência
Um diagrama mostrando como funciona o spam fantasma e o spam de referência (Fonte de imagem: magistrateinc.com)

Embora o Google, e outros mecanismos de busca, tenham feito bastante para descontar sites de spam como estes, é uma boa idéia evitá-los completamente, para que você não encontre nenhum problema.

Afinal de contas, se você está se ligando a dezenas de sites ruins, os mecanismos de busca podem pensar que você fez isso intencionalmente.

Por que é chamado de Spam de Referência?

Vale ressaltar também que este tipo de spam recebe seu nome pela forma como interage com o Google Analytics. Estes spammers aproveitam o fato de que todos os proprietários de websites gostam de ver que outros sites estão encaminhando tráfego para sua plataforma.

Você tem até mesmo um relatório de referência no Google Analytics para ver de onde está vindo a maior parte do seu tráfego.

Infelizmente, alguns de seus usuários podem querer ver esses relatórios de referência em seus registros de acesso, e você pode acabar clicando em um dos links prejudiciais ao verificar suas referências no Google Analytics.

Não importa quem clica neles, porque tudo isso é uma má notícia.

Quais são as vantagens de bloquear o tráfego de robôs?

Algumas pessoas pensam que ter tráfego de bot e remeter spam não é tão importante assim. É um grande negócio quando se considera a quantidade de tráfego de bot por aí:

Bots bons vs maus bots vs humanos
Bots bons vs maus bots vs humanos (Fonte de imagem: voluum.com)

Quase 56% do tráfego de bot é utilizado para fins maliciosos. Não apenas distorce seus dados analíticos, mas também pode:

  • Contribuir para os ataques DDoS
  • Prejudicar sua reputação em SEO e website
  • Sequestrar suas contas
  • Custa-lhe dinheiro

Embora isso possa não afetá-lo muito, você ainda tem a chance de se conectar acidentalmente a esses sites de spam e diminuir sua classificação nos motores de busca.

Além disso, os legítimos proprietários de websites estão no negócio de gerar conteúdo de qualidade, portanto, é seu dever como um webmaster responsável evitar que os spammers desordenem a Internet com links ruins.

Como usuário da Internet, tudo o que eles fazem é dificultar as coisas para você quando procura. Finalmente, há uma chance de que você, ou um dos visitantes do seu site, clique em um dos links de referência de spam, levando-o a um site que poderia conter material nocivo.

Como Bloquear o Tráfego de Spam de Referência no Google Analytics

Aqui estão algumas opções que você poderia usar para bloquear o spam do Google Analytics:

Vamos dar uma olhada em cada um desses métodos:

1. Excluir bots e aranhas conhecidas em configurações do Google Analytics

Antes de formas mais avançadas de bloquear spam do Google Analytics, certifique-se de aproveitar um recurso incorporado que você encontrará em Admin > Ver Configurações > Filtragem de garrafas:

Filtragem de garrafas no Google Analytics
Filtragem de garrafas no Google Analytics

Basta marcar a caixa de seleção e clicar em Salvar na parte inferior da página.

2. Filtre Spam Bots a partir de seus resultados do Google Analytics

Quando você faz qualquer mudança técnica, você sempre quer ter um backup ao qual você pode se referir se as coisas derem errado.

Isto não é diferente no Google Analytics. Você vai querer manter uma visão não filtrada para que você tenha dados para comparar com os resultados filtrados para garantir que eles estejam funcionando. Isso também lhe dá uma visão à qual você pode voltar se um de seus filtros não funcionar corretamente.

Estabelecer uma visão não filtrada no Google Analytics

Vá para a seção Admin e clique em View Settings na terceira coluna.

Estabelecendo uma visão não filtrada no Google Analytics
Estabelecendo uma visão não filtrada no Google Analytics

Em seguida, clique em Vista de cópia, e então nomeie sua opinião Unfiltered.

Copiando e nomeando sua nova visão na GA
Copiando e nomeando sua nova visão na GA

Agora, volte para a página principal de Administração no Google Analytics e clique em Filtros na seção Ver.

Nota: isto é diferente de Todos os Filtros na seção de Conta.

Criando um filtro no Google Analytics
Criando um filtro no Google Analytics

Clique no botão vermelho + Adicionar filtro:

Adicionar um novo filtro à GA (e dar-lhe um nome descritivo)
Adicionar um novo filtro à GA (e dar-lhe um nome descritivo)

A partir daqui, há alguns filtros de spam diferentes que você pode configurar para bloquear o spam do Google Analytics.

Para cada filtro que você cria, reserve alguns minutos para testá-lo e certifique-se de que está funcionando corretamente. Uma vez que você esteja satisfeito com a precisão, clique em Salvar.

Vamos dar uma rápida olhada nos tipos de filtros de spam que você pode configurar no Google Analytics:

Tipos de Spam a serem observados (E como removê-los)

A partir daqui, há alguns filtros de spam diferentes que você pode configurar para bloquear o spam do Google Analytics.

Para cada filtro que você cria, reserve alguns minutos para testá-lo e certifique-se de que está funcionando corretamente. Uma vez que você esteja satisfeito com a precisão, clique em Salvar.

Vamos dar uma rápida olhada nos tipos de filtros de spam que você pode configurar no Google Analytics:

Tipos de Spam a serem observados (E como removê-los)

Há três tipos comuns de spam. Aqui está um resumo rápido do que cada um é e como você pode bloqueá-lo:

Spam Fantasma

O spam fantasma (às vezes chamado de tráfego fantasma ou tráfego fantasma) é um tráfego falso e dados inseridos por hackers em sua conta do Google Analytics, numa tentativa de fazer com que você visite seus sites.

Para encontrar spam fantasma em sua conta do Google Analytics, vá até:

Público > Tecnologia > Rede > Hostname

Isto lhe mostrará uma lista de todos os hostnames envolvidos com seu site. Deverá mostrar apenas seu domínio, subdomínios e quaisquer outros serviços que você tenha vinculado à sua conta no Google Analytics.

Se você vê algo que não reconhece, pode ser spam fantasma.

Para remover o spam fantasma, construa um filtro personalizado que informe ao Google Analytics quais nomes de hosts pertencem em sua conta e quais não pertencem.

Veja como remover o Spam Fantasma no Google Analytics:
  1. Escreva uma lista de hostnames válidos em uma expressão regular.
  2. Separar cada nome de mangueira com um caractere de tubo | e adicionar uma contrabarra antes de todos os períodos e hífens. (Exemplo: kinsta\. com|youtube\. com)
  3. Agora abra sua conta no Google Analytics, vá para “Admin” e selecione a visualização correta.
  4. Vá para “Filtros” e clique em “Adicionar filtro”.
  5. Nomeie seu filtro, escolha “Personalizado” para Tipo de filtro e selecione que você deseja “Incluir” “Nome do anfitrião”.
  6. Digite sua expressão, e use o “Botão Verificar” para verificar seu novo funcionamento do filtro.
  7. Pressione “Salvar” para terminar seu filtro de spam fantasma.

Para torná-lo ainda mais forte, aqui está outra coisa que você poderia fazer para combater o spam fantasma.

Abra o Google Analytics, e vá para Público > Tecnologia > Rede.

Desça para selecionar Hostname como sua Dimensão Primária, e faça com que os resultados sejam mostrados por mês.

Selecione o nome de sua empresa como sua principal dimensão na GA
Selecione o nome de sua empresa como sua principal dimensão na GA

Veja a lista completa de nomes de mangueiras. Identifique os legítimos e anote-os.

A chave aqui é fazer uma lista dos hostnames válidos. Em seguida, vá para a guia Admin no topo e clique em Filtros.

Criar uma lista de nomes de host válidos no Google Analytics
Criar uma lista de nomes de host válidos no Google Analytics

Clique em Adicionar filtro > Tipo de filtro personalizado > Incluir. Este campo lhe pedirá para inserir uma lista de nomes de host aceitáveis. O formato para isto exige que você coloque um ^ sinal antes de cada hostname, junto com um sinal de $ depois de cada um.

Para separar os nomes das mangueiras, use um | sinal.

Adicionando um filtro personalizado no Google Analytics
Adicionando um filtro personalizado no Google Analytics

Selecione o botão Salvar para completar o processo. Deve levar cerca de 24 horas para ver as mudanças no painel de controle do Google Analytics. Você também pode dar uma olhada nesta grande lista de sites de referência de spam/ghost referrer.

Você deve excluir todos eles em seu Google Analytics.

Spam de Rastejador

O Crawler Spam é um tipo de spam gerado por bots que navegam em websites e registram informações através da execução de tarefas automatizadas em websites. Estes bots rastreiam suas páginas, ignorando regras como as encontradas no robots.txt.

Aqui está como remover o Crawler Spam no Google Analytics:

Você precisará criar filtros personalizados no Google Analytics usando as seguintes expressões, que são criadas para excluir o spam de rastreamento detectado nos últimos dois anos.

Expressão nº 1:

(best|dollar|success|top1)\-seo|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)

Expressão nº 2:

Datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter|top10\-way

Para criar seu filtro personalizado, você precisará fazê-lo:

  1. Abra sua conta no Google Analytics
  2. Vá para Admin, Escolha Filtros, depois clique em “Adicionar filtro”.
  3. Dê um nome ao seu filtro, selecione “Personalizado” para Tipo de Filtro e depois selecione “excluir”.
  4. Coloque o campo igual a “fonte da campanha” e em seguida cole uma expressão na caixa.
  5. Verificar o filtro, depois “Salvar”.
  6. Repita o processo de Expressão nº 2.
Spam de linguagem falsa

O spam de linguagem é tipicamente usado por spammers para uma determinada agenda ou para promover seus próprios sites ou produtos. Eles manipulam o idioma usado por sites reais como thenextweb.com, lifehacker.com, reddit.com.

Aqui está como remover o Spam falso de linguagem no Google Analytics:
  1. Abra sua conta no Google Analytics
  2. Vá para Admin, Escolha Filtros, depois clique em “Adicionar filtro”.
  3. Dê um nome ao seu filtro, selecione “Personalizado” para Tipo de Filtro e depois selecione “excluir”.
  4. Definir campo igual a “configurações de idioma” e, em seguida, colar o seguinte na caixa de padrão de filtro: \s[^\s]*\s|.{15,}|\.|
  5. Verificar o filtro, depois “Salvar”.

3. Edite o arquivo .htaccess de seu domínio ou adicione uma regra no Nginx

Se sua hospedagem utiliza o cPanel, uma das formas mais eficazes de bloquear o tráfego de referência de spam é editando seu arquivo .htaccess. Este arquivo é usado para controlar seu servidor e pode ser instruído a bloquear qualquer visita de spam de um domínio ou endereço IP.

Bloquear o tráfego de spam em seu .htaccess é eficaz
Bloquear o tráfego de spam em seu .htaccess é eficaz (desde que você seja cuidadoso e não quebre seu site)

Este método não apenas bloqueia os domínios de referência de spam de seu site, mas também os remove de seu servidor. O que é útil para manter a velocidade de seu servidor agradável e rápida.

Aqui está Como bloquear o spam em seu arquivo .htaccess:

Digamos que você gostaria de excluir Semalt, freetraffic.xyz e botões-for-website.com. Basta adicionar o seguinte comando ao arquivo .htaccess do seu site:

## SITE REFERRAL BLOCK
RewriteCond %{HTTP_REFERER} semalt\.xyz [NC,OR]
RewriteCond %{HTTP_REFERER} free-traffic\.xyz [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC,OR]
RewriteRule .* – [F]

Não tem certeza do que tudo isso significa? Aqui está um rápido resumo do que está acontecendo nesse comando:

  • O ‘NC’ torna o caso de comando insensível, portanto, mesmo o SeMalT.com ou Free-Traffic será pego pelo filtro.
  • O ‘OR’ indica que múltiplos referenciadores devem ser bloqueados.
  • A linha final é para o que acontece com um domínio tentando acessar seu site e sendo negado.
  • ‘F’ é igual a falha e significa que o referente receberá um erro 403.

Agora, quando se trata de qualquer coisa .htaccess relacionado: tenha muito cuidado.

Colocar apenas um caractere no lugar errado ou digitar acidentalmente um espaço duplo poderia tirar seu site inteiro do ar.

Aqui está Como Bloquear Spam em Nginx:

Se seu host tirar vantagem do Nginx como servidor web em vez do Apache, você não será capaz de editar seu arquivo .htaccess e precisará configurar uma regra no Nginx para bloquear o pedido de referência:

if ($http_referer ~* "bad-site-to-block\.com") {
    return 403;
}

Se você for um cliente Kinsta, precisará pedir para o nosso suporte para adicionar esta regra.

4. Use uma ferramenta de terceiros para bloquear spam de referência

Se você é um usuário WordPress, você pode usar um plugin de referência de spam para se livrar do tráfego de bot.

Sua melhor opção é Sucuri que monitora os spams de referência e os remove de seu website. Além disso, este plugin também pode proteger seu site contra ataques DDoS, uma vez que é uma solução de segurança de site tudo-em-um.

Se Sucuri parecer demais para você, outro plugin que você pode querer tentar é Stop Referrer Spam, que usa uma lista pública de remetentes de spam fornecidos pela Matomo, a empresa por trás da alternativa Piwik do Google Analytics.

Existem algumas opções adicionais, mas elas não foram atualizadas há algum tempo, portanto podem não ser compatíveis com sua instalação do WordPress. Além disso, a execução de software ultrapassado poderia levantar algumas ameaças à segurança, mas se você gostaria de testá-las, aqui estão elas:

Por favor, sempre pegue um backup antes de instalar um novo plugin para que você possa facilmente retornar a um local de trabalho se algo errado ocorrer.

FAQs sobre Spam do Google Analytics

Aqui estão as respostas a algumas das perguntas mais freqüentes sobre spam do Google Analytics:

Posso visitar os sites de spam encontrados no Google Analytics?

A primeira coisa (e mais importante) a ser lembrada é a seguinte: não clique no link!

Se você visitar o próprio site, os spammers estão conseguindo o que querem. Em vez disso, Google o site entre aspas:

Procurar sites de referência de spam no Google para ver se outros sites já os marcaram antes
Procurar sites de referência de spam no Google para ver se outros sites já os marcaram antes

Fazendo isso desta maneira, você evitará visitar o site, mas verá resultados de outros sites sobre ele. Se o site é uma fonte de spam do Google Analytics, provavelmente outra pessoa escreveu sobre ele.

Por que a filtragem de spam do meu Google Analytics é importante?

Os dados do Google Analytics (e a análise do site em geral) são uma das melhores maneiras de acompanhar o desempenho de seu site e ver o que está funcionando com seu público on-line. Eles não só podem mostrar o que está funcionando, mas também podem mostrar o que não está (também conhecido como áreas para melhorias).

Mas se você jogar spam de referência na mistura, a precisão destes dados está em jogo.

Você poderia estar recebendo um número decente de sessões que são basicamente visitas de lixo:

Junk visits from Semalt in Google Analytics
Junk visits from Semalt in Google Analytics

Se você não tiver os melhores dados disponíveis no Google Analytics, você corre o risco de tomar decisões erradas. Basicamente, como os dados não são precisos, você pode interpretar mal as coisas.

Por exemplo, você poderia gastar tempo e dinheiro extra para melhorar uma determinada página em seu site porque ela parece popular entre seu público. Mas se todo esse tráfego vem de bots, não adianta investir em melhorias.

Em resumo: limpando seus dados, os filtros de spam bot garantem que suas análises forneçam insights mais precisos e úteis.

Posso limpar os dados históricos do Google Analytics?

Os filtros de spam farão com que os dados mais limpos avancem, mas não serão aplicados a dados passados.

Uma vez instalados seus filtros, o spam será filtrado a partir dessa data, mas não para trás. Seus dados históricos ainda incluirão dados imprecisos causados por bots.

No entanto, não é tudo ruim. Você será capaz de comparar seus dados com e sem spam no Google Analytics:

Comparando com vs sem tráfego de spam no Google Analytics
Comparando com vs sem tráfego de spam no Google Analytics

Ver a comparação entre suas análises antes e depois da aplicação de filtros de spam pode ajudá-lo a entender quanto tráfego era proveniente de bots, dando-lhe uma visão mais precisa de seu site.

Resumo

Infelizmente, evitar completamente o spam é impossível. Mas você pode controlar o impacto que ele tem sobre seus dados do Google Analytics.

Usando os filtros certos, plugins e algum conhecimento técnico é a melhor maneira de parar os spammers e devolver os dados precisos no Google Analytics que você precisa para construir um bom website.

Agora é a sua vez: qual é a sua maneira preferida de se livrar de spam no Google Analytics?

Matteo Duò Kinsta

Editor-chefe da Kinsta e consultor de marketing de conteúdo para desenvolvedores de plugins do WordPress. Conecte-se com Matteo no Twitter.