Как блокировать реферальный спам WordPress в Google Analytics? Побеждаем реферальный спам в Google Analytics.

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Реферальный спам – это вид спама через реферера – участника партнёрской программы, который зарегистрировался после приглашения другого пользователя. Это имитация переходов из поиска, т.е. в лог-файлах фиксируются визиты пользователей, которые на самом деле ни разу не посещали страницу. В записях Яндекс.Метрики и Google Analytics можно увидеть просмотры сайта от тех доменов, которые не имеют к нему никакого отношения.

Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

Особенности рефспама

Такие действия – разновидность бесплатной рекламы того ресурса, с которого фиксируются переходы. Вас обманным путем привлекают к себе на сайт.

Объясним на простом примере. Нам всегда интересно узнать, кто уделяет нам внимание, и этим пользуются любители накручивать поведенческие факторы. Если кто-то постоянно лайкает ваши фотографии, оставляет хвалебные комментарии, вы рано или поздно зайдете в аккаунт этого пользователя, чтобы посмотреть, кто же это такой и почему проявляет столько интереса к вам. И наверняка будете разочарованы, когда вместо живого человека увидите фейковый аккаунт с подписью «Накрутка лайков, подписчиков, продвижение в Instagram». Так же и с рефспамом. Вы видите в отчетах источник регулярного стабильного трафика. Переходите по адресу, чтобы узнать, что это за ресурс, и найти на нем ссылку на свой сайт. Но ссылки там нет и никогда не было, а все посетители фейковые, и никаких переходов на ваш сайт на самом деле не совершали. Трафик ложный и исходит не от реальных пользователей, а от .

Самый очевидный показатель того, что источник переходов ложный – странные доменные имена, например: share-buttons.com, buttons-for-website.com. Когда вы кликаете по ссылкам, вы видите ресурсы с бесполезным или даже вредоносным содержимым. В отчетах Google Analytics такой источник переходов помечают статусом «не определен».

Для чего используют рефспам

При использовании реферального спама или по логам, обращение к вашему ресурсу происходит автоматически. В лучшем случае с сайта вытянут пару килобайт или совсем ничего, если подключение происходило с использованием функции открытия соединения.

Рефспам – это умышленное искажение данных о количестве посещений и поведенческих факторах. В нашем блоге есть , из нее можно сделать вывод что любой спам – это обман. Он нужен владельцам сайтов для того чтобы увеличить количество переходов. Рефспам искусственно повышает данные о трафике, и поэтому владельцы сайтов надеются на увеличение позиций в выдаче. Но эффект обычно оказывается обратным. За мошеннические способы накрутки ПФ сайт рискует попасть под антифорд-фильтр. Из-за пессимизации сайт теряет трафик и позиции в выдаче.

Какой вред приносит реферальный спам

Самое безобидное в спаме по логам – замусоривание интернет-пространства. Более серьезные последствия – снижение позиций того сайта, на который направлен рефспам. Ложные переходы имеют стопроцентный показатель отказов, длительность сеанса практически нулевая. Сведения в отчетах по веб-аналитике искажаются, владелец сайта получает ложные сведения, и вместе с этим наблюдает падение позиций своего ресурса из-за снижения поведенческих факторов.

Как запретить рефспам на сайте

Самые популярные и крупные поисковые системы, такие как Яндекс и Google утверждают, что у них есть автоматическая защита от злоумышленников, и они не учитывают переходы с таких сайтов. Но на самом деле владельцы сайтов по прежнему жалуются на спам по логам. Особенно подвержены спаму владельцы плохо защищенных ресурсов. Например, если их ресурс находится на дешевом хостинге или имеет ненадежную CMS.

Избежать проблем с рефспамом можно. Для этого существует два способа:

Способ 1. Поставьте фильтры, чтобы в отчетах по аналитике вашего сайта не появлялись внешние ссылки

В отчетах Google Analytics можно полностью исключить реферальные переходы. Поставив фильтр, вы учитываете трафик только с вашего хоста. Главное – не забудьте учесть необходимый хостнейм, иначе трафик потеряется.

Порядок действий по установке фильтра:

  • Открываем отчет по переходам и отмечаем максимально допустимый временной промежуток.
  • Отмечаем «Имя хоста» как дополнительный параметр».

  • Когда вы видите результаты, среди них нужно выбрать те, которые относятся к вашему сайту, включая поддомены.
  • Выполните настройку фильтров, вписав ваш сайт в поле «Шаблон фильтра»:

Недостаток этого подхода – можно по невнимательности не включить все хосты, и тогда сведения в отчетах будут неправильными.

Способ 2. Исключите весь ненужный трафик из ваших отчетов

Другой тип фильтра, который убирает все переходы от спам-ботов.

  • Заходим в фильтры и выполняем настройку:

  • В поле «Шаблон фильтра» указываем определенное выражение. В случае, указанном на скриншоте, не будут учитываться переходы с darodar и priceg.
  • Если вы захотите добавить другие ресурсы, переходы с которых нужно исключить из отчета, пропишите их в круглых скобках через вертикальный слеш.

Сложность заключается в том, что число рефералов постоянно растет. Поэтому нужно регулярно отслеживать новые и обновлять список.

В последнее время подобная картина знакома многим (особенно мелким компаниям, у которых в Google Analytics не так уж и много источников трафика):

Предприимчивые дельцы генерируют фейковые переходы на сайт и оставляют свой рефферер перехода или источник кампании, в надежде на то, что владелец аккаунта GA обратит на ссылку внимание и решит по ней перейти.

Перейдя по такой ссылке, человека будет ждать какой ни будь сайт, участвующий в одной из CPA сетей (например aliexpress). Разумеется, человек такой сайт закроет, однако, кука посещения у него останется. Весь расчет идет на то, чтобы "заразить" такими куками как можно больше людей и чтобы какая-то часть из посетителей совершила (сразу или в течение 30 дней) целевое действие на этом сайте.

Поскольку, покупать ничего на aliexpress мы не хотим, нужно как-то избавляться от этих ссылок, захламляющих наши отчеты в GA. Ниже несколько способов избавления от спама Google Analytics.

Исключаем источники

С помощью фильтра (не изменяет исторические данные)

Для того, чтобы исключить все ненужные нам источники - создадим новое представление (view), к которому мы применим наш фильтр (показанный на скриншоте):

Последний шаблон фильтра (собраны самые достающие источники) -

Darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\. Не забывайте проверять свой фильтр, чтобы не исключить ничего лишнего.

upd: в шаблон фильтра влезает только 255 символов (поэтому проверка может выдавать ошибку), рекомендую разбить строчку на 2 фильтра или же пользоваться расширенным сегментом.

С помощью сегмента (изменяет исторические данные)

Создаем расширенный сегмент с такими настройками:

Исключаем в источнике/канале точно такие же источники - darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.

После применения такого сегмента можно наблюдать существенную разницу в отчетах:

Результат налицо. Надеюсь, эта статья будет полезна небольшим компаниям (стартапам), которые каждый день сталкиваются с этой проблемой.

Если вы знаете еще какие нибудь более удобные и автоматические способы - просьба делиться в комментариях.

Очень часто мы отмечаем всплеск трафика на сайте, анализируя данные, собранные Google Analytics. Это воспринимается как интерес к ресурсу. И, разумеется, такой рост посещаемости не может не радовать.

Но это не всегда повод для радости. Позже мы обнаруживаем, что большая часть этого реферального трафика была отправлена от спамеров. Именно спам стал большой проблемой в последнее время.

Реферальный спам происходит, когда ваш сайт получает поддельные направления трафика от спам-ботов. Эта подделка трафика и записывается Google Analytics. Если вы замечаете в Аналитике трафик, полученный из спам источников, вам необходимо выполнить определенные действия, чтобы устранить эти данные из статистики.

Что такое бот?

Ботами принято называть программы, задача которых – выполнение повторяющихся задач с максимальной скоростью и степенью точности.

Традиционный вариант использования ботов - веб-индексация содержимого интернет-ресурсов, регулярно осуществляемая поисковиками. Но боты также могут использоваться и в злонамеренных целях. Например, для:

  • совершения мошенничества путем кликов;
  • аккумуляции адресов e-mail;
  • передачи содержания веб-сайтов;
  • распространения вредоносного программного обеспечения;
  • искусственного завышения трафика ресурса.
Анализируя задачи, для которых используются боты, можно разделить их на безопасные и опасные.

Опасные и безопасные боты

Пример хорошего бота - «Googlebot», используемый Google для сканирования и индексации веб-страниц в интернете.

Большинство ботов (будь то безопасные или опасные), не выполняют сценарии JavaScript, но некоторые это делают.

Поисковые боты, которые выполняют сценарии Javascript (как код аналитики Google) проявляются в отчетах Google Analytics и искажают показатели трафика (прямой трафик, реферальный трафик) и прочих метрических данных на основе сессий (показатель отказов, коэффициент конверсии и др).

Поисковые боты, которые не выполняют JavaScript (например, Googlebot), не искажают вышеуказанные данные. Но их посещения все равно записываются в логи сервера. Они также потребляют ресурсы сервера, ухудшают пропускную способность и способны негативно повлиять на скорость загрузки сайта.

Безопасные боты, в отличие от опасных, подчиняются директиве robots.txt. Они способны создавать поддельные учетные записи пользователей, рассылать спам, собирать адреса электронной почты и могут обходить CAPTCHA.

Опасные боты используют различные методы, усложняющие их обнаружение. Они могут влиять на веб-браузер (например, Chrome, Internet Explorer и т.д.), а также на трафик, поступающий от нормального сайта.

Невозможно сказать наверняка, какие опасные боты могут исказить данные аналитики Гугл, а какие - нет. Поэтому стоит рассматривать все опасные боты как угрозу целостности данных.

Спам-боты

Как понятно из названия, главная задача этих ботов – спам. Они посещают огромное количество веб-ресурсов ежедневно, отправляя HTTP запросы на сайты с поддельными заголовками реферера. Это позволяет им избежать обнаружения в качестве ботов.

Подделанный заголовок реферера содержит адрес веб-сайта, который спамер хочет продвигать, либо получать обратные ссылки.

Когда ваш сайт получает запрос HTTP от спам-бота с поддельным заголовком реферера, он сразу же записывается в журнале сервера. Если ваш журнал сервера имеет открытый доступ, то он может быть просканирован и проиндексирован Google. Система обрабатывает значение реферера в журнале сервера как обратную ссылку, которая в итоге влияет на ранжирование веб-сайта, продвигаемого спамером.

В последнее время алгоритмы индексации Google построены таким образом, чтобы не учитывать данные из логов. Это нивелирует старания создателей подобных ботов.

Спам-боты, имеющие возможность выполнять сценарии JavaScript, способны обходить методы фильтрации, используемые Google Analytics. Благодаря этой способности этот трафик отражается в аналитических отчетах Google.

Ботнет

Когда спам-бот использует ботнет (сеть зараженных компьютеров, расположенных локально или по всему миру), он может получить доступ к веб-сайту с помощью сотен различных IP-адресов. В этом случае черный список IP адресов или rate limiting (rate of traffic sent or received) становятся в значительной степени бесполезными.

Способность спам-бота искажать трафик на ваш сайт прямо пропорциональна размеру ботнета, который использует спам-бот.

При большом размере ботнета с отличающимися друг от друга IP-адресами, спам-бот может получать доступ к вашему веб-сайту без блокирования брандмауэром или другим традиционным механизмом безопасности.

Не все спам-боты отправляют заголовки реферера.

В этом случае трафик от таких ботов не появится как источник реферального трафика в отчетах Google Analytics. Он выглядит как прямой трафик, что делает его еще более трудным для обнаружения. Иными словами, всякий раз, когда реферер не передается, этот трафик обрабатывается в Google Analytics как прямой.

Spambot может создать десятки поддельных заголовков рефереров.

Если вы заблокировали один источник реферера, спам-боты отправят на сайт очередную подделку. Поэтому фильтры на спам в Google Analytics или.htaccess, не дают гарантии, что ваш сайт полностью заблокирован от спам-ботов.

Теперь вы знаете, что не все спам-боты являются опасными. Но некоторые из них действительно опасны.

Очень опасные спам-боты

Цель действительно опасных спам-ботов - не только исказить трафик вашего веб-ресурса, очистить содержимое или получить адреса e-mail. Их цель - заразить чужой компьютер вредоносным ПО, сделать вашу машину частью бот-сети.

Как только ваш компьютер интегрируется в сеть ботнета, он начинает использоваться для пересылки спама, вирусов и других вредоносных программ на другие компьютеры в сети Интернет.

Есть сотни и тысячи компьютеров по всему миру, которые используются реальными людьми, одновременно являясь частью ботнета.

Существует высокая вероятность, что ваш компьютер является частью ботнета, но вы не знаете об этом.

Если вы решили заблокировать ботнет, вы, скорее всего, блокируете трафик, поступающий от реальных пользователей.

Существует вероятность, что как только вы заходите на подозрительный сайт из вашего отчета реферального трафика, ваша машина заражается вредоносным ПО.

Поэтому не посещайте подозрительные сайты из отчетов аналитики, не установов надлежащей защиты (антивирусных программ, установленных на вашем компьютере). Предпочтительно использование отдельной машины специально для посещения таких сайтов. Как вариант, можно обратиться к системному администратору, чтобы справиться с этой проблемой.

Умные спам-боты

Некоторые спам-боты (как darodar.com) могут посылать искусственный трафик даже без посещения вашего сайта. Они делают это путем воспроизведения HTTP запросов, которые исходит от кода отслеживания Google Analytics, используя при этом ваш идентификатор веб-ресурса. Они не только могут отправить вам поддельный трафик, но также и поддельных рефереров. Например, bbc.co.uk. Так как BBC является законным сайтом, то когда вы видите этот реферер в своем отчете, вы даже не думаете, что трафик, поступающий с уважаемого сайта, может быть фальшивкой. На самом же деле никто с BBC не посещал ваш сайт.

Этим умным и опасным ботам не нужно посещать ваш веб-сайт или выполнять сценарии JavaScript. Поскольку они фактически не посещают ваш сайт, эти посещения не записываются в журнал сервера.

И, раз их посещения не записываются в журнал сервера, вы не можете заблокировать их с помощью любых средств (блокирование IP, пользователя, реферального трафика и т.д.).

Умные спам-боты сканируют ваш сайт в поисках идентификаторов веб-собственности. Люди, которые не используют Google Tag Manager, оставляют код отслеживания Google Analytics на своих веб-страницах.

Код отслеживания Google Analytics содержит ваш идентификатор веб-ресурса. Идентификатор крадется умным спам-ботом и может передаваться в использование другим ботам. Никто не станет гарантировать, что бот, укравший ваш идентификатор веб-ресурса и бот, посылающий вам искусственный трафик, - одно и то же «лицо».

Вы можете решить эту проблему, воспользовавшись Google Tag Manager (GTM).

Используйте GTM для отслеживания Google Analytics на вашем сайте. Если ID вашего веб-ресурса уже был заимствован, то решать эту проблему, скорее всего, уже слишком поздно. Все, что вы можете сделать сейчас, - использовать другой ID или ждать решения проблемы со стороны Google.

Не любой сайт попадает под атаку спам-ботов.

Изначально задача спам-ботов - обнаружение и использование уязвимых сторон веб-ресурса. Они атакуют слабо защищенные сайты. Соответственно, если вы разместили страничку на «бюджетном» хостинге или с помощью пользовательского CMS, у него велики шансы подвергнуться нападению.

Иногда сайту, который часто попадает под атаку опасных ботов, достаточно сменить свой веб-хостинг. Этот простой способ действительно может помочь.

Следуйте инструкциям ниже, чтобы обнаружить источники спама

1) Перейдите к отчету реферального трафика в вашем аккаунте Google Analytics и отсортируйте отчет по проценту отказов в порядке убывания:

2) Посмотрите на рефереров с 100% или 0% показателем отказов, а также на тех, у кого 10 или более сессий. Скорее всего, это спамеры.

3) Если один из ваших подозрительных рефереров принадлежат к списку нижеперечисленных сайтов, то это реферальный спам. Вам можно не проверять это самостоятельно:

buttons-for-website.com


7makemoneyonline.com


ilovevitaly.ru


resellerclub.com


vodkoved.ru


cenokos.ru


76brighton.co.uk


sharebutton.net


simple-share-buttons.com
forum20.smailik.org
social-buttons.com
forum.topic39398713.darodar.com

Исчерпывающий перечень источников спама можно скачать .

4) Когда не удалось подтвердить личность вашего подозрительного реферера, возьмите на себя риск и посетите сомнительный веб-сайт. Возможно, это действительно нормальный ресурс. Удостоверьтесь, что у вас есть антивирусное программное обеспечение, прежде чем посещать подобные сомнительные ресурсы. Они способны заразить ваш компьютер в момент перехода на их страницу.

5) После подтверждения идентичности опасных ботов следующий шаг заключается в блокировании их от посещения вашего сайта еще раз.

Как же можно ограничить свой сайт от спам-ботов?

Создайте аннотацию на вашем графике и напишите записку с объяснением, что вызвало необычный всплеск трафика . Можно будет сбрасывать этот трафик со счетов во время анализа.

Блокируйте реферальный спам, используя возможности Spambot . К файлу.htaccess (или веб-конфигурации, если используется IIS) добавьте указанный ниже код:

RewriteEngine On Options +FollowSymlinks RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*buttons-for-website\.com\ RewriteRule .* – [F]

Этот код будет блокировать все HTTP и HTTPS направления от buttons-for-website.com, включая поддомены buttons-for-website.com.

Заблокируйте IP-адресиспользуемый спам-ботом . Возьмите.htaccess файл и дополните кодом, показанным ниже:

RewriteEngine On
Options +FollowSymlinks
Order Deny,Allow
Deny from 234.45.12.33

Примечание : Нет необходимости в копировании кода в ваш.htaccess - схема не сработает. Здесь продемонстрирован лишь пример, обеспечивающий блокировку IP-адреса в файле.htaccess.

Спам-боты способны использовать различные IP-адреса. Систематически пополняйте список IP-адресов спам-ботов, имеющихся на вашем сайте.

Подвергайте блокировке лишь IP-адреса, оказывающие влияние на сайт.

Бессмысленно стремиться заблокировать каждый из известных IP-адресов. Файл.htaccess превратится в очень громоздкий. Им станет трудно управлять, снизится производительность веб-сервера.

Заметили, что количество сток черного списка IР-адресов стремительно увеличивается? Налицо явный признак возникших проблем с безопасностью. Обратитесь к представителю веб-хостинга или системному администратору. Используйте Google, чтобы найти черный список для блокирования IP-адресов. Автоматизируйте эту работу, составив сценарий, способный самостоятельно находить и запрещать IP-адреса, чья вредоносность не подвергается сомнению.

Воспользуйтесь возможностью блокировки диапазонов IP-адресов, используемых ботами-спамерами . Когда есть уверенность, что конкретный диапазон IP-адресов используется спам-ботом, можно одним движением заблокировать сразу ряд IP-адресов, как показано ниже:

RewriteEngine On

Options + FollowSymlinks


Deny from 76.149.24.0/24


Allow from all

Здесь 76.149.24.0/24 - диапазон CIDR (CIDR - метод, используемый для представления диапазонов адресов).

Использование блокировки по CIDR результативнее блокирования конкретных IP-адресов, поскольку позволяет занимать минимум пространства на сервере.

Примечание: Вы можете скрыть в CIDR ряд IP адресов и наоборот открыть их с помощью этого инструмента: www.ipaddressguide.com/cidr

Блокируйте запрещенных пользователей, использующих спам-ботов . Анализируйте лог-файлы сервера еженедельно, обнаруживайте и блокируйте вредоносные агенты пользователей, использующих спам-ботов. После блокировки они не смогут получить доступ к веб-ресурсу. Возможность сделать это показана ниже:

RewriteEngine On


Options +FollowSymlinks


RewriteCond %{HTTP_USER_AGENT} Baiduspider


RewriteRule .* –

Воспользовавшись поисковой строкой Гугл, можно получить внушительный список ресурсов, которые поддерживают записи известных запрещенных агентов пользователей. Воспользуйтесь полученными сведениями для выявления таких агентов пользователей на вашем сайте.

Самый простой способ - написание сценария, позволяющего автоматизировать весь процесс. Составьте базу данных со всеми известными запрещенными агентами пользователей. Используйте скрипт, который будет автоматически идентифицировать и блокировать их, опираясь на данные из базы. Регулярно пополняйте базу данных новыми запрещенными пользовательскими агентами – появляются таковые с завидным постоянством.

Блокируйте только пользовательские агенты, реально влияющие на ресурс. Бессмысленно стремиться к блокировке каждого известного IP-адреса - это сделает файл.htaccess чересчур большим, им станет трудно управлять. Снизится и производительность сервера.

Пользуйтесь доступной в Google Analytics фильтрацей «Bot Filtering» - «Исключить хиты от известных ботов и пауков».

Проводите мониторинг логов сервера хотя бы еженедельно . Положить начало борьбе с опасными ботами реально на уровне сервера. Пока не удалось «отвадить» спам-ботов от посещения вашего ресурса, не исключайте их из аналитической отчетности Гугла.

Используйте брандмауэр . Firewall станет надежным фильтром между вашим компьютером (сервером) и виртуальным пространством. Он способен защитить веб-ресурс и от опасных ботов.

Получайте квалифицированную помощь от системного администратора . Круглосуточная защита клиентских веб-ресурсов от вредоносных объектов – его основная работа. У того, кто ответственен за безопасность сети, намного больше инструментов для отражения атак ботов, чем у владельца сайта. Если вами обнаружен новый бот, угрожающий сайту, незамедлительно проинформируйте о находке сисадмина.

Пользуйтесь Google Chrome для веб-серфинга . В случае, если брандмауэр не используется, для просмотра интернет-страниц лучше всего использовать Google Chrome.

Chrome также способен обнаружить вредоносное программное обеспечение. При этом он открывает веб-страницы оперативнее, нежели другие браузеры, не забывая сканировать их на наличие вредоносных программ.

Если вы используете Chrome, риск «подцепить» вредоносное ПО у вашего компьютера снижается. Даже когда заходите на подозрительный ресурс из отчетов реферального трафика Google Analytics.

Используйте пользовательские предупреждения при мониторинге неожиданных скачков посещаемости. Персонализированное оповещение в аналитике Google даст возможность оперативно обнаружить и нейтрализовать вредные запросы ботов, минимизируя их вредоносное воздействие на сайт.

Используйте фильтры, доступные в Google Analytics . Для этого на вкладке «Администратор» в столбце «Представления» нужно выбрать «Фильтры» и создать новый.

Справиться с настройкой фильтров довольно просто. Главное – знать, как это делается.

Можно использовать флажок «Bot Filtering», расположенный в разделе «View Settings» вкладки «Administrator». Это не повредит.

Несмотря на простоту использования фильтров в Google Analytics, мы все же не советуем использовать их на практике.

Для этого есть три веских причины:

  • Есть сотни и тысячи плохих ботов, огромное количество новых появляется ежедневно. Какое количество фильтров придется создавать и применять к вашим отчетам?
  • Чем большее число фильтров будет применяться, тем сложнее будет анализировать отчеты, полученные от аналитической службы Google.
  • Блокировка трафика спама в Google Analytics – это сокрытие, но не решение проблемы. Вы потеряете возможность оценивать степень искаженности трафика спам-ботами.

Аналогично, не блокируйте реферальный трафик с помощью «Referral exclusion list »- это не решит вашу проблему. Наоборот, этот трафик в последствии будет оцениваться как прямой, что приведет к потере возможности следить за воздействием спама на трафик вашего веб-ресурса.

После того, как спам-бот попал в статистику аналитического сервиса Google, данные о трафике будут искажены навсегда. Вы уже не сможете исправить его.

Заключение

Мы надеемся, что перечисленные выше рекомендации помогут вам избавиться от всех источников спама на Ваш сайт. Это можно сделать разными способами, мы же описали те, которые помогли многим ресурсам защитить свои данные в Google Analytics.

Теги: Добавить метки

А вот соответствующая таблица (закрасил неважные столбцы):

Вся гадость отмечена галочками. Кроме показанных на картинках simple-share-buttons, buttons-for-website, semalt, humanorightswatch, o-o-6-o-o, s.click.aliexpress я у себя видел в статистике следующий мусор: hulfingtonpost.com , darodar.com , www.amazon.com , ilovevitaly.com . В общем, полный букет.

Если в списке ваших рефералов красуется что-то из перечисленного - поздравляю: и в Вашей статистике размещена реклама.

Почему это плохо?

Засоряется статистика. Особенно это мешает, если посещаемость у сайта невысокая. Также обычно растёт средний показатель отказов. При настоящих переходах это может негативно влиять на ранжирование сайта (он опускается в результатах выдачи). Но в большинстве случаев этого не происходит.

Реальный ссылочный спам

Весь этот ссылочный спам (реферальный спам, рефспам, referrer spam, referral spam) можно разделить на 2 категории: боты, которые на самом деле посещают ваш сайт, и «призрачный» ссылочный спам. Второй случай означает, что сайт на самом деле не посещали, а фальшивые данные были отправлены вместе с настоящими на сервера GA и YM.

Конечно, Яндекс и Гугл говорят, что всё это не влияет на ранжирование, беспокоиться, мол, не о чем. Но было бы странно, если бы они говорили иначе, не правда ли? Вот что пишет знаменитый Платон Щукин (таким именем подписываются все сотрудники службы поддержки Яндекса) на запросы о посещениях со странных сайтов: «Если Ваш сайт продвигается в интересах пользователей, не используя каких-либо техник, направленных на обман поисковых систем, то Вам не о чем волноваться, так как при разработке наших алгоритмов мы, конечно же, учитывали возможность злоумышленников повлиять на позиции того или иного сайта и минимизировали её».

Яндекс.Директ

Можно в сети встретить жалобы на то, что такие «посещения» будто бы «едят» платные щелчки на Яндекс.Директе, т.е. за них списываются деньги, как будто бы это были реальные переходы. Судя по всему, это неправда, описанный метод отправки фальшивых посещений не может подделывать клики пользователей.

Вопросы

Когда возник «призрачный» рефспам? Кто его придумал и осуществил впервые? Законно ли это? Сколько их, таких спамеров? Вот на эти вопросы мне самому было бы интересно узнать ответ. Жду экспертных мнений в комментариях!

И напоследок немного пикантности. Среди запросов в статистике YM можно увидеть «яндекс -официально -рекомендует ilovevitaly.ru поисковую оболочку». Похоже, кто-то отомстил Виталию его же методом. См. его комментарий .

P.S. Если появились какие-то новости, упущенные в моей записи - поделитесь, пожалуйста!