В статье "Остановите веб-спам на своих сайтах", я писал о так называемом реф-спаме, который искажает общую картину посещений Вашего сайта, и в особенности в счетчиках аналитики, которые безусловно подключены к каждому сайту. Но почему так важно следить за чистотой посещений своего сайта и цифрами аналитики: блокировать всякий реф-спам, блокировать нежелательных пауков (за бугром .htaccess переполнены блокировкой всевозможных ботов и пауков, в рунете до сих пор почему-то игнорируют эти рекомендации), блокировать различные технические моменты?
Если Вы любите свой сайт и на нем установлены счетчики аналитики посещений (а они там установлены - я это знаю), дайте мне пару минут: я расскажу Вам почему и как сделать статистику посещений своего сайта чище, правдивее и актуальнее!
Начну с того, что счетчики аналитики посещений сайта давно уже не предназначены для рейтинга в каталоге (у кого больше чисел, тот круче), гиганты поискового трафика на базе анализа данных счетчиков могут строить далеко идущие выводы о самом сайте и учитывать это в результатах ранжирования Вашего сайта.
Так, в Google Analytics (счетчик от Google) проводится полный анализ аудитории и всех межсайтовых переходов. На основании собранных данных, можно узнать: находят ли пользователи на ваших страницах то, что они ищут, видят ли они то, что вы им хотите показать и т.д. Такая аналитика, безусловно, полезна для ранжирования Вашего сайта поисковиком. Естественно, если вы не установили на свой сайт Google Analytics, многие параметры Вашего сайта остаются недоступными для Google и он может вычислять их лишь по косвенным признакам.
А что Яндекс? Их продукт "Яндекс.Метрика" (кстати, с 22 июня она полностью переходит на новый интерфейс) в плане сбора статистики посещений сайта и его анализа продвинулся не хуже забугорного Гоши: анализируется рекламный трафик, конверсии, есть интерактивные карты путей пользователей по сайту. Доступны отчёты по полу и возрасту посетителей сайта, их запросам и интересам.
Это лишь 2 кита, рекомендациям которым зачастую следуют вебмастера: поэтому не встретить счетчик от "Google Analytics" и/или "Яндекс.Метрики" на русскоязычных сайтах - редкий случай. Естественно, для достижения более точных статистических данных о Вашем сайте, ими учитывается каждый посетитель, его карта путей и интересов, все его действия, вплоть до выявления заинтересованности: понравилось ли ему на вашем сайте, как он к вам попал, куда пошел дальше, приходил ли еще и т.д. Все посещения и интересы суммируются, что и представляет из себя аналитику Вашего сайта, для последующих выводов и действий.
Есть и другие киты, счетчики посещений которых можно встретить на сайтах вебмастеров. В рунете популярностью пользуются: Рамблер-ТОП, LiveInternet, Openstat, Mail.Ru, HotLog и другие. У каждого свой подход к сбору статистики, но ни одному из них не понравится считать переходы-реф ботов, ботов имитаторов, парсеров, сканеров, пауков и т.д. Весь этот хлам нужно блокировать и не пускать на свой сайт вообще, поскольку искажается общая картина Вашей целевой аудитории в глазах рейтинга и поисковых систем.
Блокируем нежелательных посетителей
В упомянутой статье "Остановите веб-спам на своих сайтах" приведены рекомендации блокировки "нулевых посетителей" из подозрительных доменов - так называемый реф-спам.
В статье "Крутой .htaccess" можно найти рекомендации по блокировке ненужных пауков и сканеров, а также хакеров и недоброжелателей.
Также хочу рассказать об еще одном техническом моменте, на который почему-то никто не обратил внимания. А именно: так ли важно учитывать на сайте интересы и действия администратора сайта? Как администратор сайта, такой посетитель генерирует колоссальную активность на сайте: перечитывает записи, перелинковывает материалы, просматривает технические страницы... хм, но ведь все это записывается в логи статистики, но полезной нагрузки не несет! Вы просто вставили счетчик аналитики на свой сайт где нибудь в футер и забыли о нем! А он считает все то, что и считать ему не положено. Зачем сервисам статистики логи действий администратора сайта (даже если счетчики не встроены в административную часть сайта, тем не менее возможно собрать предостаточно конфиденциальных данных)?

И если Вы помешаны на аналитике своего сайта, то согласитесь, что смотреть на аналитику своего детища, в которой учтены исключительно посетители Вашего сайта, а не гиперактивность администратора (именно гиперактивность, так как администратор будет самым "крутым" посетителем сайта, накручивающим всевозможные показатели) - куда приятнее и объективнее.
Если я Вас не убедил, можете открыть свою статистику, например, в Яндекс.Метрике. Посмотрите, кто лидирует по активности, по продолжительности пребывания на сайте, по хитам/просмотрам, по номеру посещения и т.д. и т.п. А теперь вообразите себе, каким образом это влияет на объективность показателей и суммарную статистику!? В конце-концов, с каких это пор, вы идете в Яндекс.Метрику, чтобы анализировать свое собственное пребывание и свою активность на своем собственном сайте? Вы же не параноик?
Отключаем счетчики статистики для администратора
Счетчики статистики для администратора на сайтах всегда нужно отключать - ничего хорошего в том, что активность администратора фиксируется в логах на посторонних серверах аналитики - нет и быть не может по определению (если Вы считаете иначе, буду рад услышать Ваши аргументы в комментариях)!
Делается это не сложно, на используемом Вами движке, обязательно должна быть функция определения администратора. На сайтах под управлением WordPress это можно сделать с помощью такого нехитрого кода:
<?php if ( is_user_logged_in() && current_user_can('administrator') ){ ?> <?php } else { ?> //сюда ваши счетчики <!-- Yandex.Metrika counter --> ... <!-- /Yandex.Metrika counter --> <?php } ?>
Код вычисляет залогиненного администратора сайта на WordPress, и не подгружает на страницы счетчики аналитики. Такая простая конспирология избавит Вас не только от лишних логов в статистике аналитики Вашего сайта, но и в том числе от многих неприятностей и казусов, о существовании которых Вы можете и не догадываться!
А как вы в принципе относитесь к счётчикам аналитики? Например за Метрику Яндекса, ходит много историй что после добавления/удаления, трафик падает/растёт.
Если на сайте нет аналитики, то как вы узнаете, что "после добавления/удаления, трафик падает/растёт"?
Аналитика нужна не так вебмастеру, как самому сайту, как показатель при продвижении, продаже и т.д.
Вы написали код для WordPress.
А скажите на движке OcStore будет такой же код, или нужно будет изменить?
1. По своим сайтам я хожу не всегда залогинившись.
2. Залогинившись, управляя через СМС контентом, в метрику ничего не попадает, т.к.при этом footer (там код счетчика) не трогается.
Естественно, метрика не пишет ваши телодвижения непосредственно в админке (вы правильно заметили, там нет футера темы), но все передвижения по сайту как администратора (в том числе и по закрытых от всех страницах, например, черновики, запланированные и т.д.).
Просто откройте метрику и найдите себя там!!!
Конечно, так. Поэтому в закрытых разделах сайта (ЗР) счетчикам делать нечего. И всякие "красивости" (подвалы, интерактивные формы и т.п.) в рабочие разделы не нужно включать. Или делать для ЗР свой шаблон со своей головой и футером, например,
{{header777}}
[*content*]
{{footer777}}
, где footer777 - подвал БЕЗ СЧЕТЧИКА. Так пойдет?
Так, что ваша статья очень полезная.
А каким боком можно блокать рефспам в хтассесс, если запросы направлены прямо в метрику?
Рефспам обращается к сайту с подстановкой нужного рефферера (отсюда и название), поэтому он легко блокируется в хтассесс. Кстати, в Метрике можно включить фильтр для доменов, с которых не надо считать статистику (отчего сама статистика будет чище), но это не блокирует сами реф-переходы, поэтому только хтассесс
Сам лично в качестве эксперимента проверял можно ли заспамить метрику без участия сайта, оказалось можно!
Впервые об этом читаю, что нежно отключать. Пока оставлю всё без изменения.
Может имели ввиду "нужно"? В статье приведены аргументы. Каковы Ваши контраргументы?
Да, я имел ввиду "нужно". Опечатка получилась.
Согласен, от того, что цыфрульки на сайте от своего посещения станут большими приятнее не становится, хочется видеть реальную статистику