Недавно прикрутил к корпоративному сайту статистику посещений с полным разбором заголовка приходящего запроса. Анализ содержимого таблицы в базе наводит ряд интересных моментов, о которых и решил высказааться... и так:
1. Общее количество посещений - в сутки примерно 40-50 тысяч шт. Поначалу - вроде как "ого-го!". Но при ближайшем рассмотрении, оказывается что от 80% до 98% заходов - это поисковые запросы роботов поисковых машин. Причем с некоторых поисковиков запросы приходят "по отдельности" от разных служб и разных "зеркал"... Итог: относительно "полезный" траффик сервера это "всего лишь" около 5 тысяч запросов в сутки.
2. При дальнейшем рассмотрении оказывается, что среди нужного остатка тоже есть запросы роботов. Никто ведь не решит отнести к "пользователю за компом" - 52 внешних запроса с одного и того же адреса, сделанных в течение менее чем одной секунды к разным(!) страницам сайта... таких можно условно отделить как около 10% остаточного траффика. Далее: при обратном поиске по различным спискам в инете адресов и сигнатур посетителя, обнаруживаем что часть из них тоже известна как роботы различных назначений... Итого, суммарно полезного траффика у меня осталось еще половина - 2500шт в день.
3. Дальнейший анализ сухого остатка показывает, что большая часть (две трети) - это запросы с поисковиков, в основном Яндекс, Мэйл и Гугль (в порядке убывания долей) примерно в равном количестве... что несогласуется и сильно с принятым рейтингом в инете... ну да ладно, может это сайт такой.
4. Итого оставшиеся около 800 запросов в день - это и есть те самые посетители. И, если учесть среднюю повторяемость одного адреса во времени, то можно оценить полезность и качество просмотра ресурса... Это с одной стороны.
А с другой: полезность поискового запроса - оказывается "обрамлена" тучей поискового спама, вычленить из которого что-то - задачка. Т.е. когда кто-то говорит, что у него "стоимость одного клика ... всего лишь" - можно смело умножать эту цифру от 10 до 100раз. Не ошибешься. Или если речь о "росте посетителей", то делить на тот же коэффициент. Ну это ладно, это к вопросу стоимости интернет рекламы, которая и так уже "до небес".
5. А с третьей стороны, что и побудило написать эту мысль: все старательно бьются против почтового спама, а спам поисковый - вроде как никто не замечает. Но ведь именно он (ну так получается!) и создает основную загруженность каналов интернет!!! т.е. от 80% ВСЕГО ИНТЕРНЕТ траффика - это поисковый спам. Вот что мне показалось грустным.