Что такое выборка отчета Google Analytics?

Выборка отчета — это процесс, применяемый к сайтам, которые генерируют большие объемы данных посещений. Причина его применения — стремление к оптимизации генерации отчетов и минимизации задержек при их построении. По существу, если система Google Analytics работает в режиме выборки отчета, для вычисления результатов она исследует только часть собранных данных.

Затем для отображения отчета Google Analytics автоматически выполняет обратное масштабирование этих числовых значений. Например, если для вычисления выборки используется 10% фактических данных, в отображенном отчете такие метрики, как количество посещений и количество просмотров страниц, умножаются на 10. Это — стандартный статистический подход при работе с большими объемами данных. При его применении меньший репрезентативный поднабор данных используется для оценки общих значений.

Важно запомнить, что если сайт получает менее 100 000 посещений в месяц, вам вряд ли придется сталкиваться с выборкой отчетов.

Обратите внимание, что выборка отчета отличается от выборки при сборе данных, описанной в разделе «Индивидуальная настройка кода GATC». Выборка при сборе данных определяет объем данных, отправляемых в Google Analytics, и ею можно управлять. Выборка отчета выполняется автоматически при генерации отчета, объем которого превышает определенный предел.

Необходимость применения автоматической выборки данных определяется для каждого отчета в отдельности. Это немедленно сказывается на объеме данных, которые должны быть обработаны вашим запросом отчета — в зависимости от диапазона дат и типа отчета, выбранных в пользовательском интерфейсе. Например, комплект отчетов в разделе Standard Reporting (Создание стандартных отчетов) Google Analytics генерируется из не подвергавшихся выборке заранее обобщенных таблиц данных. Любой запрос отчета, который может быть удовлетворен за счет применения заранее обобщенных данных, не подвергается выборке.

Однако запрос отчета может требовать нестандартного набора данных, такого как использование расширенных сегментов, дополнительного измерения или нестандартного отчета. В этих случаях, если запрошенные данные поступают из веб-свойства, количество посещений которого превышает 500 000 для одного и того же диапазона дат, выборка будет иметь место. Чтобы проиллюстрировать сказанное, предположим, что вы просматриваете отчет Content → Site Content → Landing Page (Контент → Контент сайта → Посадочная страница), для которого в качестве дополнительного измерения выбрано medium (средство), что ведет к отображению таблицы с общим количеством посещений 90 000. Зачем может требоваться выборка для такого сравнительно небольшого набора данных?

В данном случае вы запрашиваете нестандартный набор данных про аренда авто в испании, который не может быть получен из не подвергающегося выборке заранее обобщенного отчета. Поэтому требуется запрос необработанных данных сеанса. Выборка будет выполняться, если общее количество посещений в течение выбранного диапазона дат для данного веб-свойства превысит 500 000. Обратите внимание, что я умышленно делаю упор на веб-свойство. Даже при наличии фильтрованного профиля, который отсекает большую часть трафика, выборка осуществляется на уровне веб-свойства.

Для указания того, что отчет генерируется на основе выборки данных, Google Analytics отображает в верхней части экрана предупреждение желтого цвета This report is generated in fast-access mode (Этот отчет сгенерирован в режиме быстрого доступа). Хотя это и не указано явно, данное сообщение означает, что имела место выборка.

Применение выборки отчетов можно считать признаком успеха — т.е. вы получаете настолько много зафиксированных посетителей, что создание отчетов обо всей их активности становится процессом, требующим значительных затрат времени и ресурсов. Однако старайтесь минимизировать ситуации, в которых может применяться выборка, разумным образом структурируя свои данные. Например, вместо того, чтобы помещать все данные в один раздел, подумайте о распределении данных по различным веб-свойствам Google Analytics и даже по различным аккаунтам Google Analytics.

Google Analytics Premium, платная версия Google Analytics, обладает функцией, которая позволяет загружать не подвергающиеся выборке отчеты в формате CSV. Обратите внимание, что для поддержания высокой скорости загрузки отчетов в пользовательском интерфейсе критерий применения выборки к генерации отчетов остается неизменным — т.е. равным 500 000 посещений для запросов нестандартных данных, которые не могут быть обслужены посредством заранее обобщенных данных.


Top