Понимание области данных в отчетах Google Analytics

Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5 (4 оценок, среднее: 5,00 из 5)
Загрузка...

Google Analytics позволяет легко собирать и формировать отчеты, не понимая основную организацию этих данных. Сложные вопросы или странное поведение можно объяснить, поняв модель, которую Google Analytics собирает и хранит. Начнем с начала:

Данные, собранные в Google Analytics, могут попадать в одну из двух категорий: параметры или показатели. Я описывал разницу между ними в этом блоге.

Тем не менее, не каждая параметр-показатель может быть проанализирован в стандартных отчетах Google Analytics. Например, в отчете «Все страницы» приведены сведения о разных страницах вашего сайта. Вы можете увидеть сколько просмотров страниц, уникальных просмотров страниц и входов по каждой странице вместе со средним временем на странице, показателем отказов %, выходов и значением страницы. Но вы не видите такие показатели, как количество пользователей или сеансов.

Где показатели сеанса и пользователя?

Вы используете GA, потому что хотите узнать как можно больше информации о производительности своего сайта – так почему эти дополнительные показатели недоступны из коробки? Это может показаться ограничением стандартных отчетов, но упущение этих показателей преднамеренно и понимание того, почему они не учтены, является ключом к созданию значимых и точных отчетов ваших данных.

Что такое области?

Параметры и показатели сохраняются отдельно друг от друга из-за того, как данные определяются и собираются в Google Analytics. Области действия характеристики каждого параметра и показателя, и каждый параметр и показатель может иметь только одну область. Данные GA организованы в 4 типа областей:

  1. Данные пользователя;
  2. Данные сеанса;
  3. Хит-данные;
  4. Данные о товаре (электронная торговля).

Хит определяется как любое действие на сайте, такое как просмотр страницы или событие, вызванное просмотром видео или загрузкой PDF-файла. У хитов также могут быть связанные с ними продукты.

Сеанс определяется как один или несколько обращений в течение определенного периода времени. Действия одного человека на вашем сайте во время одного сеанса просмотры загружаемые страницы, файлы которые они загружают, подключены к одному сеансу.

Пользователь – это самый высокий уровень данных и это ключевая часть, которая связывает предыдущее и будущее поведение в Интернете. В частности, в Google Analytics хранится идентификатор клиента для каждого пользователя, который посещает ваш сайт, а затем объединяет все сеансы с одним и тем же идентификатором клиента. Идентификатор клиента – это значение, которое генерируется кодом отслеживания Google Analytics и хранится в файле cookie в браузере пользователя на своем компьютере. Это разъяснение важно; важно понимать, что пользователи – это файлы cookie, а не отдельные люди – cookie привязан к браузеру, а не к человеку. Таким образом, человек, посещающий сайт Chrome на работе и посещающий тот же сайт из Firefox на своем домашнем компьютере, будет считаться двумя пользователями, индивидуальный файл cookie у каждого браузера.

Пользователи состоят из одного или нескольких сеансов, сеансы состоят из одного или нескольких хитов, а хиты могут иметь один или несколько продуктов, связанных с ними.

Область пользовательского уровня

Любой параметр или показатель с областью пользовательского уровня относится к аспекту пользователя. Некоторые из наиболее часто используемых включают:

ПараметрыПоказатели
Тип пользователяПользователи
Количество сеансовНовые пользователи
Географическое положение

Сфера охвата

Параметры и показатели уровня сеанса описывают атрибуты одного сеанса. Они включают:

ПараметрыПоказатели
Landing PageСессия
Источник/КаналПоказатель отказов
КомпанияСредняя продолжительность сеанса

Область охвата

Размеры и показатели уровня Hit относятся к особенностям одного попадания. Они включают

ПараметрыПоказатели
СтраницыаВсе страницы
HostnameВремя на странице
Категория событий Все события

Ниже приведен список всех доступных измерений и показателей в GA .

Почему область важна?

Как я уже сказал выше, пользователи состоят из одного или нескольких сеансов, сеансы состоят из одного или нескольких хитов, а хиты могут иметь один или несколько продуктов, связанных с ними. Важно признать, что эта иерархия обычно работает в одном направлении. Например, сеансы имеют хиты, но хиты не могут иметь сеансов, а хиты могут иметь продукты, но продукты не могут иметь хиты. У хитов есть пользователи, однако у хитов не может быть сеансов.

Хиты являются строительными блоками GA. Идентификатор клиента (упомянутый выше) приписывается каждому хиту вместе с тонной другой информацией, например какой тип хита отправляется (просмотр страницы, событие и т.д.), время когда был сделан хит и т.д. Хиты – это части информации, поступающей в GA для обработки. Некоторые хиты сохраняются, а некоторые выбрасываются на основе фильтров, которые вы настроили для своего представления. Хиты организованы в хронологическом порядке на основе их временных меток и связаны между собой на основе идентификатора клиента. Только тогда GA выясняет к какой сессии они принадлежат, просматривая время между хитами.

В результате хиты не имеют идентификатора сеанса приписываемого им, поэтому мы можем сказать «у хитов есть пользователи», потому что хиты содержат информацию идентификатора клиента, мы не можем сказать что «хиты имеют сеансы» потому что они не содержат информация о сеансе. И если бы был способ связать хиты с сеансами, наши отчеты на уровне хитов, вероятно дублировались бы. Таким образом, отчет о сеансе несовместим, и поэтому мы говорим: «у хитов не может быть сеансов».

Вы должны учитывать области при представлении данных и настройке параметров и показателей.

Составление отчетов

Это особенно актуально, когда речь идет о отчетности. Как я уже говорил выше, встроенные отчеты GA не позволяют делать недопустимые комбинации показателей. Однако, если вы создаете пользовательские отчеты или отчеты с помощью API, существует меньше ограничений – вы можете комбинировать практически любые параметры или показатели, которые вы хотите, что не всегда хорошо.

Первое, что вам нужно спросить при создании отчета, – «Имеет ли смысл эта метрическая комбинация в отношении того, как Google Analytics собирает данные?» В противном случае вы могли бы создать несколько отчетов, которые не означают, что вы ожидаете от них.

Например, если вы попытаетесь совместить страницу с сеансами, итоговая таблица не покажет вам, сколько сеансов, на которых просматривалась эта страница. Вместо этого в отчете показано, сколько сеансов началось на каждой странице. Чтобы увидеть информацию, которую вы ищете, вам нужно совместить страницу с другим измерением уровня, например Unique Pageviews.

При объединении любого измерения уровня хита с метрикой уровня сеанса, метрика будет содержать только данные с первого хита сеанса. Я писал об этом более подробно здесь, а также другие ошибки, которые вы можете сделать при представлении отчетов.

Аналогичным образом вы не можете комбинировать:

  • События и цели
    Возможно, вам захочется узнать, сколько событий было засчитано как завершение цели. Цель может быть определена как событие, но она не может относиться к завершению цели, поскольку цели – это уровень сеанса, в то время как события – это уровень хита.
  • Продукты и общие события
    Вам может быть интересно, сколько людей, купивших продукт, также завершило цель. В этом случае сравнение уровня продукта на уровень хита не работает; эта комбинация приведет к таблице без данных.
  • Страницы и цели
    Другая информация, которую вы можете заинтересовать, – это страницы, на которых были достигнуты цели. Вы можете увидеть некоторый уровень детализации с помощью URL-адреса «Цель», но вы не можете комбинировать измерение «Страница» с «Достижениями цели». Причина, по которой этот анализ не будет работать, относится к вышеперечисленным мероприятиям и достижениям цели – цели определяются на уровне сеанса, тогда как страницы имеют уровень хита.

В целом, комбинации этих измерений и показателей производят таблицы, которые не имеют смысла в отношении того, как GA определяет и обрабатывает данные.

Пользовательские параметры и показатели

Область данных очень важна и необходимо помнить это при создании Пользовательских параметров и переменных. Вы получаете возможность решить, как охватить эти параметры и показатели.

Основывайте свое решение как на данных, которые вы ожидаете получить, так и на том, как вы в конечном итоге хотите видет эти данные. Описывает ли эта информация только текущий хит, дает ли нам больше информации о сеансе просмотра или сообщает нам что-то об этом пользователе, которое мы хотим запомнить навсегда?

Есть исключения

Как я уже сказал, объединение измерений и показателей по масштабам может быть крайне ошибочным. Это может создать отчеты, которые либо не имеют никакого смысла, либо по крайней мере, означают нечто иное, чем вы ожидаете. Но иногда вы получаете отчет, который ожидаете.

Например, если вы создаете настраиваемый отчет, который объединяет страницу измерения уровня на уровне страницы с пользовательскими метрическими пользователями, вы ожидаете получить таблицу, которая показывает, сколько пользователей посетило каждую страницу вашего сайта. Если вы помните из ранее хитов делать содержат информацию о пользователе (идентификатор клиента), так что это на самом деле именно отчет , что вы получите в этом случае.

И напоследок

Посмотрите на свои результаты и перекрестные ссылки с другими данными в GA, чтобы убедиться, что таблица показывает вам то, что вы действительно хотите видеть. Постоянно помните как GA обрабатывает данные – идентификатор клиента связан с каждым хитом, но идентификатор сеанса – нет. И, как правило, никогда не объединяйте метрики на уровне хитов и сеансов.

comments powered by HyperComments

Об авторе

Антон Курусь

Создатель этого блога. Люблю узнавать новое и развиваться в интересующих меня областях.
Хочешь сбежать от повседневности — не останавливайся в развитии.

Просмотреть все сообщения