редакции Выбор
Зависит ли количество показов сайта в поиске Google от погоды? Пример отчета
Так как я не могу раскрывать информацию клиента, для статьи я заменила данные о количестве поисковых запросов на показатели другого сайта, большая часть трафика на который идет из Москвы. А бизнес клиента находится в Лондоне, поэтому данные о погоде мы использовали для Лондона. В результате я получила отчет с корреляцией запросов российского сайта оказания услуг от погоды в Лондоне. Не очень логично, но я хочу рассказать о том, как я делала отчет, а не поделиться реальными цифрами. Поэтому, если вам это понравится и будет актуально, то всегда можно подставить шаблон реальные данные.
Итак, поехали.
Какие наборы данных используем на входе
Документ с тестовыми данными можно найти по ссылке.
Для анализа мы выбрали период с начала 2020 года до 16 июня 2021, то есть 1,5 года.
Данные о поисковых запросах я получила из Google Search Console, поле Impressions. С помощью коннектора для Google Sheets выгрузила данные на вкладку «Impressions». Данные сразу же находятся в удобном формате и требуют преобразований. У нас таблица с двумя столбцами: дата и количество показов сайта в поиске Google.
Данные о погоде можно найти на различных сайтах. Мне их уже в готовом виде прислал клиент, но данные можно найти на различных сайтах, например, на www.meteomatics.com с доступом через API и бесплатным тестовым периодом на 14 дней. Если вам, так же как и мне, данные нужны разово, то бесплатного тестового периода будет вполне достаточно.
На входе я получила 3 вкладки в Google Sheets с данными по часам:
- Температура на вкладке High Temp by the hour
- Дождь — вкладка Rainfall by the hour
- Облачность — Cloud Cover by the hour
Преобразования данных о погоде
Данные о погоде и данные о показах сайта в поисковой выдаче имеют разный уровень детализации и мы не можем просто взять и сравнить данные о погоде по часам с показами сайта в разбивке по дням. Поэтому я решила построить сводные таблицы для каждого показателя погоды и группировать данные по дням.
Так как дождь может быть только в определенные часы и облачность также может быть в какое-то время суток, а в какое-то нет, я расчитала среднее значение для каждого показателя. По температуре я сделала 2 среза — среднее за день и максимальная температура за день.
Трафик ночью сильно ниже, чем днем, поэтому я решила убрать из анализа данные с 1 ночи до 6 утра, как не релевантные.
Сначала я свела данные из 3-х вкладок с погодой в одну «weather_hour» и перевела дату из формата Timestamp в отдельные колонки с датой и временем. Формулы для Google Sheets такие:
Исходные данные:
Timestamp A2 = 20200101T0000
Преобразуем:
Date B2 = date(left(A2,4),mid(A2,5,2),mid(A2,7,2))
Time C2 = =time(mid(A2,10,2),right(A2,2),0)
Следующие 3 колонки — температура, дождь и облачность подставила данные из исходных вкладок с помощью ВПР.
Формулы:
High Temp by the hour D2 = VLOOKUP($A2,’High Temp by the hour’!$A:$B,2,0)
Rainfall by the hour E2 = VLOOKUP($A2,’Rainfall by the hour’!$A:$B,2,0)
Cloud Cover by the hour F2 = VLOOKUP($A2,’Cloud Cover by the hour’!$A:$B,2,0)
Когда таблица с данными по часам сформирована, можно сделать сводную и группировать данные по дням. Результат на вкладке «weather_day». Здесь в фильтре отключаем ночные часы и выбираем нужные для работы колонки. Для температуры создаем 2 столбца — со средним и максимальным значением.
Теперь можем объединить данные в одну таблицу на вкладке «GDS_Impr_Weather». С помощью той же функции ВПР соединяем данные о показах со вкладки «Impressions» и данные о погоде по дням со вкладки «weather_day».
Наш набор данных для визуализации готов. Переходим к картинкам.
Визуализация данных в Google Data Studio
Шаблон отчета можно посмотреть по ссылке.
На первой странице представлены данные только за прошлый месяц. На верхних графиках линией представлены показы сайта в поиске и столбцами средняя и максимальная температура в этот день. Даже на таком графике уже видно, что при понижении температуры количество показов сайта было выше.
На второй строке с данными об осадках и облачности закономерности на первый взгляд не заметно.
Зависит ли количество показов сайта в поиске Google от погоды
Далее я решила построить графики корреляции, на каждый из которых добавила линейную линию тренда. Линия тренда более наглядно показывает, что при повышении температуры количество показов сайта в поиске понижается. Для осадков и облачности также есть незначительная корреляция, но она более слабо выражена.
На второй странице отчета я вывела те же графики, но за весь период — 1,5 года. В целом, картинка повторила данные за май, кроме облачности. На большом промежутке времени заметно небольшое повышение количества показов сайта в те дни, когда небо затянуто тучами или облаками. Ну и в целом, точек на графике стало больше и данная выборка может считаться более релевантной.
Зависит ли количество показов сайта в поиске Google от погоды
Строим матрицу корреляций
Можно было бы остановиться и на этом, но мне стало интересно построить общую матрицу корреляций, для чего я воспользовалась библиотеками Python для статистики и визуализации данных. Документ можно посмотреть по ссылке.
Я загрузила те же данные, которые использовала для визуализации в Google Data Studio. Построила гистограммы для каждого параметра. В целом, это было не нужно, но интересно посмотреть на равномерность распределения данных. Кстати, интересный факт, что гистограмма температуры имеет близкое к нормальному распределение.
Зависит ли количество показов сайта в поиске Google от погоды — графики распределения
Так как данные представлены в разных единицах измерения, я их нормализовала и построила матрицу корреляций.
На основе данной матрицы можно сделать следующие выводы
- Существует слабая корреляция между облачностью и показами сайта. В облачный день с вероятностью 5-10% можно ожидать повышения количества показов сайта в поиске.
- Более ярко выражена обратная корреляция с температурой. Здесь уже с вероятностью 25% можно утверждать, что в жаркий день показы сайта будут уменьшаться и наоборот, в прохладный увеличиваться.
- И еще один интересный вывод, что в облачные дни с вероятностью 30% температура будет ниже, а вероятность дождя, в среднем 25%.
И что мне с этим делать?
На тестовых данных уровень корреляции показов сайта и погоды не слишком высокий, но если взять реально работающий сезонный бизнес, то такой анализ может помочь эффективнее работать с рекламными каналами. Например, можно увеличивать или уменьшать рекламный бюджет в зависимости от прогноза погоды.
Если вам понравился мой пример, можете повторить его на своих данных и посмотреть как погода влияет на ваш бизнес.