SEO-прогнозирование в Google Таблицах

Еще в 2015 году я опубликовал статью, в которой раздавал бесплатный простой инструмент прогнозирования и рассказывал о сценариях использования прогнозирования в SEO. Это был быстрый и эффективный способ узнать, является ли изменение посещаемости вашего сайта какой-то сезонностью, которую вы можете игнорировать, чем-то, что стоит отметить, или тревожным признаком потери трафика.

Короче говоря: вы могли войти в серию данные, и он будет отображать это на графике, как на изображении выше.

Пять лет спустя я все еще получаю людей — от бывших коллег до совершенно незнакомых людей — спрашивающих меня об этом инструменте, и чаще всего я попросили версию, которая работает непосредственно с электронными таблицами.

Я нахожу это легким сочувствием: электронные таблицы более гибкие, их легче отлаживать, их легче расширять, проще в обслуживании и формат, с которым люди хорошо знакомы.

Компромисс при оптимизации для этих вещей заключается в том, что, хотя я улучшил этот инструмент несколько лет назад, мне все еще приходилось сохранять управляемость в известной непостоянной среде программирования, которой являются Excel / Google Таблицы. Это означает, что шаблон, представленный в этом посте, использует более простую, немного менее производительную модель, чем некоторые инструменты с выполнением внешнего кода (например, Forecast Forge).

В этом посте я собираюсь раздать бесплатный шаблон, покажу, как это работает и как использовать, а затем покажу, как создать свою (лучшую?) версию. (Если вам нужно напомнить, когда использовать прогнозирование в целом, а также такие понятия, как доверительные интервалы, обратитесь к исходной статье, указанной выше.)

Типы прогнозов SEO

Есть одна вещь, которую я хочу подробнее рассказать раньше мы переходим к работе с электронными таблицами: различные типы прогнозов SEO.

В целом, я думаю, вы можете разделить прогнозы SEO на три группы:

  1. «Я настроен оптимистично — добавьте 20% к этому году» или аналогичные неизменные изменения существующих показателей. Более сложные версии могут добавить только 20% к определенным группам страниц или ключевым словам. Я думаю, что многие агентства используют этот вид прогноза в презентациях, и все сводится к использованию опыта.
  2. Модели ключевых слов / CTR, когда вы оцениваете изменение рейтинга (или широкий набор изменений рейтинга), а затем экстраполируете полученный результат изменение трафика от объема поиска и данных CTR (вы можете увидеть аналогичную методологию здесь). Опять же, более сложные версии могут иметь некоторую основу для изменения рейтинга (например, «Что, если бы мы поменялись местами с конкурентом A по каждому ключевому слову группы X, где он в настоящее время превосходит нас?»)
  3. Статистический прогноз, основанный на исторических данных, когда вы экстраполируете предыдущие тенденции и сезонность, чтобы увидеть, что произойдет, если все останется неизменным (такой же уровень маркетинговой активности у вас и у конкурентов и т. д.).

Второй тип имеет свои достоинства, но если вы сравните подобные Ahrefs / SEMRush / Sistrix в вашу собственную аналитику, вы увидите, насколько сложно это обобщить. Кстати, я не думаю, что первый тип такой же нелепый, как кажется, но я не буду вдаваться в подробности в этой статье. В любом случае шаблон в этом посте подходит к типу 3.

Что делает этот прогноз для SEO?

Почему, вообще ничего. Одна вещь, которую вы заметите в моем описании третьего типа выше, — это то, что в нем не упоминается ничего, относящегося к SEO. Это также может относиться, например, к прямому трафику. Тем не менее, есть несколько причин, по которым я предлагаю это специально в качестве прогноза SEO:

  • Мы в блоге Moz, и я консультант по SEO.
  • Есть более эффективные методики, доступные для многих другие каналы.

Я упоминал, что второй тип выше очень сложен, и это связано с крайне недетерминированной природой SEO и в целом низким качеством подробных данных в Search Console и других платформах, ориентированных на SEO. Кроме того, чтобы получить точное представление о сезонности, вам нужно будет хранить данные Search Console как минимум пару лет.

Для многих других каналов существуют высококачественные подробные исторические данные и взаимосвязь намного более предсказуемы, что позволяет делать более детальные прогнозы. Например, для платного поиска инструмент Forecast Forge, о котором я упоминал выше, учитывает такие факторы, как данные о конверсиях на уровне ключевых слов и цена за клик на основе ваших исторических данных, что было бы совершенно непрактично для SEO.

сказал, что мы все еще можем комбинировать несколько типов прогнозов в шаблоне ниже. Например, вместо того, чтобы прогнозировать трафик вашего сайта в целом, вы можете спрогнозировать вложенные папки отдельно или отдельно для брендов / небрендов, а затем применить процентный рост к определенным областям или внести ожидаемые изменения рейтинга. Но мы забегаем вперед…

Как использовать шаблон

БЕСПЛАТНЫЙ ШАБЛОН
Первое, что вам нужно сделать, это сделать копию (в меню «Файл» в левом верхнем углу , но автоматический со ссылкой, которую я включил). Это означает, что вы можете ввести свои собственные данные и поиграть, сколько душе угодно, и вы всегда можете вернуться и получить новую копию позже, если она вам понадобится.

Затем на первой вкладке вы заметите, что в некоторых ячейках есть зеленая или синяя подсветка:

Вы должны изменять значения только в цветных ячейках.

Синие ячейки в столбце E в основном предназначены для того, чтобы убедиться, что все в конечном итоге правильно помечено на выходе. Так, например, если вы вставляете данные сеанса, данные о кликах или данные о доходах, вы можете установить этот ярлык. Точно так же, если вы введете начальный месяц 2018-01 и 36 месяцев исторических данных, вывод прогноза начнется в январе 2021 года.

В этом случае это должны быть данные за месяц — это один из компромиссов для простоты I упомянутый ранее. Вы можете вставить исторические ежемесячные данные за последние десять лет в столбец B, начиная с ячейки B2, но есть несколько вещей, о которых вам нужно позаботиться:

  • Вам нужны данные не менее 24 месяцев, чтобы модель имела хорошее представление о сезонности. (Если в ваших исторических данных есть только один январь, и это был всплеск трафика, как мне узнать, разовое это событие или ежегодное?)
  • Вам нужны полные месяцы. Поэтому, если вы читаете это 25 марта 2021 года, последний месяц данных, которые вы должны включить, — февраль 2021 года.

Убедитесь, что вы также удалили все остатки данных из моего примера в столбце B.

Выходы [19659008] После того, как вы это сделаете, вы можете перейти на вкладку «Outputs», где вы увидите что-то вроде этого:

Столбец C, вероятно, тот, который вас интересует. Имейте в виду, что он полон формулы здесь, но вы можете скопировать и вставить как значения на другой лист или просто перейти в меню «Файл»> «Загрузить»> «Значения, разделенные запятыми», чтобы получить необработанные данные.

Вы заметите, что я показываю только прогноз на 15 месяцев в этот график по умолчанию, и я рекомендую вам сделать то же самое. Как я упоминал выше, неявное предположение прогноза состоит в том, что исторический контекст сохраняется, если вы явно не включите в свою модель измененные сценарии, такие как блокировка COVID (подробнее об этом чуть позже!). Вероятность того, что это предположение сохранится на два или три года вперед, мала, поэтому, хотя я и предоставил прогнозные значения на будущее, вы должны помнить об этом.

Показанные верхняя и нижняя границы соответствуют 95% уверенности. интервалы — опять же, вы можете повторить, что это означает, в моем предыдущем посте, если хотите.

Расширенные варианты использования

Вы, возможно, уже заметили вкладку «Дополнительно»:

Хотя я сказал, что хочу Я чувствовал, что, учитывая все, что произошло в 2020 году, многим людям придется учесть основные внешние факторы в своей модели.

В приведенном выше примере я заполнил столбец B переменной, показывающей, находилась ли Великобритания под запретом COVID. Я использовал «0,5», чтобы обозначить, что мы ввели изоляцию в середине марта.

Вы, вероятно, можете сделать это лучше с учетом факторов, имеющих отношение к вашему бизнесу, но есть несколько важных моментов, о которых следует помнить. tab:

  • Можно оставить его полностью нетронутым, если вы не хотите добавлять эти дополнительные переменные.
  • Идите слева направо — столбец C можно оставить пустым, если вы используете столбец B, но он не правильно оставлять поле B пустым, если вы используете C.
  • Если вы используете «фиктивную» переменную (например, «1» для чего-то активного), вам необходимо убедиться, что вы заполнили нули в других ячейках по крайней мере на период ваших исторических данных.
  • Вы можете ввести будущие значения — например, если вы прогнозируете блокировку COVID в марте 2021 года (сволочь!), вы можете ввести что-то в эту ячейку, чтобы оно было включено в прогноз .
  • Если вы не вводите будущие значения, модель будет делать прогноз на основе этого числа, равного нулю в будущем. Таким образом, если вы ввели «брендированный PPC активен» в качестве фиктивной переменной для исторических данных, а затем оставили его пустым для будущих периодов, модель будет предполагать, что вы отключили брендированный PPC в будущем.
  • Добавление слишком большого количества данных здесь слишком мало исторических периодов приведет к так называемому «переобучению» — я не хочу вдаваться в подробности, поэтому эта вкладка называется «Advanced», но постарайтесь не увлекаться.

Вот некоторые примеры использования этой вкладки, которые вы должны рассмотреть:

  • Укажите, была ли активна брендированная PPC (0 или 1)
  • Укажите, показываете ли вы телеобъявления или нет
  • Введите блокировки COVID
  • Введите обновления алгоритма значимые для вашего бизнеса (одна колонка на каждое обновление)

Почему мои оценки отличаются от ваших старых оценок? Один из них неверен?

Есть два основных различия в методах между этим шаблоном и моим старым инструментом:

  • В старом инструменте использовалась библиотека причинного воздействия Google, в новом шаблоне используется регрессия обыкновенных наименьших квадратов.
  • Старый инструмент Инструмент зафиксировал нелинейные тенденции, используя квадрат периода времени в качестве прогнозной переменной (например, месяц 1 = 1, месяц 2 = 4, месяц 3 = 9 и т. д.) и попытался подогнать кривую трафика к этой кривой. Это называется квадратичной регрессией. Новый инструмент фиксирует нелинейные тенденции, подбирая каждый временной период как кратное предыдущему временному периоду (например, месяц 1 = X * месяц 2, где X может быть любым значением). Это называется моделью AR (1).

Если вы видите значительную разницу в значениях прогноза между этими двумя, это почти наверняка сводится ко второй причине, и, хотя она добавляет немного сложности, в огромном В большинстве случаев новый метод более реалистичен и гибок.

Также гораздо меньше шансов предсказать нулевой или отрицательный трафик в случае серьезного нисходящего тренда, что хорошо.

Как это работает?

В шаблоне есть скрытая вкладка, на которой вы можете взглянуть, но краткая версия — это формула электронной таблицы «ЛИНЕЙН ()».

Я использую следующие входные данные:

  • Зависимые переменные
    • Все, что вы указали в столбце B на вкладке входов (например, трафик)
  • Независимые переменные
    • Линейная передача время
    • Трафик за предыдущий период
    • Фиктивные переменные за 11 месяцев (12-й месяц представлен другими 11 переменными, все равны 0)
    • До трех «продвинутых» переменных

Формула затем выдает серию «коэффициентов» в качестве выходных данных, которые можно умножить на значения и сложить вместе, чтобы сформировать прогноз, например:

  • Трафик «Временной период 10» = Перехват + (Временной коэффициент * 10) + (Коэффициент предыдущего периода * Трафик периода 9)

На этом скрытом листе я пометил и закодировал цветом многие результаты формулы Linest, которые могут помочь вам начать работу, если вы захотите поиграться с ней самостоятельно. [19659007] Возможные расширения

Если вы действительно хотите поиграть с этим самостоятельно, вот некоторые из них: поскольку я лично имею в виду дальнейшее расширение, которое может вас заинтересовать:

  • Ежедневные данные вместо ежемесячных, с еженедельной сезонностью (например, спад каждое воскресенье)
  • Встроенные цели роста (например, ввести 20% рост к концу 2021 года)

Ричард Ферги чей инструмент Forecast Forge, о котором я упоминал несколько раз выше, также предоставил некоторые отличные предложения по повышению точности прогнозов при довольно ограниченной дополнительной сложности:

  • Сглаживайте данные и избегайте отрицательных прогнозов в крайних случаях, используя log () входных данных и предоставляя экспоненту выходных данных (сглаживание данных может быть, а может и не быть хорошей вещью в зависимости от вашей точки зрения!).
  • Регресс к предыдущим 12 месяцам вместо использования предыдущего 1 месяца + сезонность (для этого требуются минимальные исторические данные за 3 года)

Я могу или не могу включить некоторые или все над собой со временем, но в этом случае я обязательно воспользуюсь той же ссылкой и запишу ее в таблице, чтобы в этой статье всегда была ссылка на самую последнюю версию.

Если у вас есть зашли так далеко, что бы вы хотели увидеть? Дайте мне знать в комментариях!

Комментарии запрещены.