Главное Авторские колонки Вакансии Образование
😼
Выбор
редакции
22 478 8 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как проложить кратчайший путь на вершину YouTube

Основатель Школы траблшутеров Олег Брагинский рассказал про разработку алгоритма для подбора сильных названий, описаний и тегов к видеороликам. В ходе эксперимента удалось повысить seo-качество канала на 14,5%.

Опытные блогеры и начинающие пользователи сети действуют вслепую, надеясь на художественность оформления каналов и роликов. Читают тайные форумы, используют покупные плагины, нанимают гроусхакеров, надеясь на мгновенный взлёт популярности, не стыдятся закупать таргетированную рекламу.

Специализированные агентства и фрилансеры обещают золотые горы под разумный бюджет, но по факту перенаправляют половину средств третьим исполнителям, превращаясь в квалифицированных спекулянтов. Странно наблюдать всё это, находясь на территории, которая когда-то славилась крутыми программистами.

С Александром Яценко, коллегой по «Бюро Брагинского», решили показать класс и сформулировали задачу:

  • разработать инструмент, регулярно собирающий статистику YouTube-канала
  • создать алгоритм подбора сильных слов для названий, описаний, тегов
  • научиться прогнозировать просмотры, лайки, дислайки, комментарии.

Итогом исследования предположили технологию, помогающую заполнять текстовые поля видеороликов лучшими фразами по оценке самой сети. Наверняка подобный инструмент могут создать ещё несколько команд в мире, но пускать его в бой мало кто решится, ведь в таком случае соперничество тут же закончится.

Да, признаём, что обошли вниманием вопросы оформления самого канала: шапки и описания, видеовизитки и тегов, создания плейлистов и сортировки видео в горизонтальных рядах, но кто сказал, что мы к этому не вернёмся на следующей итерации, тем более что множественные задумки и значительные наработки уже есть.

Решили не громоздить сложные конструкции, а «починить забор» с помощью палочки и верёвочки. На этот раз отказались от макросов, вспомнив про Python, предлагающий сотни готовых библиотек. Обилие заготовок обнадёжило, но найти подходящие оказалось делом нетривиальным:

На вход скрипту передаём ссылку на YouTube-канал стоматолога-ортодонта Инессы Брагинской:

Собираем перечень плейлистов, для каждого формируем список видео, для роликов сохраняем:

  • количество просмотров, лайков и комментариев
  • название, длительность и дату публикации
  • текстовое описание и список тегов:


После выгрузки собранной информации в Excel получаем первый полезный эффект — становится доступна проверка орфографии. Названий роликов и ошибок, мешающих поиску, оказывается немало:

Вторая находка — пропущенные нумерованные видео, недоступные сюжеты, дублированные ролики в плейлистах. Особо не мешает, но и на пользу точно не идёт:

Третьей победой стало программирование сбора информации канала, настроенного через планировщик заданий Windows на ежедневный сбор показателей в 12:00...

... с сохранением в базу данных SQL Lite для последующего анализа:

Четвёртым шагом построили температурную карту тегов при описании видео — стала отчётливо видна классическая ошибка новичков: использовать слабые однородные слова для всех роликов плейлиста, вместо того чтобы тщательно подбирать индивидуальные ключевые слова к каждому сюжету:

Пятым этапом собрали статистику поисков тегов в Гугл и YouTube, чтобы оценить количество релевантных результатов, после чего повторили операцию для роликов, которые оказывались выше в выдаче при использовании браузера в режиме «инкогнито», что позволило найти «улучшенные» ключевые слова:

На шестой ступени оценили распределение роликов по seo-корзинам:

  1. к первой отнесли 159 видео, набравших менее 50 баллов (1.1)
  2. ко второй — 0 получивших ровно полусотню
  3. к третьей — 12 рекордсменов (3.1):


На седьмом уровне изучили теги третьей корзины...

... и, варьируя параметрами сортировки, подобрали лучшую очерёдность ключевых слов...

...создали таблицу групповых замен тегов по маске названий...

... для видео первой корзины:

...при которой SEO-оценка роликов сразу же становилась не менее чем 48.7...

... улучшив корзинную статистику:

  1. первая «потеряла» всего 9 видео (1.2)
  2. вторая, как и раньше осталась пустой
  3. третья пополнилась из первой (3.2):


Восьмой очередью запустили анализ тегов под видео, которые выдавал YouTube в ответ на уже собранные нами ключевые слова:

Удалив очевидно неподходящие, провели оценку всех слов-претендентов под каждым видео из первой корзины:

Девятым подходом занялись исследованием роликов, получивших SEO-балл выше ожидаемого. Вставляли по одному ключевому слову, чтобы зафиксировать его силу под конкретным видео. Гипотеза оказалась верна: тот же тег под разными роликами приобретал силу от 0 до 13.1 баллов:

Десятым шагом стала попытка вставлять под «не взлетевшими» видео первой корзины...

... сортированную очерёдность индивидуально оценённых тегов с попыткой удаления последних для поиска строки пикового seo-значения...

... что дало новые сдвиги:

Температурная карта ключевых слов предсказуемо улучшилась:

Как, впрочем, и распределение по seo-корзинам:

В ходе эксперимента удалось повысить seo-качество канала на 14,5%:

Переместить все отстающие видео во вторую корзину не вышло из-за слабости найденных тегов, но мы обязательно продолжим эксперименты, тем более что все требуемые программные инструменты уже созданы:

Кстати, стоматологам на заметку:

  1. диагностика грузовиков пользуется большей популярностью, чем аналогичная процедура во рту
  2. зрители надеются удалить камень, поставить импланты, выровнять и отбелить зубы дома
  3. особую тревогу вызывает прикус, влияющий на самооценку, отношения и личную жизнь.

Читайте также:

Самые востребованные языки программирования в 2020 году: топ-5 от системного архитектора Deutsche Bank

Программирование на Python: особенности обучения, перспективы, ситуация на рынке труда

Зачем изучать Racket

Бесплатные курсы программирования от самых лучших ВУЗов мира: подборка

Как бесплатно изучать программирование на Code Basics

+4
В избр. Сохранено
Авторизуйтесь
Вход с паролем