Главное Авторские колонки Вакансии Образование
😼
Выбор
редакции
41 813 2 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как раскачать профиль Facebook и оценить силу связей

Основатель Школы траблшутеров Олег Брагинский провел гигантский эксперимент и проанализировал связи в сети на 6,3 млн участников. О процессе и выводах он обстоятельно рассказал Spark.

Всегда удивляло, для чего ко мне добавляются незнакомцы. Сначала в соединении отказывал, затем решил: «Приму всех, достигну ограничения в 5’000 и проблема отсева исчезнет». Но тут повалили фоловеры, которых уже набралось 10’000. Задался вопросом: «Кто все эти люди и зачем вообще кому-то нужна социальная сеть?»

С Александром Яценко, коллегой по «Бюро Брагинского», решили изучить феномен групповой дружбы и подглядывания. Договорились создать алгоритм, оценивающий профили участников сети по:

  • связности — количеству налаженных соединений;
  • активности — свежести публикуемой информации;
  • реактивности — частоте реагирования на посты друзей.

Ввели обозначения:

  • 0-й участник — я, чей профиль подвергли изучению;
  • 1-й круг — друзья, с кем связан в пределах 5’000 соединений;
  • 2-й круг — друзья друзей, которых в максимальном случае будет 25 млн;
  • подписчики — односторонние контакты людей, отслеживающих мою ленту;
  • претенденты — участники сети, подавшие запрос на дружбу с 0-м участником.

Зарисовали схему предстоящего эксперимента, наметив последовательность прохождения от 0-го к 37-му шагу в двумерном пространстве вышеописанных списков:

Учитывая неторопливость Facebook, действовали поэтапно:

  • пролистывали страницы до ограничивающего маркера;
  • сохраняли html-файлы для последующей обработки;
  • разбирали накопленное, заполняя базу данных.

Пролистывание списка друзей 0-го участника заняло 34 минуты...

... и принесло неожиданный результат: вместо 5’000 соединений удалось обнаружить лишь 4’986 (1):

Визуальный просмотр сохранённой страницы раскрыл тайну — 14 друзей оказались мёртвыми душами (2) ...

... и при попытке зайти в подобные профили, сеть сообщала о деактивации страниц:

Пришлось написать скрипт определения действительности профилей (3) ...

... и снова нас ожидал сюрприз — мёртвых душ в 1-м круге обнаружилось не 14, а целых 47 или 9,4% (4):

Оказалось, что 48% друзей имели 250–750 связей (5), и лишь 11% использовали сеть по максимуму (6) ...

... при этом количество одинаковых связей в 98% случаев не превышало 120 общих знакомых (7) и лишь для 1% друзей превосходило значение 180 (8):

Отложив отключение несуществующих друзей на потом, приступили к оценке мощности сети 2-го уровня (9) ...

... и выяснили, что вместо ожидаемых 25 млн (5’000 друзей по 5’000 связей) 0-й участник имеет доступ к 6,3 млн человек (10) — четверти от максимального потенциала, при том что 50,7 тысяч связей (11) не уникальны:

Перешли к сбору друзей 2-го круга...

и столкнулись с ожидаемым, но неприятным препятствием — Facebook ограничивает суточный объём информации, который можно выкачать из чужих профилей...

... поставили процедуру сохранения страниц на таймер, что позволило за 26 суток добыть 20 Гб данных...

... после чего запустили парсинг в 50 потоков (12),

который за 142 минуты (13)...

...выделил 759 тысяч наиболее связанных участников сети 0-го участника (14),

... превратившихся в 484 тысячи после проверки на уникальность (15):

Выгрузка связей 2-го круга показала нулевое пересечение с контактами нулевого участника (16 и 17):

Карта связанности 200 наиболее общительных друзей подтвердила высокую повторяемость контактов 1-го и 2-го кругов:

Чтобы оценить активность друзей 0-го участника в собственных профилях, запустили сбор даты и времени 15 последних личных постов,

... и после парсинга, который длился для каждого в среднем по 83 секунды,

... с удивлением обнаружили, что 7,3% сети (18) сообщали о себе миру более года назад, а 39,8% публикуются не реже раза в месяц (19):

Снова, отложив отключение редко пишущих друзей на последний этап, сохранили профили подписчиков. Потратили на всех 56 секунд (20):

И ещё по 6 секунд (21) занял парсинг в 50 потоков профиля каждого,

...чтобы определить разочаровывающе низкое количество друзей у подписчиков, стремящееся к нулю (22 и 23). Вероятно большинство наблюдает за происходящим в сети, не вступая в социальные контакты:

Уже привычным способом собираем по 15 постов подписчиков:

Предсказуемо подтверждаем гипотезу о пассивности: 54,8% публикуются в два раза реже участников 1-го круга (24), но 9,3% делают репосты в полтора раза чаще друзей 0-го участника (25), что насторожило.

Но интрига раскрылась так же быстро, как и была замечена: Facebook позволяет просматривать, а следовательно, и выгружать лишь 500 подписчиков, выбирая наиболее активных.

Перешли к сохранению профилей претендентов:

Оказалось, что обладают сетью контактов ниже среднего контакта 0-го участника (26 и 27),

и в 66% случаев не блещут частотой пополнения личных страниц (28), что особенно странно для девушек. Прочие же публикуются даже чаще участников 1-го круга, вероятно наращивая влияние в сети (29):

Посты 2-го круга решили не выгружать, оценив время операции как неприемлемое в рамках текущего эксперимента.

Приближая момент истины, сохранили 1’000 постов 0-го участника:

И столкнулись с обилием публикаций санкционированного авторства друзей с моим упоминанием (30), а также с тем, что Facebook не отдаёт список участников сети, отреагировавших на пост (31):

Поэтому пришлось сохранять мою ленту, параллельно сохраняя html-страницы отреагировавших участников сети, дописывая в файлы тег фиктивной связи с соответствующими постами,

...чтобы получить персонализированные реакции (32):

Находка не порадовала: друзья слабо реагируют на посты 0-го участника, в 71% случаев отметившись за три года под постами единожды (33), а 10 наиболее позитивных контактов дали 16% всех реакций (34):

Как и следовало ожидать, друзья, имеющие больше контактов (горизонталь), реже выражают реакции (вертикаль) под давлением количества доступных постов:

Активность контактов 0-го участника на топ-200 постов наглядно демонстрирует вялость интереса к публикациям:

Поведение подписчиков тоже оказалось более чем грустным (35 и 36):

Но претенденты не реагировали на мои посты от слова «совсем» (37), поэтому изучили доступные операции с постами, спроектировали развесовку потенциальных действий контактов (38),

...построили интегральный рейтинг реактивности участников сети, отмечающих посты 0-го участника (39 и 40),

...чтобы составить хит-парад наиболее дружелюбных контактов:

Финальным аккордом эксперимента стало построение пространства реакций, демонстрирующее, что при потенциале в 25 млн соединений и максимально возможном объёме реакций в 175 млн баллов (41) мне удалось построить сеть в 6,3 млн участников, дающих 11’207 реакций (42), вместо ожидаемых 44,4 млн (43):

Отключили мёртвых друзей, пассивных подписчиков и слабо соединённых претендентов, не реагировавших на мои посты, высвободили слоты на подключения (44) с надеждой на то, что новые контактёры будут активнее.

Подключили наиболее соединённых, активных и реагирующих претендентов, увеличили мощность сети на 0,9% или 56 тысяч участников (45), потеряв 0,2% или 111 пассивных контактов (46):

Что дальше:

  1. Благодаря достигнутой автоматизации смогу определять тихонько отписавшихся друзей.
  2. Не стану присоединять слабо соединённых, пассивных и не реагирующих.
  3. Как только достигну предела связей, повторю эксперимент и отчитаюсь.

Наставления идущим следом:

  1. Не радуйтесь большому количеству контактов, среди них до 10% будут неактивными.
  2. Принимая дружбу, помните, что многосвязные физически не смогут подбадривать.
  3. Проверяйте как часто участник сети делал публикации в собственной ленте.
  4. Будьте готовы к повторяемости трети связей 1-го и 2-го уровней.
  5. Примите за факт: сеть Facebook алгоритмически асоциальна.

Читайте также:

Российский предприниматель опубликовал видео в Facebook и стал мемом у американских спасателей

Как «инженер-задрот из деревни» за неделю собрал $2 млн на «тамагочи для хакеров»

Как мы покоряли Tiktok: история и ноу-хау от Bloome

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем