Главное Авторские колонки Вакансии Образование
2 326 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Исследование зависимости читаемости писем от попадания в папку “спам”

Почтовые сервисы типа Яндекса или Mail.ru имеют алгоритмы, которые распознают в некоторых письмах спам, но иногда они работают не идеально. Поэтому в корпоративном мире уже привыкли проверять папку “спам”, потому что иногда важные письма оказываются именно там. Мы решили проанализировать нашу рассылку и найти закономерности
Мнение автора может не совпадать с мнением редакции

Какие письма мы рассылаем

Мы собрали в открытых источниках адреса электронной почты компаний России и высылаем на эти адреса заказы на продукцию компании. Например, если это полиграфия в Москве, то такая компания будет получать письма с заказами на печать листовок, визиток и пр. Наша рассылка осуществляется с собственных почтовых серверов, которые настроены по всем правилам.

Как мы собираем данные о результатах рассылки

Мы подключили Postmaster mail.ru и Почтовый офис Яндекса. Последний позволяет смотреть статистику для каждой рассылки отдельно - это и предоставило нам необходимые данные для нашего исследования.

Почтовый офис показывает рассылки только от 100 писем. Для каждой из них обозначены доли: сколько писем прочитано, не прочитано, удалено, спам. Кроме того, можно посмотреть более полный и, надо признать, очень красивый отчет. Результаты также можно агрегировать по всем рассылкам за день, по темам и т.д.

Проблема Почтового офиса в том, что доля прочитанных писем определяется только при чтении из веб-интерфейса почты. Часть людей, особенно в корпоративной среде, читают свою почту с помощью Outlook, The Bat и других почтовых клиентов. Поэтому доля прочитанных писем на самом деле значительно больше.

Мне, к сожалению, не удалось найти статистику Яндекса или другой компании, какая доля их пользователей читает почту из веб-интерфейса, чтобы скорректировать полученные данные. Таким образом, мы знаем, что в абсолютных числах есть погрешность на неизвестный коэффициент, но общий вид зависимости должен быть верным.

Стоит отметить, что наша рассылка идет на разные почтовые службы, а анализ мы проводим только по подмножеству, которое уходит на Яндекс.Почту. Это также может внести систематическую погрешность.

Анализ данных

Мы обработали 113 наших рассылок за октябрь 2014 г. В них оказалось 22 тысячи писем. Результаты рассылок оформили в виде таблицы.

Зависимость доли прочитанных писем от числа писем, упавших в папку "спам", представлена на рисунке ниже. Интересно то, что при увеличении в 2 раза доли писем, которые угодили в "спам", число прочитанных писем уменьшается не в 2 раза, а всего на 25% (примерно). Это говорит о том, что примерно половина компаний регулярно просматривают папку "спам" и читают оттуда письма, которые сочли интересными.

Доля писем, которые Яндекс отправляет в спам, почти не зависит от количества писем в рассылке, что видно из рисунка ниже. Небольшое снижение линии тренда - скорее всего результат статистической погрешности или какой-то скрытой закономерности. Например, возможно, самые большие рассылки у нас идут по тем рубрикам, которые "нравятся" Яндексу по содержанию писем.

Когда у нас появилась идея проанализировать информацию, которую нам предоставляет Яндекс о нашей рассылке, мы рассчитывали, что сможем как-то уменьшить процент писем, которые падают в папку спам. К сожалению, это нам не удалось. Но мы узнали, что примерно половина компаний читает интересные письма из спама – это позитивный фактор для нашего проекта Supl.biz. А вы находите полезные письма в папке "спам"?

Автор статьи: Евгений Дьяченко

+6
В избр. Сохранено
Авторизуйтесь
Вход с паролем