Как оказалось, известные мемы в основном появляются в обсуждении pol на 4chan и в сабреддите the_donald на площадке Reddit, сообщает Lenta.ru. Таким образом, учёным удалось собрать базу из более чем 100 миллионов изображений, распространяемых в сети на порталах Reddit, Twitter, 4chan и Gab, а также 700 тысяч — с портала KnowYourMeme.
При помощи анализа по методу перцептивного хеширования удалось выделить визуально похожие файлы и распределить в разные группы в зависимости от контекста и тональности. Например, расистские, политические, враждебные и так далее.
Наибольшее количество изображений было обнаружено на 4chan, а пользователи Reddit отдают предпочтение политическим мемам. Вирусные картинки преобладают в ветке обсуждения the_donald.
По мнению исследователей, такой алгоритм может пригодиться аналитикам социальных сетей.
