Инстаграм поделился новыми деталями о работе машинного обучения, которое формирует в соцсети индивидуальные ленты с рекомендациями.
Основным открытием стало то, что алгоритм ориентируется не на отдельные посты, а на вероятный интерес пользователя к аккаунту в целом.
Инстаграм находит интересные профили при помощи метода “word embedding.” В его рамках анализируется окружение слов и их связи.
Алгоритм начинает работу с изучения понравившихся пользователю аккаунтов (контент которых он лайкал и сохранял), находит похожие профили и из них выбирает 500 публикаций. В выборку не попадает спам, дезинформация и нарушающие правила записи (близкие к этому, по мнению машинного обучения).
Ранжируется выдача с учетом того, какова вероятность, что пост пользователю понравится. 25 лучших записей попадают в топ.