Ученые T-Bank AI Research создали новый метод для ускорения алгоритмов рекомендаций и их разнообразия

 
Ученые из T-Bank AI Research создали новый метод Sampled Maximal Marginal Relevance (SMMR), который позволяет до 10% быстрее и разнообразнее формировать рекомендации на онлайн-платформах по сравнению с другими известными в науке методами, сообщается на сайте банка.
 
Разработка команды российских ученых из T-Bank AI Research открывает новые возможности для крупнейших финтех-компаний, медиа и социальных сетей, онлайн-кинотеатров, маркетплейсов и др. Метод помогает создавать более персонализированные подборки под интересы пользователя, но не зацикливающиеся на одном типе контента. В итоге платформы, внедрившие SMMR, будут становиться удобнее и интереснее — и для пользователя, и для бизнеса.
 
Т-Банк планирует в первую очередь внедрять новый метод в собственные цифровые сервисы для повышения качества рекомендаций — в Т-Шопинге — для формирования более широких и гибких товарных подборок, и в социальной сети Пульс — для повышения разнообразия в пользовательской ленте.
 
Результаты исследования были признаны мировым научным сообществом и представлены на одной из ведущих конференций в области машинного обучения и ИИ по информационному поиску уровня, А* — 48-й международной конференции по информационному поиску ACM SIGIR (проходит в итальянской Падуе с 13 по 18 июля 2025).
 
Суть открытия
 
Традиционные алгоритмы стремятся подбирать максимально подходящие объекты — товары, фильмы, новости — основываясь на предпочтениях пользователя. Однако такой подход нередко приводит к однотипным рекомендациям, формируя так называемый «информационный пузырь», когда пользователь видит только те товары или контент, которые схожи с его предыдущими интересами. Например, если пользователь часто смотрит комедии, модели персонализации будут показывать только этот жанр, не предлагая альтернатив. Аналогичная проблема наблюдается и в новостных лентах: алгоритм фиксирует клики на самые заметные заголовки и начинает продвигать похожий контент, даже если сам материал не интересен пользователю или его потребности в информации намного шире.
 
Метод SMMR решает эту проблему за счет вероятностного выбора: вместо того чтобы каждый раз отдавать предпочтение одному наиболее релевантному объекту, алгоритм случайным образом выбирает из ограниченного круга подходящих вариантов. Такой подход обеспечивает большее разнообразие контента и помогает пользователю открывать новое знание.
 
Помимо повышения разнообразия, SMMR также работает быстрее, чем его известные аналогии — MMR (Maximal Marginal Relevance) и DPP (Determinantal Point Process). Алгоритм выбирает несколько объектов за одну итерацию и увеличивает объем выборки с каждым шагом, что снизило количество необходимых шагов с 100 до 5–10 на размере выборки из 3000 кандидатов. В результате новая методика оказалась в 2–10 раз быстрее MMR и DPP и при этом обеспечила рост разнообразия рекомендаций на 5–10%.
 
Уникальность метода
 
Метод SMMR представляет собой развитие классических подходов к формированию разнообразных рекомендаций и отличается рядом принципиальных особенностей:
 
- Вероятностный подход к выбору
В отличие от традиционных методов, которые на каждом шаге выбирают наиболее релевантный объект, SMMR использует вероятностную выборку из ограниченного числа кандидатов. Это позволяет повысить разнообразие без значительной потери релевантности.
 
- Пакетная выборка с увеличивающимся размером
Алгоритм формирует рекомендации не по одному, а по нескольким элементам, постепенно увеличивая их размер. Такой подход позволяет существенно ускорить работу модели, особенно на больших выборках, за счет снижения количества итераций.
 
- Управляемый уровень случайности
Метод включает параметр «температуры», регулирующий степень случайности при выборе объектов. Это дает возможность настраивать алгоритм под конкретные задачи — от консервативного отбора до большего разнообразия в выдаче.
 
- Высокая масштабируемость на больших данных
За счет снижения вычислительной сложности SMMR эффективно работает на больших объемах данных. Для списков из нескольких тысяч объектов алгоритм требует в 10–100 раз меньше итераций, чем классические подходы.
 
- Простота интеграции в существующую инфраструктуру
Метод легко встраивается в текущие рекомендательные системы. Это снижает издержки на внедрение и упрощает адаптацию технологии для бизнес-задач.
 
Рекомендательные системы сегодня выполняют гораздо более сложную задачу, чем просто угадывать интересы пользователя. Их цель — предлагать контент, который человек мог бы не обнаружить самостоятельно. Например, при поиске книг в интернет-магазине традиционные алгоритмы обычно рекомендуют 10 произведений одного жанра, исходя из предпочтений пользователя. В отличие от них, технология SMMR дополняет подборку 2–3 книгами из других жанров — научно-популярными изданиями или триллерами — которые могут заинтересовать пользователя, но ранее не попадали в поле зрения алгоритма. Такой подход помогает найти оптимальный баланс между точностью рекомендаций и элементом неожиданности, что способствует повышению вовлеченности и расширению пользовательского опыта.
 
Применение метода SMMR может принести практическую пользу как бизнесу, так и пользователям. Для цифровых платформ это означает рост удовлетворенности аудитории: рекомендации становятся не только релевантными, но и разнообразными, что помогает удерживать внимание и повышать вовлеченность. Например, стриминговый сервис вместо десяти однотипных фильмов теперь может предложить пять предсказуемых и пять неожиданных, но потенциально интересных вариантов. Это также способствует более равномерному охвату каталога — больше единиц контента получают шанс быть показанными, что выгодно для продавцов, производителей и агрегаторов. Для пользователей это открывает новые возможности: вместо зацикленности на одном жанре или товарной категории они получают разнообразные предложения, что делает взаимодействие с сервисом более осмысленным и персонализированным.
 
Метод SMMR успешно протестирован на трех открытых датасетах: MovieLens (фильмы), Dunnhumby (покупки) и MIND (новости). Он демонстрирует стабильные результаты как в потребительских сценариях (подбор фильмов, товаров), так и в более динамичных — например, в рекомендациях новостей.
 
Метод размещен в открытой библиотеке Т-Банка на Github.com
https://www.tbank.ru/
Источник: RFinance

Материал просмотрен: 44 раз
Комментарии (0)добавить комментарий
Ваш комментарий
Автор
Введите число на картинке

  • курсы
Знач. Изм.
USD ЦБ РФ 14/07 77.89 77.8855
EUR ЦБ РФ 14/07 91.12 91.1201