Ученые T-Bank AI Research создали новый метод для ускорения алгоритмов рекомендаций и их разнообразия

18

Ученые из T-Bank AI Research создали новый метод Sampled Maximal Marginal Relevance (SMMR), который позволяет до 10% быстрее и разнообразнее формировать рекомендации на онлайн-платформах по сравнению с другими известными в науке методами, сообщается на сайте банка.

 

Разработка команды российских ученых из T-Bank AI Research открывает новые возможности для крупнейших финтех-компаний, медиа и социальных сетей, онлайн-кинотеатров, маркетплейсов и др. Метод помогает создавать более персонализированные подборки под интересы пользователя, но не зацикливающиеся на одном типе контента. В итоге платформы, внедрившие SMMR, будут становиться удобнее и интереснее — и для пользователя, и для бизнеса.

 

Т-Банк планирует в первую очередь внедрять новый метод в собственные цифровые сервисы для повышения качества рекомендаций — в Т-Шопинге — для формирования более широких и гибких товарных подборок, и в социальной сети Пульс — для повышения разнообразия в пользовательской ленте.

 

Результаты исследования были признаны мировым научным сообществом и представлены на одной из ведущих конференций в области машинного обучения и ИИ по информационному поиску уровня, А* — 48-й международной конференции по информационному поиску ACM SIGIR (проходит в итальянской Падуе с 13 по 18 июля 2025).

 

Суть открытия

 

Традиционные алгоритмы стремятся подбирать максимально подходящие объекты — товары, фильмы, новости — основываясь на предпочтениях пользователя. Однако такой подход нередко приводит к однотипным рекомендациям, формируя так называемый «информационный пузырь», когда пользователь видит только те товары или контент, которые схожи с его предыдущими интересами. Например, если пользователь часто смотрит комедии, модели персонализации будут показывать только этот жанр, не предлагая альтернатив. Аналогичная проблема наблюдается и в новостных лентах: алгоритм фиксирует клики на самые заметные заголовки и начинает продвигать похожий контент, даже если сам материал не интересен пользователю или его потребности в информации намного шире.

 

Метод SMMR решает эту проблему за счет вероятностного выбора: вместо того чтобы каждый раз отдавать предпочтение одному наиболее релевантному объекту, алгоритм случайным образом выбирает из ограниченного круга подходящих вариантов. Такой подход обеспечивает большее разнообразие контента и помогает пользователю открывать новое знание.

 

Помимо повышения разнообразия, SMMR также работает быстрее, чем его известные аналогии — MMR (Maximal Marginal Relevance) и DPP (Determinantal Point Process). Алгоритм выбирает несколько объектов за одну итерацию и увеличивает объем выборки с каждым шагом, что снизило количество необходимых шагов с 100 до 5–10 на размере выборки из 3000 кандидатов. В результате новая методика оказалась в 2–10 раз быстрее MMR и DPP и при этом обеспечила рост разнообразия рекомендаций на 5–10%.

 

Уникальность метода

 

Метод SMMR представляет собой развитие классических подходов к формированию разнообразных рекомендаций и отличается рядом принципиальных особенностей:

 

- Вероятностный подход к выбору

В отличие от традиционных методов, которые на каждом шаге выбирают наиболее релевантный объект, SMMR использует вероятностную выборку из ограниченного числа кандидатов. Это позволяет повысить разнообразие без значительной потери релевантности.

 

- Пакетная выборка с увеличивающимся размером

Алгоритм формирует рекомендации не по одному, а по нескольким элементам, постепенно увеличивая их размер. Такой подход позволяет существенно ускорить работу модели, особенно на больших выборках, за счет снижения количества итераций.

 

- Управляемый уровень случайности

Метод включает параметр «температуры», регулирующий степень случайности при выборе объектов. Это дает возможность настраивать алгоритм под конкретные задачи — от консервативного отбора до большего разнообразия в выдаче.

 

- Высокая масштабируемость на больших данных

За счет снижения вычислительной сложности SMMR эффективно работает на больших объемах данных. Для списков из нескольких тысяч объектов алгоритм требует в 10–100 раз меньше итераций, чем классические подходы.

 

- Простота интеграции в существующую инфраструктуру

Метод легко встраивается в текущие рекомендательные системы. Это снижает издержки на внедрение и упрощает адаптацию технологии для бизнес-задач.

 

Рекомендательные системы сегодня выполняют гораздо более сложную задачу, чем просто угадывать интересы пользователя. Их цель — предлагать контент, который человек мог бы не обнаружить самостоятельно. Например, при поиске книг в интернет-магазине традиционные алгоритмы обычно рекомендуют 10 произведений одного жанра, исходя из предпочтений пользователя. В отличие от них, технология SMMR дополняет подборку 2–3 книгами из других жанров — научно-популярными изданиями или триллерами — которые могут заинтересовать пользователя, но ранее не попадали в поле зрения алгоритма. Такой подход помогает найти оптимальный баланс между точностью рекомендаций и элементом неожиданности, что способствует повышению вовлеченности и расширению пользовательского опыта.

 

Применение метода SMMR может принести практическую пользу как бизнесу, так и пользователям. Для цифровых платформ это означает рост удовлетворенности аудитории: рекомендации становятся не только релевантными, но и разнообразными, что помогает удерживать внимание и повышать вовлеченность. Например, стриминговый сервис вместо десяти однотипных фильмов теперь может предложить пять предсказуемых и пять неожиданных, но потенциально интересных вариантов. Это также способствует более равномерному охвату каталога — больше единиц контента получают шанс быть показанными, что выгодно для продавцов, производителей и агрегаторов. Для пользователей это открывает новые возможности: вместо зацикленности на одном жанре или товарной категории они получают разнообразные предложения, что делает взаимодействие с сервисом более осмысленным и персонализированным.

 

Метод SMMR успешно протестирован на трех открытых датасетах: MovieLens (фильмы), Dunnhumby (покупки) и MIND (новости). Он демонстрирует стабильные результаты как в потребительских сценариях (подбор фильмов, товаров), так и в более динамичных — например, в рекомендациях новостей.

 

Метод размещен в открытой библиотеке Т-Банка на Github.com

https://www.tbank.ru/

Источник: RFinance

ПОДЕЛИСЬ С ДРУЗЬЯМИ: