Онлайн-кинотеатры, интернет-магазины и другие интернет-ресурсы используют возможность подбора предложений с помощью коллаборативной фильтрации. Она позволяет сделать подборку для каждого пользователя, исходя из предыдущего выбора посетителей со схожими интересами. В статье расскажем, что это такое и как работает.
Что такое коллаборативная фильтрация
Задача владельцев сайта — создать условия, чтобы пользователь дольше задержался, переходя с одной страницы на другую. Для этого нужен некий путеводитель, направляющий на интересующий контент. В последнее время используют алгоритмы, отслеживающие интересы целевой аудитории.
Алгоритм коллаборативной фильтрации активно используется торговыми площадками. Распространение он получил в социальных сетях, на сайтах, где размещаются фильмы, сериалы, музыка, мастер-классы. Основная цель — привлечь внимание покупателей и посетителей страницы к иным товарам и услугам, которые могли бы заинтересовать пользователя.
Коллаборативная фильтрация полезна для всех: владельцы интернет-ресурсов удерживают посетителей на сайте, продавцы делают допродажи товаров, пользователи экономят время на выборе.
Посетители сайтов нередко видят блоки: «С этим товаром выбирают», «Похожие фильмы» и т.д. Подборка выстраивается путем использования модели коллаборативной фильтрации.
Схема работы фильтрации состоит из нескольких этапов:
-
Система определяет, с какой целью пользователь зашел на сайт. Например, он посетил страничку с блендерами, миксерами.
-
Далее происходит сравнение запроса пользователя с другими посетителями, которых интересует тот же товар. Для анализа берутся клиенты, совершившие покупку.
-
Проводится анализ сопутствующих товаров, которые можно предложить потенциальному покупателю, Например, для блендеров рекомендуется посмотреть чаши для взбивания, средства для ухода за техникой
-
Составляется список рекомендаций.
Где используют
Особенно выгодна фильтрация интересов посетителей для торговых площадок, где предлагается много групп и наименований товаров. К примеру, потенциальный покупатель зашел на сайт интернет-магазина, чтобы выбрать зимнюю куртку. Внизу появляется блок, где дополнительно предлагаются сапоги, шапки и т.д. Посетитель сайта перейдет в другой блок и поинтересуется предложениями. Вполне вероятно, что что-то купит.
Коллаборативную фильтрацию используют онлайн-кинотеатры, когда при просмотре кинофильма внизу можно увидеть ленту с фильмами похожего жанра. А еще крупные сервисы (Amazon, eBay, AliExpress, Netflix) и соцсети (ВКонтакте).
YouTube активно использует алгоритм отбора контента по интересам. После просмотра одного фильма в ленте предложений появляется схожий контент. Рекомендации по следующим видео основываются на том, что пользователи смотрели перед этим.
Пример использования
Больше всего коллаборативная фильтрация помогает интернет-магазинам. Если пользователь сделал заказ, при следующем входе на сайт внизу находится лента с рекомендациями.
Музыкальные сервисы, например, Яндекс.Музыка, предлагают музыкальные подборки, исходя из истории прослушивания контента. Пользователям рекомендуют новые песни понравившихся авторов или новых исполнителей в данном жанре.
Банки в мобильных приложениях размещают предложения, исходя из анализа профиля клиентов, его интересов и потребностей.
Типы
Корни коллаборативной фильтрации уходят в 90-е годы прошлого века. Изначально алгоритмы были простыми, но с годами совершенствовались. Обновления становятся дороже, так как усложняется алгоритм. В настоящее время используется три вида фильтрации.
Основанный на соседстве
Это наиболее дешевый вариант. Работа основана на распределении пользователей по группам интересов. Подключив сюда отзывы, алгоритм объединяет пользователей в сообщества. Им демонстрируется определенный контент. Не всегда оценка интересов бывает верной. Исходя из небольшого количества характеристик, положенных в основу анализа интересов аудитории, прогноз нельзя назвать точным. Однако такой тип пользуется популярностью из-за бюджетной цены и простоты настройки.
Основанный на модели
Данный тип предполагает самообучающийся алгоритм. Работа начинается с выявления закономерностей и воплощения их в определенные модели. Метод отличают точность, скорость, минимизация ошибок.
Тип, основанный по принципу соседства, уступает модельному методу по числу и точности рекомендаций. Но не все применяют его. Чаще всего препятствием является высокая стоимость внедрения и риск потери важной информации.
Гибридный
Третий тип позволяет избежать потери информации и гарантирует высокую точность. Единственный недостаток — высокая стоимость.
Проблемы
Интернет-ресурсы получают большие преимущества, используя коллаборативную фильтрацию. Но есть проблемы, о которых не следует забывать.
Разреженность данных. Для того чтобы правильно определить интересы аудитории, нужны оценки. Особенно сложно применять алгоритм для новых сайтов, если на них выставлено много товаров, а посещений и оценок мало. Система не может собрать достаточное количество данных для анализа.
Масштабируемость. Для изучения интересов пользователей и составления списка рекомендаций используется матрица. Когда достаточно много пользователей интернет-ресурса и выставленных на сайте товаров, матрица получается объемной, что затрудняет и замедляет анализ. Однако получение перечня рекомендаций требует оперативности.
Контролируйте выполнение показателей, увеличьте количество заявок для отдела продаж и выяснить количество лидов и стоимость привлечения лида с помощью Системы сквозной аналитики MANGO OFFICE. Система соберет в единый отчет цифры из коллтрекинга, CRM-системы, веб-метрик и рекламных площадок.
Проблема холодного старта. Особая проблема возникает при запуске сайта. Еще нет достаточной информации о новых товарах/услугах. Но эта проблема решается проще. Разработчики пользуются общими характеристиками по схожим товарам, которые уже выставлены в интернете. С анализом посетителей сайта работа строится сложнее. Трудно дать рекомендации, так как нет базы отзывов и покупок, на которые можно ориентироваться при создании перечня.
Синонимия. Товары, выполняющие одни и те же функции, могут называться по-разному. Например, мобильный телефон называется смартфон. Системе сложно ориентироваться в синонимах, поэтому круг рекомендации может быть меньше, чем на самом деле имеется подходящих товаров. Из-за этого посетители интернет-ресурса не находят нужной вещи и покидают сайт.
Мошенничество. Информация может оказаться недостоверной из-за нечестной конкуренции. Компании, предлагающие идентичный товар, размещают негативные отзывы от имени покупателей на сайте конкурента. Алгоритм сбивается, а информация до посетителей интернет-ресурса доходит в искаженном виде.
Разнообразие. Соперничество мелких бизнесменов с крупными компаниями оказывается неудачным для первых. Использование коллаборативной фильтрации позволяет размещать оценки качества продукции ото всех производителей. Малый бизнес ищет в этом спасение. Однако сайты чаще всего не набирают достаточного количества оценок.
Белые вороны. Бывает, что по одному и тому же товару есть множество хороших оценок, но несколько негативных отзывов дополняют картину. Однако их мнение при выстраивании рекомендаций не берется в расчет.
Выводы
-
Коллаборативная фильтрация представляет собой алгоритм, позволяющий изучать потребности пользователей интернет-ресурсов и на основе анализа выдавать список рекомендаций.
-
С ее помощью продавцы товаров увеличивают продажи, а владельцы интернет-ресурсов удерживают внимание посетителей и стараются подтолкнуть их к переходу на другие страницы. Есть несколько типов фильтрации, отличающихся по стоимости и эффективности.
-
Алгоритм применяется в социальных сетях, на сайтах интернет-магазинов, на ресурсах, на которых размещается развлекательный контент.