Тайны ИИ на Авито: что происходит за кулисами?

Искусственный интеллект уже настолько интегрирован в нашу повседневную жизнь, что его присутствие зачастую остаётся незамеченным. Многие из нас ежедневно используют различные платформы и сервисы, не задумываясь о том, что за их эффективностью и удобством стоят сложные ИИ-алгоритмы. Примером такой платформы является один из крупнейших сервисов для размещения объявлений Авито.

На Авито нейросети играют ключевую роль в оптимизации поиска и сортировки объявлений, анализируют поведение пользователей, их предпочтения и предыдущие запросы, чтобы предложить наиболее релевантные объявления и товары. О том, какие ещё продукты и сервисы на базе ИИ внедряют на платформе, и за что они отвечают (спойлер: примерно за всё), рассказал редакции The GEEK директор по данным Авито Андрей Рыбинцев.

Где на Авито можно встретиться с искусственным интеллектом?

С момента знакомства с платформой человек соприкасается с ИИ. При регистрации алгоритмы проверяют, похож ли аккаунт на недобросовестный, при публикации объявления помогают его заполнить и подскажут, по какой цене обычно продают такой товар. Есть алгоритмы, которые помогают планировать бюджет на продвижение. Лента подстраивается индивидуально под каждого человека, не будет двух людей с одинаковой подборкой объявлений.

Общий подход такой: если можно сделать алгоритм, который упростит жизнь пользователя на Авито и защитит от злоумышленников, мы его создаем. И такие улучшения можно встретить на каждом шагу пользовательского пути. За это отвечает команда AvitoTech. В ней сегодня работают 1800 инженеров, мы все разработки делаем внутри.

Как нейросеть помогает создавать объявление?

Рассмотрим на конкретном примере — создание объявления по продаже кроссовок. Сначала добавляете фото. Компьютерное зрение определяет, что на нем кроссовки, после чего подсказывает категорию для размещения. Дальше нужно заполнить поля с основными параметрами вроде бренда, размера, материала, цвета. Из них нейросеть собирает логичное стройное описание. Больше нюансов — качественнее текст. Потом его можно скорректировать самому или попросить нейросеть предложить ещё варианты.

Таким образом, даже в таком простом процессе задействованы сразу несколько ИИ-алгоритмов. Сначала алгоритм Image-to-text генерирует описание по изображению товара. Потом эту информацию берет большая языковая модель, дополняет её той информацией, которую заполнил человек в описании, и генерирует финальный текст.

Кроме мелких бытовых вещей на Авито большое количество объявлений по продаже недвижимости, в частности квартир. Для продавца один из самых сложных моментов при продаже квартиры — поставить правильную цену. Сделать это могут не все, так как обычные люди продают недвижимость один или два раза в жизни.

Определение рыночной цены — та фича, которая здорово экономит время, нервы и деньги пользователей. Алгоритм использует подход профессиональных оценщиков: изучает похожие объявления, анализирует десятки параметров и предлагает цену. Но, в отличие от живого человека, алгоритм может учитывать как открытые объявления, так и уже закрытые, а также оценивать не только стоимость квадратного метра, локацию, состояние объекта, но и время экспозиции. Это то, как долго объявление размещено.

Чтобы не возникало проблем с оценкой недвижимости в разных регионах, Авито использует две модели:

  • Глобальная — смотрит на все объекты и хорошо предсказывает в среднем
  • Локальная — учитывает местные нюансы ценообразования

Например, когда в конкретном городе на двух соседних улицах цены сильно различаются из-за того, что на одной престижно жить, есть прямой доступ к озеру или какая-то местная достопримечательность, а на второй этого уже нет. Локальная модель подправляет прогноз глобальной, чтобы дать более точную оценку, с учётом рекомендаций пользователей.

Аналогичным образом можно оценить стоимость автомобиля и смартфона. В первом случае алгоритм учитывает марку, модель, комплектацию и год выпуска, пробег, цвет, тип кузова и ряд других необходимых для оценки вещей. Для оценки смартфона достаточно заполнить всего шесть полей и получить интервал, в рамках которого обычно продаются аналогичные товары в похожем состоянии.

Каким образом внедрение ИИ-алгоритмов повлияло на продвижение объявлений?

В конце 2023 года Авито запустил ИИ-алгоритмы в продвижении объявлений. Принцип работы остался таким же, как и раньше. Так, после запуска продвижения объявление начинает чаще попадать на верхние места в поиске и рекомендациях. Алгоритм же сделал настройку более точной. Теперь на этом этапе пользователь видит интервал, сколько дополнительных просмотров объявления можно получить при определенном дневном бюджете и длительности кампании. Их можно менять с помощью «бегунков» и смотреть на обновленный прогноз.

Также при формировании цены показа мы используем аукционные механики. Вместе с применением ИИ они делают продвижение до 10% эффективнее, чем раньше. Так что это точно стоило наших усилий. Инструментарий универсален и помогает продвигаться в разных категориях: от бетонных конструкций до вакансий.

Как ИИ определяет, кому показывать объявление?

Чем дольше пользователь на Авито, тем точнее мы будем попадать в интересы человека. Для каждого наши алгоритмы строят вектор интересов — это математическое представление, которое учитывает, какие объявления человек ищет, что добавляет в избранное и так далее.

Поскольку платформой пользуются миллионы человек, мы имеем миллионы векторов. Нейросеть находит людей с похожим пользовательским поведением и может определить, какими категориями товаров и услуг те ещё могут заинтересоваться.

Такие же векторы есть и у объявлений, но они формируются на основе текста, картинок, региона и других параметров. Эти векторы помогают собрать кластеры похожих объявлений и сформировать индивидуальную ленту для каждого пользователя.

С технической точки зрения это выглядит следующим образом. Мы оцифровываем более 30 млрд кликов в день, благодаря этому много знаем про паттерны поведения пользователей и можем подстроить ленту спустя пять минут и несколько кликов на платформе. Согласно статистике, 60% пользователей смотрят минимум одну рекомендацию в день. При этом с помощью рекомендаций происходит 40% от всех сделок.

Отвечает за формирование ленты собственная система поискового ранжирования, впервые запущенная в 2018 году. В её основе лежит опенсорсная система полнотекстового поиска, а также стек моделей машинного обучения, ориентированных на решение задач отбора кандидатов и их ранжирования по множеству признаков.

Если опираться на цифры, то для каждого пользователя алгоритмы определяют около трех тысяч подходящих объявлений из базы в почти 220 млн предложений на Авито.

Применяются ли нейросети для повышения безопасности Авито?

С безопасности как раз и начиналось использование алгоритмов и ИИ на Авито. Ежегодно платформой пользуются треть населения России. Мы стараемся сделать так, чтобы пользователи чувствовали себя безопасно на нашей платформе. Ежегодно на эти цели мы тратим 3-5 млрд рублей.

Реклама

В первую очередь работа алгоритмов и команды безопасности касается проверки профилей. Сразу после регистрации и первых действий мы определяем, похож ли аккаунт на недобросовестный. Звоночками могут быть такие аномалии, как подключение прокси-серверов, специальных браузеров для сокрытия конечного устройства и другие системы, популярные у злоумышленников. Также наши алгоритмы умеют понимать поведенческие паттерны и особенности общения пользователей. Когда аккаунт похож на те, что мы уже заблокировали, он отправляется на дополнительную проверку. Если добросовестный пользователь случайно попадает в такую группу, он без проблем пройдет её.

ИИ анализирует около 20 млн объявлений в день, чтобы выявить нарушения. И сегодня 99% недобросовестного контента отсеивают модели анализа изображений и текста. По сути, они заменяют работу 100 тысяч модераторов.

Компьютерное зрение, которое определяет товар и его категорию при подаче объявления, помогает найти запрещённый правилами контент, а также нарушения вроде написанного на изображении номера телефона. При определении фейков алгоритмы изучают, насколько цена в объявлении соответствует рыночной, проверяют, не использовалось ли это изображение где-то ещё.

Сложные случаи обрабатывают наши сотрудники, эксперты по контенту. У нас есть должность детективов, которые расследуют действительно запутанные случаи и дополняют нашу базу знаний.

Каковы дальнейшие перспективы применения ИИ на Авито?

В самых осязаемых планах — повышение эффективности работы алгоритмов. Это нужно, чтобы процент ошибок становился меньше и ещё меньше злоумышленников могли пройти сквозь ИИ-фильтры.

Мы также пристально следим за трендами в развитии генеративных нейросетей и активно тестируем собственные решения в десяти сервисах. Думаю, уже к концу этого года 4 из 10 пользователей Авито будут так или иначе взаимодействовать с генеративным искусственным интеллектом в наших продуктах. Это перспективное направление и с экономической точки зрения. Эффект от использования генеративных нейросетей оцениваем в 2 млрд рублей уже на второй год. Дальше эта сумма вырастет в разы, поэтому активно расширяем команду дата-сайентистов. До конца 2024-го в ней будет уже более 100 сотрудников.

В будущем мы сможем создавать суперперсонализированные маркетинговые кампании, что приблизит нас к формату one-click shopping. А нейросети в пользовательском пути будущего будут выполнять роль универсальных помощников. Например, если вам нужно подобрать подарок человеку определенной профессии и возраста по конкретному случаю, нейросети изучат рынок, выберут подходящие варианты и предложат конкретные объявления с учетом требований по цене, срокам доставки и других параметров. Человеку останется только нажать на кнопку «Купить».

👍 Хочешь больше? Подпишись в Телеграм и VK

Источник:
Подписаться
Уведомить о
0 Комментариев
Межтекстовые Отзывы
Посмотреть все комментарии

Сейчас на главной