Алгоритм автоматического подбора товара для промышленного маркетплейса

Главная

Наши проекты

Автозакупки

Закупкам

Снабжению

Корпоративным каталогам

Поставщикам

Закупкам

Снабжению

Корпоративным каталогам

Поставщикам

Алгоритм автоматического подбора товара для промышленного маркетплейса

ИИ-алгоритм, который сопоставляет позиции из закупочных заявок предприятий с товарами в каталоге маркетплейса. Разбирает текстовое описание промышленной номенклатуры в различных вариациях написания — арматура, трубы, электрооборудование, метизы, КИПиА — извлекает технические характеристики и находит точное или допустимое соответствие в каталоге поставщиков. Работает как ядро подбора маркетплейса: получает заявку, возвращает подобранные товары с ценами и сроками.

Ключевое отличие:

Точность подбора 92–96% на сложной промышленной номенклатуре (задвижки, насосы, КИПиА с ГОСТ/ТУ-спецификациями), время подбора одной позиции — менее 2 секунд. Оператор маркетплейса обрабатывает только позиции, по которым алгоритм не уверен — доля таких позиций снижается по мере дообучения модели.

Зачем это нужно?

Проблема

Ручной подбор товара оператором маркетплейса занимает от нескольких минут до 15 минут на позицию в зависимости от сложности номенклатуры; при потоке 100 000 позиций/месяц трудозатраты достигают 20 000+ часов

Хаос номенклатуры: например, одна и та же задвижка 30с41нж Ду150 Ру16 встречается в заявках как «задв. клин. ст. фл. DN150 PN16 30с41нж», «Задвижка стальная 150мм 16атм ГОСТ 8437», «Gate valve 30с41нж 6"» — десятки вариантов написания

Ошибки ручного подбора приводят к возвратам, простою производства, потере доверия к маркетплейсу

Каталог маркетплейса — миллионы SKU от сотен поставщиков с разной детализацией описания: от полной спецификации до «труба 100 мм»

Масштабирование при текущем уровне автоматизации ограничено: рост потока заявок требует пропорционального роста штата операторов

Решение

Алгоритм использует трехуровневую архитектуру подбора:

Парсинг заявки: NLP-разбор свободного текста позиции — извлечение структурированных параметров (тип изделия, материал, DN/PN, ГОСТ/ТУ, марка стали, класс точности)

Каскадная фильтрация: многоэтапный пайплайн отбора кандидатов — bi-encoder для быстрого векторного поиска по всему каталогу → cross-encoder для точного переранжирования топ-K → LLM-reranker для семантической оценки → LLM-expert для финального обоснования выбора SKU

Контроль уверенности: confidence scoring для каждого подбора; автоматическая передача на ручную проверку при уверенности ниже порога

Основные функции

(01)

Интеллектуальный парсинг позиций заявки

Извлечение из текстового запроса: тип продукта, типоразмер (DN/PN, сечение, длина), материал/марка стали, стандарт (ГОСТ, ТУ, ISO), исполнение, дополнительные требования.
Обработка аббревиатур, жаргонизмов, опечаток: «задв.» → задвижка, «нж» → нержавеющая сталь, «10атм» → PN10.
Работа с составными позициями: «Комплект: задвижка + ответные фланцы + крепеж» → 3 отдельные позиции.
Определение обязательных и желательных параметров для каждого типа продукта.

(02)

Нормализация каталога и кросс-референсинг

Единая таксономия промышленных товаров: 12 000+ категорий, 850+ нормализованных атрибутов.
Автоматический маппинг между стандартами: ГОСТ 8732 ↔ ISO 9329, ГОСТ 9544 ↔ EN 12266.
Справочник взаимозаменяемости: эквиваленты по материалам (09Г2С ↔ P355NL1), по типоразмерам (Ду → DN → NPS).
Нормализация каталогов поставщиков при онбординге — приведение к единой структуре атрибутов.

(03)

Каскадный алгоритм подбора

Bi-encoder: быстрый векторный поиск по всему каталогу — формирование широкого пула кандидатов за миллисекунды; эффективно масштабируется на миллионы SKU.
Cross-encoder: точное попарное переранжирование топ-K кандидатов с учетом технических параметров (DN, PN, материал, стандарт) — отсев несоответствий по «hard»-характеристикам.
LLM-reranker: семантическая оценка соответствия с учетом отраслевого контекста, норм взаимозаменяемости и неявных требований — ранжирование по «soft»-параметрам (производитель, наличие, срок поставки, цена).
LLM-expert: финальное обоснование выбора SKU, генерация предложений функциональных аналогов с указанием отличий при отсутствии точного соответствия.

(04)

Confidence scoring и маршрутизация

Каждый подбор получает score 0–100% с декомпозицией по параметрам.
Автоподбор (score ≥ 95%) — позиция передается в заказ без участия оператора.
Проверка оператором (score 70–95%) — алгоритм предлагает топ-3 варианта, оператор подтверждает.
Экспертная обработка (score < 70%) — позиция передается в ручную обработку с контекстом парсинга.
Обратная связь: решения операторов и экспертов используются для дообучения модели.

Ключевые характеристики

Параметр

Значение

Точность подбора (precision на автоподборе)

92-96% на промышленной номенклатуре

Доля позиций, обрабатываемых автоматически (без оператора)

70-85% на этапе зрелой эксплуатации

Доля позиций на ручной проверке оператора

10–25%

Доля позиций на экспертной обработке

5–10%

Время подбора одной позиции

менее 2 секунд

Размер каталога

до 12 000 000 SKU

Число нормализованных категорий

12 000+

Кросс-стандарты

ГОСТ, ТУ, ISO, DIN, ANSI, EN

Обработка новых каталогов поставщиков

менее 48 часов на онбординг

Самообучение

Дообучение по решениям операторов, цикл — 1 неделя

Пропускная способность

до 500 000 позиций/месяц на инстанс

Сценарии применения

(01)

Массовый подбор стандартной номенклатуры (трубы, метизы, кабель)

Цель:

Автоматизация подбора для типовых позиций с однозначной спецификацией

Эффект:

85–92% позиций подбираются автоматически за менее чем 1 секунду; обработка десятков тысяч позиций в день одним инстансом без участия оператора

(02)

Подбор сложной промышленной арматуры и оборудования

Цель:

Корректный подбор задвижек, клапанов, насосов, КИПиА с учетом ГОСТ/ТУ, материала, исполнения, климатического класса

Эффект:

Точность 92–96% при 65–75% автоподбора; оператор подтверждает нетривиальные случаи — экономия 60–70% времени на сложных позициях

(03)

Обработка заявок с неполной спецификацией

Цель:

Работа с заявками, где указано «насос центробежный 50 м³/ч» без ГОСТ, марки, исполнения

Эффект:

LLM-reranker и LLM-expert предлагают топ-5 подходящих вариантов с ранжированием и обоснованием; заказчик уточняет выбор — цикл подбора сокращается с нескольких дней переписки до минут

(04)

Подбор аналогов при отсутствии позиции в каталоге

Цель:

При отсутствии запрошенного товара — автоматическое предложение функциональных аналогов с указанием отличий

Эффект:

Часть заявок, ранее уходивших «в никуда», конвертируется в заказы; рост выполнения заявок в сегменте составляет несколько процентных пунктов

Ценность для заказчика

Операционная эффективность

Расчет приведен для маркетплейса с потоком 100 000 позиций/месяц (1,2 млн/год). Эффект пропорционален объему.

Статья эффекта

База расчета

Допущение

Оценка

Статья эффекта

Сокращение трудозатрат операторов на подбор

База расчета

20 000 ч/год × средний ФОТ оператора ~760 руб./ч

Допущение

Автоматизация 75% объема

Оценка

11 400 000 руб.

Статья эффекта

Снижение ошибок подбора → меньше возвратов и простоев у заказчиков

База расчета

Текущая доля ошибок 5–8%, снижение до 1–2%

Допущение

Средняя стоимость возврата в портфеле

Оценка

2 500 000 – 4 800 000 руб.

Статья эффекта

Ускорение обработки заявки → рост конверсии

База расчета

Текущий цикл 1–2 дня → минуты; конверсия ускоренной заявки выше

Допущение

Рост конверсии маркетплейса на 8–12%

Оценка

5 000 000 – 8 500 000 руб.

Статья эффекта

Подбор аналогов → рост выполнения заявок

База расчета

Доля заявок с отсутствующей позицией — 5–10%

Допущение

Конверсия аналогов 25–35%

Оценка

1 500 000 – 3 200 000 руб.

Статья эффекта

Удержание заказчиков за счет скорости и точности

База расчета

LTV заказчиков платформы

Допущение

Снижение оттока на 5–10%

Оценка

1 500 000 – 2 500 000 руб.

Итого:

22 000 000 – 30 500 000 руб.

Главный эффект

Масштабирование маркетплейса без пропорционального роста штата операторов: рост потока заявок в несколько раз не требует пропорционального роста команды.

Стратегические преимущества

Системные эффекты

Нормализованная база товаров и заявок — фундамент для предиктивной аналитики, ценового мониторинга и автозакупок.

Данные о паттернах спроса: какие товары запрашиваются чаще, какие категории растут — ценность для поставщиков и расширения каталога.

Сетевой эффект: с ростом объема обработанных заявок качество подбора растет — барьер для конкурентов.

Экономика проекта

Показатель

1-й год

2-й год и далее

Показатель

Затраты

1-й год

12 млн руб. (внедрение)

2-й год и далее

4 млн руб. (поддержка)

Показатель

Ожидаемая экономия

1-й год

22 – 30,5 млн руб.

2-й год и далее

22 – 30,5 млн руб.

Показатель

Чистый эффект

1-й год

10 – 18,5 млн руб.

2-й год и далее

18 – 26,5 млн руб.

Срок окупаемости:

5–7 месяцев при указанных параметрах потока заявок. При меньшем объеме — пропорционально дольше.