Автозакупки
Закупкам
Снабжению
Корпоративным каталогам
Поставщикам
Закупкам
Снабжению
Корпоративным каталогам
Поставщикам
Алгоритм автоматического подбора товара для промышленного маркетплейса
ИИ-алгоритм, который сопоставляет позиции из закупочных заявок предприятий с товарами в каталоге маркетплейса. Разбирает текстовое описание промышленной номенклатуры в различных вариациях написания — арматура, трубы, электрооборудование, метизы, КИПиА — извлекает технические характеристики и находит точное или допустимое соответствие в каталоге поставщиков. Работает как ядро подбора маркетплейса: получает заявку, возвращает подобранные товары с ценами и сроками.
Ключевое отличие:
Точность подбора 92–96% на сложной промышленной номенклатуре (задвижки, насосы, КИПиА с ГОСТ/ТУ-спецификациями), время подбора одной позиции — менее 2 секунд. Оператор маркетплейса обрабатывает только позиции, по которым алгоритм не уверен — доля таких позиций снижается по мере дообучения модели.
Зачем это нужно?
Проблема
Ручной подбор товара оператором маркетплейса занимает от нескольких минут до 15 минут на позицию в зависимости от сложности номенклатуры; при потоке 100 000 позиций/месяц трудозатраты достигают 20 000+ часов
Хаос номенклатуры: например, одна и та же задвижка 30с41нж Ду150 Ру16 встречается в заявках как «задв. клин. ст. фл. DN150 PN16 30с41нж», «Задвижка стальная 150мм 16атм ГОСТ 8437», «Gate valve 30с41нж 6"» — десятки вариантов написания
Ошибки ручного подбора приводят к возвратам, простою производства, потере доверия к маркетплейсу
Каталог маркетплейса — миллионы SKU от сотен поставщиков с разной детализацией описания: от полной спецификации до «труба 100 мм»
Масштабирование при текущем уровне автоматизации ограничено: рост потока заявок требует пропорционального роста штата операторов
Решение
Алгоритм использует трехуровневую архитектуру подбора:
Парсинг заявки: NLP-разбор свободного текста позиции — извлечение структурированных параметров (тип изделия, материал, DN/PN, ГОСТ/ТУ, марка стали, класс точности)
Каскадная фильтрация: многоэтапный пайплайн отбора кандидатов — bi-encoder для быстрого векторного поиска по всему каталогу → cross-encoder для точного переранжирования топ-K → LLM-reranker для семантической оценки → LLM-expert для финального обоснования выбора SKU
Контроль уверенности: confidence scoring для каждого подбора; автоматическая передача на ручную проверку при уверенности ниже порога
Основные функции
(01)
Интеллектуальный парсинг позиций заявки
  • Извлечение из текстового запроса: тип продукта, типоразмер (DN/PN, сечение, длина), материал/марка стали, стандарт (ГОСТ, ТУ, ISO), исполнение, дополнительные требования.
  • Обработка аббревиатур, жаргонизмов, опечаток: «задв.» → задвижка, «нж» → нержавеющая сталь, «10атм» → PN10.
  • Работа с составными позициями: «Комплект: задвижка + ответные фланцы + крепеж» → 3 отдельные позиции.
  • Определение обязательных и желательных параметров для каждого типа продукта.
(02)
Нормализация каталога и кросс-референсинг
  • Единая таксономия промышленных товаров: 12 000+ категорий, 850+ нормализованных атрибутов.
  • Автоматический маппинг между стандартами: ГОСТ 8732 ↔ ISO 9329, ГОСТ 9544 ↔ EN 12266.
  • Справочник взаимозаменяемости: эквиваленты по материалам (09Г2С ↔ P355NL1), по типоразмерам (Ду → DN → NPS).
  • Нормализация каталогов поставщиков при онбординге — приведение к единой структуре атрибутов.
(03)
Каскадный алгоритм подбора
  • Bi-encoder: быстрый векторный поиск по всему каталогу — формирование широкого пула кандидатов за миллисекунды; эффективно масштабируется на миллионы SKU.
  • Cross-encoder: точное попарное переранжирование топ-K кандидатов с учетом технических параметров (DN, PN, материал, стандарт) — отсев несоответствий по «hard»-характеристикам.
  • LLM-reranker: семантическая оценка соответствия с учетом отраслевого контекста, норм взаимозаменяемости и неявных требований — ранжирование по «soft»-параметрам (производитель, наличие, срок поставки, цена).
  • LLM-expert: финальное обоснование выбора SKU, генерация предложений функциональных аналогов с указанием отличий при отсутствии точного соответствия.
(04)
Confidence scoring и маршрутизация
  • Каждый подбор получает score 0–100% с декомпозицией по параметрам.
  • Автоподбор (score ≥ 95%) — позиция передается в заказ без участия оператора.
  • Проверка оператором (score 70–95%) — алгоритм предлагает топ-3 варианта, оператор подтверждает.
  • Экспертная обработка (score < 70%) — позиция передается в ручную обработку с контекстом парсинга.
  • Обратная связь: решения операторов и экспертов используются для дообучения модели.
Ключевые характеристики
Параметр
Значение
Точность подбора (precision на автоподборе)
92-96% на промышленной номенклатуре
Доля позиций, обрабатываемых автоматически (без оператора)
70-85% на этапе зрелой эксплуатации
Доля позиций на ручной проверке оператора
10–25%
Доля позиций на экспертной обработке
5–10%
Время подбора одной позиции
менее 2 секунд
Размер каталога
до 12 000 000 SKU
Число нормализованных категорий
12 000+
Кросс-стандарты
ГОСТ, ТУ, ISO, DIN, ANSI, EN
Обработка новых каталогов поставщиков
менее 48 часов на онбординг
Самообучение
Дообучение по решениям операторов, цикл — 1 неделя
Пропускная способность
до 500 000 позиций/месяц на инстанс
Сценарии применения
(01)
Массовый подбор стандартной номенклатуры (трубы, метизы, кабель)
Цель:
Автоматизация подбора для типовых позиций с однозначной спецификацией
Эффект:
85–92% позиций подбираются автоматически за менее чем 1 секунду; обработка десятков тысяч позиций в день одним инстансом без участия оператора
(02)
Подбор сложной промышленной арматуры и оборудования
Цель:
Корректный подбор задвижек, клапанов, насосов, КИПиА с учетом ГОСТ/ТУ, материала, исполнения, климатического класса
Эффект:
Точность 92–96% при 65–75% автоподбора; оператор подтверждает нетривиальные случаи — экономия 60–70% времени на сложных позициях
(03)
Обработка заявок с неполной спецификацией
Цель:
Работа с заявками, где указано «насос центробежный 50 м³/ч» без ГОСТ, марки, исполнения
Эффект:
LLM-reranker и LLM-expert предлагают топ-5 подходящих вариантов с ранжированием и обоснованием; заказчик уточняет выбор — цикл подбора сокращается с нескольких дней переписки до минут
(04)
Подбор аналогов при отсутствии позиции в каталоге
Цель:
При отсутствии запрошенного товара — автоматическое предложение функциональных аналогов с указанием отличий
Эффект:
Часть заявок, ранее уходивших «в никуда», конвертируется в заказы; рост выполнения заявок в сегменте составляет несколько процентных пунктов
Ценность для заказчика
Операционная эффективность
Расчет приведен для маркетплейса с потоком 100 000 позиций/месяц (1,2 млн/год). Эффект пропорционален объему.
Статья эффекта
База расчета
Допущение
Оценка
Статья эффекта
Сокращение трудозатрат операторов на подбор
База расчета
20 000 ч/год × средний ФОТ оператора ~760 руб./ч
Допущение
Автоматизация 75% объема
Оценка
11 400 000 руб.
Статья эффекта
Снижение ошибок подбора → меньше возвратов и простоев у заказчиков
База расчета
Текущая доля ошибок 5–8%, снижение до 1–2%
Допущение
Средняя стоимость возврата в портфеле
Оценка
2 500 000 – 4 800 000 руб.
Статья эффекта
Ускорение обработки заявки → рост конверсии
База расчета
Текущий цикл 1–2 дня → минуты; конверсия ускоренной заявки выше
Допущение
Рост конверсии маркетплейса на 8–12%
Оценка
5 000 000 – 8 500 000 руб.
Статья эффекта
Подбор аналогов → рост выполнения заявок
База расчета
Доля заявок с отсутствующей позицией — 5–10%
Допущение
Конверсия аналогов 25–35%
Оценка
1 500 000 – 3 200 000 руб.
Статья эффекта
Удержание заказчиков за счет скорости и точности
База расчета
LTV заказчиков платформы
Допущение
Снижение оттока на 5–10%
Оценка
1 500 000 – 2 500 000 руб.
Итого:
22 000 000 – 30 500 000 руб.
Главный эффект
Масштабирование маркетплейса без пропорционального роста штата операторов: рост потока заявок в несколько раз не требует пропорционального роста команды.
Стратегические преимущества
Системные эффекты
Нормализованная база товаров и заявок — фундамент для предиктивной аналитики, ценового мониторинга и автозакупок.
Данные о паттернах спроса: какие товары запрашиваются чаще, какие категории растут — ценность для поставщиков и расширения каталога.
Сетевой эффект: с ростом объема обработанных заявок качество подбора растет — барьер для конкурентов.
Экономика проекта
Показатель
1-й год
2-й год и далее
Показатель
Затраты
1-й год
12 млн руб. (внедрение)
2-й год и далее
4 млн руб. (поддержка)
Показатель
Ожидаемая экономия
1-й год
22 – 30,5 млн руб.
2-й год и далее
22 – 30,5 млн руб.
Показатель
Чистый эффект
1-й год
10 – 18,5 млн руб.
2-й год и далее
18 – 26,5 млн руб.
Срок окупаемости:
5–7 месяцев при указанных параметрах потока заявок. При меньшем объеме — пропорционально дольше.