Кластеризация товара

Бизнес-задача: кластеризовать товар по схожести технических характеристик на три уровня. На третьем уровне достигается взаимозаменяемость товара.
Дополнительно добавить деление по ценовым сегментам.
Кластеризация позволят проводить аналитику по совокупностям схожих товаров (по кластерам), оптимизировать процессы закупа, хранения и наполнения сети товаром.
Некоторые этапы на пути к реализации модели:
- написание SQL запросов для получения исходных данных,
- очистка данных от нерелевантных значений,
- многоуровневый отбор наиболее подходящих признаков,
- ранжирование признаков,
- функция понижения размерности для генерации оптимальных по размеру кластеров.
Краткое описание скриншотов:
1) пример кода создания ценовых сегментов,
2) пример визуализации ценовых сегментов,
3) матрица корреляций для проверки на мультиколлинеарность признаков,
4) пример функции понижения размерности,
5) пример итогового результата кластеризации, экспортированный в Excel.
Октябрь, 2023