Дерево решений (на примере данных о клиентах розничной сети)
ВВЕДЕНИЕ
Современные условия, в которых функционируют информационные системы, предполагают использование неструктурированных данных и эффективных средств для работы с ними. Они собирают и обрабатывают огромные объемы быстро поступающей цифровой информации и анализируют её, находя определенные закономерности, что позволяет разработать системы для классификации и прогнозирования. Совсем недавно стало популярно использование машинного обучения, в основе которой лежат большие данные. Эта технология получила широкое распространение за счет того, что существует большой спектр сфер, где её можно использовать для решения задач.
Своевременная разработка и принятие правильного решения – главные задачи работы управленческого персонала любой организации. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего решения или исходов испытаний, то применяют схему, называемую деревом решений.
Актуальность выбранной темы объясняется тем,
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
РАЗДЕЛ 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ КЛАССИФИКАЦИИ ДАННЫХ 5
1.1. Сущность и значение классификации данных 5
1.2. Алгоритмы классификации данных 6
1.3. Инструментальные средства классификации данных 9
РАЗДЕЛ 2 КЛАССИФИКАЦИЯ ДАННЫХ О КЛИЕНТАХ РОЗНИЧНОЙ СЕТИ МЕТОДОМ ДЕРЕВА РЕШЕНИЙ В АНАЛИТИЧЕСКОЙ ПЛАТФОРМЕ ФОРСАЙТ 13
2.1. Анализ предметной области 13
2.2. Алгоритм дерева решений 14
2.3. Методика проведения дерева решений 16
2.4. Оценка полученных результатов 27
ЗАКЛЮЧЕНИЕ 33
СПИСОК ЛИТЕРАТУРЫ 34
СПИСОК ЛИТЕРАТУРЫ
1. 10 самых популярных алгоритмов машинного обучения знаний [Электронный ресурс]. – URL: https://mcs.mail.ru/blog/samye-populyarnye-algoritmy-mashinnogo-obucheniya (дата обращения: 30.11.2022)
2. 13 лучших инструментов для анализа данных знаний [Электронный ресурс]. – URL: https://new-science.ru/13-luchshih-instrumentov-dlya-analiza-dannyh/ (дата обращения: 28.11.2022)
3. 2.3. Решающие деревья знаний [Электронный ресурс]. – URL: https://academy.yandex.ru/handbook/ml/article/reshayushchiye-derevya (дата обращения: 30.11.2022)
4. Data Mining знаний [Электронный ресурс]. – URL: https://www.sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami/data-mining#TOC-Classification- (дата обращения: 20.11.2022).
5. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. - СПб.: Питер, 2017. - 88 с.
6. Гид по органической косметике. Она правда популярнее обычной? Как её отличить? знаний [Электронный ресурс]. – URL: https://mastera.academy/organic-cosmetics-guide/?ysclid=lb3nqmcqjw313489205 (дата обращения: 30.11.2022)
7. Две разные косметики: органическая и синтетическая знаний [Электронный ресурс]. – URL: https://biozka.ru/blog/item/two-different-cosmetics-organic-and-synthetic/?ysclid=lb3mnbwsw1179412944 (дата обращения: 29.11.2022)
8. Дерево решений: понятие, алгоритм работы, сферы применения метода знаний [Электронный ресурс]. – URL: https://gb.ru/blog/derevo-reshenij/?ysclid=lb3n7ygxk9545161821 (дата обращения: 30.11.2022)
9. Деревья решений: общие принципы знаний [Электронный ресурс]. – URL: https://loginom.ru/blog/decision-tree-p1?ysclid=lb3n6yev35288542217 (дата обращения: 30.11.2022)
10. Задача классификации (Classification problem) знаний [Электронный ресурс]. – URL: https://wiki.loginom.ru/articles/classification-problem.html?ysclid=lb3n3ruvgd280106134 (дата обращения: 30.11.2022)
11. Иванько, А. Ф. IT-технологии обучения и их применение в различных сферах / А. Ф. Иванько, М. А. Иванько, К. А. Гаврилов. — Текст: непосредственный // Молодой ученый. — 2019. — № 1 (239). — С. 5-10. — URL: https://moluch.ru/archive/239/55351/ (дата обращения: 30.11.2022)
12. Кацов И. Машинное обучение для бизнеса и маркетинга. - СПб.: Питер, 2019. - 512 с.
13. Классификаторы машинного обучения знаний [Электронный ресурс]. – URL: https://machinelearningmastery.ru/machine-learning-classifiers-a5cc4e1b0623/?ysclid=lb3mzirwp8985917871 (дата обращения: 29.11.2022)
14. Классификация (Classificati
Инструменты классификации, в соответствии с используемыми методами, делятся на следующие категории: правила, деревья решений, нейронные сети, метод опорных векторов и другие.
Для того чтобы систематизировать большой массив разрозненных данных используются специальные компьютерные программы. Они предназначены для анализа, сортировки и классификации файлов, в которых содержатся цифровые таблицы, тексты и изображения, описывающие разнообразные факты и явления. С помощью программных инструментов осуществляется проверка, преобразование и визуализация данных перед их размещением в информационных базах.
Weka – это набор инструментов визуализации и алгоритмов для анализа данных и прогностического моделирования. Все они доступны бесплатно по лицензии GNU General Public License. Более конкретно, Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации и визуализации. Для людей

