Кластерный анализ
Введение
Кластерный анализ - это набор математических методов, предназначенных для формирования «далеких» друг от друга групп на основе информации о расстоянии или отношениях (близости) между «близкими» друг к другу объектами, распознавание образов без наблюдения.
На самом деле, «кластерный анализ» - это общий термин для довольно большого набора алгоритмов, используемых для создания классификаций.
Первое применение кластерного анализа было в социологии. Название «кластерный анализ» происходит от английского слова cluster (скопление, стадо); впервые предмет был определен и описан исследователем Трионом в 1939 году. Основная цель кластерного анализа - разделить изучаемое множество объектов и признаков на соответствующие однородные группы или кластеры. Другими словами, решается задача классификации данных и выявления в них соответствующей структуры.
Содержание
Введение 3
1 Кластерный анализ 4
1.1 Основные понятия 4
1.2 Применение кластерного анализа 5
1.3 Задачи кластерного анализа 7
2 Методы кластерного анализа 11
2.1 Метод ближнего соседа (Single linkage clustering) 11
2.2 Метод дальнего соседа (Complete linkage clustering) 14
2.3 Метод k-средних 17
Заключение 21
Список использованных источников 22
Список использованных источников
Сокэл Р.Р. Кластерный анализ и классификация: предпосылки и основные направления. В кн: Классификация и кластер /Под ред. Дж.Вэн Райзина М: Мир, 1980, стр. 7-19.
Мандель И.Д. Кластерный анализ. М.: Финансы и статистика, 1988, стр.176
Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. М.: Высшая школа, 2004, стр. 479.
Енюков И.С. Факторный, дискриминантный и кластерный анализ. М:Финансы и статистика, 1989, стр. 215.
Айвазян С. А., Енюков И. С, Мешалкин Л. Д. О структуре и содержании пакета программ по прикладному статистическому анализу//Алгоритмическое и программное обеспечение прикладного статистического анализа.—М., 1980.
Интернет ресурсы: http://dic.academic.ru/dic.nsf/ruwiki/238149Мандель И.Д. Кластерный анализ. - М.: Финансы и статистика. 1988. - 176с.
Интернет ресурсы: https://ru.wikipedia.org/wiki/Кластерный анализ
Факторный, дискриминантный и кластерный анализ: Пер с англ./Дж. - О.Ким, Ч.У.Мьюллер, У.Р.Клекка и др.; Под ред. И.С.Енюкова. - М.: Финансы и статистика, 1989. Стр.215.
Дюран Б., Оделл П. Кластерный анализ. - М.: Статистика, - 1977, стр.128.
Кластерный анализ наиболее четко отражает характеристики многомерного анализа в классификации и факторного анализа в исследованиях связей.
Подход кластерного анализа иногда называют в литературе числовой таксономией, числовой классификацией или распознаванием с самообучением.
Первое применение кластерного анализа было в социологии. Название кластерного анализа происходит от английского слова cluster, а сам предмет был впервые определен и описан исследователем Трионом в 1939 году. Основная цель кластерного анализа - разделить изучаемое множество объектов и признаков на соответствующие однородные группы или кластеры. Другими словами, решается задача классификации данных и выявления в них соответствующей структуры. Методы кластерного анализа могут применяться в самых разных случаях, даже для простых группировок, образующих группы на основе количественного сходства.
Основным преимуществом кластерного анализа является то, что он позволяет кластеризовать объекты по целым признакам, а не по одному параметру. Также, в отличие от многих математических и статистических методов, кластерный анализ не имеет ограничений на тип объекта и может рассматривать исходные наборы данных практически произвольного характера. Это имеет большое значение, например, в экономическом прогнозировании, где разнообразие показателей затрудняет применение традиционных эконометрических подходов.
Кластерный анализ позволяет резко сократить и сжать большие массивы социально-экономической информации, сделав ее компактной и наглядной, учитывая достаточное количество информации.