Кластерный анализ объединяет различные процедуры, используемые для проведения классификации. Под кластером понимают группу объектов, обладающую свойством плотности, дисперсией, отделимостью от других кластеров, формой, размером.
Задача сложна тем, что мы сравниваем страны не по - одному какому - либо параметру, а по нескольким параметрам одновременно.
Использование кластер-анализа для решения данной задачи наиболее эффективно. В общем случае кластер-анализ предназначен для объединения некоторых объектов в классы (кластеры) таким образом, чтобы в один класс попадали максимально схожие, а объекты различных классов максимально отличались друг от друга. Количественный показатель сходства рассчитывается заданным способом на основании данных, характеризующих объекты.
Шаг первый - Иерархическая классификация. Для начала работы в статистике запускаем таблицу с данными. Далее выбираем Кластерный анализ, а в рабочем окне программы STATISTICA выбираем пункт Анализ, затем стартовую панель самого Кластерного анализа. Выбираем метод Иерархической кластеризации. Выбираем нужные переменные, в поле Объекты выбираем Наблюдения (строки). В качестве правила объединения отмечаем Метод полной связи, в качестве меры близости - Евклидово расстояние.
Метод полной связи определяет расстояние между кластерами как наибольшее расстояние между любыми двумя объектами в различных кластерах (т.е. "наиболее удаленными соседями"). Мера близости, определяемая евклидовым расстоянием, является геометрическим расстоянием в n- мерном пространстве.
Наиболее важным результатом, получаемым в результате древовидной кластеризации, является иерархическое дерево. Выбираем опцию Вертикальная диаграмма.
На рисунке 7, представленном ниже, получили результат, который включил в себя следующие данные: количество переменных, равные 9, количество наблюдаемых стран - 65, правило объединения и метрику расстояния. Эти данные будем использовать для построения диаграммы результата, где страны будут разбиты на кластеры.
Рисунок 7 - Результат вычислений
Каждый узел диаграммы, приведенной ниже на рисунке 8, представляет объединение нескольких кластеров, положение узлов на вертикальной оси определяет расстояние, на котором были объединены соответствующие кластеры. На расстоянии 500 можно выделить 3 класса, в него попали следующие страны - Китай, Германия и Япония.
Рисунок 8 - Диаграмма результата
Второй шаг - Кластеризация методом К-средних. Исходя из визуального представления результатов, можно сделать предположение, что страны образуют около семи естественных кластеров. Проверим данное предположение, разбив исходные данные методом К-средних на 7 кластеров, и проверим значимость различия между полученными группами. В Стартовой панели модуля Кластерный анализ выбираем Кластеризация методом К средних. Получаем результаты дисперсионного анализ (рисунок 9).
Исходя из амплитуды (и уровней значимости) F-статистики, все переменные являются главными при решении вопроса о распределении объектов по кластерам.
Рисунок 9 - Результат дисперсионного анализа
Коррупция, как системная проблема России
Тема
курсовой работы является несомненно актуальной в настоящее время. Коррупция,
как социальное явление своими корнями уходит в глубокую древность, но свое
масштабное становление она получила уже в современном обществе. Она стала
обыденностью общества в России, которая давно переросла в системную проблему.
Ур ...
Инфляционные процессы в Республике Беларусь, их последствия и принимаемые антиинфляционные меры
Инфляция
является неотъемлемым атрибутом рыночного хозяйства, оказывающим неоднозначное
воздействие на экономику. В результате инфляции растет денежная масса.
Некоторый рост денежной массы (до 10% в год) создает стимул для увеличения
объема выпускаемой продукции, ускоряет платежный оборот, способствует
активизац ...