Главная страница --> Экономические научные работы (книги)

Контрольные вопросы по разде .. | Орлов А.И. Математика случая .. | Багиев Г.Л., Асаул А.Н. Орг .. | Ермишин П.Г. Основы экономич .. | Галасюк В. Новое – это хорош .. |


Теория принятия решений: Интервальный кластер-анализ

2.3.9. Интервальный кластер-анализ

 Кластер-анализ, как известно [27], имеет целью разбиение совокупности объектов на группы сходных между собой. Многие методы кластер-анализа основаны на использовании расстояний между объектами. (Степень близости между объектами может измеряться также с помощью мер близости и показателей различия, для которых неравенство треугольника выполнено не всегда.) Рассмотрим влияние погрешностей измерения на расстояния между объектами и на результаты работы алгоритмов кластер-анализа.

 С ростом размерности р евклидова пространства диагональ единичного куба растет как  А какова погрешность определения евклидова расстояния? Пусть двум рассматриваемым векторам соответствуют  и  - вектора размерности р. Они известны с погрешностями  и , т.е. статистику доступны лишь вектора  Легко видеть, что

 (73)

Пусть ограничения на абсолютные погрешности имеют вид

Такая запись ограничений предполагает, что все переменные имеют примерно одинаковый разброс. Трудно ожидать этого, если переменные имеют различные размерности. Однако рассматриваемые ограничения на погрешности естественны, если переменные предварительно стандартизованы, т.е. отнормированы (т.е. из каждого значения вычтено среднее арифметическое, а разность поделена на выборочное среднее квадратическое отклонение).

 Пусть  Тогда последнее слагаемое в (73) не превосходит  поэтому им можно пренебречь. Тогда из (73) следует, что нотна евклидова расстояния имеет вид

с точностью до бесконечно малых более высокого порядка. Если случайные величины  имеют одинаковые математические ожидания и для них справедлив закон больших чисел (эти предположения естественны, если переменные перед применением кластер-анализа стандартизованы), то существует константа С такая, что

с точностью до бесконечно малых более высокого порядка при малых  больших р и

 Из рассмотрений настоящего пункта вытекает, что

 (74)

при некотором  таком, что

 Какое минимальное расстояние является различимым? По аналогии с определением рационального объема выборки при проверке гипотез предлагается уравнять слагаемые в (74), т.е. определять минимально различимое расстояние  из условия

. (75)

Естественно принять, что расстояния, меньшие , не отличаются от 0, т.е. точки, лежащие на расстоянии , не различаются между собой.

 Каков порядок величины С? Если xi и yi независимы и имеют стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1, то, как легко подсчитать,  и соответственно С = 4,51. Следовательно, в этой модели

 Формула (75) показывает, что хотя с ростом размерности пространства р растет диаметр (длина диагонали) единичного куба – естественной области расположения значений переменных, с той же скоростью растет и естественное квантование расстояния с помощью порога неразличимости , т.е. увеличение размерности (вовлечение новых переменных), вообще говоря, не улучшает возможности кластер-анализа.

 Можно сделать выводы и для конкретных алгоритмов. В дендрограммах (например, результатах работы иерархических агломеративных алгоритмах ближнего соседа, дальнего соседа, средней связи) можно порекомендовать склеивать (т.е. объединять) уровни, отличающиеся менее чем на . Если все уровни склеятся, то можно сделать вывод, что у данных нет кластерной структуры, они однородны. В алгоритмах типа «Форель» центр тяжести текущего кластера определяется с точностью  по каждой координате, а порог для включения точки в кластер (радиус шара R) из-за погрешностей исходных данных может измениться согласно (74) на

Поэтому кроме расчетов с R рекомендуется провести также расчеты с радиусами R1 и R2, где

,

и сравнить полученные разбиения. Быть адекватными реальности могут только выводы, общие для всех трех расчетов. Эти рекомендации развивают общую идею [3] о целесообразности проведения расчетов при различных значениях параметров алгоритмов с целью выделения выводов, инвариантных по отношению к выбору конкретного алгоритма.



Похожие по содержанию материалы:
Маркетинг: Менеджмент: Функции менеджмента (планирование, организация, мотивация, контроль), их взаи ..
Маркетинг: Менеджмент: Виды организационных структур управления, принципы проектирования структуры у ..
Сущность, цели и задачи менеджмента - Основы менеджмента ..
Квалификационный справочник: Агент по продаже недвижимости ..
Контрольные вопросы по разделу 2 - Основы менеджмента ..
Орлов А.И. Математика случая: Вероятность и статистика – основные факты: Математическое ожидание ..
Багиев Г.Л., Асаул А.Н. Организация предпринимательской деятельности: Упражнения и вопросы для само ..
Ермишин П.Г. Основы экономической теории: Предмет и метод экономической теории ..
Галасюк В. Новое – это хорошо забытое старое или о необходимости использования «правовой концепции» ..
Акулов В.Б., Рудаков М.Н. Теория организации: Естественные монополии и их регулирование ..
Квалификационный справочник: Ученый секретарь ..
Акулов В.Б., Акулова О.В. Экономическая теория: 20. Вывоз капитала и образование международных моноп ..
Квалификационный справочник: Заведующий (начальник) научно-исследовательским отделом (лабораторией) ..


Похожие документы из сходных разделов


Прикладная статистика: Проверка гипотез: Литература

Часть 2. Основные проблемы прикладной статистики

2.3. Проверка гипотез

Литература

1. Крамер Г. Математические методы статистики  / Пер. с англ. / 2-е изд. - М.: Мир, 1975. – 648 с.

2. Орлов А.И. Метод моментов проверки согласия с параметрическим семейством распределений. – Журнал «Заводская лаборатория». 1989. Т.55. .. читать далее


Стратегии бизнеса: Трансформации бизнеса

ГЛАВА 2. СОЗДАНИЕ, РЕОРГАНИЗАЦИЯ И ЛИКВИДАЦИЯ БИЗНЕСА

2.3. Трансформации бизнеса

Как указывалось в п.2.1, выделяются следующие основные виды трансформаций бизнеса: слияние, присоединение, разделение, выделение, преобразование и объединение предприятий. Поскольку под этими терминами могут скрываться разные понятия, определим их с юридической стороны.

читать далее


Гольдштейн Г.Я. Стратегические аспекты управления НИОКР: Основные типы реакций фирмы на изменения во внешней среде и роль НИОКР

2. Особенности управления фирмой в современных условиях

2.3. Основные типы реакций фирмы на изменения во внешней среде и роль НИОКР

Как следует из рис.2, стили организационного поведения фирмы, в том числе и ее стратегический менеджмент, определяются реакцией фирмы на изм .. читать далее