Теория принятия решений: Место статистики интервальных данных (СИД) среди методов описания неопределенностей2.3.10. Место статистики интервальных данных (СИД) среди методов описания неопределенностей Кратко рассмотрим положение статистики интервальных данных среди других методов описания неопределенностей. Нечеткость и СИД. С формальной точки зрения описание нечеткости интервалом – это частный случай описания ее нечетким множеством. В СИД функция принадлежности нечеткого множества имеет специфический вид – она равна 1 в некотором интервале и 0 вне его. Такая функция принадлежности описывается всего двумя параметрами (границами интервала). Эта простота описания делает математический аппарат СИД гораздо более прозрачным, чем аппарат теории нечеткости в общем случае. Это, в свою очередь, позволяет продвинуться дальше, чем при использовании функций принадлежности произвольного вида. Интервальная математика и СИД. Можно было бы сказать, что СИД – часть интервальной математики, что СИД так соотносится с прикладной математической статистикой, как интервальная математика – с математикой в целом. Однако исторически сложилось так, что интервальная математика занимается прежде всего вычислительным погрешностями. С точки зрения интервальной математики две формулы для выборочной дисперсии, рассмотренные выше, имеют разные погрешности. А с точки зрения СИД эти две формулы задают одну и ту же функцию, и поэтому им соответствуют совпадающие нотны и рациональные объемы выборок. Интервальная математика прослеживает процесс вычислений, СИД этим не занимается. Необходимо отметить, что типовые постановки СИД могут быть перенесены в другие области математики, и, наоборот, вычислительные алгоритмы прикладной математической статистики и СИД заслуживают изучения. Однако и то, и другое – скорее дело будущего. Из уже сделанного отметим применение методов СИД при анализе такой характеристики финансовых потоков, как NPV – чистая текущая стоимость [27]. Математическая статистика и СИД. Как уже отмечалось, математическая статистика и СИД отличаются тем, в каком порядке делаются предельные переходы и При этом СИД переходит в математическую статистику при . Правда, тогда исчезают основные особенности СИД: нотна становится равной 0, а рациональный объем выборки – бесконечности. Рассмотренные выше методы СИД разработаны в предположении, что погрешности малы (но не исчезают) и объем выборки велик. СИД расширяет классическую математическую статистику тем, что в исходных статистических данных каждое число заменяет интервалом. С другой стороны, можно считать СИД новым этапом развития математической статистики. Статистика объектов нечисловой природы и СИД. Статистика объектов нечисловой природы (СОНП) расширяет область применения классической математической статистики путем включения в нее новых видов статистических данных [27]. Естественно, при этом появляются новые виды алгоритмов анализа статистических данных и новый математический аппарат (в частности, происходит переход от методов суммирования к методам оптимизации). С точки зрения СОНП частному виду новых статистических данных – интервальным данным – соответствует СИД. Напомним, что одно из двух основных понятий СИД – нотна – определяется как решение оптимизационной задачи. Однако СИД, изучая классические методы прикладной статистики применительно к интервальным данным, по математическому аппарату ближе к классике, чем другие части СОНП, например, статистика бинарных отношений. Робастные методы статистики и СИД. Если понимать робастность согласно [3] как теорию устойчивости статистических методов по отношению к допустимым отклонениям исходных данных и предпосылок модели, то в СИД рассматривается одна из естественных постановок робастности. Однако в массовом сознании специалистов термин «робастность» закрепился за моделью засорения выборки большими выбросами (модель Тьюки-Хубера), хотя эта модель не имеет большого практического значения [27]. К этой модели СИД не имеет отношения. Теория устойчивости и СИД. Общей схеме устойчивости [3] математических моделей социально-экономических явлений и процессов по отношению к допустимым отклонениям исходных данных и предпосылок моделей СИД полностью соответствует. Он посвящен математико-статистическим моделям, используемым при анализе статистических данных, а допустимые отклонения – это интервалы, заданные ограничениями на погрешности. СИД можно рассматривать как пример теории, в которой учет устойчивости позволил сделать нетривиальные выводы. Отметим, что с точки зрения общей схемы устойчивости [3] устойчивость по Ляпунову в теории дифференциальных уравнений – весьма частный случай, в котором из-за его конкретности удалось весьма далеко продвинуться. Минимаксные методы, типовые отклонения и СИД. Постановки СИД относятся к минимаксным. За основу берется максимально возможное отклонение. Это – подход пессимиста, используемый, например, в теории антагонистических игр. Использование минимаксного подхода позволяет подозревать СИД в завышении роли погрешностей измерения. Однако примеры изучения вероятностно-статистических моделей погрешностей, проведенные, в частности, при разработке методов оценивания параметров гамма-распределения [4], показали, что это подозрение не подтверждается. Влияние погрешностей измерений по порядку такое же, только вместо максимально возможного отклонения (нотны) приходится рассматривать математическое ожидание соответствующего отклонения (см. выше). Подчеркнем, что применение в СИД вероятностно-статистических моделей погрешностей не менее перспективно, чем минимаксных. Подход научной школы А.П. Вощинина и СИД. Если в математической статистике неопределенность только статистическая, то в научной школе А.П. Вощинина - только интервальная. Можно сказать, что СИД лежит между классической прикладной математической статистикой и областью исследований научной школы А.П. Вощинина. Другое отличие состоит в том, что в этой школе разрабатывают новые методы анализа интервальных данных, а в СИД в настоящее время изучается устойчивость классических статистических методов по отношению к малым погрешностям. Подход СИД оправдывается распространенностью этих методов, однако в дальнейшем следует переходить к разработке новых методов, специально предназначенных для анализа интервальных данных. Анализ чувствительности и СИД. При анализе чувствительности, как и в СИД, рассчитывают производные по используемым переменным, или непосредственно находят изменения при отклонении переменной на +10% от базового значения. Однако этот анализ делают по каждой переменной отдельно. В СИД все переменные рассматриваются совместно, и находится максимально возможное отклонение (нотна). При малых погрешностях удается на основе главного члена разложения функции в многомерный ряд Тейлора получить удобную формулу для нотны. Можно сказать, что СИД – это многомерный анализ чувствительности. Литература 1. Дискуссия по анализу интервальных данных // Заводская лаборатория. 1990. Т.56. No.7, с.75-95. 2. Сборник трудов Международной конференции по интервальным и стохастическим методам в науке и технике (ИНТЕРВАЛ-92). Тт. 1,2. - М.: МЭИ, 1992, 216 с., 152 с. 3. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. 296 с. 4. ГОСТ 11.011-83. Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения. - М.: Изд-во стандартов, 1984, 53 с. 5. Orlov A.I. // Interval Computations, 1992, No.1(3), р.44-52. 6. Орлов А.И. // Наука и технология в России. 1994. No.4(6). С.8-9. 7. Шокин Ю.И. Интервальный анализ. Новосибирск: Наука, 1981, 112 с. 8. Орлов А.И. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1990, с..89-99. 9. Орлов А.И. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1991, с.77-86. 10. Орлов А.И. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1988, с.45-55. 11. Орлов А.И. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1995, с.114-124. 12. Орлов А.И. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Пермский государственный университет, 1993, с.149-158. 13. Биттар А.Б. Метод наименьших квадратов для интервальных данных. Дипломная работа. - М.: МЭИ, 1994. 38 с. 14. Пузикова Д.А. // Наука и технология в России. 1995. No.2(8). С.12-13. 15. Орлов А.И. // Надежность и контроль качества, 1991, № 8, с.3-8. 16. Орлов А.И. // Заводская лаборатория. 1998. Т.64. № 3. С.52-60. 17. Вощинин А.П. Метод оптимизации объектов по интервальным моделям целевой функции. - М.: МЭИ, 1987. 109 с. 18. Вощинин А.П., Сотиров Г.Р. Оптимизация в условиях неопределенности. - М.: МЭИ - София: Техника, 1989. 224 с. 19. Вощинин А.П., Акматбеков Р.А. Оптимизация по регрессионным моделям и планирование эксперимента. - Бишкек: Илим, 1991. 164 с. 20. Вощинин А.П. // Заводская лаборатория. 2000. Т.66, № 3. С.51-65. 21. Вощинин А.П. // Заводская лаборатория. 2002. Т.68, № 1. С.118-126. 22. Дывак Н.П. Разработка методов оптимального планирования эксперимента и анализа интервальных данных. Автореф. дисс. канд.. технич. наук. - М.: МЭИ, 1992. 20 с. 23. Симов С.Ж. Разработка и исследование интервальных моделей при анализе данных и проектировании экспертных систем. Автореф. дисс. канд. технич. наук. - М.: МЭИ, 1992. 20 с. 24. Орлов А.И. // Заводская лаборатория. 1999. Т.65. № 7. С.46-54. 25. Орлов А.И. // Заводская лаборатория. 1991. Т.57. № 7. С.64-66. 26. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. – Л.: Энергоатомиздат, 1985. 248 с. 27. Орлов А.И. Эконометрика. – М.: Экзамен, 2002. 576 с. 28. Дейвид Г. Порядковые статистики. – М.: Наука, 1979. 29. Колмогоров А.Н. Метод медианы в теории ошибок. – В кн.: Колмогоров А.Н. Теория вероятностей и математическая статистика: [Сб. статей]. – М.: Наука, 1986. – С.111-114. 30. Орлов А.И. Об оценивании параметров гамма-распределения. - Журнал "Обозрение прикладной и промышленной математики". 1997. Т.4. Вып.3. С.471-482. 31. Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей. – М.: Наука, 1970. 32. Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся втузов. – М.-Л.: ГИТТЛ, 1945. 33. Кендалл М., Стьюарт А. Статистические выводы и связи. – М.: Наука, 1973. 900 с. 34. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. – М.: ВНИИС, 1987. 35. Ляшенко Н.Н., Никулин М.С. Машинное умножение и деление независимых случайных величин // Записки научных семинаров Ленингр. Отделения Математического ин-та АН СССР, 1986, Т.153. 36. Хьюбер П. Робастность в статистике. – М.: Мир, 1984. 303 с. 37. Орлов А.И. Асимптотика решений экстремальных статистических задач // Анализ нечисловых данных в системных исследованиях. Сб. трудов. Вып.10. – М.: ВНИИ системных исследований АН СССР, 1982. – С.4-12. 38. Крамер Г. Математические методы статистики. – М.: Мир, 1975. 648 с. 39. Боровков А.А. Математическая статистика. – М.: Наука, 1984. 472 с. 40. Кендалл М., Стьюарт А. Теория распределений. – М.: Наука, 1966. 41. Смирнов Н.В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках // Бюллетень МГУ. Сер.А. 1939. Т.2. №2. 42. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. 43. Орлов А.И. О критериях Колмогорова и Смирнова // Заводская лаборатория. 1995. Т.61. No.7. С.59-61. 44. Гантмахер Ф.Р. Теория матриц. - М.: Наука, 1966. -576 с. 45. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика. - М.: Наука, 1989. - 320 с. 46. Налимов В.В., Голикова Т.И. Логические основания планирования эксперимента. – М.: Металлургия, 1976. 128 с. Контрольные вопросы и задачи 1. Покажите на примерах, что в задачах принятия решений исходные данные часто имеют интервальный характер. 2. В чем особенности подхода статистики интервальных данных в задачах оценивания параметров? 3. В чем особенности подхода статистики интервальных данных в задачах проверки гипотез? 4. Какие новые нюансы проявляются в статистике интервальных данных при переходе к многомерным задачам? 5. Выполните операции над интервальными числами: вариант 1 - а)[1,2]+[3,4], б)[4,5]-[2,3], в)[3,4]x[5,7], г)[10,20]:[4,5]; вариант 2 - а)[0,2]+[3,5], б)[3,5]-[2,4], в)[2,4]x[5,8], г)[15,25]:[1,5]. 6. Выпишите формулу для асимптотической нотны (ошибки по абсолютной величине не превосходят константы t, предполагающейся малой) для функции f(x1,x2) = 5 (x1)2 + 10 (x2)2 + 7 x1x2. Вычислите асимптотическую нотну в точке (x1,x2) = (1,2) при t = 0,1. 7. Выпишите формулу для асимптотической нотны (ошибки по абсолютной величине не превосходят константы t, предполагающейся малой) для функции f(x1,x2) = 4 (x1)2 + 12 (x2)2 - 3 x1x2. Вычислите асимптотическую нотну в точке (x1,x2) = (2,1) при t = 0,05.
Темы докладов, рефератов, исследовательских работ 1. Классическая математическая статистика как предельный случай статистики интервальных данных. 2. Концепция рационального объема выборки. 3. Сравнение методов оценивания параметров и характеристик распределений в статистике интервальных данных и в классической математической статистике. 4. Подход к проверке гипотез в статистике интервальных данных. 5. Метод наименьших квадратов для интервальных данных. 6. Различные способы учета погрешностей исходных данных в статистических процедурах. 7. Статистика интервальных данных как часть теории устойчивости (с использованием монографии [3]).
|