Заметки по теории классификации
Аннотация
Проанализированы различные направления в теории классификации. Для этой области дана классификация математических методов. Рассмотрена проблема естественной классификации, обоснован тезис: критерий естественности - устойчивость. В вероятностной теорий кластер-анализа предложен метод статистической проверки обоснованности объединения кластеров. Найдено асимптотическое распределение «прогностической силы» алгоритма классифицирования, разработан метод проверки возможности пересчета на модель линейного дискриминантного анализа.
Ключевые слова:
методы классификации, объекты нечисловой природы, кластер, естественность классификации, прогностическая сила, устойчивость, проверка гипотез, асимптотические распределения
Литература
Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. М.: ВНИИСИ, 1987.
Анализ нечисловой информации в социологических исследованиях. М.: Наука, 1985.
Орлов A.И. Общий взгляд на статистику объектов нечисловой природы //[2].
Раушенбах Г.B. Меры близости и сходства //[2].
Орлов A.И. Статистика объектов нечисловой природы //Статистика. Вероятность. Экономика. М.: Наука, 1985.
Орлов A.И. Статистика объектов нечисловой природы //Тр. 1 Всемирного Конгресса Общества им. Бернулли «Математическая статистика, теория вероятностей, комбинаторика и ее применения». Вып. 1. М.: МИАН СССР, Советский Комитет Общества им. Бернулли, 1988.
Маамяги A.В. Некоторые задачи статистического анализа классификаций. Таллинн: Изд-во АН ЭССР, 1982.
Орлов А.И., Рыданова Г.В. О некоторых результатах статистики объектов нечисловой природы //Материалы I Всесоюз. школы-семинара «Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях (8-в июня 1985 г., Пущино)». Пущино: НИВЦ АН СССР, 1986.
Фоменко А.Т. Новая эмпирико-статистическая методика обнаружения параллелизмов в датировании дубликатов //Проблемы устойчивости стохастических моделей. М.: ВНИИСИ, 1984.
Розова С.С. Классификационная проблема в современной науке. Новосибирск: Наука, 1986.
Шрейдер Ю.А., Шаров А.А. Системы и модели. М.: Радио и связь, 1982.
Воронин Ю.А. Теория классифицирования и ее приложения. Новосибирск: Наука, 1985.
Горелик А.Л., Скрипкин. В.А. Методы распознавания. Учебное пособие для вузов. М.: Высшая школа, 1984.
Орлов А.И. Математические методы классификации, статистика объектов нечисловой природы и медико-биологические исследования //Доклады МОИП 1984 г. Общая биология. Цитогенетический и математический подход к изучению биосистем. М.: Наука, 1986.
Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974.
Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976.
Орлов А.И. Некоторые неклассические постановки в регрессионном анализе и теории классификации //Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях. М.: Наука, 1987.
Орлов А.И. Некоторые вероятностные вопросы теории классификации //Прикладная статистика. М.: Наука, 1983.
Шорников Б.С. Классификация и диагностика в биологическом эксперименте. Проблема оценки и классификации интерьерных признаков человека. М.: Наука, 1979.
Гелъфанд И.М., Алексеевская М.А.. Губерман Ш.А.. Сыркин А.Л., Головня Л.Д.. Извекова М.А. Прогнозирование исхода инфаркта миокарда с помощью программы «Кора-3» //Кардиология. 1977. Т.17. № 6, 7.
Орлов А.И. О сравнении алгоритмов классификации по результатам обработки реальных данных //Общая биология. Новые данные исследований структуры и функций биологических систем. Доклады МОИП, 1985. М.: Наука, 1.987.
Орлов А.И. Оценка размерности модели в регрессии //Алгоритмическое и программное обеспечение прикладного статистического анализа. М.: Наука, 1980.
Орлов А.И. Асимптотика некоторых оценок размерности модели в регрессии //Прикладная статистика. М.: Наука, 1983.
Орлов А.И. Некоторые вероятностные вопросы кластер-анализа //Общая биология. Новые данные исследований структуры и функций биологических систем. Доклады МОИП, 1985. М.: Наука, 1987.
Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979.
Орлов А.И., Гусейнов Г.А. Математические Методы в изучении способных к математике школьников //Исследования по вероятностно-статистическому моделированию реальных систем. М.: ЦЭМИ АН СССР, 1977.
Куперштох В.Л., Миркин Б.Г., Трофимов В.А. Сумма внутренних связей как показатель качества классификации //А и Т. 1976. № 3.
Орлов А.И. Математика нечеткости //Наука и жизнь. 1982. № 7.
Большев Л.Л.; Смирнов H.В. Таблицы математической статистика. М.: Наука, 1983.
Орлов А.И. Парные сравнения в асимптотике Колмогорова //Экспертные оценки в задачах управления. М.: ИПУ, 1982.
ПлоткинА.А. Устойчивость разбиения как критерий оптимальности Построенной классификации //Статистические методы анализа экспертных оценок. М.: Наука, 1977.
Шурыгин A.M. Статистический кластер-критерий //Алгоритмическое и программное обеспечение прикладного статистического анализа. М.: Наука, 1980.
Орлов А.И. Классификация объектов нечисловой природы на основе непараметрических оценок плотности //Проблемы компьютерного анализа данных и моделирования. Минск: Белорусск. Гос. ун-т, 1991.
ЛюбищевА.А. Проблемы формы, систематики и эволюции организмов. М.: Наука, 1982.
Райская H.Н., Гостилин Н.Н., Френкель А.А. Об одном способе проверки обоснованности разбиения в кластерном анализе //Всесоюз. конф. «Применение многомерной статистического анализа в экономике и оценке качеств) продукции». Teз. докл. Тарту, 19Т7.
Бала Ю.М., Фуки B.Б., Рог А.И., Савченко Т.Л., Савченко A.В. О возможности автоматизации процесса дифференциальной диагностики атеросклеротического кардиосклероза и ревматических пороков сердца, осложненные мерцательной аритмией //Кардиология, 1977. Т. 17. ,№7.
Орлов A.И. Махаланобиса расстояние //Математическая энциклопедия. Т.8. М.: Советская Энциклопедия, 1982.
Кулинская E.В. Об эмпирических индексах качеств классификации и их реализации в пакете програм CLAMS для IBM РС // Всесоюз. симпозиум с международным участием «Теория и практика классификации и систематики в народном хозяйстве». Тез. докл. М.: ВИНИ ТИ, 1980.
Кулинская Е.В,, Сатаров Г.А. Проверка гипотез о качестве классификации в пакете программ CLAMS для IВM PC //Всесоюз. симпозиум с международным участием «Теория и практика классификации и систематики в народном хозяйстве». Teз. докл. М: ВИНИТИ, 1990.
Kulinskaya E.V., Satarov G.A. Testing the Hypotesis about the Quality of Classification in the Data-Analysis System Clams //Statistical Data Analysis. Abstracts о International Conference. Sofia, 1990.
Анализ нечисловой информации в социологических исследованиях. М.: Наука, 1985.
Орлов A.И. Общий взгляд на статистику объектов нечисловой природы //[2].
Раушенбах Г.B. Меры близости и сходства //[2].
Орлов A.И. Статистика объектов нечисловой природы //Статистика. Вероятность. Экономика. М.: Наука, 1985.
Орлов A.И. Статистика объектов нечисловой природы //Тр. 1 Всемирного Конгресса Общества им. Бернулли «Математическая статистика, теория вероятностей, комбинаторика и ее применения». Вып. 1. М.: МИАН СССР, Советский Комитет Общества им. Бернулли, 1988.
Маамяги A.В. Некоторые задачи статистического анализа классификаций. Таллинн: Изд-во АН ЭССР, 1982.
Орлов А.И., Рыданова Г.В. О некоторых результатах статистики объектов нечисловой природы //Материалы I Всесоюз. школы-семинара «Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях (8-в июня 1985 г., Пущино)». Пущино: НИВЦ АН СССР, 1986.
Фоменко А.Т. Новая эмпирико-статистическая методика обнаружения параллелизмов в датировании дубликатов //Проблемы устойчивости стохастических моделей. М.: ВНИИСИ, 1984.
Розова С.С. Классификационная проблема в современной науке. Новосибирск: Наука, 1986.
Шрейдер Ю.А., Шаров А.А. Системы и модели. М.: Радио и связь, 1982.
Воронин Ю.А. Теория классифицирования и ее приложения. Новосибирск: Наука, 1985.
Горелик А.Л., Скрипкин. В.А. Методы распознавания. Учебное пособие для вузов. М.: Высшая школа, 1984.
Орлов А.И. Математические методы классификации, статистика объектов нечисловой природы и медико-биологические исследования //Доклады МОИП 1984 г. Общая биология. Цитогенетический и математический подход к изучению биосистем. М.: Наука, 1986.
Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974.
Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976.
Орлов А.И. Некоторые неклассические постановки в регрессионном анализе и теории классификации //Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях. М.: Наука, 1987.
Орлов А.И. Некоторые вероятностные вопросы теории классификации //Прикладная статистика. М.: Наука, 1983.
Шорников Б.С. Классификация и диагностика в биологическом эксперименте. Проблема оценки и классификации интерьерных признаков человека. М.: Наука, 1979.
Гелъфанд И.М., Алексеевская М.А.. Губерман Ш.А.. Сыркин А.Л., Головня Л.Д.. Извекова М.А. Прогнозирование исхода инфаркта миокарда с помощью программы «Кора-3» //Кардиология. 1977. Т.17. № 6, 7.
Орлов А.И. О сравнении алгоритмов классификации по результатам обработки реальных данных //Общая биология. Новые данные исследований структуры и функций биологических систем. Доклады МОИП, 1985. М.: Наука, 1.987.
Орлов А.И. Оценка размерности модели в регрессии //Алгоритмическое и программное обеспечение прикладного статистического анализа. М.: Наука, 1980.
Орлов А.И. Асимптотика некоторых оценок размерности модели в регрессии //Прикладная статистика. М.: Наука, 1983.
Орлов А.И. Некоторые вероятностные вопросы кластер-анализа //Общая биология. Новые данные исследований структуры и функций биологических систем. Доклады МОИП, 1985. М.: Наука, 1987.
Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979.
Орлов А.И., Гусейнов Г.А. Математические Методы в изучении способных к математике школьников //Исследования по вероятностно-статистическому моделированию реальных систем. М.: ЦЭМИ АН СССР, 1977.
Куперштох В.Л., Миркин Б.Г., Трофимов В.А. Сумма внутренних связей как показатель качества классификации //А и Т. 1976. № 3.
Орлов А.И. Математика нечеткости //Наука и жизнь. 1982. № 7.
Большев Л.Л.; Смирнов H.В. Таблицы математической статистика. М.: Наука, 1983.
Орлов А.И. Парные сравнения в асимптотике Колмогорова //Экспертные оценки в задачах управления. М.: ИПУ, 1982.
ПлоткинА.А. Устойчивость разбиения как критерий оптимальности Построенной классификации //Статистические методы анализа экспертных оценок. М.: Наука, 1977.
Шурыгин A.M. Статистический кластер-критерий //Алгоритмическое и программное обеспечение прикладного статистического анализа. М.: Наука, 1980.
Орлов А.И. Классификация объектов нечисловой природы на основе непараметрических оценок плотности //Проблемы компьютерного анализа данных и моделирования. Минск: Белорусск. Гос. ун-т, 1991.
ЛюбищевА.А. Проблемы формы, систематики и эволюции организмов. М.: Наука, 1982.
Райская H.Н., Гостилин Н.Н., Френкель А.А. Об одном способе проверки обоснованности разбиения в кластерном анализе //Всесоюз. конф. «Применение многомерной статистического анализа в экономике и оценке качеств) продукции». Teз. докл. Тарту, 19Т7.
Бала Ю.М., Фуки B.Б., Рог А.И., Савченко Т.Л., Савченко A.В. О возможности автоматизации процесса дифференциальной диагностики атеросклеротического кардиосклероза и ревматических пороков сердца, осложненные мерцательной аритмией //Кардиология, 1977. Т. 17. ,№7.
Орлов A.И. Махаланобиса расстояние //Математическая энциклопедия. Т.8. М.: Советская Энциклопедия, 1982.
Кулинская E.В. Об эмпирических индексах качеств классификации и их реализации в пакете програм CLAMS для IBM РС // Всесоюз. симпозиум с международным участием «Теория и практика классификации и систематики в народном хозяйстве». Тез. докл. М.: ВИНИ ТИ, 1980.
Кулинская Е.В,, Сатаров Г.А. Проверка гипотез о качестве классификации в пакете программ CLAMS для IВM PC //Всесоюз. симпозиум с международным участием «Теория и практика классификации и систематики в народном хозяйстве». Teз. докл. М: ВИНИТИ, 1990.
Kulinskaya E.V., Satarov G.A. Testing the Hypotesis about the Quality of Classification in the Data-Analysis System Clams //Statistical Data Analysis. Abstracts о International Conference. Sofia, 1990.