Математические методы классификации
Автор: Albert Chernogradskiy • Октябрь 23, 2023 • Реферат • 595 Слов (3 Страниц) • 118 Просмотры
Министерство науки и высшего образования РФ
ФГАОУ ВО «»
Факультет
Кафедра
Реферат
на тему: «Математические методы классификации»
Выполнил: студент гр.
Проверил:доцент.
г. Якутск - 2000 г.
Содержание
Содержание 2
Введение 3
Кластеризация (кластер-анализ) 4
Группировка 5
Дискриминантный анализ 6
Введение
Термин «классификация» имеет несколько основных смысла. Во-первых, это система классов. Во-вторых, это действие, связанное с системой классов. Согласно «термином «классификация» обозначают, по крайней мере, три разные вещи: процедуру построения классификации, построенную классификацию и процедуру ее использования ».
Рассмотрим виды классификаций используемых в геологии: кластеризация (кластер-анализ) и группировка, статистический анализ классификаций, дискриминация (дискриминантный анализ).
Кластеризация (кластер-анализ)
При кластеризации целью является выявление и выделение классов. Задача кластер-анализа состоит в выяснении по эмпирическим данным, насколько элементы «группируются» или распадаются на изолированные «скопления», «кластеры» (от cluster (англ.) - гроздь, скопление). Иными словами, задача - выявление естественного разбиения на классы, свободного от субъективизма исследователя, а цель - выделение групп однородных объектов, сходных между собой, при резком отличии этих групп друг от друга.
Группировка
Задача группировки состоит в том что, «мы хотим разбить элементы на группы независимо от того, естественны ли границы разбиения или нет». При группировке целью является выявление и выделение классов, однако «соседние» группы могут не иметь резких различий (в отличие от кластер-анализа). Границы между группами условны, не являются естественными, зависят от субъективизма исследователя. Аналогично при лесоустройстве проведение просек (границ участков) зависит от специалистов лесного ведомства, а не от свойств леса. Задачи кластеризации и группировки принципиально различны, хотя для их решения могут применяться одни и те же алгоритмы. Важная для практической деятельности проблема состоит в том, чтобы понять, разрешима ли задача кластер-анализа для конкретных данных или возможна только их группировка, поскольку совокупность объектов достаточно однородна и не разбивается на резко разделяющиеся между собой кластеры. Как правило, в математических задачах кластеризации и группировки основное - выбор метрики, расстояния между объектами, меры близости, сходства, различия. Хорошо известно, что для любого заданного разбиения объектов на группы и любого числа ε > 0 можно указать метрику такую, что расстояния между объектами из одной группы будут меньше ε, а между объектами из разных групп - больше 1/ε. Тогда любой разумный алгоритм кластеризации даст именно заданное разбиение. Поэтому весьма важен выбор метрики, адекватной решаемой прикладной задачи.
...