Методы и стадии Data Mining
Автор: Polinaskos • Март 14, 2023 • Реферат • 2,357 Слов (10 Страниц) • 242 Просмотры
Министерство науки и высшего образования
Российской Федерации
Федеральное государственное автономное образовательное
учреждение высшего образования
«Севастопольский государственный университет»
Кафедра «Государственное и муниципальное управление»
РЕФЕРАТ
По дисциплине: «Информационно-аналитические технологии государственного и муниципального управления»
На тему: «Методы и стадии Data Mining»
Выполнил:
ст. 3 курса гр. ГМУ/б-20-1-о
Скосырская Полина Александровна
Проверил:
кандидат физико-математических наук,
доктор биологических наук, профессор
Чернышенко Сергей Викторович
Севастополь
2023
Содержание
Введение 3
Классификация стадий Data Mining 4
Классификация методов Data Mining 9
Заключение 13
Список использованных источников 14
Введение
Результатом развития информационных технологий является большой объем данных, которые хранятся в электронном виде и растут быстрыми темпами. При этом данные, чаще всего, хранятся в разном виде (тексты, изображения, аудио и тд). Данные, накопленные за длительный период времени, могут содержать закономерности и взаимосвязи, которые являются ценной информацией для планирования, прогнозирования, принятия решений и управления процессами. Однако человек физически не способен эффективно анализировать такие большие объемы разнородных данных. Традиционные методы математической статистики долгое время были основными инструментами для анализа данных. Однако они не позволяют синтезировать новые гипотезы и могут использоваться только для подтверждения априорных гипотез или для "сухого" исследовательского анализа, который составляет основу оперативной аналитической обработки данных [5]. Наиболее сложной задачей в последующем анализе принятия решений часто является формулировка правильной гипотезы. Поэтому технологии Data mining рассматриваются как одна из самых важных и многообещающих тем для исследований и применения в отрасли информационных технологий. Это и определяет актуальность и важность, выбранной мной темы.
Целью данной работы является рассмотрение технологии Data mining. Для этого необходимо изучить стадии Data mining, а также рассмотреть ее методы.
Data Mining - это процесс нахождения в неизвестных данных ранее, практически полезных и доступных интерпретации знаний, которые необходимы для принятия решений в различных сферах человеческой деятельности[1]. Суть и цель технологии Data Mining можно сформулировать следующим образом: это технология, предназначенная для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей[7].
Классификация стадий Data Mining
Состав Data Mining может быть из нескольких (двух или трёх) стадий. На стадии №1 выявляются все закономерности. По-другому называется это свободный поиск.
На стадии №2 происходит использование закономерностей, которые были выявлены на первой стадии, для предсказания неизвестных значений. Другими словами, происходит процесс прогностического моделирования.
В дополнение к вышеперечисленным этапам, после этапа свободного поиска может быть введен этап проверки, который является этапом 1. Целью проверки является проверка достоверности найденных закономерностей. Однако, поскольку в некоторых реализациях, таких как деревья решений и нейронные сети, весь набор данных разделяется на обучающий и проверочный [2], мы будем называть валидацию этапом 1. Таким образом, последний может проверить достоверность полученных результатов.
...