Использование методов Data Mining для решения задачи классификации
Автор: Sergey576 • Ноябрь 14, 2019 • Курсовая работа • 2,880 Слов (12 Страниц) • 556 Просмотры
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ
БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
≪ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИМЕНИ И.С. ТУРГЕНЕВА≫
ФИЗИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ
КАФЕДРА АЛГЕБРЫ И МАТЕМАТИЧЕСКИХ МЕТОДОВ
В ЭКОНОМИКЕ
КУРСОВАЯ РАБОТА
Использование методов Data Mining для решения задачи классификации
Исполнитель: студент 3 курса
3 группы направления подготовки
09.03.03 Прикладная информатика
(в экономике) Прасолов С.В
Руководитель: кандидат
педагогических наук,
доцент Чернобровкина И.И.
Оценка Подписи членов комиссии
Орел – 2018[pic 1]
Содержание
1 Задача классификации и методы ее решения 5
1.1 Общие понятия задачи классификации 5
1.2 Нейронные сети 8
1.3 Деревья решений 12
2 Реализация методов Data Mining 16
Введение
На протяжении последних лет в информационной индустрии наблюдается устойчивый рост интереса к технологиям анализа данных и основанным на этих технологиях системам поддержки принятия решений. За всей областью закрепился, ставший уже привычным в англоязычной литературе, термин Data Mining. На русском языке употребляют также словосочетание "интеллектуальный анализ данных". Фактически это выражение переводится как “Добыча данных”.
Популярность Data Mining сегодня можно сравнить с его популярностью половину века назад, на заре компьютерной эпохи. Тогда, правда, этот термин не был известен, но много говорили об искусственном интеллекте, о нейронных сетях и распознавании образов. Однако, за немногими исключениями, практическую реализацию теории пришлось отложить до тех пор, пока аппаратная и программная инфраструктура не развилась до современного уровня. И сегодня, по завершению пятидесятилетнего цикла развития, мы вновь обращаемся к решению задач анализа, обладая уже для этого мощными вычислительными системами и системами управления базами данных, развитой операционной и языковой средой.
К основным методам Data Mining относятся: методы классификации, моделирования и прогнозирования, которые основаны на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, нечеткой логики, ассоциативной памяти и эволюционного программирования. Также существуют статистические методы, такие как: дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, анализ временных рядов.
Одним из наиболее важных назначений методов Data Mining является наглядное представление результатов вычислений, что позволяет пользоваться инструментами Data Mining людям, не имеющим специальной математической подготовки. В то же время, применение статистических методов анализа данных требует хорошего владения теорией вероятности и математической статистикой.
Таким образом, Data Mining – это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей. Суть этой технологии состоит в поиске в больших объемах данных неочевидных, объективных и полезных на практике закономерностей.
Целью работы является реализация методов решения задачи классификации.
Для достижения поставленной цели были поставлены следующие задачи:
1. ознакомиться со структурой задачи классификации;
2. ознакомиться с существующими методами решения задачи классификации;
...