Базовые методы интеллектуального анализа данных
Автор: Танзиля Тлегенова • Декабрь 11, 2022 • Лабораторная работа • 1,413 Слов (6 Страниц) • 259 Просмотры
[pic 1]
Министерство образования и науки Российской Федерации
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
"ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Факультет математики и информационных технологий
Кафедра информатики
Отчет
«Базовые методы интеллектуального анализа данных»
ОГУ 09.03.02. 6020. 802 О
Руководитель доцент
___________ __О.В Хашкин___
подпись инициалы фамилия
«______»_________________2020 г.
Студент группы 19ИСТ(м)ИСНИ
_____________ О.С.Голубева
подпись инициалы фамилия
«_____»__________________2020 г.
Оренбург 2020
Лабораторная работа 3
Цель работы: ознакомиться с возможностями классификации данных с помощью аналитического пакета Deductor Academic.
Программа работы
1. Выполнить классификацию данных с использованием алгоритма g-mean.
2. Выполнить классификацию данных с использованием алгоритма k-mean.
3. Выполнить классификацию данных с использованием нейронной сети.
Импорт данных в программный комплекс Deductor Academic
Импорт данных является отправной точкой анализа данных. Импорт в Deductor может осуществляться из популярных форматов хранения данных, таких как Excel, Access, MS SQL, Oracle, Текстовый файл и прочих. Импорт данных из текстового файла с разделителями осуществляется путем вызова мастера импорта на панели «Сценарии».
[pic 2]
Рисунок 1 – Импорт данных
[pic 3]
Рисунок 2 – Загруженные данные
Для начала попробуем провести классификацию ирисов, встроенным методом кластеризации g-mean. Более того, не будут даже указано количество кластеров, на которое необходимо разделить данную выборку, проверим эффективность встроенной системы кластеризации, для этого необходимо выбрать в мастере обработок пункт кластеризация.
[pic 4]
Рисунок 3 – Настройка мастера обработки
Далее следует настроить параметры обучения, в данном конкретном случае, параметры по умолчанию отлично подходят. На следующем шаге мастера необходимо выбрать алгоритм кластеризации. На и так заранее известно, что количество кластеров должно равняться «3», но протестируем возможности программы и предоставим ей самой выбрать количество кластеров. Это так же будет полезно, если не известно на какое количество групп следует разбивать выборку.
...