Машинное обучение no-code на платформе BigML
Автор: Tenki • Май 28, 2023 • Лабораторная работа • 1,369 Слов (6 Страниц) • 182 Просмотры
Лабораторная работа «Машинное обучение no-code на платформе BigML»
О платформе BigML
BigML — облачный сервис машинного обучения, который позволяет легко решать и автоматизировать задачи классификации, регрессии, прогнозирования временных рядов, кластерного анализа, обнаружения аномалий и т.п. BigML рассчитан на удовлетворение потребностей бизнеса, которые касаются больших данных и облачных вычислений, а также призван сделать прогнозирование и его результат как можно более простым, понятным и пригодным для демонстрации конечным пользователям.
Инструмент использует интерактивные решающие деревья, представляющие собой эффективный метод машинного обучения и позволяющие наглядно представить результат.
Официальный сайт: https://bigml.com/
Ссылка на руководство пользователя по BigML от команды разработчиков: https://static.bigml.com/static/pdf/BigML_Classification_and_Regression.pdf?ver=39b79a4
Учебно-методическое пособие по использованию платформы
Э. И. Шамаев, В. Г. Афанасьева. Руководство пользователя Bigml.com. Учебно-методическое пособие для школьников [Электронный ресурс] / Э. И. Шамаев, В. Г. Афанасьева. — Якутск : СВФУ, 2021. — Текст : электронный.
Введение
Знакомство с BigML будет осуществляться в виде лабораторного практикума, разделенного на 2 части:
- Обучение – решение задачи классификации ирисов по пошаговой инструкции с использованием учебно-методического пособия Э.И. Шамаева, В.Г. Афанасьевой (далее – Пособие). Время выполнения: 2 часа СРС.
- Самостоятельное решение задачи регрессии. Время выполнения: 2 аудиторных часа.
За выполнение каждого из заданий начисляется max 3 балла в зависимости от качества выполнения и ответов на вопросы.
Зарегистрируйтесь на https://bigml.com/, используя бесплатный доступ для обучающихся и преподавателей (страница 4 Пособия).
Важно: обязательно нужно регистрироваться с почтой, доменное имя которой ВНЕ российских серверов.
Подтвердите адрес электронной почты.
Задания
- Выполните решение задачи классификации ирисов по пошаговой инструкции:
- Создание набора данных. Для этого сначала внимательно прочтите страницы 5-8 Пособия. Запустите Панель управления (Dashboard). Выберите вкладку Источники (Sources) и найдите в списке исходные данные для нашей задачи – Iris Flower Classification. Кликнув по ссылке, откройте данные и изучите структуру набора данных (наименования атрибутов ирисов и их типы). Прочтите страницы 9-11 Пособия и создайте набор данных «одним щелчком». В результате из исходных данных будет получен датасет, подготовленный к моделированию.
Нажмите или наведите курсор на небольшую сигму справа, чтобы увидеть сводку по атрибуту.
[pic 1][pic 2]
Прочтите страницу 12 Пособия.
Проанализировав всю предыдущую информацию, ответьте на вопросы[1] (ответы на все вопросы можно дать письменно в вашей рабочей тетради, или напечатать в файл «Тетрадь исследователя»):
- Сколько данных в наборе? Что прогнозируется? Является ли данная задача многоклассовой задачей классификации?
- Какие атрибуты ирисов взяты за основу при поиске закономерностей (составляют features)? Какой атрибут в нашем датасете выбран целевым значением (является label)? Что означают слова features и label применительно к понятию «датасет»?
- Создание модели. Сначала разобьем наш набор на две части: тренировочный и тестовый наборы в соотношении 90%:10%. Для этого нажмите на кнопку диаграммы и выберите «TRANING | TEST SPLIT»:
[pic 3]
Передвинув бегунок на нужные значения, нажмите на кнопку Create Training | Test. По умолчанию используется случайное распределение данных[2].
Запустите обучение модели на тренировочных данных. Для этого во вкладке Datasets выберите Iris Flower Classification | Training (90%). Затем нажмите значок облака и в разделе 1-CLICK SUPERVISED выберите MODEL. Прочтите страницы 12-13 Пособия.
...