Методы машинного обучения
Автор: Prostobochka • Апрель 29, 2023 • Курсовая работа • 2,093 Слов (9 Страниц) • 201 Просмотры
Введение.
Машинное обучение ̶ математическая дисциплина, которая состоит в том, чтобы формировать предсказания, основываясь на прошлых данных и примерах. Зачастую задачи, с которыми можно столкнуться на практике, не дают возможности для их решения какими-либо используемыми методами, из-за нехватки информации, либо практически её отсутствия. В таких ситуациях остаётся только изучать исходные данные и делать выводы основывая на них, в чём и заключается суть машинного обучения.
Началом для машинного обучения можно назвать разработку первых ЭВМ, к примеру, ЭНИАК (1943-1945). В то время некоторые люди уже задумывались о том, может ли машина делать то же, что и мыслящие существа ̶ примером тому служит Алан Тьюринг, предложивший общественности свой эмпирический тест в 1950 году. Он занимался проблемой машинного интеллекта ещё с 1941, и в 1947 году упоминал об компьютерном интеллекте, предрекая свои будущие исследования.
В 1952 году, Артур Самуэль создаёт первую программу по игре в шашки, позже добавив возможность к самообучению, заставляя играть против самой себя. Основой для программы служил механизм дерева поиска игровых позиций, реализовав альфа-бета-отсечение.
Первой нейронной сетью является Персептрон, разработанный Фрэнком Розенблаттом в 1958 году, в 1960 было реализована в виде нейрокомпьютера «Марк-1».
1959 год ̶ разработка SNARC (стохастический нейронный аналоговый калькулятор подкрепления) Марвином Ли Мински.
1967 год ̶ Написан метрический алгоритм классификации (Метод k ближайших соседей). Алгоритм позволил компьютерам использовать простые шаблоны распознавания.
1985 год ̶ разработан NETalk, искусственная нейронная сеть, созданный для изучения механизмов обучения правильному произношению английского текста.
§1. Основы машинного обучения.
Машинное обучение является невероятно обширным предметом, который, по своей сути, никогда не сможет достичь своей вершины ̶ невозможно достичь идеальной статистики, невозможно написать алгоритм, выводящий результат со 100% точностью, имея в расчёте различные шумы, единичные погрешности в классификации и т.д. Всё, что остаётся ̶ это максимально приближать итог к абсолюту, используя огромное количество алгоритмов, которых к этому моменту придумало человечество.
Суть машинного обучения можно разделить на три компонента:
1. Существует некий шаблон, последовательность. Без неё рассматривать будет нечего.
2. Не имеется возможность эту последовательность выразить математически. Многочлен для формулы может быть в какой угодно степени, и выписывать его будет пустой тратой времени, либо может занять слишком много времени.
3. Естественно, необходимо иметь данные, без них обучаться будет не из чего.
Основной базой для обучения является: «используя некий набор наблюдений раскрыть основной процесс». Это простое словосочетание можно интерпретировать во множестве вариаций, и для множества разных дисциплин.
Машинное обучение разделяют на три группы:
1. Обучение с учителем. Предоставляемые машине данные уже содержат правильный ответ, так что ему надо выявлять взаимосвязи.
2. Обучение без учителя. Данные никак не помечены, так что компьютеру нужно опираться на закономерности.
3. Обучение с подкреплением. Оно является частным случаем обучения с учителем, где машина будет получать ответ из данных самостоятельно, основываясь на обратной связи самой среды.
Виды задач машинного обучения:
1. Задачи классификации.
В них множество ответов является конечным, и каждый ответ соответствует некому классу, и задача машинного обучения заключается в вычислении по каждому объекту соответствующего ему класса. Классов может быть как два, так и больше.
2. Задачи регрессии.
В задачах регрессии множество ответов имеет вид или . Задачи данного типа как правило связаны с прогнозированием.[pic 1][pic 2]
3. Задачи ранжирования.
Задачи ранжирования возникают например в системах информационного поиска, или в рекомендательных системах. В данных задачах требуется по каждому объекту определить его приоритет в выдаче в качестве результата на некоторый запрос. Множество ответов здесь является конечным упорядоченным множеством.
...