Анализ DeepSat (SAT-4) Airborne Dataset

Автор: Nicki • Март 23, 2023 • Реферат • 769 Слов (4 Страниц) • 193 Просмотры

Страница 1 из 4

1. Общая информация по данным: источник, кем предоставлены, когда и для каких задач могут использоваться.

(Общее описание дататасета DeepSat (SAT-4) Airborne Dataset)

Датасет состоит из изображений, которые были извлечены из набора данных Национальной программы создания изображений сельского хозяйства (NAIP), который в свою очередь состоит в общей сложности из 330 000 сцен, охватывающих всю континентальную часть Соединенных Штатов (CONUS), и представляющих собой изображения ~ 6000 пикселей в ширину и ~ 7000 пикселей в высоту, размером около 200 мегабайт каждый.

Для составления датасета были извлечены фрагменты изображений 28*28 пикселей из множества сцен (всего 1500 фрагментов изображения), охватывающих различные ландшафты, такие как сельские районы, городские районы, густо покрытые лесом, гористая местность, водоемы, сельскохозяйственные районы и т. д., охватывающие весь штат Калифорния.

Содержание датасета

Каждый образец изображения является 4-х канальным(красный, зеленый, синий и ближний инфракрасный) и имеет размер 28x28 пикселей.
Все изображения разбиты на 4 класса представляющие собой 4 обширных почвенных покрова: бесплодные земли, деревья, луга и класс, который состоит из всех классов почвенного покрова, отличных от трех вышеупомянутых.
Обучающие и тестовые метки представляют собой векторы размером 1x4.
Обучающий и тестовый наборы данных принадлежат непересекающемуся набору фрагментов изображений.
После создания обучающий и тестовый наборы данных были рандомизированы с использованием генератора псевдослучайных чисел.

2. Описание целевой задачи анализа данных исходя из данных

Определение 1-го из 4-х типов местности (бесплодная земля, деревья, луга и другая) на изображении.

3. Метаинформация: формат, количество атрибутов и векторов, типы атрибутов, классы и т.п.

Формат данных: csv-файлы.

Количество векторов: 400000 обучающих, 100000 тестовых

Количество атрибутов: 28*28(размер)*4(каналы) = 3136

Тип данных: integer (0...255)

Количество классов: 4 (barren land, trees, grassland and other)

Набор csv-файлов для обучения и тестов:

sat4annotations.csv: описание кодировки классов(barren land, trees, grassland and other) изображений в файлах с метками

X_train_sat4.csv: 400 000 обучающих изображений, 28x28 изображений, каждое с 4 каналами

y_train_sat4.csv: 400 000 обучающих меток, 1x4

X_test_sat4.csv: 100 000 тестовых изображений, 28x28 изображений, каждое с 4 каналами

y_test_sat4.csv: 100 000 тестовых меток, 1x4

Файлы изображений содержат 400 000/100 000 строк и 3136 столбцов (одно изображение в 4-х каналах записано в 1 строку csv файла)

Файлы меток содержат 400 000/100 000 строк и 4 столбца (в каждой строке есть 3 нуля и 1 единица, которая показывает принадлежность к 1-му из 4-х классов, описанных в sat4annotations.csv)

Каждая клетка строки обозначает 1 пиксель изображения в 1-м из каналов, и ее значение находится в диапазоне от 0 до 255.

[pic 1]

[pic 2]

4. Ограничения данных: пропущенные значения, аномалии, и т.п..

Пропущенных данных и аномалий не обнаружено.

5. Предлагаемый ML алгоритм (из модуля Apache Spark Mllib) для решения целевой задачи

Так как поставленную задачу можно отнести к разделу «Распознавание образов и классификация», где в качестве образцов выступают изображения, то наиболее подходящим способом решения будет создание и обучение нейронной сети.

Возможные архитектуры нейросетей, для решения данной задачи:

Перцептрон
Свёрточные нейронные сети

Алгоритм оптимизации градиентного спуска: Adam

...

Скачать: txt (10.8 Kb) pdf (432.7 Kb) docx (533.2 Kb)

Продолжить читать еще 3 страниц(ы) »

Читать полный текст Сохранить

Доступно только на Essays.club