Предобработка данных в текстовом редакторе и редакторе таблиц
Автор: Мария Тополева • Октябрь 19, 2022 • Лабораторная работа • 496 Слов (2 Страниц) • 342 Просмотры
МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РФ
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«ПОВОЛЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ»
ОТЧЁТ
ПО ЛАБОРАТОРНОЙ РАБОТЕ
«Предобработка данных в текстовом редакторе и редакторе таблиц»
по дисциплине «Основы сбора и обработки больших данных»
ЛАБОРАТОРНАЯ РАБОТА №1
Предобработка данных в текстовом редакторе и редакторе таблиц
Цель работы – получить базовые навыки предобработки данных в текстовом редакторе и редакторе таблиц.
Ход работы:
- Найдите и скачайте в сети Интернет файл формата .txt или .csv, содержащий данные, разделённые запятой, знаком табуляции, пробелом или запятой.
[pic 1]
- Сделайте копию указанного файла. Откройте её в текстовом редакторе. При помощи глобальной замены заменить символ-разделитель значений. Сделайте скриншот фрагмента получившегося файла и сохраните его.
[pic 2]
- Откройте изменённый файл в редакторе таблиц.
- Выполните, если необходимо, разбиение по столбцам.
- Если в файле отсутствуют названия столбцов, добавьте их.
- Сделайте скриншот получившегося файла и сохраните его.
[pic 3]
- По согласованию с преподавателем, определитесь с целевой переменной (столбцом).
- Включите фильтр столбцов. Выполните фильтрацию по двум значениям целевой переменной и по одному значению двух любых независимых переменных. Сделайте скриншоты результатов и сохраните их.
В качестве целевой переменной выберем столбец «participants».
[pic 4]
Также выполним фильтрацию столбца «title» и столбца «section».
[pic 5] [pic 6]
Результат:
[pic 7]
- Создайте три новых столбца разными способами. Сделайте скриншот получившихся столбцов и сохраните его.
[pic 8]
- Создайте новый столбец на основе целевого столбца. В новом столбце число значений должно быть равно трём. Если в оригинальном целевом столбце число возможных значений равно двум, то необходимо увеличить число принимаемых значений до четырёх (в новом столбце).
[pic 9]
Результат:
[pic 10]
- Раскрасьте ячейки получившегося нового целевого столбца исходя из их значений (двумя способами).
Раскрасим ячейки столбца в жёлтый цвет, если значения < 100, и в синий цвет, если значения ≥ 100.
[pic 11]
- Постройте три вида гистограмм.
Гистограмма с группировкой:
[pic 12]
Объёмная гистограмма с группировкой:
[pic 13]
Линейчатая гистограмма с группировкой:
[pic 14]
- Выполните умножение на константу для произвольного столбца из файла.
Умножим столбец H (participants) на 2
...