Essays.club - Получите бесплатные рефераты, курсовые работы и научные статьи
Поиск

Предобработка данных в текстовом редакторе и редакторе таблиц

Автор:   •  Октябрь 19, 2022  •  Лабораторная работа  •  496 Слов (2 Страниц)  •  251 Просмотры

Страница 1 из 2

МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РФ

Федеральное государственное бюджетное образовательное учреждение
высшего образования
«ПОВОЛЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ»

ОТЧЁТ

ПО ЛАБОРАТОРНОЙ РАБОТЕ

«Предобработка данных в текстовом редакторе и редакторе таблиц»

по дисциплине «Основы сбора и обработки больших данных»

ЛАБОРАТОРНАЯ РАБОТА №1

Предобработка данных в текстовом редакторе и редакторе таблиц

Цель работы – получить базовые навыки предобработки данных в текстовом редакторе и редакторе таблиц.

Ход работы:

  1. Найдите и скачайте в сети Интернет файл формата .txt или .csv, содержащий данные, разделённые запятой, знаком табуляции, пробелом или запятой.

[pic 1]

  1. Сделайте копию указанного файла. Откройте её в текстовом редакторе. При помощи глобальной замены заменить символ-разделитель значений. Сделайте скриншот фрагмента получившегося файла и сохраните его.

[pic 2]

  1. Откройте изменённый файл в редакторе таблиц.
  2. Выполните, если необходимо, разбиение по столбцам.
  3. Если в файле отсутствуют названия столбцов, добавьте их.
  4. Сделайте скриншот получившегося файла и сохраните его.

[pic 3]

  1. По согласованию с преподавателем, определитесь с целевой переменной (столбцом).
  2. Включите фильтр столбцов. Выполните фильтрацию по двум значениям целевой переменной и по одному значению двух любых независимых переменных. Сделайте скриншоты результатов и сохраните их.

В качестве целевой переменной выберем столбец «participants».

[pic 4]

Также выполним фильтрацию столбца «title» и столбца «section».

[pic 5]    [pic 6]

Результат:

[pic 7]

  1. Создайте три новых столбца разными способами. Сделайте скриншот получившихся столбцов и сохраните его.

[pic 8]

  1. Создайте новый столбец на основе целевого столбца. В новом столбце число значений должно быть равно трём. Если в оригинальном целевом столбце число возможных значений равно двум, то необходимо увеличить число принимаемых значений до четырёх (в новом столбце).

[pic 9]

Результат:

[pic 10]

  1. Раскрасьте ячейки получившегося нового целевого столбца исходя из их значений (двумя способами).

Раскрасим ячейки столбца в жёлтый цвет, если значения < 100, и в синий цвет, если значения ≥ 100.

[pic 11]

  1. Постройте три вида гистограмм.

Гистограмма с группировкой:

[pic 12]

Объёмная гистограмма с группировкой:

[pic 13]

Линейчатая гистограмма с группировкой:

[pic 14]

  1. Выполните умножение на константу для произвольного столбца из файла.

Умножим столбец H (participants) на 2

...

Скачать:   txt (6.5 Kb)   pdf (502 Kb)   docx (424.6 Kb)  
Продолжить читать еще 1 страницу »
Доступно только на Essays.club