Кластеризация студентов
Автор: oehvonbsr • Апрель 27, 2022 • Лабораторная работа • 463 Слов (2 Страниц) • 275 Просмотры
Лист ответов по ЛР 4.2 «Кластеризация студентов»
ФИО студента: Никифоров Арсен
Группа: ФИИТ-21
Задание 1. Решение задачи кластеризации методом k-средних при k = 4
№ | Вопрос | Ответ |
L39 =ПОИСКПОЗ(L38;L34:L37;0) | ||
А | Что в формуле для L39 означает параметр 0? Как вы объясните полученный результат? | Если тип_сопоставления равен 0, то функция ПОИСКПОЗ() находит первое значение, которое в точности равно аргументу искомое_значение. Значение 1 означает, что это первое значение, которое нашлось в диапазоне L34:L37, совпадающее с искомым |
Н2 =СУММЕСЛИ('4КС'!$L$39:$DG$39;'4КС-Рейтинг'!H$1;'4КС'!$L2:$DG2) | ||
B | Что в формуле для H2 означает каждый из трех параметров? Как можно интерпретировать полученный результат? | '4КС'!$L$39:$DG$39 – это копирование заданного диапазона значений из листа 4КС, означающий принадлежность студента к кластеру. Количество студентов, относящихся к 1 кластеру, выбравших данный курс. '4КС-Рейтинг'!H$1 – это первая ячейка первого кластерного центра в таблице 4КС, критерий '4КС'!$L2:$DG2 – это диапазон суммирования пар курс-студент из листа 4КС, где 0 это отсутствие связи, а 1 наличие. Это студенты, которые отнесены к первому кластеру. При перетаскивании формулы на соседние поля, будут отображены 2,3,4 кластеры студентов |
C | Какие курсы наиболее популярны в кластере 1? Что в них общего? Как можно охарактеризовать студентов в этом кластере? Ответьте на эти же вопросы для каждого кластера 2-4. | Кластер 1: предпринимательство и экономика. Учатся хорошо. Средний балл >=4. Интересуются почти всем, как 2 направлением. Кластер 2: математика и экономика. Учатся на русском языке. 6-8 курсы. Кластер 3: Все направления 1. Не могут сдать автоматом. Учатся на английском. Интересуются экономикой направление 2. Кластер 4: предпринимательство, инновации, экономика. Не могут сдать автоматом. Интересуются экономикой. |
D | Явно ли прослеживаются отличия кластеров друг от друга? Подходит ли 4 для значения k в кластеризации по k-средним наилучшим образом? | Нет. Нет, не подходит, так как нам нужно среднее значение силуэта, близкое к 1, чтобы считать k-значение 4 оптимальным |
E | Как можно оценить полученное значение силуэта? Почему? | Среднее значение кластера ближе к 0, это значит кластеры пересекаются и накладываются друг на друга. |
...