Однофакторный дисперсный анализ
Автор: ea3025 • Февраль 2, 2020 • Лабораторная работа • 730 Слов (3 Страниц) • 316 Просмотры
Лабораторная работа № 2 по курсу «Статистика»
Тема: Однофакторный дисперсный анализ
Задание: исходные данные для выполнения работы – информация по 25 регионам в диапазоне Иглинский – Хайбуллинский, из которой нас интересует:
– численность населения в каждом регионе (за 2007 г.);
– рождаемость по каждому региону (за 2007 год);
– объемы производства с/х продукции (зерновые и зернобобовые культуры) за 2008 год.
[pic 1]
Выполнение работы:
Часть 1. Группировка данных
1. На Лист «Группировка по Рождаемости» копируем необходимые данные, скроем лишние столбцы (Формат-Скрыть-Скрыть столбцы) и произведем группировку исходных данных по Рождаемости (данные столбца «Родилось, чел») с равными интервалами, используя для поиска количества групп формулу Стерджесса: k=1+3.322 * lgn=1+log2n , где n - число единиц совокупности /берется всегда целое число, путем округления/. Шаг группировки найдем по формуле: h=(Xmax-Xmin)/k.
Сформируем группировочную таблицу, откладывая равные интервалы от хmin
Группировка по рождаемости | |||
Результаты вычислений | |||
xmax= | 774 | n= | 25 |
xmin= | 198 | k= | 5 |
Шаг | 115,2 | ||
Ниж.граница | Верх.граница | ||
Интервал 1 | 198,0 | 313,2 | |
Интервал 2 | 313,2 | 428,4 | |
Интервал 3 | 428,4 | 543,6 | |
Интервал 4 | 543,6 | 658,8 | |
Интервал 5 | 658,8 | 774,0 | |
Формулы | |||
xmax= | МАКС(C5:C29) |
| 25 |
xmin= | МИН(C5:C29) |
| 5 |
Шаг | (G5-G6)/5 | ||
Ниж.граница | Верх.граница | ||
Интервал 1 | G6 | H9+G18 | |
Интервал 2 | H9+$G$7 | I9+$G$7 | |
Интервал 3 | H10+$G$7 | I10+$G$7 | |
Интервал 4 | H11+$G$7 | I11+$G$7 | |
Интервал 5 | H12+$G$7 | I12+$G$7 |
3. На Лист «Группировка по Численности» копируем исходные данные и произведем аналогичные пунктам 1 и 2 действия и вычисления для Листа «Группировка по Численности».
[pic 2]
Для удобства группировки на каждом расчетном листе выполним сортировку данных по Рождаемости /Численности/ (Сортировка – Настраиваемая сортировка Сортировать по Родилось /Численность/ – По возрастанию).
Часть 2. Вычисление показателей разброса
Вычисления показателей разброса проводим для Результативного признака – Производства продукции.
Постановка задачи: Необходимо провести анализ влияния каждого из группировочных признаков: рождаемости, численности на результативный признак – производство зерновых культур. Для этого прибегнем к помощи Аналитической группировки - основам дисперсионного анализа. Осуществим однофакторный дисперсионный анализ с помощью коэффициента детерминации предварительно вычислив показатели:
2.1. Частота (численность) группы (fj)
- после разделения исходной упорядоченной совокупности на группы рассчитаем численность для каждой группы;
=СЧЕТ(адрес массива);
2.2. Среднее групповое значение (j) [pic 3]
- по каждой группе рассчитаем, сколько в среднем приходится на эту группу тонн производимой продукции;
=СРЗНАЧ(адрес массив);
2.3. Внутригрупповая дисперсия () [pic 4]
- рассчитаем средний квадрат разброса значений внутри каждой группы
[pic 5]
=ДИСПР(адрес массив).
2.4 Средняя из внутригрупповых дисперсий ()[pic 6]
...