T-тест для независимых выборок
Автор: Виктория Полишко • Январь 7, 2022 • Задача • 417 Слов (2 Страниц) • 340 Просмотры
t-тест для независимых выборок.
Перед применением t-теста необходимо проверить, чтобы данные выборок имели нормальное распределение или близкое к нему.
Для проверки этого необходимо:
- Выбрать способ проверки Descriptive statistics (рисунок 1).
[pic 1]
Рис. 1 Выбор способа проверки
- Выбрать все переменные (рисунок 3)
[pic 2]
Рис. 2 Выбор переменных
- Выбрать проверку с помощью гистограмм (рисунок 3)
[pic 3]
Рис. 3 Выбор проверки
- Получаем результаты для 2 выборок (рисунки4,5)
[pic 4]
Рис.4 Результаты для выборки Мужчины
[pic 5]
Рис.5 Результаты для выборки Женщины
Таким образом, можно сделать вывод, что данные выборки имеют нормальное распределение, а, следовательно, можно применять t-тест.
Задача: Дан файл из 99 значений со средней продолжительность жизни у мужчин и женщин. Требуется проверить гипотезу о том, что средняя продолжительность жизни зависит от пола.
Выдвигаем следующие гипотезы:
Н0: Средняя продолжительность жизни не зависит от пола человека.
И альтернативную ей гипотезу
Н1: Средняя продолжительность жизни зависит от пола.
Последовательность действий:
- Сначала открываем исходный файл с данными в пакете STATICTICA.
[pic 6]Рис.1 Исходные данные
- Далее выбираем способ проверки гипотез - t-test, independent, by variables, так как данные внесены в самостоятельные столбцы, (рисунок 2).
[pic 7]Рис. 2 Выбор способа проверки гипотез
- Выбираем переменные
[pic 8]Рис. 3 Выбор переменных
- Затем нажимаем на кнопку Summary и появляется окно с результатами.
[pic 9]Рис. 4 Результаты
В итоге программа выдаст таблицу с результатами t-теста (рисунок 4). Эта таблица имеет несколько столбцов:
- Mean Group 1(муж) - среднее значение роста в группе «Мужчины»;
- Mean Group 2(жен) - среднее значение роста в группе «Женщины»;
- t-value: значение рассчитанного программой t-критерия Стьюдента;
- df - число степеней свободы;
- P - вероятность справедливости гипотезы о том, что сравниваемые средние значения не различаются. Фактически, это самый главный результат анализа, поскольку именно значение P говорит, верна ли проверяемая гипотеза.
В данном случае P < 0.05, из чего можно сделать вывод о том, что статистически значимые различия между средней продолжительностью мужчин и женщин наблюдаются.
...