Парная корреляция и регрессия
Автор: Kema_01 • Январь 4, 2022 • Контрольная работа • 753 Слов (4 Страниц) • 321 Просмотры
Построим поле корреляции в Excel(предоставленно ниже) .
На основании построенного поля корреляции выдвинем гипотезу о том, что связь между всеми возможными значениями Х и Y носит линейные характер.
Рассчитаем коэффициент ковариации
[pic 1]
Exel: [pic 2]
x | y | x-xcp | y-ycp | (x-xcp)*(y-ycp) | (Y-Y cp)2 | (X-X cp)2 |
6 | 4 | 2,4 | 1,6 | 3,84 | 2,56 | 5,76 |
2 | 1 | -1,6 | -1,4 | 2,24 | 1,96 | 2,56 |
4 | 3 | 0.4 | 0,6 | 0,24 | 0,36 | 0,16 |
3 | 2 | -0,6 | -0,4 | 0,24 | 0,16 | 0,36 |
4 | 2 | 0,4 | -0,4 | -0,16 | 0,16 | 0,16 |
4 | 3 | 0,4 | 0,6 | 0,24 | 0,36 | 0,16 |
6 | 4 | 2,4 | 1,6 | 3,84 | 2,56 | 5,76 |
3 | 1 | -0,6 | -1,4 | 0,84 | 1,96 | 0,36 |
2 | 2 | -1,6 | -0,4 | 0,64 | 0,16 | 2,56 |
2 | 2 | -1,6 | -0,4 | 0,64 | 0,16 | 2,56 |
36 | 24 | 12,6 | 10,4 | 20,4 |
Xср=3,6 Yср=2,4 Cov (X,Y)=1,257
Исходя из данных, полученных при рассчёте сделаем вывод, что между количеством людей в семье и количеством телевизоров присутствует прямая связь. О тесноте говорить нельзя,ведь коэфициент ковариации измеряется от минус бесконечности, до плюс бесконечности. Поэтому, можно рассчитать для измерения тесноты связи коэффициент корреляции
σ2(x)=20,410=2,04𝜎2x=20,410=2,04
σ(x)=1,428𝜎x=1,428
σ2(y)=10,410=1,04𝜎2y=10,410=1,04
σ(y)=1,019𝜎y=1,019
rx,y=1,2571,428∗1,019=1,2571,455=0,865rx,y=1,2571,428∗1,019=1,2571,455=0,865
Можно сделать вывод о том, что связь между Х и Y прямая и тесная. Этот вывод можно сделать , так как коэффициент приобретает положительные значения, а это говорит о прямоте связи. Поскольку коэффициент корреляции находится в пределах от -1 до 1, то получится значение близкое к 1 -связь тесная.
Коэффициент детерминации
r2x,y=(rx,y)2=(0,865)2=0,748r2x,y=(rx,y)2=(0,865)2=0,748
Коэффициент детерминации показывает, какая часть колеблемости Y объясняется колеблемостью Y. Так же можно сказать, что количество телевизоров зависит от количества человек в семье на 74,8%.
Проверим значимость коэффициента корреляции
Для этого сформулируем гипотезы:
[pic 3] (линейной корреляционной связи между Х и У нет; коэффициент корреляции не значим)
[pic 4] (между Х и У есть линейная корреляционная связь; Коэффициент корреляции значим)
Устанавливаем уровень значимости
α=0,05
Находим наблюдаемое значение критерия
tнабл.=rx,yσr=0,8651,77=4,877tнабл.=rx,y𝜎r=0,8651,77=4,877
σr=√𝜎r=1−r2/n−2= 0,177
Находим критическое значение критерия по таблице Стьюдента по уровню значимости α и по числу степеней свободы k=n-m
tкр.(α;k=n−m)tкр.𝛼;k=n−m
tкр.(α=0,05;k=10−2)=2,31
Сравним tнабл и tкр
tнабл(4,877) > tкр(0,177)
С надежность, большей 0,95 можно утверждать, что между Х и У (между числом человек в семье и числом телевизоров) в генеральной совокупности существует линейная корреляционная связь.
Построим доверительный интервал коэффициента корреляции в генеральной совокупности
...