Модель парной линейной регрессии
Автор: Маргарита Тейлор • Декабрь 7, 2022 • Контрольная работа • 879 Слов (4 Страниц) • 203 Просмотры
Модель парной линейной регрессии
Задача. Собраны данные за апрель 2021 о стоимости квартир (млн. руб.) и общей площади (м2) в городе Иркутске на вторичном рынке недвижимости. Данные собраны самостоятельно с помощью сервиса: https://www.domofond.ru/.
Y – стоимость квартиры
X – общая площадь квартиры
Необходимо оценить регрессионную модель зависимости стоимости квартиры (в млн. руб.) от общей площади (в м2).
[pic 1]
Построение поля корреляции и формирование гипотезы о форме связи
[pic 2]
Связь по направлению – прямая, по форме – близка к линейной.
Расчёт параметров выборочного уравнения линейной регрессии при помощи МНК
МНК позволяет минимизировать сумму квадратов остатков.
Коэффициенты b0 и b1, при которых сумма квадратов отклонения будет минимальной можно найти, решив следующую систему уравнений:
[pic 3]
[pic 4]
Также можно использовать следующие формулы:
[pic 5]
[pic 6]
Если воспользуемся функцией ЛИНЕЙН в Excel, то получим:
[pic 7]
b0 = 1.29
b1 = 0.08
Уравнение парной линейной регрессии: ŷ = 1,29+0.08x R2 = 0,66
Оценка тесноты связи с помощью показателей корреляции (выборочный коэффициент корреляции) и детерминации
Линейный коэффициент корреляции вычислим по формуле:
[pic 8]
rxy = 0.81
По шкале Чеддока сила связи между признаками высокая.
Для вычисления коэффициента детерминации используется следующая формула:
[pic 9]
SSR = 35,9
SSобщ = 54,4 R2 = 0,66
66% вариации стоимости недвижимости объясняется общей площадью квартиры, 34% приходится на прочие факторы. Такими факторами могут быть район, качество ремонта, площадь кухни, наличие инфраструктуры рядом с домом (детская площадка, парковка), близость остановочного пункта и другое.
Оценка статистической значимости коэффициентов регрессии и корреляции с помощью критерия Стьюдента
[pic 10]
α = 0,05 – уровень значимости
1. Оценить параметры регрессии. 𝑏0 = 1,29; 𝑏1 = 0,08
2. Оценить дисперсию возмущений
[pic 11]
𝑆2 = 18,28/13 = 1,41 – несмещенная оценка дисперсии случайных отклонений S = 1,19
3. Оценить стандартные ошибки оценок параметров
[pic 12]
𝑆𝑏1=1,19/71,7 = 0,02 – cтандартная ошибка коэффициента регрессии
Статистика критерия при нулевой гипотезе имеет распределение Стьюдента с (n-2) степенями свободы.
[pic 13]
t = 0,08/0,02 = 4
Критические точки: 𝑡1−𝑎/2(𝑛−2) = 𝑡0,975(13) = 2,16
4 > 2,16 |tфакт| > t табл[pic 14]
Гипотеза Н0 : b1=0, отвергается в пользу альтернативной при выбранном уровне значимости 0,05. Это подтверждает статистическую значимость коэффициента регрессии b1.
[pic 15]
α = 0,05 – уровень значимости
[pic 16]
𝑆𝑏02 = (1,41 * 63135,8)/(15*5140,5) = 1,15
𝑆𝑏0 = 1,07
[pic 17]
t = 1,29/1,07 = 1,2
Гипотеза Н0 : b1=0 принимается при выбранном уровне значимости 0,05. Коэффициент b0 не является значимым.
...