Построение и нахождение наилучшей модели множественной регрессии
Автор: MaryLaz • Март 10, 2019 • Контрольная работа • 822 Слов (4 Страниц) • 427 Просмотры
Цели и задачи: построить множественную регрессионную модель на основе исходных данных, оценить параметры, оценить статистическую значимость коэффициентов, тесноту связи, а также качество подгонки модели, найти наилучшую модель. На основе результатов сделать соответствующие выводы посредством их интерпретации.
Описание исходных данных: Данные для построения множественной регрессионной модели (80 наблюдений) были взяты случайным образом с сайта агентства недвижимости «Лендлорд», где представлены текущие предложения г. Ростова-на-Дону. Исследуется, какие факторы и в какой степени влияют на формирование цены на вторичном рынке жилья. Регрессантом модели выступает цена квартиры на вторичном рынке (млн руб.), выделено 6 факторов, среди которых: х1 - число комнат в квартире (1,2,3,4), d1 - район города (1 – центральные, 0 - периферийные), х2 - общая площадь квартиры (м2) , х3 - жилая площадь квартиры (м2), х4 - площадь кухни (м2), d2 - время строительства (1 – новостройки, 0 – «хрущевки» и старый жилой фонд).
Априорные предположения: Большое влияние на цену квартиры должна оказывать общая площадь, а также район города, время постройки. Проверим предположение, построив модель.
Построим выбранную модель, используя статистический пакет Statistica.
Итак, мы получили следующие коэффициенты регрессии:
a = -0,95, b1 = 0,08, b2 = 0,06, b3 = 0,01, b4 = 0,04, γ1 = 1,1, γ2 = 1,11, таким образом, получено уравнение множественной регрессии:
[pic 1]
Дадим интерпретацию полученным результатам:
- Коэффициент а показывает совокупное влияние прочих факторов, не включенных в модель;
- При увеличении числа комнат в квартире на единицу, показатель цены увеличивается в среднем на 80 000 руб., при фиксированном влиянии остальных факторов, включенных в модель;
- При увеличении общей площади квартиры на 1 м2, показатель цены увеличивается в среднем на 60 000 руб., при фиксированном влиянии остальных факторов, включенных в модель;
- При увеличении жилой площади квартиры на 1 м2, показатель цены увеличивается в среднем на 10 000 руб., при фиксированном влиянии остальных факторов, включенных в модель;
- При увеличении площади кухни на 1 м2, показатель цены увеличивается в среднем на 40 000 руб., при фиксированном влиянии остальных факторов, включенных в модель;
- Жилье в центральных районах дороже, чем на периферийных в среднем на 1,1 млн. руб., при фиксированном влиянии остальных факторов, включенных в модель;
- Новое жилье (в новостройках) дороже «хрущевок» и старого жилого фонда в среднем на 1,11 млн руб., при фиксированном влиянии остальных факторов, включенных в модель.
Проверим модель на мультиколлинеарность факторов с помощью оценки парных коэффициентов корреляции.
Парные коэффициенты корреляции | |||||||
Переменная | x1 | d1 | x2 | x3 | x4 | d2 | y |
x1 | 1,00 | -0,06 | 0,85 | 0,82 | 0,54 | 0,03 | 0,69 |
d1 | -0,06 | 1,00 | 0,04 | 0,03 | 0,09 | -0,01 | 0,23 |
x2 | 0,85 | 0,04 | 1,00 | 0,95 | 0,66 | 0,15 | 0,84 |
x3 | 0,82 | 0,03 | 0,95 | 1,00 | 0,48 | 0,06 | 0,76 |
x4 | 0,54 | 0,09 | 0,66 | 0,48 | 1,00 | 0,31 | 0,69 |
d2 | 0,03 | -0,01 | 0,15 | 0,06 | 0,31 | 1,00 | 0,34 |
y | 0,69 | 0,23 | 0,84 | 0,76 | 0,69 | 0,34 | 1,00 |
Высокий коэффициент парной корреляции наблюдается у х1 и х2, х1 и х3, х2 и х3 (больше 0,7).
Частные коэффициенты корреляции представлены в таблице:
Переменная | |
x1 | 0,04 |
d1 | 0,39 |
x2 | 0,34 |
x3 | 0,06 |
x4 | 0,14 |
d2 | 0,38 |
При этом статистически значимы по t-статистике Стьюдента a, d1, x2, d2. С точки зрения F-критерия Фишера, модель качественная F = 50,8. Множественная корреляция – 0,9 (сильная связь между регрессантом и всеми факторами, вошедшими в модель), Коэффициент детерминации = 0,81(81% вариации цены объясняется вариацией факторов, включенных в модель), скорректированная множественная корреляция – 0,79.
...