Построение регрессионных моделей с упорядоченными альтернативами в зависимой переменной
Автор: youhomeless • Июнь 14, 2018 • Лабораторная работа • 545 Слов (3 Страниц) • 634 Просмотры
ФГБОУ ВО
Уфимский государственный авиационный технический университет
Лабораторная работа №2
по дисциплине:
«Эконометрическое моделирование»
Выполнил: студент группы БИБ-404
Соловьев А.C.
Преподаватель: Агадуллина А.И.
Уфа 2018
Цель - Построение регрессионных моделей с упорядоченными альтернативами в зависимой переменной.
Задачи:
- Провести предварительный анализ исходных данных. Исключить аномальные наблюдения (если такие есть), заполнить пропуски (если они имеются). Зависимая переменная должна иметь несколько упорядоченных альтернатив.
- Построить статистически значимую модель упорядоченной регрессии, оценив параметры модели методом максимального правдоподобия, применяя метод пошагового исключения, в которой все переменные будут статистически значимы. Проверить статистическую значимость границ латентной переменной. Подобрать функцию распределения, описывающую вероятность каждой альтернативы между нормальным распределением (пробит), логистическим (логит) и экстремальным (гомпит) на основе минимума информационных критериев.
- Проверить качество отобранной модели, подтвердив его значениями коэффициентов R2 МакФаддена, тестом отношения правдоподобия (LR-тестом).
- Рассчитать маржинальные эффекты для каждой упорядоченной альтернативы и провести интерпретацию коэффициентов модели. Проверить равенство нулю суммы маржинальных эффектов для каждой альтернативы по каждой переменной.
- Оформить отчет о выполнении задания с приведением условия задачи, результатов решения и выводов.
Ход работы:
Исходные данные: уровень зарплаты в европейских компаниях
Источник: kaggle.com
Выбраны поля для анализа:
- Уровень з.п - зависимая переменная (алтернативы: 1 – excellent, 2 – good, 3 – bad)
- Рейтинг компании
- Тест на квалификацию
- Кол-во сотрудников в отделе
- Возраст
- Брак
Цель исследования – выяснить какие из вышеперечисленных факторов влияют на уровень зарплаты. Если есть связь, установить ее по характеру
H0: независимые факторы (рейтинг компании, тест на квалификацию, количество сотрудников в отделе, возраст, брак) не влияют на изменение зависимой упорядоченной переменной – уровень зарплаты
H1: независимые факторы (рейтинг компании, тест на квалификацию, количество сотрудников в отделе, возраст, брак) влияют на изменение зависимой упорядоченной переменной – уровень зарплаты
В ходе исследования, гипотеза H0 была принята, а H1 отвергнута, так как рейтинг компании, тест на квалификацию, количество сотрудников в отделе, возраст, брак не влияют на уровень зарплат.
Построение регрессионных моделей с упорядоченными альтернативами в зависимой переменной
[pic 1]
Рисунок 1 – Построение модели
[pic 2]
Рисунок 2 – Результаты пробит-модели
Факторы Рейтинг компании, Тест-квалификация и возраст статистически незначимы так как prob >0,05
Исключим данные факторы и перестроим модель
[pic 3]
Рисунок 3 – Результаты пробит-модели со значимыми факторами
пробит-модель со значимыми факторами
оценивание логит-модели
для логит и гомпит моделей Факторы Рейтинг компании, Тест-квалификация и возраст статистически незначимы, поэтому исключаем их
...