Регрессионный анализ
Автор: redwald • Апрель 18, 2023 • Задача • 3,300 Слов (14 Страниц) • 138 Просмотры
Регрессионный анализ.
Задание: Рассмотрите данные о заработной плате и социально-демографических характеристиках 2246 женщин, проживавших в 1988г. в США.
Ключевым аспектом работы является разделение работников по уровням квалификации, как и подавляющем большинстве работ за уровень квалификации принят уровень образования/стаж. [1]
[pic 1]
Рисунок 1 – Группировка данных с использованием пакета R
[pic 2]
Рисунок 2 – Дисперсия
Так, работники, имеющие высшее образование, относятся к высококвалифицированным специалистам, работники, имеющие за плечами только среднее общее образование, относятся к низкоквалифицированным специалистам. Итак, в работе использовались данные по занятости и заработным платам с учётом уровня образования в период 1988 по штатам США.
В работе была использована реальная среднемесячная заработная плата сотрудников организаций по штатам, которая была приведена к реальным значениям с помощью корректировки на региональный уровень инфляции.
[pic 3]
Рисунок 3 – Анализ данных с использованием пакета R
Прежде всего проверим гипотезу о наличии конвергенции между регионами CIF. Для этого используем модель условной конвергенции, предложенную Barro, Robert J., and Xavier Sala-i-Martin: [19][20]
ln()=α+ ++ + , (1)[pic 4][pic 5][pic 6][pic 7][pic 8]
где - вектор значений среднемесячной начисленной заработной платы населения в регионе i в год t[pic 9]
- вектор значений среднемесячной начисленной заработной платы населения в регионе i в год t-1.[pic 10]
вектор значений объясняющих переменных.[pic 11]
вектор значений контрольных переменных.[pic 12]
Далее для анализа возросшего неравенства проверим гипотезу об увеличивающемся внутригрупповом неравенстве в доходах, проверим наличие этого процесса для высококвалифицированных и низкоквалифицированных работников. Исходя из теоретического обоснования, разрыв в заработных платах будет наблюдаться только у высококвалифицированных работников, в то время как доходы низкоквалифицированных продолжат сходиться. Регрессия, с помощью которой будет проверена эта гипотеза имеет следующий вид:
Ln () =α+β +, (2)[pic 13][pic 14][pic 15]
где - вектор значений среднемесячной начисленной заработной платы населения в регионе i в год t[pic 16]
- вектор значений среднемесячной начисленной заработной платы населения в регионе i в год t-1.[pic 17]
Если коэффициент при объясняющей переменной β статистически значим, а также имеет отрицательный знак, то имеет место β – конвергенция. В противном случае, если коэффициент β положительный, то наблюдается дивергенция. Также, чтобы подтвердить выявленную динамику, построим регрессию отражающую взаимосвязь между изменениями в премии за навыки и концентрации высококвалифицированной силы в регионах. Логично предположить, что увеличение концентрации навыков в регионе ведёт к уменьшению премии, однако, из предположения о существовании технологических изменений, ориентированных на навыки, следует, что с увеличением концентрации навыков, премия за них будет увеличиваться. Таким образом неравенство между регионами еще больше усугубится и появятся регионы с явно выраженным преимуществом в навыках, знаниях, а, следовательно, и в развитии. Предполагается, что коэффициент β окажется положительным.
Ln () =α+ + ++, (3)[pic 18][pic 19][pic 20][pic 21][pic 22]
Где - вектор значений среднемесячной начисленной заработной платы населения с высшим образованием в регионе i в год t;[pic 23]
- вектор значений среднемесячной начисленной заработной платы населения со средним образованием в регионе i в год t;[pic 24]
- вектор значений занятости населения в регионе i в год t;[pic 25]
- вектор значений занятости населения со средним в регионе i в год t;[pic 26]
...