Аналіз економічних даних в R
Автор: Mukuta_063 • Февраль 26, 2020 • Статья • 496 Слов (2 Страниц) • 489 Просмотры
КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ
ІМЕНІ ТАРАСА ШЕВЧЕНКА
[pic 1]
Економічний факультет
Кафедра економічної кібернетики
Стаття на тему
«Аналіз економічних даних в R»
Студента 3 курсу
ОКР «Бакалавр»
спеціальності «Економіка»
ОП «Економічна кібернетика»
Сільченко Нікіта Сергійович
Київ – 2019
gdp=Makroekonomichni_Dani[1:45,3]
inv=Makroekonomichni_Dani[1:45,4]
rate=Makroekonomichni_Dani[1:45,5]
cpi=Makroekonomichni_Dani[1:45,6]
fm=lm(gdp~inv)
summary(fm)
fm1=lm(gdp~inv+rate+cpi)
summary(fm1)
t1=abs(coef(fm1)[2]-3)/sqrt(vcov(fm1)[2,2])
?qt
t=qt(0.95,41)
if(t1<=t) "H0+" else" H0-"
Надійні інтервали для коефіціентів моделі
confint(fm1)
Надійний інтервал для коефіціента біля Інвестицій
confint(fm1,"inv")
Графічне представлення моделі
plot(fm1)
Таблиця дисперсій моделі
anova(fm1)
Сума квадратів залишків (RSS)
deviance(fm1)
Оцінені значення
predict(fm1)
Зробимо прогноз, за ситуації що в наступному кварталі Інвестиції складуть
80000, Відсоткова ставка 15% та індекс інфляції 116
new=data.frame(inv=c(80000),rate=c(15),cpi=c(116))
predict(fm1,new)
Вектор залишків моделі
residuals(fm1)
Покроковий пошук оптимальної моделі, відкидаючи почергово незалежні
змінні
step(fm1)
Побудова ефективної моделі
fm2=lm(gdp~inv+rate)
summary(fm2)
Модель без константи
fm3=lm(gdp~inv+rate+0)
summary(fm3)
fm3=lm(gdp~inv+rate-1)
summary(fm3)
Нелінійні моделі
Логарифми. Дайте економічну та статистичну інтерпретацію коефіціентам
моделі
fm4=lm(log(gdp)~log(inv)+log(rate))
summary(fm4)
Поліноміальна регресія (фактор Відсоткова ставка представлений тричі в різних
степенях, від 1 до 3)
fm5=lm(gdp~inv+poly(rate,3))
summary(fm5)
Застосування інших нелінійних функцій до функціональної форми регресії
fm6=lm(gdp~I(inv^2)+I(1/rate))
summary(fm6)
fm7=lm(log(gdp)~log(inv)+I(1/rate)+poly(cpi,2))
summary(fm7)
Імпортуємо початкові дані. Формуємо часові ряди
Makroekonomichni_Dani <- read.csv2("D:/Makroekonomichni_Dani.csv")
gdpt=ts(Makroekonomichni_Dani[1:45,3], start=2005, frequency = 4)
invt=ts(Makroekonomichni_Dani[1:45,4], start=2005, frequency = 4)
ratet=ts(Makroekonomichni_Dani[1:45,5], start=2005, frequency = 4)
cpit=ts(Makroekonomichni_Dani[1:45,6], start=2005, frequency = 4)
Будуємо лінійну багатофакторну регресію
fm=lm(gdpt~invt+ratet+cpit)
Проводимо графічний аналіз. Досліджуємо періоди потенційної нестабільності
plot(invt, type="l", ylim=c(0,600000))
lines(gdpt)
plot(invt, type="l", ylim=c(10000,600000), log="y")
lines(gdpt)
plot(invt, type="l", ylim=c(-150000,400000))
lines(gdpt-200000)
plot(ratet, type="l", ylim=c(1,600000), log="y")
lines(gdpt)
lines(invt)
Прийшли до висновку, що в 1му кварталі 2009 року структурне зрушення є
найбільш імовірним
Перевіряємо гіпотезу про наявність структурного зрушення в 2009Q1 за
дисперсійним критерієм Чоу
n1=17
n=45
k=4
gdpt1=ts(gdpt[1:n1], start = 2005, frequency = 4)
gdpt2=ts(gdpt[c(n1+1):45], start = c(2009, 2), frequency = 4)
invt1=ts(invt[1:n1], start = 2005, frequency = 4)
invt2=ts(invt[c(n1+1):45], start = c(2009, 2), frequency = 4)
ratet1=ts(ratet[1:n1], start = 2005, frequency = 4)
ratet2=ts(ratet[c(n1+1):45], start = c(2009, 2), frequency = 4)
cpit1=ts(cpit[1:n1], start = 2005, frequency = 4)
cpit2=ts(cpit[c(n1+1):45], start = c(2009, 2), frequency = 4)
fm1=lm(gdpt1~invt1+ratet1+cpit1)
fm2=lm(gdpt2~invt2+ratet2+cpit2)
Fpr=((deviance(fm)-
(anova(fm1)[4,2]+anova(fm2)[4,2]))/k)/((deviance(fm1)+deviance(fm2))/n-2*k)
Fpr
if (Fpr<=qf(0.95,k, n-2*k)) "Приймаємо гіпотезу про відсутні структурні
зрушення" else "Структурні зрушення наявні"
Якщо ж перевірити 2015Q2, то скористаємось прогностичним критерієм Чоу
n1=42
gdpt1=ts(gdpt[1:n1], start = 2005, frequency = 4)
invt1=ts(invt[1:n1], start = 2005, frequency = 4)
ratet1=ts(ratet[1:n1], start = 2005, frequency = 4)
cpit1=ts(cpit[1:n1], start = 2005, frequency = 4)
...