Изучение параметров множественной регрессии в «Statistica»
Автор: Nastia28 • Февраль 1, 2019 • Лабораторная работа • 1,537 Слов (7 Страниц) • 473 Просмотры
ЛАБОРАТОРНАЯ РАБОТА №3
«Изучение параметров множественной регрессии в «Statistica»
Цель работы: Изучение параметров множественной регрессии в программе «Statistica».
1. Теоретический обзор
В экономическом анализе значения результатов деятельности складываются под воздействием не одного, а нескольких (многих) факторов. Построение модели многофакторного регрессионного анализа позволяет определить не только степень влияния каждого из факторов на исследуемый показатель, но и моделировать этот показатель, задаваясь значениями того или иного фактора.
Множественная регрессия представляет собой уравнение связи с несколькими независимыми переменными: y=f(x1, x2,...,xn). В общем виде линейное уравнение множественной регрессии выглядит следующим образом:
[pic 1]
где y – исследуемый показатель (зависимая переменная);
x1, x2, ..., xn – факторы, влияющие на исследуемый показатель;
а1, а2, ..., аn – коэффициенты регрессии, показывающие степень влияния факторов на исследуемый показатель.
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
По коэффициентам уравнения регрессии определяется степень влияния определенного фактора на величину изменения исследуемого показателя. С изменением величины любого фактора зависимая переменная изменяется с учетом значения коэффициента регрессии и знака в уравнении при этом факторе.
Чтобы построить многофакторную регрессионную модель, необходимо отобрать факторы, в наибольшей степени, влияющие на результативный показатель. Это достигается при помощи определения тесноты связи между показателями, как правило, при помощи расчета коэффициента парной корреляции. В уравнение регрессии не рекомендуется включать факторы, слабо связанные с результативным показателем, но тесно связанные с другими факторами. Не включают в уравнение и факторы, имеющие тесную корреляционную связь (коэффициент корреляции равен 1). Включение таких факторов приводит к неопределенности решения задачи.
Тесноту связи исследуемого показателя с одним из факторов характеризует парный коэффициент корреляции:
[pic 2]
где , i σx , σy – среднеквадратическое отклонение фактора xi и показателя y, которые определяются средними значениями фактора и показателя.
Значения линейных коэффициентов корреляции rxixj для всевозможных комбинаций переменные xi , xj составляют корреляционную матрицу { rxixj }:
[pic 3]
Если выполняется условие rxixj ≥0,8, то факторные переменные xi , xj находятся в линейной зависимости между собой, а сами переменные xi , xj называются явно коллинеарными. В этом случае в уравнение регрессии включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.
Задание к лабораторной работе
[pic 4]
Рисунок 1
1) Сформируйте таблицу с исходными данными в программе статистика «Statistica» (рисунок 1). Сохраните ее с названием «Данные» в личной папке. 2) Получите трехмерные графики исходных данных.
3) Получите матрицу парных корреляций. Сделайте выводы о наличии или отсутствии коллинеарных переменных. В случае наличия коллинеарных переменных приведите обоснованные доводы о причинах исключения переменной из анализа.
4) Получите таблицу с итогами регрессии для зависимой переменной. Составьте уравнение регрессии. Отметьте степень влияния факторов в модели.
...