Построение множественной линейной регрессионной модели
Автор: Yulia Ilkevich • Февраль 23, 2020 • Контрольная работа • 1,858 Слов (8 Страниц) • 407 Просмотры
Индивидуальная работа на тему
«Построение множественной линейной регрессионной модели»
Выполнила
Студентка 17ДЭА-1, 3 курс, УЭФ
Илькевич Юлия
Шаг 1. Выбор темы, постановка задачи. На данном этапе была определена тема индивидуального задания – от чего зависит трансфертная стоимость футболиста (величина Y). В соответствии с темой были исследованы предполагаемые факторы (X):
- X1: Возраст игрока – позволяет оценить степень влияния возрастной категории на стоимость футболиста.
- X2: Количество забитых голов (в сезоне) - отражает непосредственно результативную деятельность игрока во время матча.
- X3: Позиция – позволяет оценить важность расположения игрока на поле.
- X4: Голевая передача – отражает количество передач, после которых следуют голы. По своей роли сопоставим
- X5: Клуб, откуда переходит игрок (страна) - рассмотрение данного фактора основано на предположении, что игроки, выступающие за клубы наиболее успешных в футбольной деятельности стран, вызывают повышенный интерес у клуба-покупателя.
- Х6: Продолжительность травм (за сезон) – введение данного фактора обусловлено предположением о том, что игрок, часто подвергающийся травмированию и по этой причине пропускающий тренировки и матчи, оценивается клубом ниже.
- Х7: Количество сыгранных матчей за сезон – отобран как фактор в связи с предположением о имеющейся зависимости от числа выходов игрока на поле.
Данные о трансфертной стоимости игрока на 2019 год были взяты на сайте transfermarkt.com, данные о результативных показателях футболистов – на сайтах www.myscore.ru, www.sports.ru.
Исходные данные по 31 футболисту представлены в следующей таблице:[pic 1]
Рис.1. Исходные данные
Для проведения исследования необходимо внести некоторые преобразования данных:
- для включения в работу качественного показателя «позиция» переменной x3 были определены следующие количественные значения:
значение переменной «1» свидетельствует о принадлежности футболиста к позиции «нападающий». Значение переменной «0» указывает на принадлежность игрока к позиции «защитник/полузащитник».
- Для рассмотрения качественного показателя «клуб, откуда переходит игрок» переменной x5 также присвоим количественные значения:
значение переменной «1» свидетельствует о том, что футболист играл в клубе одной из четырех наиболее успешных стран: Англии, Испании, Италии или Франции. Значение переменной «0» указывает на принадлежность игрока к клубу иной страны.
В результате внесенных обозначений таблица примет вид:[pic 2]
Рис.2.Исходные данные после преобразований
Шаг 2. Определение факторных признаков для построения регрессионной модели.[pic 3]
Рис.3. Корреляционная матрица
Проанализируем коэффициенты парной корреляции. Зависимая переменная y имеет тесную связь с переменной x2 (rx2y = 0,99), и достаточно высокое влияние на нее оказывают переменные x3 и x7 (rx3y = 0,58, rx7y= 0,49). Мультиколлинеарность факторов отсутствует, поскольку зависимость между факторами не превышает 0,7.
Шаг 3. Построим протокол первичного регрессионного анализа. [pic 4]
Рис.4. Протокол первичного регрессионного анализа
Исходная регрессионная модель трансфертной стоимости футболиста будет иметь вид:
[pic 5]
tстат (7,4) (-5,6) (50,8) (-0,01) (-1,01) (6,9) (-0,6) (0,1) F = 860,7
Шаг 4. Осуществим проверку статистической значимости коэффициентов уравнения (по Стьюденту)
Получив протокол регрессионного анализа в Excel, мы должны сравнить p-значение каждого фактора со значением 0,1.
...