Московский государственный университет им. М.В. Ломоносова
Московская школа экономики (факультет)
Кафедра эконометрики и математических методов в экономике
Курсовая работа по эконометрике
На тему:
Эконометрическое моделирование качества жизни населения
(Econometric modeling of the quality of life)
Выполнил: студент 3 курса Редькин Артем Вадимович
Научный руководитель: Ивин Евгений Александрович
(кандидат физико-математических наук, доцент)
Москва 2014
План работы (оглавление):
- Введение (актуальность, цель работы, объект исследования, предмет исследования)
- Корреляционно-регрессионный анализ влияния уровня качества жизни населения на экономическое развитие страны.
2а) Построение парной регрессии
2б) Построение множественной регрессии
- Моделирование с фиктивной переменной (гипотеза о географическом положении)
- Заключение
Введение
Актуальность:
Эконометрика служит мощным инструментом для обнаружения, описания и использования наиболее устойчивых характеристик в поведении реальных экономических явлений и объектов. Данная работа посвящена исследованию проблемы качества жизни населения в различных странах мира и выявлению основных причин и факторов, способствующих улучшению качества жизни населения.
Исследование уровня качества жизни граждан является достаточно актуальной и важной проблемой в современном мире. Показатель качества жизни населения выступает одним из главных показателей экономического развития страны.
Проблемы уровня и качества жизни являются одними из наиболее актуальных. Причиной служит экономический кризис 2008-2010 гг., на фоне которого в обществе произошло глубокое падение уровня и качества жизни основной массы населения.
От решения проблем уровня и качества жизни во многом зависит направленность и темпы дальнейших преобразований в стране и, в конечном счете, политическая, а, следовательно, и экономическая стабильность в обществе. Решение этих проблем требует определенной политики, выработанной государством, центральным моментом которой был бы человек, его благосостояние, физическое и социальное здоровье. Именно поэтому все преобразования, которые, так или иначе, могут повлечь изменение уровня жизни, вызывают большой интерес у самых разнообразных слоев населения.
Целью данной работы является изучение факторов, определяющих динамику уровня жизни населения, анализ степени их влияния и роли в повышении данного показателя.
Объект исследования – выборка из 54 стран, среди которых есть как европейские, так и страны Азии и других континентов.
Предмет исследования – влияние качества жизни населения на экономическое развитие в различных странах.
Для решения поставленных задач нами будет использован пакет EViews 6.0
Раздел 1. Парная регрессия
Для того чтобы построить эконометрическую модель и посмотреть, как ведут себя те или иные параметры, воспользуемся регрессионным анализом.
У нас есть выборка по 54 странам.
Y(1) – эндогенная переменная, или зависимая. Она обозначает уровень качества жизни населения.
Экзогенные переменные, или независимые:
Х(3) - личное конечное потребление на душу в год в текущих ценах (с учетом ППС) в тыс. долл.
Х(13) – уровень безработицы (в %)
Х(15) – уровень распространенности и эффективности использования новых информационных технологий (экспертная оценка, измеряется от 0 до 10)
Х(16) – ожидаемая при рождении продолжительность жизни (количество лет)
Х(17) – риск политической нестабильности (экспертная оценка, измеряется от 0 до 10, 0 – высокий риск, низкий риск политической нестабильности – 10)
Для того чтобы построить простейшую парную линейную регрессию, необходимо вычислить, какой из наших факторов сильнее всего коррелирует с зависимой переменной. Для этого вычислим корреляционную матрицу по всем переменным и посмотрим на результат.
|
Y1 |
X3 |
X15 |
X16 |
X13 |
X17 |
Y1 |
1.000000 |
0.816812 |
0.577703 |
0.656261 |
-0.363789 |
0.785786 |
X3 |
0.816812 |
1.000000 |
0.450634 |
0.647153 |
-0.338061 |
0.709810 |
X15 |
0.577703 |
0.450634 |
1.000000 |
0.458867 |
-0.276786 |
0.451191 |
X16 |
0.656261 |
0.647153 |
0.458867 |
1.000000 |
-0.569628 |
0.539824 |
X13 |
-0.363789 |
-0.338061 |
-0.276786 |
-0.569628 |
1.000000 |
-0.238717 |
X17 |
0.785786 |
0.709810 |
0.451191 |
0.539824 |
-0.238717 |
1.000000 |
Как мы видим, сильнее всего с качеством жизни населения Y(1) коррелирует личное конечное потребление на душу Х(3). При чем эта зависимость положительная (прямая) , и она равна 0.82 , что говорит о заметной связи. Другими словами, связь высокая, так как значение парных коэффициентов по модулю больше 0.6 . Отсюда можно сделать вывод, что при росте личного конечного потребления качество жизни населения улучшится или увеличится.
Затем с помощью статистического пакета Eviews построим уравнение парной регрессии и проанализируем его.
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 09/23/14 Time: 15:08 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
0.000158 |
1.55E-05 |
10.20988 |
0.0000 |
C |
4.493269 |
0.254854 |
17.63079 |
0.0000 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.667182 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.660782 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
1.189244 |
Akaike info criterion |
3.220847 |
|
Sum squared resid |
73.54368 |
Schwarz criterion |
3.294513 |
|
Log likelihood |
-84.96286 |
Hannan-Quinn criter. |
3.249257 |
|
F-statistic |
104.2416 |
Durbin-Watson stat |
1.989883 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Как видно из таблицы, свободный член (С) равен 4.49. А коэффициент при Х(3) равен 0.000158 .
Таким образом наше уравнение имеет вид: Y=4.49 + 0.000158 X3
Ниже представлена диаграмма распределения наших переменных:
Прямая красного цвета является линией регрессии, построенной при помощи метода наименьших квадратов (МНК).
Свободный член говорит о том, что если мы не включим в уравнение все независимые переменные, то уровень качества жизни населения будет равен 4.49 . А коэффициент при Х(3) говорит о том, что при изменении личного конечного потребления на душу на 1% , уровень качества жизни населения Y(1) изменится на 0.000158 .
Для того чтобы понять, являются ли полученные коэффициенты значимыми, то есть имеет ли смысл модель, воспользуемся критерием Стьюдента, нулевая гипотеза которого говорит о незначимости коэффициента, то есть коэффициент равен 0. Уровень доверия возьмем равным 0.95 (95%) , соответственно, вероятность ошибки равна 0.05 (5%).
Так как Probability равен 0.000 в обоих случаях, то есть меньше 0.05 , то нулевая гипотеза отвергается. Соответственно, наши коэффициенты значимы, поэтому наша модель является действующей.
Другим показателем, характеризирующим качество нашей модели, является R-squared (измеряется в пределах от 0 до 1). Чем его величина больше, тем лучше. В нашей ситуации он равен 0.67. Это означает, что 67% вариации результативного признака Y(1) обусловлено вариацией факторных признаков, вошедших в наше уравнение регрессии. Остальные 33% обусловлены влиянием факторных признаков, не включенных в уравнение, а также действием случайных факторов.
Раздел 2. Множественная регрессия
В предыдущем разделе мы анализировали модель только с одной экзогенной переменной. При построении множественной регрессии одной переменной не обойтись, поэтому мы включим в нашу модель еще четыре объясняющих переменных Х(13), Х(15), Х(16) и Х(17). И посмотрим, как изменятся параметры нашей модели.
Но, в первую очередь, нам нужно выяснить: нет ли признаков мультиколлинеарности между нашими экзогенными переменными. Для ответа на данный вопрос, воспользуемся корреляционной матрицей, рассчитанной выше. Так как корреляции между независимыми переменными больше 0.75 нет, значит и признака мультиколлинеарности нет.
Далее найдем описательные статистики признаков и построим графики плотности распределений:
|
Y1 |
X3 |
X15 |
X16 |
X13 |
X17 |
Mean |
6.503333 |
12713.74 |
7.161667 |
75.28519 |
6.660741 |
6.468148 |
Median |
6.250000 |
8133.500 |
7.200000 |
77.45000 |
6.150000 |
6.290000 |
Maximum |
9.710000 |
34520.00 |
8.920000 |
82.50000 |
23.00000 |
9.640000 |
Minimum |
2.440000 |
548.0000 |
4.650000 |
51.00000 |
1.380000 |
1.220000 |
Std. Dev. |
2.041886 |
10549.14 |
0.976858 |
5.709754 |
3.440766 |
2.225316 |
Skewness |
-0.134133 |
0.603290 |
-0.507597 |
-1.703509 |
2.082032 |
-0.417538 |
Kurtosis |
1.990539 |
1.977168 |
2.791197 |
7.388761 |
10.69636 |
2.322642 |
|
|
|
|
|
|
|
Jarque-Bera |
2.454701 |
5.629546 |
2.416990 |
69.45522 |
172.2901 |
2.601371 |
Probability |
0.293068 |
0.059918 |
0.298646 |
0.000000 |
0.000000 |
0.272345 |
|
|
|
|
|
|
|
Sum |
351.1800 |
686542.0 |
386.7300 |
4065.400 |
359.6800 |
349.2800 |
Sum Sq. Dev. |
220.9728 |
5.90E+09 |
50.57535 |
1727.868 |
627.4602 |
262.4576 |
|
|
|
|
|
|
|
Observations |
54 |
54 |
54 |
54 |
54 |
54 |
|
|
|
|
|
|
|
Синяя линия показывает график плотности распределения, а красная – график плотности нормального распределения.
По статистике Jarque-Bera , нулевая гипотеза которой говорит о нормальности распределения, посмотрим, какие переменные имеют распределения близкие к нормальному.
Y(1), Х(3), Х(15) и Х(17) имеют нормальное распределение, так как probability больше 0.05. Все остальные переменные не имеют нормального распределения.
Снова воспользуемся EViews и проанализируем нашу модель.
Модель 1 (с пятью переменными)
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 10/07/14 Time: 09:57 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
7.95E-05 |
2.02E-05 |
3.927710 |
0.0003 |
X15 |
0.373978 |
0.161513 |
2.315465 |
0.0249 |
X16 |
0.035044 |
0.036404 |
0.962622 |
0.3406 |
X13 |
-0.021070 |
0.047732 |
-0.441427 |
0.6609 |
X17 |
0.323013 |
0.088383 |
3.654707 |
0.0006 |
C |
-1.773337 |
2.779863 |
-0.637922 |
0.5266 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.792828 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.771247 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
0.976595 |
Akaike info criterion |
2.894950 |
|
Sum squared resid |
45.77943 |
Schwarz criterion |
3.115948 |
|
Log likelihood |
-72.16365 |
Hannan-Quinn criter. |
2.980180 |
|
F-statistic |
36.73826 |
Durbin-Watson stat |
1.893748 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
Уравнение регрессии:
Y1 = - 1.77333652361+ 7.95Е-05*X3 + 0.37*X15 + 0.04*X16 - 0.02*X13 + 0.32*X17
Полученная модель характеризуется более высокими показателями коэффициентов детерминации R-squared и Adjusted R-squared, повышающими качество модели, по сравнению с моделью парной регрессии, но при этом коэффициенты при Х(16) , Х(13) согласно критерию Стьюдента не являются значимыми, что само по себе, снижает статистическую значимость модели, за которую отвечает F-статистика. Поэтому убираем эти значения по очереди, пока не останутся только значимые коэффициенты. Таким образом, в нашей модели значимыми являются коэффициенты при Х(3) , Х(15) и Х(17).
Модель 2 ( с тремя переменными)
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 10/07/14 Time: 09:48 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
9.45E-05 |
1.96E-05 |
4.826134 |
0.0000 |
X13 |
-0.059076 |
0.043551 |
-1.356487 |
0.1810 |
X17 |
0.381194 |
0.089969 |
4.236943 |
0.0001 |
C |
3.229624 |
0.582929 |
5.540334 |
0.0000 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.761490 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.747180 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
1.026686 |
Akaike info criterion |
2.961736 |
|
Sum squared resid |
52.70417 |
Schwarz criterion |
3.109068 |
|
Log likelihood |
-75.96687 |
Hannan-Quinn criter. |
3.018556 |
|
F-statistic |
53.21167 |
Durbin-Watson stat |
2.027436 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
Уравнение регрессии:
Y1=3.23 + 0.38* X17 -0.06* X13 + 9.45E-05 * X3
Далее сравним эти две модели:
|
Модель №2 (с тремя переменными) |
Модель №1 ( с пятью переменными) |
R-squared |
0.761490 |
0.792828 |
Adjusted R-squared |
0.747180 |
0.771247 |
F-statistic |
53.21167 |
36.73826 |
Prob(F-statistic) |
0.000000 |
0.000000 |
Akaike info criterion |
2.961736 |
2.961736 |
Schwarz criterion |
3.109068 |
3.115948 |
Из сравнительной таблицы мы видим, что в модели №1 R-squared и Ajusted R-squared больше, что говорит не в пользу этой модели, а Akaike info criterion и Schwarz criterion тоже больше, что говорит, напротив, в пользу модели №2. F-statistic больше у модели №2, что свидетельствует в ее пользу. Поэтому я считаю, что модель с тремя независимыми переменными лучше.
Далее поговорим про эластичность.
Для того чтобы проинтерпретировать модель с экономической точки зрения необходимо определить приоритетность влияния того или иного фактора на модель с помощью рассмотрения коэффициентов эластичностей, присущих каждой независимой переменной.
Если личное конечное потребление, приходящееся на душу населения ( с учетом ППС) Х(3) изменится на 1%, то уровень качества жизни изменится на 9.45Е-05. А если уровень безработицы Х(13) изменится на 1%, то уровень качества жизни Y(1) изменится на -0.06. Если риск политической нестабильности изменится Х(17) изменится на 1%, то уровень качества жизни населения Y(1) изменится на 0.38.
Остатки модели №2 ( с тремя переменными):
obs |
Actual |
Fitted |
Residual |
Residual Plot |
1 |
9.28000 |
8.81836 |
0.46164 |
| . | * . | |
2 |
9.64000 |
8.77725 |
0.86275 |
| . | *. | |
3 |
4.58000 |
5.04350 |
-0.46350 |
| . * | . | |
4 |
8.71000 |
6.60485 |
2.10515 |
| . | . * | |
5 |
3.53000 |
5.37597 |
-1.84597 |
| * . | . | |
6 |
4.79000 |
6.09095 |
-1.30095 |
| *. | . | |
7 |
7.16000 |
8.81692 |
-1.65692 |
| * . | . | |
8 |
5.25000 |
5.06831 |
0.18169 |
| . |* . | |
9 |
2.44000 |
3.66830 |
-1.22830 |
| *. | . | |
10 |
8.89000 |
8.13308 |
0.75692 |
| . | *. | |
11 |
6.18000 |
7.39331 |
-1.21331 |
| *. | . | |
12 |
8.98000 |
9.04916 |
-0.06916 |
| . * . | |
13 |
6.91000 |
5.96668 |
0.94332 |
| . | *. | |
14 |
5.27000 |
5.17123 |
0.09877 |
| . * . | |
15 |
4.26000 |
4.36242 |
-0.10242 |
| . * . | |
16 |
5.66000 |
5.63999 |
0.02001 |
| . * . | |
17 |
8.39000 |
9.04332 |
-0.65332 |
| . * | . | |
18 |
7.71000 |
7.24991 |
0.46009 |
| . | * . | |
19 |
6.86000 |
4.43442 |
2.42558 |
| . | . * |
20 |
9.27000 |
8.62059 |
0.64941 |
| . | * . | |
21 |
4.72000 |
5.39843 |
-0.67843 |
| . * | . | |
22 |
4.82000 |
4.91360 |
-0.09360 |
| . * . | |
23 |
5.22000 |
5.35906 |
-0.13906 |
| . *| . | |
24 |
9.21000 |
9.85563 |
-0.64563 |
| . * | . | |
25 |
7.43000 |
5.95487 |
1.47513 |
| . | . * | |
26 |
4.63000 |
5.69272 |
-1.06272 |
| * | . | |
27 |
8.91000 |
8.43916 |
0.47084 |
| . | * . | |
28 |
8.91000 |
7.99357 |
0.91643 |
| . | *. | |
29 |
9.16000 |
9.62823 |
-0.46823 |
| . * | . | |
30 |
4.33000 |
4.96842 |
-0.63842 |
| . * | . | |
31 |
4.26000 |
5.04955 |
-0.78955 |
| .* | . | |
32 |
6.12000 |
7.18226 |
-1.06226 |
| * | . | |
33 |
6.18000 |
5.59171 |
0.58829 |
| . | * . | |
34 |
2.89000 |
5.31167 |
-2.42167 |
| * . | . | |
35 |
2.68000 |
4.87401 |
-2.19401 |
| * . | . | |
36 |
8.89000 |
8.00456 |
0.88544 |
| . | *. | |
37 |
6.30000 |
5.48884 |
0.81116 |
| . | *. | |
38 |
6.81000 |
6.32972 |
0.48028 |
| . | * . | |
39 |
8.53000 |
9.22078 |
-0.69078 |
| . * | . | |
40 |
5.93000 |
4.43468 |
1.49532 |
| . | . * | |
41 |
5.84000 |
5.47932 |
0.36068 |
| . | * . | |
42 |
5.00000 |
5.11254 |
-0.11254 |
| . * . | |
43 |
2.73000 |
3.52357 |
-0.79357 |
| .* | . | |
44 |
4.81000 |
3.90724 |
0.90276 |
| . | *. | |
45 |
8.12000 |
8.26985 |
-0.14985 |
| . *| . | |
46 |
8.17000 |
8.08044 |
0.08956 |
| . * . | |
47 |
5.58000 |
5.51523 |
0.06477 |
| . * . | |
48 |
7.59000 |
6.50349 |
1.08651 |
| . | * | |
49 |
6.68000 |
6.38353 |
0.29647 |
| . |* . | |
50 |
9.71000 |
9.78379 |
-0.07379 |
| . * . | |
51 |
9.08000 |
8.57257 |
0.50743 |
| . | * . | |
52 |
6.20000 |
6.16669 |
0.03331 |
| . * . | |
53 |
5.08000 |
3.82504 |
1.25496 |
| . | .* | |
54 |
6.90000 |
7.03669 |
-0.13669 |
| . *| . | |
Синяя линия – остатки модели.
Красная линия – фактические данные (исходные значения Y, которые даны в условии)
Зеленая линия – значения, рассчитанные по модели №2.
Затем выясним, являются ли остатки нашей модели гомо- или гетероскедатичными. Для этого проведем Breusch-Godfrey и White тесты.
Heteroskedasticity Test: Breusch-Pagan-Godfrey |
||||
|
|
|
|
|
|
|
|
|
|
F-statistic |
1.851615 |
Prob. F(3,50) |
0.1499 |
|
Obs*R-squared |
5.399379 |
Prob. Chi-Square(3) |
0.1448 |
|
Scaled explained SS |
4.927434 |
Prob. Chi-Square(3) |
0.1772 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Test Equation: |
|
|
|
|
Dependent Variable: RESID^2 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 17:48 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
C |
2.593930 |
0.797155 |
3.253984 |
0.0020 |
X3 |
3.03E-06 |
2.68E-05 |
0.113169 |
0.9103 |
X13 |
-0.035496 |
0.059556 |
-0.596019 |
0.5539 |
X17 |
-0.219541 |
0.123033 |
-1.784413 |
0.0804 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.099989 |
Mean dependent var |
0.976003 |
|
Adjusted R-squared |
0.045988 |
S.D. dependent var |
1.437432 |
|
S.E. of regression |
1.403991 |
Akaike info criterion |
3.587702 |
|
Sum squared resid |
98.55957 |
Schwarz criterion |
3.735034 |
|
Log likelihood |
-92.86796 |
Hannan-Quinn criter. |
3.644522 |
|
F-statistic |
1.851615 |
Durbin-Watson stat |
1.480338 |
|
Prob(F-statistic) |
0.149864 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Heteroskedasticity Test: White |
|
|||
|
|
|
|
|
|
|
|
|
|
F-statistic |
0.956541 |
Prob. F(9,44) |
0.4879 |
|
Obs*R-squared |
8.836511 |
Prob. Chi-Square(9) |
0.4525 |
|
Scaled explained SS |
8.064136 |
Prob. Chi-Square(9) |
0.5277 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Test Equation: |
|
|
|
|
Dependent Variable: RESID^2 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 17:48 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
C |
2.505753 |
2.425658 |
1.033020 |
0.3072 |
X3 |
-5.29E-05 |
0.000172 |
-0.307644 |
0.7598 |
X3^2 |
4.87E-09 |
3.79E-09 |
1.286296 |
0.2051 |
X3*X13 |
1.82E-05 |
1.29E-05 |
1.415608 |
0.1639 |
X3*X17 |
-2.68E-05 |
2.42E-05 |
-1.110260 |
0.2729 |
X13 |
-0.125621 |
0.361759 |
-0.347251 |
0.7301 |
X13^2 |
0.005874 |
0.009067 |
0.647901 |
0.5204 |
X13*X17 |
-0.027245 |
0.045991 |
-0.592398 |
0.5566 |
X17 |
-0.062522 |
0.639843 |
-0.097714 |
0.9226 |
X17^2 |
0.025342 |
0.062404 |
0.406088 |
0.6866 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.163639 |
Mean dependent var |
0.976003 |
|
Adjusted R-squared |
-0.007435 |
S.D. dependent var |
1.437432 |
|
S.E. of regression |
1.442766 |
Akaike info criterion |
3.736577 |
|
Sum squared resid |
91.58924 |
Schwarz criterion |
4.104908 |
|
Log likelihood |
-90.88758 |
Hannan-Quinn criter. |
3.878628 |
|
F-statistic |
0.956541 |
Durbin-Watson stat |
1.611845 |
|
Prob(F-statistic) |
0.487890 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Нулевая гипотеза в обоих случаях говорит о том, что дисперсии остатков равны, то есть гомоскедатичны. Для проверки гипотезы мы смотрим на показатели Probability (F-statistic) и Probability Chi-Square. Так как они больше 0.05 в обоих случаях, то нулевая гипотеза принимается, а наши остатки гомоскедатичны.
Проведем Durbin-Watson тест на автокорреляцию остатков. Нулевая гипотеза говорит о том, что автокорреляции нет. DW=2.02 DL=4-1.45=2.55 DN=4-1.68=2.32. Так как 2.02 меньше 2.55 и 2.32 , то нулевая гипотеза принимается, следовательно, автокорреляции нет.
Тест Breusch-Godfrey также говорит, что автокорреляции остатков нет:
Breusch-Godfrey Serial Correlation LM Test: |
|
|||
|
|
|
|
|
|
|
|
|
|
F-statistic |
0.012439 |
Prob. F(1,49) |
0.9117 |
|
Obs*R-squared |
0.013705 |
Prob. Chi-Square(1) |
0.9068 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Test Equation: |
|
|
|
|
Dependent Variable: RESID |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 19:11 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
Presample missing value lagged residuals set to zero. |
||||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
6.22E-08 |
1.98E-05 |
0.003145 |
0.9975 |
X13 |
0.000120 |
0.044001 |
0.002720 |
0.9978 |
X17 |
-4.43E-05 |
0.090872 |
-0.000488 |
0.9996 |
C |
-0.001261 |
0.588882 |
-0.002142 |
0.9983 |
RESID(-1) |
-0.015945 |
0.142965 |
-0.111530 |
0.9117 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.000254 |
Mean dependent var |
-1.54E-16 |
|
Adjusted R-squared |
-0.081358 |
S.D. dependent var |
0.997205 |
|
S.E. of regression |
1.036978 |
Akaike info criterion |
2.998519 |
|
Sum squared resid |
52.69080 |
Schwarz criterion |
3.182684 |
|
Log likelihood |
-75.96001 |
Hannan-Quinn criter. |
3.069544 |
|
F-statistic |
0.003110 |
Durbin-Watson stat |
1.995737 |
|
Prob(F-statistic) |
0.999980 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Так как Probability(F) больше 0.05 то нулевая гипотеза принимается, поэтому автокорреляции нет.
Раздел 3. Моделирование модели с фиктивной переменной.
Введем в модель парной регрессии фиктивную переменную 1, если страна находится в Европе, 0 если нет.
Одна фиктивная переменная:
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 19:23 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
0.000163 |
2.76E-05 |
5.914349 |
0.0000 |
Z1 |
-0.702439 |
0.527635 |
-1.331295 |
0.1891 |
Z1*X3 |
9.76E-06 |
3.48E-05 |
0.280379 |
0.7803 |
C |
4.715395 |
0.325864 |
14.47044 |
0.0000 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.685470 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.666598 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
1.179005 |
Akaike info criterion |
3.238406 |
|
Sum squared resid |
69.50267 |
Schwarz criterion |
3.385738 |
|
Log likelihood |
-83.43697 |
Hannan-Quinn criter. |
3.295227 |
|
F-statistic |
36.32238 |
Durbin-Watson stat |
2.003085 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент значим только при (Х3)
Две фиктивные переменные:
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 19:25 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
0.000175 |
3.30E-05 |
5.300551 |
0.0000 |
Z1 |
-0.517894 |
0.595244 |
-0.870053 |
0.3886 |
Z2 |
0.454705 |
0.634365 |
0.716787 |
0.4770 |
Z1*X3 |
-3.38E-07 |
3.88E-05 |
-0.008696 |
0.9931 |
Z2*X3 |
-3.17E-05 |
6.88E-05 |
-0.461046 |
0.6468 |
C |
4.498988 |
0.451065 |
9.974149 |
0.0000 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.688808 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.656392 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
1.196914 |
Akaike info criterion |
3.301809 |
|
Sum squared resid |
68.76493 |
Schwarz criterion |
3.522807 |
|
Log likelihood |
-83.14885 |
Hannan-Quinn criter. |
3.387039 |
|
F-statistic |
21.24914 |
Durbin-Watson stat |
1.964212 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент значим только при Х(3)
Далее введем в модель множественной регрессии фиктивные переменные:
Одна фиктивная переменная
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 19:27 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
8.15E-05 |
2.95E-05 |
2.764421 |
0.0082 |
X13 |
-0.018440 |
0.048560 |
-0.379727 |
0.7059 |
X15 |
0.341064 |
0.169083 |
2.017144 |
0.0495 |
X16 |
0.039728 |
0.037821 |
1.050429 |
0.2990 |
X17 |
0.311059 |
0.091080 |
3.415239 |
0.0013 |
Z1 |
-0.317288 |
0.468615 |
-0.677075 |
0.5017 |
Z1*X3 |
7.12E-06 |
3.01E-05 |
0.236785 |
0.8139 |
C |
-1.748175 |
2.830554 |
-0.617609 |
0.5399 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.795606 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.764502 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
0.990889 |
Akaike info criterion |
2.955525 |
|
Sum squared resid |
45.16562 |
Schwarz criterion |
3.250190 |
|
Log likelihood |
-71.79919 |
Hannan-Quinn criter. |
3.069166 |
|
F-statistic |
25.57929 |
Durbin-Watson stat |
1.951639 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Значимы коэффициенты Х(15) , Х(17) , Х(3) Две фиктивные переменные:
Dependent Variable: Y1 |
|
|
||
Method: Least Squares |
|
|
||
Date: 12/24/14 Time: 19:30 |
|
|
||
Sample: 1 54 |
|
|
|
|
Included observations: 54 |
|
|
||
|
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
X3 |
9.76E-05 |
3.29E-05 |
2.968536 |
0.0048 |
X13 |
0.012731 |
0.059609 |
0.213583 |
0.8319 |
X15 |
0.329611 |
0.175548 |
1.877613 |
0.0671 |
X16 |
0.061489 |
0.043072 |
1.427583 |
0.1605 |
X17 |
0.302704 |
0.092564 |
3.270198 |
0.0021 |
Z1 |
-0.095816 |
0.523484 |
-0.183036 |
0.8556 |
Z2 |
0.693251 |
0.649398 |
1.067529 |
0.2916 |
Z1*X3 |
-8.67E-06 |
3.33E-05 |
-0.260690 |
0.7955 |
Z2*X3 |
-6.45E-05 |
6.18E-05 |
-1.044644 |
0.3019 |
C |
-3.717951 |
3.377247 |
-1.100882 |
0.2769 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.801556 |
Mean dependent var |
6.503333 |
|
Adjusted R-squared |
0.760966 |
S.D. dependent var |
2.041886 |
|
S.E. of regression |
0.998301 |
Akaike info criterion |
3.000053 |
|
Sum squared resid |
43.85063 |
Schwarz criterion |
3.368383 |
|
Log likelihood |
-71.00142 |
Hannan-Quinn criter. |
3.142103 |
|
F-statistic |
19.74728 |
Durbin-Watson stat |
1.879861 |
|
Prob(F-statistic) |
0.000000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Уравнение регрессии:
Y(1)= -3.72 + 9.76E-05*X3+0.01*X13+0.33*X15+0.06*X16+0.3*X17-0.1*Z1+0.7*Z2-8.67E-06*Z1*X3-6.45E-05*Z2*X3
Значимы коэффициенты Х(3), Х(17).
Модель множественной регрессии с двумя фиктивными переменными лучше, чем модель множественной регрессии с одной фиктивной переменной и лучше, чем модель парной регрессии. Так как R-squared и Adjusted R-squared больше, а Schwarz criterion и Akaike criterion меньше.
Краткие итоги:
При анализе модели парной регрессии коэффициент при Х(3) был значим, из чего следует, что наша модель имеет право на существование. Но она уступает в качестве моделям множественной регрессии со всеми пятью независимыми переменными и с тремя независимыми переменными, так как такие показатели как R-squared и Ajusted R-squared у нее меньше.
Модель множественной регрессии с тремя независимыми переменными лучше чем с пятью независимыми переменными, что видно из сравнения, которое проводилось выше. Поэтому Y(1) уровень качества жизни населения реально зависит только от Х(3) личного конечного потребления на душу в год ( с учетом ППС), от Х(13) уровня безработицы (в %) , от Х(17) риска политической нестабильности. При чем изменение личного конечного потребление Х(3) на 1%, приводит изменения уровня качества жизни на 9.45Е-05. А если уровень безработицы Х(13) изменится на 1%, то уровень качества жизни Y(1) изменится на -0.06. Если риск политической нестабильности изменится Х(17) изменится на 1%, то уровень качества жизни населения Y(1) изменится на 0.38.
Автокорреляция остатков в нашей модели отсутствует и они гомоскедатичны, что говорит в пользу нашей модели с тремя экзогенными переменными. При этом Y(1) имеет нормальное распределение. Поэтому данная модель подходит для нашего анализа. Признаков мультиколлинеарности нет, а Х(3) , Х(16) и Х(17) имеют заметную связь с нашей эндогенной переменной. Она составляет 0.82 , 0.66 и 0.79 соответственно. При чем во всех случаях связь прямая (положительная).
При введении в нашу модель фиктивных переменных , лучше всего подходит та, в которой используются все пять факторов и две фиктивные переменные. В этой модели больше всего значимых коэффициентов и такие показатели как R-squared и Ajusted R-squared выше чем у других. Они равны 0.80 и 0.76 соответственно. А такие показатели , как Schwarz criterion и Akaike criterion меньше и равны соответственно 3.36 и 3.00 .
Поэтому при сравнении моделей множественной регрессии без фиктивных переменных будет состоятельней модель с тремя регрессорами. Но, если мы будем рассматривать модель множественной регрессии с фиктивными переменными, то будет лучше та, у которой все пять независимых переменных и две фиктивные переменные.
Заключение.
В данной работе мы провели обширный эконометрический анализ уровня влияния качества жизни населения на экономическое развитие страны по выборке из 54 стран. Тщательным образом была исследована зависимость между уровнем качества жизни населения и другими социально-экономическими факторами.
Были отобраны показатели, наиболее точно характеризующие уровень влияния качества жизни населения на экономическое развитие стран мира. Далее, нами были построены и проанализированы парная и множественная регрессионные модели зависимости уровня качества жизни населения от других социально-экономических факторов.
Финальная модель – модель с фиктивной переменной качественна по всем параметрам, включая такие как нормальность распределения выборок, гомоскедатичность остатков, отсутствие автокорреляции случайных остатков, высокие значения F-статистики, означающие высокую значимость модели в целом, высокие значения t-статистик, значащие высокую значимость отдельных переменных. В модели также отсутствует мультиколлинеарность – следовательно оценки параметров устойчивы.
На основании проведенного анализа можно сделать вывод, что уровень качества жизни населения стран мира наиболее сильно зависит от личного конечного потребления на душу (с учетом ППС) , от уровня безработицы в странах (в%) и от уровня политической нестабильности в той или иной стране.
Скачать: