Лабораторная работа
Регрессионные модели с переменной структурой
Задание По данным лабораторной работы 1:
1 Оцените линейную регрессию, включив в модель фиктивную переменную
2 Проверти данные на наличие структурного сдвига при помощи теста Чоу.
Реализация типовых заданий
Задание 1 По исходным данным из лабораторной работы №1, включив фиктивную переменную (таблица 2.1), построим матрицу парных коэффициентов корреляции (таблица 2.2).
Таблица 2.1 – Исходные данные для построения объединенной модели с фиктивными переменными
№ п/п |
Пол руководителя компании |
D |
||||||
1 |
2,5 |
38,1 |
5,2 |
16,4 |
29,3 |
1,1 |
муж |
1 |
2 |
3,3 |
20,2 |
3,7 |
24,8 |
28,9 |
1,9 |
муж |
1 |
3 |
2,3 |
11,3 |
5 |
9,1 |
27,3 |
0,8 |
муж |
1 |
4 |
3,3 |
16,8 |
1,2 |
19,2 |
26,9 |
1,2 |
муж |
1 |
5 |
4,2 |
26,8 |
6 |
40,7 |
25,7 |
1,5 |
муж |
1 |
6 |
2,9 |
21,8 |
1,5 |
37,1 |
14,9 |
0,2 |
жен |
0 |
7 |
5,7 |
143 |
27,4 |
133,4 |
25,4 |
2,5 |
муж |
1 |
8 |
3,2 |
24,7 |
5,5 |
32,8 |
25,2 |
1,2 |
муж |
1 |
9 |
8,5 |
172,2 |
16,7 |
286,4 |
24,7 |
2,2 |
муж |
1 |
10 |
2 |
8,8 |
0,3 |
1,5 |
23,7 |
0,9 |
жен |
0 |
11 |
2,9 |
13,6 |
2,1 |
10,2 |
23,7 |
1,4 |
жен |
0 |
12 |
3,5 |
33 |
5,2 |
16,3 |
23,4 |
1,7 |
муж |
1 |
13 |
3,5 |
20,2 |
3,6 |
23,7 |
14,6 |
1,8 |
жен |
0 |
14 |
3 |
16,6 |
3,4 |
81,4 |
21,5 |
1,2 |
жен |
0 |
15 |
2 |
26,3 |
3,3 |
40,3 |
21,1 |
1,4 |
жен |
0 |
16 |
2,4 |
13,6 |
0,8 |
12,8 |
20,5 |
0,1 |
жен |
0 |
17 |
3,4 |
33,8 |
3,5 |
54,5 |
18,9 |
1 |
муж |
1 |
18 |
2,5 |
19,2 |
1,8 |
36,8 |
18,2 |
1,6 |
жен |
0 |
19 |
2,7 |
24,5 |
4,1 |
53,7 |
13,8 |
2 |
жен |
0 |
20 |
3,5 |
19,5 |
3,2 |
22,7 |
17,7 |
2 |
муж |
1 |
21 |
0,7 |
28,2 |
0,3 |
50,3 |
17,6 |
1,3 |
муж |
1 |
22 |
2,9 |
20,3 |
2,3 |
27,1 |
17,6 |
1,7 |
жен |
0 |
23 |
3,6 |
20,2 |
3,1 |
25,1 |
17,5 |
1,9 |
муж |
1 |
24 |
2,2 |
11 |
0,4 |
8,8 |
16,3 |
1,2 |
жен |
0 |
25 |
2,3 |
22,3 |
1,5 |
31 |
15,6 |
1,9 |
жен |
0 |
Итого |
79 |
806 |
111,1 |
1096,1 |
530 |
35,7 |
- |
- |
где y – чистый доход, млрд. долл.; x1 – оборот капитала, млрд. долл.; x2 – использованный капитал, млрд. долл.; x3 – численность служащих, тыс. чел.; x4 – рыночная капитализация компаний, млрд. долл.; x5 – заработная плата служащих, тыс. долл.
Таблица 2.2 - Матрица парных коэффициентов корреляции по объединенной подвыборке
|
y |
x1 |
x2 |
x3 |
x4 |
x5 |
d |
y |
1,00 |
|
|
|
|
|
|
x1 |
0,85 |
1,00 |
|
|
|
|
|
x2 |
0,76 |
0,90 |
1,00 |
|
|
|
|
x3 |
0,83 |
0,91 |
0,71 |
1,00 |
|
|
|
x4 |
0,27 |
0,25 |
0,35 |
0,12 |
1,00 |
|
|
x5 |
0,50 |
0,50 |
0,54 |
0,43 |
-0,03 |
1,00 |
|
d |
0,38 |
0,36 |
0,40 |
0,23 |
0,57 |
0,25 |
1,00 |
По матрице коэффициентов корреляции видно, что фиктивная переменная не коллинеарна с отобранными в лабораторной работе №1 факторными переменными х2 и х3 (соответствующие коэффициенты составили 0,40 и 0,23). Следовательно можно построить модель множественной регрессии, включив эти факторы. Результаты регрессионного анализа представлены в таблице 2.3.
Модель примет вид: . Уравнение регрессии значимо по F – критерию на 5% уровне значимости. Оно показывает, что при одном и том же объеме использованного капитала и численности служащих, у предприятий руководителями которых являются мужчины, чистый доход больше в среднем на 0,522 млрд. долл., чем у остальных компаний. Однако, коэффициент при D статистически незначим (уровень значимости составил 0,118 > 0,05). Следовательно, влияние фактора «пол» оказалось несущественно, и есть основание считать, что модель одна и та же для компаний с руководителями мужчинами и женщинами.
Таблица 2.3 – Вывод итогов регрессионного анализа
Регрессионная статистика |
|
Множественный R |
0,873 |
R-квадрат |
0,761 |
Нормированный R-квадрат |
0,727 |
Стандартная ошибка |
0,752 |
Наблюдения |
25,000 |
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
3,000 |
37,856 |
12,619 |
22,337 |
0,000 |
Остаток |
21,000 |
11,864 |
0,565 |
||
Итого |
24,000 |
49,720 |
|
|
Коэффициенты |
Стандартная ошибка |
t - статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
2,00 |
0,23 |
8,62 |
0,00 |
1,52 |
2,49 |
|
0,35 |
0,33 |
1,05 |
0,31 |
-0,34 |
1,03 |
|
0,07 |
0,04 |
1,80 |
0,09 |
-0,01 |
0,16 |
|
0,01 |
0,00 |
3,90 |
0,00 |
0,01 |
0,02 |
Задание 2. Используя критерий Г. Чоу, выясним, можно ли считать одной и той же линейную регрессию для компаний с руководителями мужчинами и женщинами.
По 13 наблюдениям для компаний, руководителями которых являются мужчины, построим уравнение регрессии от факторов х2 и х3. Исходные данные представлены в таблице 2.4.
Таблица 2.4 – Исходные данные для построения модели по первой подвыборке (руководитель компании – мужчина)
№ п.п. |
№ предприятия |
y |
x2 |
x3 |
||
1 |
1 |
2,5 |
5,2 |
16,4 |
2,9 |
0,177 |
2 |
2 |
3,3 |
3,7 |
24,8 |
3,0 |
0,116 |
3 |
3 |
2,3 |
5 |
9,1 |
2,8 |
0,242 |
4 |
4 |
3,3 |
1,2 |
19,2 |
2,7 |
0,348 |
5 |
5 |
4,2 |
6 |
40,7 |
3,4 |
0,704 |
6 |
7 |
5,7 |
27,4 |
133,4 |
6,2 |
0,264 |
7 |
8 |
3,2 |
5,5 |
32,8 |
3,2 |
0,000 |
8 |
9 |
8,5 |
16,7 |
286,4 |
8,0 |
0,273 |
9 |
12 |
3,5 |
5,2 |
16,3 |
2,9 |
0,337 |
10 |
17 |
3,4 |
3,5 |
54,5 |
3,4 |
0,000 |
11 |
20 |
3,5 |
3,2 |
22,7 |
2,9 |
0,367 |
12 |
21 |
0,7 |
0,3 |
50,3 |
3,2 |
6,003 |
13 |
23 |
3,6 |
3,1 |
25,1 |
2,9 |
0,454 |
Итого |
- |
47,7 |
- |
- |
47,449 |
9,286 |
Результаты регрессионного анализа представлены в таблице 2.5.
Таблица 2.5 – Вывод итогов регрессионного анализа по первой подвыборке
Регрессионная статистика |
|
Множественный R |
0,878 |
R-квадрат |
0,771 |
Нормированный R-квадрат |
0,725 |
Стандартная ошибка |
0,963 |
Наблюдения |
13,000 |
Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2,000 |
31,156 |
15,578 |
16,802 |
0,001 |
Остаток |
10,000 |
9,272 |
0,927 |
||
Итого |
12,000 |
40,428 |
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
2,326 |
0,368 |
6,323 |
0,000 |
1,506 |
3,146 |
|
0,064 |
0,053 |
1,208 |
0,255 |
-0,054 |
0,181 |
|
0,016 |
0,005 |
3,215 |
0,009 |
0,005 |
0,028 |
Уравнение примет вид: . Расчетные значения по нему представлены в таблице 2.5, графа 6.
Построим модель регрессии по 12 предприятиям руководителями, которых являются женщины (исходные данные представлены в таблице 2.6).
Таблица 2.6 – Исходные данные для построения модели для второй подвыборке (руководитель компании – женщина)
№ п.п. |
№ предприятия |
y |
x2 |
x3 |
||
1 |
6 |
2,9 |
1,5 |
37,1 |
2,449 |
0,204 |
2 |
10 |
2 |
0,3 |
1,5 |
2,284 |
0,081 |
3 |
11 |
2,9 |
2,1 |
10,2 |
2,665 |
0,055 |
4 |
13 |
3,5 |
3,6 |
23,7 |
2,964 |
0,288 |
Продолжение таблицы 2.6
5 |
14 |
3 |
3,4 |
81,4 |
2,745 |
0,065 |
6 |
15 |
2 |
3,3 |
40,3 |
2,846 |
0,716 |
7 |
16 |
2,4 |
0,8 |
12,8 |
2,363 |
0,001 |
8 |
18 |
2,5 |
1,8 |
36,8 |
2,517 |
0,000 |
9 |
19 |
2,7 |
4,1 |
53,7 |
2,987 |
0,082 |
10 |
22 |
2,9 |
2,3 |
27,1 |
2,660 |
0,058 |
11 |
24 |
2,2 |
0,4 |
8,8 |
2,285 |
0,007 |
12 |
25 |
2,3 |
1,5 |
31 |
2,467 |
0,028 |
Итого |
- |
31,3 |
- |
- |
31,231 |
1,585 |
Результаты регрессионного анализа представлены в таблице 2.7.
Таблица 2.7 – Вывод итогов регрессионного анализа по второй подвыборке
Регрессионная статистика
Множественный R |
0,549 |
R-квадрат |
0,302 |
Нормированный R-квадрат |
0,147 |
Стандартная ошибка |
0,420 |
Наблюдения |
12,000 |
Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2,000 |
0,685 |
0,343 |
1,946 |
0,198 |
Остаток |
9,000 |
1,584 |
0,176 |
||
Итого |
11,000 |
2,269 |
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
2,221 |
0,243 |
9,152 |
0,000 |
1,672 |
2,770 |
|
0,226 |
0,139 |
1,627 |
0,138 |
-0,088 |
0,540 |
|
-0,003 |
0,008 |
-0,349 |
0,735 |
-0,021 |
0,015 |
Модель регрессии примет вид: . Теоретические значения по уравнению представлены в графе 6 таблицы 2.6.
По всем 25 предприятиям (таблица 2.8) рассчитаем уравнение регрессии для объединенной выборки.
Результаты регрессионного анализа представлены в таблице 2.9.
Таблица 2.8 – Исходные данные для построения объединенной модели с фиктивными переменными
№ предприятия |
y |
x2 |
x3 |
||
1 |
2,5 |
5,2 |
16,4 |
2,83 |
0,110 |
2 |
3,3 |
3,7 |
24,8 |
2,83 |
0,223 |
3 |
2,3 |
5 |
9,1 |
2,71 |
0,164 |
4 |
3,3 |
1,2 |
19,2 |
2,53 |
0,598 |
5 |
4,2 |
6 |
40,7 |
3,27 |
0,871 |
6 |
2,9 |
1,5 |
37,1 |
2,82 |
0,006 |
7 |
5,7 |
27,4 |
133,4 |
6,52 |
0,670 |
8 |
3,2 |
5,5 |
32,8 |
3,10 |
0,009 |
9 |
8,5 |
16,7 |
286,4 |
7,88 |
0,381 |
10 |
2 |
0,3 |
1,5 |
2,18 |
0,033 |
11 |
2,9 |
2,1 |
10,2 |
2,47 |
0,185 |
12 |
3,5 |
5,2 |
16,3 |
2,83 |
0,448 |
13 |
3,5 |
3,6 |
23,7 |
2,80 |
0,486 |
14 |
3 |
3,4 |
81,4 |
3,65 |
0,424 |
15 |
2 |
3,3 |
40,3 |
3,03 |
1,052 |
16 |
2,4 |
0,8 |
12,8 |
2,40 |
0,000 |
17 |
3,4 |
3,5 |
54,5 |
3,26 |
0,021 |
18 |
2,5 |
1,8 |
36,8 |
2,84 |
0,117 |
19 |
2,7 |
4,1 |
53,7 |
3,30 |
0,355 |
20 |
3,5 |
3,2 |
22,7 |
2,75 |
0,558 |
21 |
0,7 |
0,3 |
50,3 |
2,91 |
4,904 |
22 |
2,9 |
2,3 |
27,1 |
2,74 |
0,025 |
23 |
3,6 |
3,1 |
25,1 |
2,78 |
0,672 |
24 |
2,2 |
0,4 |
8,8 |
2,30 |
0,010 |
25 |
2,3 |
1,5 |
31 |
2,73 |
0,184 |
Итого |
79 |
111,1 |
1096,1 |
79 |
12,510 |
Модель примет вид: . Теоретические значения по данной модели представлены в графе 5 таблицы 2.8.
Таблица 2.9 – Вывод итогов регрессионного анализа по всей совокупности
Регрессионная статистика |
|
Множественный R |
0,865 |
R-квадрат |
0,749 |
Нормированный R-квадрат |
0,726 |
Стандартная ошибка |
0,753 |
Наблюдения |
25,000 |
Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2,000 |
37,233 |
18,616 |
32,798 |
0,000 |
Остаток |
22,000 |
12,487 |
0,568 |
||
Итого |
24,000 |
49,720 |
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
2,134 |
0,197 |
10,813 |
0,000 |
1,725 |
2,543 |
|
0,087 |
0,038 |
2,304 |
0,031 |
0,009 |
0,166 |
|
0,015 |
0,004 |
3,818 |
0,001 |
0,007 |
0,022 |
Рассчитываем F- критерий по формуле:
где - сумма квадратов отклонений фактических значений результативного признака от теоретических для объединенной выборки (таблица 2.8, итог графы 6);
- сумма квадратов отклонений фактических значений результативного признака от расчетных для первой подвыборки (таблица 2.4, итог графы 7);
- сумма квадратов отклонений фактических значений результативного признака от расчетных для второй подвыборки (таблица 2.6, итог графы 7).
Табличное значение критерия Фишера составило 3,127. Так как расчетное значение критерия меньше табличного, то влияние фактора «пол» несущественно, и в качестве оценки регрессионной модели можно рассматривать уравнение регрессии, полученное по объединенной выборке.
Скачать: