close

Вход

Забыли?

вход по аккаунту

?

ЛЕКЦІЯ 4 a

код для вставкиСкачать
ЛЕКЦІЯ 4 ДИСПЕРСІЙНИЙ АНАЛІЗ ЕКОНОМЕТРИЧНОЇ МОДЕЛІ ПЛАН 1. ПОБУДОВА ЕКОНОМЕТРИЧНОЇ МОДЕЛІ НА ОСНОВІ ПОКРОКОВОЇ РЕГРЕСІЇ 2. МНОЖИННИЙ КОЕФІЦІЄНТ КОРЕЛЯЦІЇ І ДЕТЕРМІНАЦІЇ 3. ЧАСТИННІ КОЕФІЦІЄНТИ КОРЕЛЯЦІЇ І КОЕФІЦІЄНТИ РЕГРЕСІЇ 4. ПЕРЕВІРКА ЗНАЧУЩОСТІ І ДОВІРЧІ ІНТЕРВАЛИ 1. ПОБУДОВА ЕКОНОМЕТРИЧНОЇ МОДЕЛІ НА ОСНОВІ ПОКРОКОВОЇ РЕГРЕСІЇ Оцінювання параметрів економетричної моделі та її дисперсійний аналіз становлять загальний процес побудови моделі. Поєднання цих частин зумовило появу альтернативного методу оцінювання параметрів моделі 1МНК, яка базується на елементах дисперсійного аналізу. При елементарному тлумаченні взаємозв’язку між двома змінними за допомогою 1МНК увагу, як правило, акцентують на коефіцієнтах кореляції. Причому неважко показати, що $
a r
yx
y
x
=
s
s
, де r
yx
— парний коефіцієнт кореляції між Y та X; s
y
— середньоквадратичне відхилення залежної змінної; s
x
— середньоквадратичне відхилення незалежної змінної. Отже,оцінка параметрів моделі прямо пропорційна до коефіцієнта парної кореляції. Аналогічні співвідношення виконуються і в загальному випадку. А це означає, що оцінити параметри моделі можна через коефіцієнти кореляції: спочатку оцінити тісноту зв’язку між кожною парою змінних, а потім знайти оцінки параметрів економетричної моделі. Оскільки коефіцієнти парної кореляції та співвідношення між ними і оцінками параметрів моделі базуються на дисперсіях та середніх квадратичних відхиленнях, то побудову економетричної моделі через коефіцієнти парної кореляції доцільно розглянути в дисперсійному аналізі моделі. Залежність оцінок параметрів економетричної моделі і коефіцієнтів парної кореляції покладено в основу алгоритму покрокової регресії. Опишемо цей алгоритм. Крок 1-й. Усі вихідні дані змінних стандартизуються (нормалізуються): y
y y
y
*
;=
-
s
x
x x
j
j j
x
j
*
,=
-
s
(1) де y
*
— нормалізована залежна змінна; x
j
*
— нормалізовані незалежні змінні; x
j
— середнє значення j-ї незалежної змінної; y
— середнє значення залежної змінної; s
y
, s
x
j
— середньоквадратичні відхилення. При цьому середні значення x
j
*
і y
*
дорівнюють нулю, а дисперсії — одиниці. Крок 2-й. Знаходиться кореляційна матриця (матриця парних коефіцієнтів кореляції): r
r r r r r
r r r r r
r r r r r
r r r r r
yy yx yx yx yx
x y x x x x x x x x
x y x x x x x x x x
x y x x x x x x x x
m
m
m
m m m m m m
=
æ
è
ç
ç
ç
ç
ç
ç
ö
ø
÷
÷
÷
÷
÷
÷
1 2 3
1 1 1 1 2 1 3 1
2 2 1 2 2 2 3 2
1 2 3
...
...
...
..................
...
, (2) де r
yx
j
— парні коефіцієнти кореляції між залежною і незалежними змінними, r
n
y x
yx j
j
=
1
* *
n — кількість спостережень; r
x x
k j
— парні коефіцієнти кореляції між незалежними змінними, r
n
x x
x x k j
k j
=
1
* *
. Крок 3-й. На підставі порівняння абсолютних значень r
yx
j
вибираються {
}
max.r
yx
j
Найбільше r
yx
j
вказує на ту незалежну змінну, яка найтісніше пов’язана з y. На цьому кроці на основі 1МНК знаходиться оцінка параметра цієї змінної в моделі: $
$
* *
y x
j
= b, (3) де $
b — оцінка параметру моделі, яка будується на основі стандартизованих даних. Крок 4-й. Серед інших значень r
yx
j
вибирається {
}
max r
yx
j
і в модель вводиться наступна незалежна змінна $
$ $
* * *
y x x
j j
= +
+
b b
1 2 1
і т.д. Якщо немає обмеження на внесення до економетричної моделі кожної наступної незалежної змінної, то обчислення виконуються доти, поки поступово не будуть внесені до моделі всі змінні. Сума квадратів залишків для такої моделі запишеться так: u Y Y
i i i
i
n
i
n
* * *
(
$
)
2
1
2
1= =
å å
= -. Звідси мінімізації підлягає f Y x x x x
j m m
i
n
(
$
) (
$ $ $
...
$
) min
* * * * *
b b b b b= - - - - - ®
=
å
1 1 2 2 3 3
1
2
. Узявши похідну за кожним невідомим параметром b
j
цієї функції і прирівнявши всі здобуті похідні нулю, дістанемо систему нормальних рівнянь. Система нормальних рівнянь для знаходження параметрів моделі b
j
в загальному вигляді запишеться так: r r r r
r r r r
r r r r
r r r r
yx x x x x m x x
yx x x x x m x x
yx x x x x m x x
yx x x x x x x
m
m
m
m m m
1 2 1 3 1 1
2 1 2 3 2 2
3 1 3 2 3 3
1 2 3
1 2 3
2 2 3
1 2 3
1 2 3
= + + + +
= + + + +
= + + + +
= + +
$ $ $
...
$
$ $ $
...
$
$ $ $
...
$
..........
$ $ $
b b b b
b b b b
b b b b
b b b
m
m
+ +
ì
í
ï
ï
ï
ï
î
ï
ï
ï
ï
...
$
.b
Позначимо матрицю парних коефіцієнтів кореляції між незалежними змінними через r, а вектор парних коефіцієнтів кореляції між залежною і незалежними змінними через r
yx
. Тоді система нормальних рівнянь набере вигляду r r
yx
$
b =, а оператор оцінювання параметрів: $
.b =
-
r r
yx
1
(4) Оскільки всі змінні виражені в стандартизованому масштабі, то параметри $
b
j
показують порівняльну силу впливу кожної незалежної змінної на залежну: чим більше за модулем значення параметра $
b
j
, тим сильніше впливає j-та змінна на результат. Зв’язок між оцінками параметрів моделі на основі стандартизованих і нестандартизованих змінних запишеться так: $
$
(,),
$ $
.
a j m
a y a x
j j
y
x
j j
j
j
= =
= -
å
b
s
s
1
0
(5) 2. МНОЖИННИЙ КОЕФІЦІЄНТ КОРЕЛЯЦІЇ І ДЕТЕРМІНАЦІЇ Тіснота зв’язку загального впливу всіх незалежних змінних на залежну визначається коефіцієнтами детермінації і множинної кореляції. Щоб дати метод їх розрахунку необхідно показати, що варіація залежної змінної (Y) навколо свого вибіркового середнього значення (
Y
)
*
може бути розкладена на дві складові: 1) варіацію розрахункових значень (
$
Y
) навколо середнього значення ( )Y; 2) варіацію розрахункових значень (
$
Y
) навколо фактичних (Y). Необхідні при цьому обчислення зведемо в табл. 1 Таблиця 1 Джерело варіації Сума квадратів відхилень Сту
пені своб
оди Середнє квадратів відхилень або дисперсія x x x x
m1 2 3,
,...
(
)
$
$
Y Y A X Y
i
n
- = ¢ ¢
=
å
2
1
m
-
1
(
)
$
Y Y
m
A X Y
m
i
n
p
-
-
=
¢ ¢
-
=
=
å
2
1
2
1 1
s
Залишок u
(
)
Y Y u u
i
n
- = ¢
=
å
$
2
1
n
m
-
(
)
Y Y
n m
u u
n m
i
n
u
-
-
=
¢
-
=
=
å
$
2
1
2
s Загальна варіація ( )
Y Y Y Y
i
n
- = ¢
=
å
2
1
n
-
1
( )
Y Y
n
Y Y
n
i
n
y
-
-
=
¢
-
=
=
å
2
1
2
1 1
s Зауважимо, що всі змінні Y i X взяті як відхилення від свого середнього значення. Використаємо середні квадратів відхилень (дисперсії) (див. табл.1) і запишемо формулу для обчислення коефіцієнта детермінації: R
A X Y
m
Y Y
n
A X Y
Y Y
n
m
y u
y
u
y
2
2 2
2
2
2
1
1 1
1
1
=
-
= - Þ
¢ ¢
-
¢
-
=
¢ ¢
¢
×
-
-
s s
s
s
s
$
:
$
, (6) або, не враховуючи ступенів свободи: R
A X Y
Y Y
2
=
¢ ¢
¢
$
. (7) Оскільки у (6) задані незміщені оцінки дисперсії з урахуванням числа ступенів свободи, то коефіцієнт детермінації може зменшуватись при введені в модель нових незалежних змінних. Тоді як для коефіцієнта детермінації, обчисленого без урахування поправки (n – 1/m – 1) на число ступенів свободи (7), коефіцієнт детермінації ніколи не зменшується. Залежність між цими двома коефіцієнтами можна подати так: ( )
R
n
n m
R
2 2
1
1
1= -
-
-
æ
è
ç
ö
ø
÷
-, (8) де R
2
— коефіцієнт детермінації з урахуванням числа ступенів свободи; R
2
— коефіцієнт детермінації без урахування числа ступенів свободи. Для функції з двома і більше незалежними змінними коефіцієнт детермінації може набувати значень на множині ]
[
R
2
01Î,. Числове значення коефіцієнта детермінації характеризує, якою мірою варіація залежної змінної (
Y
) визначається варіацією незалежних змінних. Чим ближчий він до одиниці, тим більше варіація залежної змінної визначається варіацією незалежних змінних. Множинний коефіцієнт кореляції: R R=
2
.
Він характеризує тісноту зв’язку усіх незалежних змінних із залежною. Розглянемо альтернативний спосіб обчислення коефіцієнтів детермінації і кореляції, коли система нормальних рівнянь будується на основі коефіцієнтів парної кореляції r
. У такому разі оцінку параметрів моделі можна записати: $
,a
R
R
j
y
x
j
j
= - ×
s
s
1
11
(9) де R
kj
— алгебраїчне доповнення матриці r
до елемента r
kj
. Сума квадратів відхилень (залишків) також може бути виражена через алгебраїчне доповнення матриці r
: u
n r
R
y
i
n
2
2
11
1
=
=
å
s
, де r — визначник кореляційної матриці. А це, у свою чергу, дає нам альтернативний вираз для коефіцієнта детермінації: R
r
R
u
y
2
2
2
11
1 1= - = -
s
s
. (10) Ще один альтернативний метод розрахунку коефіцієнтів детермінації на основі матриці r
можна подати у вигляді R r r r r
yx yx yx m yx
m
2
1 2 3
1 2 3
= + + + +b b b b.... (11) Звідси коефіцієнт кореляції R r r r r
yx yx yx m yx
m
= + + + +b b b b
1 2 3
1 2 3
.... (12) 3. ЧАСТИННІ КОЕФІЦІЄНТИ КОРЕЛЯЦІЇ І КОЕФІЦІЄНТИ РЕГРЕСІЇ Частинні коефіцієнти кореляції так само, як і парні, характеризують тісноту зв’язку між двома змінними. Але на відміну від парних частинні коефіцієнти характеризують тісноту зв’язку за умови, що інші незалежні змінні сталі. Можна дістати спрощений вираз для розрахунку коефіцієнта частинної кореляції, обравши інший спосіб інтерпретації цього коефіцієнта. Для випадку простої регресії двох змінних маємо ( )
( ) ( )
r
xy
x y
a a
y
x
x
y
2
2
2 2
=
×
= ×
å
å å
, де a
y
x
характеризує коефіцієнт при x
у рівнянні y
f
x
=
( ), а a
x
y
— коефіцієнт при y
в рівнянні x
f
y
=
( ). Отже, квадрат коефіцієнта парної кореляції дорівнює добутку двох наведених коефіцієнтів. Коефіцієнт частинної кореляції можна визначити аналогічно. r
R
R R
12 3
2
12
2
11 22
,
= -. Для знаходження частинного коефіцієнта кореляції змінної y з x
2
за умови, що змінна x
3
стала, достатньо взяти добуток параметрів при x
2
і y в наведених щойно рівняннях з протилежним знаком. Аналогічно r
R
R R
231
2
23
2
22 33
,
.= - Тоді частинні коефіцієнти кореляції будуть такі: r
R
R R
12 3
12
11 22
,
= - ; r
R
R R
13 2
13
11 33
,
;= - r
R
R R
23 1
23
22 33
,
.= - (13) Ці висновки можна поширити на випадок, коли економетрична модель має m
незалежних змінних (
)
j m=1,, але при цьому решта незалежних змінних (крім двох) є константами. 4. ПЕРЕВІРКА ЗНАЧУЩОСТІ І ДОВІРЧІ ІНТЕРВАЛИ 4.1. Значущість економетричної моделі Гіпотезу про рівень значущості зв’язку між залежною і незалежною змінними можна перевірити з допомогою F-критерію: F
y u
u
p
u
=
-
=
s s
s
s
s
2 2
2
2
2
. (14) При цьому ми виходимо з того, що залишки u розподілені нормально, тобто користуємося фундаментальною теоремою про те, що для нормально розподіленої випадкової величини x
*
з нульовою середньою і одиничною дисперсією сума квадратів її n випадково вибраних значень має розподіл c
2
з n ступенями свободи. Дисперсії, які застосовуються для обчислення F-критерію, наведено в табл.1. Фактичне значення F-критерію порівнюється з табличним при ступенях свободи n – m і m – 1 і вибраному рівні значущості. Якщо Fфакт > Fтабл, то гіпотеза про істотність зв’язку між залежною і незалежними змінними економетричної моделі підтвержується, у противному разі - відкидається. 4.2. Значущість коефіцієнта кореляції Оскільки коефіцієнт кореляції є також вибірковою характеристикою, яка може відхилятись від свого “істинного” значення, значущість коефіцієнта кореляції також потребує перевірки. Базується вона на t-критерії t
R n m
R
=
-
-1
2
, де R
2
— коефіцієнт детермінації моделі; R
— коефіцієнт кореляції; n
m
-
— число ступенів свободи. Якщо t t>
табл( )a
, де t
табл( )a
— відповідне табличне значення t-розподілу з n
m
-
ступенями свободи, то можна зробити висновок про значущість коефіцієнта кореляції між залежною і незалежними змінними моделі. 
Автор
V1to4ka2008
Документ
Категория
Без категории
Просмотров
6 809
Размер файла
111 Кб
Теги
лекц
1/--страниц
Пожаловаться на содержимое документа