close

Вход

Забыли?

вход по аккаунту

?

Коэффициент детерминации

код для вставкиСкачать PDF 0,20 Mb Скачать doc 0,15 Mb
Определение коэффициента детерминации из Википедии.
Коэффициент детерминации
 
(
R
2
)— это доля объяснённой дисперсии
 
отклонений зависимой переменной от её
 
среднего значения
. Зависимая
 
переменная объясняется (прогнозируется) с помощью функции от объясняющих
 
переменных, в частном случае является квадратом
 
коэффициента
 
корреляции
 
между зависимой переменной и её прогнозными значениями с
 
помощью объясняющих переменных. Тогда можно сказать, что
 
R
2
 
показывает,
 
какая доля
 
дисперсии
 
результативного признака объясняется влиянием
 
объясняющих переменных.
Формула для вычисления коэффициента детерминации:
где
 
y
i
 
— наблюдаемое значение зависимой переменной, а
 
f
i
 
— значение
 
зависимой переменной предсказанное по уравнению регрессии
 
 
-среднее
 
арифметическое зависимой переменной.
Содержание
 
[
убрать
]
·
1
  
 
  
Проблемы и общие свойства R
  
2
  
o
1.1
  
 
  
Интерпретация
  
o
1.2
  
 
  
Общие свойства для МНК регрессии
  
o
1.3
  
 
  
Общие свойства для МНК регрессии со свободным членом (единичным
  
 
фактором)
o
1.4
  
 
  
Мнимая регрессия
  
·
2
  
 
  
Решение проблем или модификации R
  
2
  
o
2.1
  
 
  
R
  
2
  
-скорректированный (adjusted)
  
o
2.2
  
 
  
R
  
2
  
-распространённый (extended)
  
o
2.3
  
 
  
R
  
2
  
-истинный (несмещённый)
  
·
3
  
 
  
Прочие используемые критерии
  
·
4
  
 
  
См. также
  
·
5
  
 
  
Примечания
  
·
6
  
 
  
Ссылки
  
[
править
]
Проблемы и общие свойства
 
R
2
[
править
]
Интерпретация
Иногда показателям тесноты связи можно дать качественную оценку (шкала
 
Чеддока):
Количественная мера тесноты связи
Качественная характеристика силы связи
0,1 - 0,3
Слабая
0,3 - 0,5
Умеренная
0,5 - 0,7
Заметная
0,7 - 0,9
Высокая
0,9 - 0,99
Весьма высокая
Функциональная связь возникает при значении равном 1, а отсутствие связи
 
— 0. При значениях показателей тесноты связи меньше 0,7 величина
 
коэффициента детерминации всегда будет ниже 50
 
%. Это означает, что на
 
долю вариации факторных признаков приходится меньшая часть по
 
сравнению с остальными неучтенными в модели факторами, влияющими на
 
изменение результативного показателя. Построенные при таких условиях
 
регрессионные модели имеют низкое практическое значение.
[
править
]
Общие свойства для МНК регрессии
Линейная множественная регрессия методом наименьших квадратов (МНК) -
 
наиболее распространённый случай использования коэффициента
 
детерминации
 
R
2
.
Линейная
 
множественная МНК регрессия
 
имеет следующие общие
 
свойства
 
[1]
:
1.
Чем ближе значение к 1 тем ближе модель к эмпирическим
 
наблюдениям.
2.
С увеличением количества объясняющих переменных
 
увеличивается
 
R
2
.
[
править
]
Общие свойства для МНК регрессии со
 
свободным членом (единичным фактором)
Для случая наличия в такой регрессии
 
свободного члена
 
коэффициент
 
детерминации обладает следующими свойствами:
 
[2]
1.
принимает значения из интервала (отрезка)
 
[0;1]
.
2.
в случае парной линейной регрессионной МНК модели
 
коэффициент детерминации равен квадрату коэффициента
 
корреляции, то есть
 
R
2
 
=
 
r
2
. А в случае множественной МНК
 
регрессии
 
R
2
 
=
 
r
(
y
;
f
)
2
. Также это квадрат
 
корреляции Пирсона
 
между
 
двумя переменными. Он выражает количество дисперсии, общей
 
между двумя переменными.
[3]
3.
R
2
 
можно разложить по вкладу каждого фактора в значение
 
R
2
,
 
причём вклад каждого такого фактора будет положительным.
 
Используется разложение:
 
, где
 
r
0
j
 
- выборочный
 
коэффициент корреляции зависимой и соответствующей второму
 
индексу объясняющей переменной.
4.
R
2
 
связан с проверкой
 
гипотезы
 
о том, что истинные значения
 
коэффициентов при объясняющих переменных равны нулю, в
 
сравнении с альтернативной гипотезой, что не все истинные значения
 
коэффициентов равны нулю. Тогда случайная
 
величина
 
 
имеет
 
F-распределение
 
с (k-1) и (n-
k) степенями свободы.
[
править
]
Мнимая регрессия
Значения
 
R
2
,
 
,
 
 
также могут быть
 
манипулированы
, с
 
помощью включения фиктивных факторов. Например, если два показателя
 
имеют возрастающую динамику, то их коэффициент корреляции (который
 
входит в факторное разложение) будет достаточно высок. Поэтому
 
логическая и смысловая адекватность модели имеют первостепенную
 
важность. Только качество модели может быль проверено или сопоставлено с
 
использованием
 
R
2
 
и его модификаций.
[
править
]
Решение проблем или модификации
 
R
2
[
править
]
R
2
-скорректированный (adjusted)
Для того, чтобы исследователи не увеличивали
 
R
2
 
с помощью добавления
 
посторонних факторов,
 
R
2
 
заменяется на
 
скорректированный
 
, который даёт штраф за
 
дополнительно включённые факторы, где n - количество наблюдений, а k -
 
количество объясняющих переменных, включая свободный член.}
[
править
]
R
2
-распространённый (extended)
В случае отсутствия в линейной множественной МНК регрессии свободного
 
члена все четыре вышеперечисленных свойства могут нарушаться для
 
конкретной
 
реализации
. Поэтому регрессию со свободным членом и без него
 
нельзя сравнивать по критерию
 
R
2
. Эта проблема решается с помощью
 
построения распространённого коэффициента детерминации
 
,
 
который будет совпадать с исходным для случая МНК регрессии со
 
свободным членом, и для которого будут продолжать выполняться четыре
 
свойства перечисленые выше. Суть этого метода заключается рассмотрении
 
проекции единичного вектора на плоскость объясняющих переменных
 
[2]
.
Для случая регрессии без свободного члена:
,
где X - матрица nxk значений факторов,
 
P
(
X
) =
 
X
 
* (
X
' *
 
X
)
 
− 1
 
*
 
X
'
 
- проектор на
 
плоскость X,
 
, где
 
i
n
 
- единичный вектор nx1.
 
с условием небольшой модификации
, также подходит для
 
сравнения между собой регрессий построенных с помощью: МНК,
 
обобщённого метода наименьших квадратов (ОМНК), условного метода
 
наименьших квадратов (УМНК), обобщённо-условного метода наименьших
 
квадратов (ОУМНК).
[
править
]
R
2
-истинный (несмещённый)
<---Будет добавлен---!>
[4]
[
править
]
Прочие используемые критерии
AIC -
 
информационный критерий Акаике
 
- применяется исключительно для
 
сравнения между моделями. Чем меньше значение тем лучше. Часто
 
используется в виде сравнения моделей
 
временных рядов
 
с разным
 
количеством лагов.
. Даёт меньший штраф за включение лишних
 
лагов в модель, чем BIC.
BIC - информационный критерий Шварца - используется и интерпретируется
 
аналогично AIC.
. Даёт больший штраф за включение
 
лишних лагов в модель, чем BIC (см. формулу).
 
[1]
[
править
]
См. также

Коэффициент корреляции
  

Корреляция
  

Мультиколлинеарность
  

Дисперсия случайной величины
  

Метод группового учета аргументов
  

Регрессионный анализ
  
[
править
]
Примечания
1.
↑
 
1
 
2
 
Магнус Я.Р., Катышев П.К., Пересецкий
 
А.А.
 
Эконометрика. Начальный курс.. — 6,7,8-е изд., доп. и перераб.. —
 
Москва: Дело, 2004. — Т.
 
"". — 576
 
с. —
 
ISBN 5-7749-0055-X
2.
↑
 
1
 
2
 
Ершов Э.Б.
 
Распространение коэффициента детерминации
 
на общий случай линейной регрессии, оцениваемой с помощью
 
различных версий метода наименьших квадратов (рус., англ.) //
ЦЕМИ
 
РАН
 
Экономика и математические методы. — Москва: ЦЕМИ РАН,
 
2002. — В.
 
3. — Т.
 
38. — С.
 
107-120.
3.
↑
  
 
Айвазян С.А., Мхитарян В.С.
 
Прикладная статистика. Основы
 
эконометрики (в 2-х т.). — ??. — Москва: Юнити-Дана (проект TASIS),
 
2001. — Т.
 
"1,2". — 1088
 
с. —
 
ISBN 5-238-00304-8
4.
↑
  
 
Ершов Э.Б.
 
Выбор регрессии максимизирующий
 
несмещённую оценку коэффициента детерминации (рус.,
 
англ.) //
 
Айвазян С.А.
 
Прикладная эконометрика. — Москва: Маркет ДС,
 
2008. — В.
 
4. — Т.
 
12. — С.
 
71-83.
[
править
]
Ссылки

Глоссарий статистических терминов
  

Прикладная эконометрика (журнал)
  
Автор
nivus.ua
Документ
Категория
Статьи
Просмотров
22 826
Размер файла
150 Кб
Теги
коэффициента, детерминации
1/--страниц
Пожаловаться на содержимое документа