Скачать
HTML для интерации на вашу страничку:

Ширина: () Высота:

Адрес страницы документа на сервисе DocMe:
Адрес полноэкранного варианта:
Короткий адрес:
Коэффициент детерминации ( R 2 )— это доля объяснённой дисперсии отклонений зависимой переменной от её среднего значения . Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных, в частном случае является квадратом коэффициента корреляции между зависимой переменной и её прогнозными значениями с помощью объясняющих переменных. Тогда можно сказать, что R 2 показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных. Формула для вычисления коэффициента детерминации: где y i — наблюдаемое значение зависимой переменной, а f i — значение зависимой переменной предсказанное по уравнению регрессии -среднее арифметическое зависимой переменной. Содержание [ убрать ] · 1 Проблемы и общие свойства R 2 o 1.1 Интерпретация o 1.2 Общие свойства для МНК регрессии o 1.3 Общие свойства для МНК регрессии со свободным членом (единичным фактором) o 1.4 Мнимая регрессия · 2 Решение проблем или модификации R 2 o 2.1 R 2 -скорректированный (adjusted) o 2.2 R 2 -распространённый (extended) o 2.3 R 2 -истинный (несмещённый) · 3 Прочие используемые критерии · 4 См. также · 5 Примечания · 6 Ссылки [ править ] Проблемы и общие свойства R 2 [ править ] Интерпретация Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока): Количественная мера тесноты связи Качественная характеристика силы связи 0,1 - 0,3 Слабая 0,3 - 0,5 Умеренная 0,5 - 0,7 Заметная 0,7 - 0,9 Высокая 0,9 - 0,99 Весьма высокая Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение. [ править ] Общие свойства для МНК регрессии Линейная множественная регрессия методом наименьших квадратов (МНК) - наиболее распространённый случай использования коэффициента детерминации R 2 . Линейная множественная МНК регрессия имеет следующие общие свойства [1] : 1. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям. 2. С увеличением количества объясняющих переменных увеличивается R 2 . [ править ] Общие свойства для МНК регрессии со свободным членом (единичным фактором) Для случая наличия в такой регрессии свободного члена коэффициент детерминации обладает следующими свойствами: [2] 1. принимает значения из интервала (отрезка) [0;1] . 2. в случае парной линейной регрессионной МНК модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R 2 = r 2 . А в случае множественной МНК регрессии R 2 = r ( y ; f ) 2 . Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными. [3] 3. R 2 можно разложить по вкладу каждого фактора в значение R 2 , причём вклад каждого такого фактора будет положительным. Используется разложение: , где r 0 j - выборочный коэффициент корреляции зависимой и соответствующей второму индексу объясняющей переменной. 4. R 2 связан с проверкой гипотезы о том, что истинные значения коэффициентов при объясняющих переменных равны нулю, в сравнении с альтернативной гипотезой, что не все истинные значения коэффициентов равны нулю. Тогда случайная величина имеет F-распределение с (k-1) и (n- k) степенями свободы. [ править ] Мнимая регрессия Значения R 2 , , также могут быть манипулированы , с помощью включения фиктивных факторов. Например, если два показателя имеют возрастающую динамику, то их коэффициент корреляции (который входит в факторное разложение) будет достаточно высок. Поэтому логическая и смысловая адекватность модели имеют первостепенную важность. Только качество модели может быль проверено или сопоставлено с использованием R 2 и его модификаций. [ править ] Решение проблем или модификации R 2 [ править ] R 2 -скорректированный (adjusted) Для того, чтобы исследователи не увеличивали R 2 с помощью добавления посторонних факторов, R 2 заменяется на скорректированный , который даёт штраф за дополнительно включённые факторы, где n - количество наблюдений, а k - количество объясняющих переменных, включая свободный член.} [ править ] R 2 -распространённый (extended) В случае отсутствия в линейной множественной МНК регрессии свободного члена все четыре вышеперечисленных свойства могут нарушаться для конкретной реализации . Поэтому регрессию со свободным членом и без него нельзя сравнивать по критерию R 2 . Эта проблема решается с помощью построения распространённого коэффициента детерминации , который будет совпадать с исходным для случая МНК регрессии со свободным членом, и для которого будут продолжать выполняться четыре свойства перечисленые выше. Суть этого метода заключается рассмотрении проекции единичного вектора на плоскость объясняющих переменных [2] . Для случая регрессии без свободного члена: , где X - матрица nxk значений факторов, P ( X ) = X * ( X ' * X ) − 1 * X ' - проектор на плоскость X, , где i n - единичный вектор nx1. с условием небольшой модификации , также подходит для сравнения между собой регрессий построенных с помощью: МНК, обобщённого метода наименьших квадратов (ОМНК), условного метода наименьших квадратов (УМНК), обобщённо-условного метода наименьших квадратов (ОУМНК). [ править ] R 2 -истинный (несмещённый) <---Будет добавлен---!> [4] [ править ] Прочие используемые критерии AIC - информационный критерий Акаике - применяется исключительно для сравнения между моделями. Чем меньше значение тем лучше. Часто используется в виде сравнения моделей временных рядов с разным количеством лагов. . Даёт меньший штраф за включение лишних лагов в модель, чем BIC. BIC - информационный критерий Шварца - используется и интерпретируется аналогично AIC. . Даёт больший штраф за включение лишних лагов в модель, чем BIC (см. формулу). [1] [ править ] См. также Коэффициент корреляции Корреляция Мультиколлинеарность Дисперсия случайной величины Метод группового учета аргументов Регрессионный анализ [ править ] Примечания 1. ↑ 1 2 Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс.. — 6,7,8-е изд., доп. и перераб.. — Москва: Дело, 2004. — Т. "". — 576 с. — ISBN 5-7749-0055-X 2. ↑ 1 2 Ершов Э.Б. Распространение коэффициента детерминации на общий случай линейной регрессии, оцениваемой с помощью различных версий метода наименьших квадратов (рус., англ.) // ЦЕМИ РАН Экономика и математические методы. — Москва: ЦЕМИ РАН, 2002. — В. 3. — Т. 38. — С. 107-120. 3. ↑ Айвазян С.А., Мхитарян В.С. Прикладная статистика. Основы эконометрики (в 2-х т.). — ??. — Москва: Юнити-Дана (проект TASIS), 2001. — Т. "1,2". — 1088 с. — ISBN 5-238-00304-8 4. ↑ Ершов Э.Б. Выбор регрессии максимизирующий несмещённую оценку коэффициента детерминации (рус., англ.) // Айвазян С.А. Прикладная эконометрика. — Москва: Маркет ДС, 2008. — В. 4. — Т. 12. — С. 71-83. [ править ] Ссылки Глоссарий статистических терминов Прикладная эконометрика (журнал)
  • Дата публикации: 16 Август 2010
  • Владелец: nivus.ua
  • Просмотров: 19943

Коэффициент детерминации

Определение коэффициента детерминации из Википедии.

Обратить внимание администрации на недопустимое содержимое документа