close

Вход

Забыли?

вход по аккаунту

?

124.Примеры решения задач по дисциплине Эконометрика Методические указания

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации
Ярославский государственный университет им. П.Г. Демидова
Кафедра мировой экономики и статистики
Примеры решения задач
по дисциплине «Эконометрика»
Методические указания
Ярославль 2004
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ББК
УДК
У.в611я73-4
П 75
330.43(076.2)
Составитель О.В. Зеткина
Примеры решения задач по дисциплине «Эконометрика»:
Метод. указания / Сост. О.В. Зеткина; Яросл. гос. ун-т. Ярославль,
2004. 32 с.
Методические указания являются важным элементом в системе
обеспечения базовых дисциплин необходимыми учебно-методическими материалами. Они созданы для методической поддержки практических занятий, проводимых преподавателями кафедры мировой
экономики и статистики экономического факультета ЯрГУ
им. П.Г. Демидова. Служат для оказания практической помощи в решении наиболее распространенных задач по дисциплине «Эконометрика».
Рекомендуется для студентов, обучающихся по специальностям
060500 Бухгалтерский учет, анализ и аудит, 060600 Мировая экономика (дисциплина «Эконометрика», блок ЕН), очной формы обучения.
Рецензент: кафедра мировой экономики и статистики Ярославского государственного университета им. П.Г. Демидова.
© Ярославский государственный университет, 2004
© О.В. Зеткина, 2004
2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
«Эконометрика» как самостоятельная дисциплина введена Государственными образовательными стандартами высшего профессионального образования по специальностям «Мировая экономика», «Бухгалтерский учет и аудит», «Менеджмент» в 2000 году. В связи с малым
практическим опытом преподавания «Эконометрики» весьма острой
является проблема ее методического обеспечения. Так как зарождение
«Эконометрики» стало следствием междисциплинарного подхода к
изучению экономики в целом, то от студентов требуется значительная
подготовка в области практического применения статистических и математических методов. Эконометрические модели и методы на современном этапе - это не только мощный инструментарий для получения
новых знаний в экономике, но и широко применяемый аппарат для
принятия практических решений в прогнозировании деятельности
предприятия, банковском деле, бизнесе. Изучение дисциплины «Эконометрика» предполагает достаточно свободное владение студентами
соответствующими основными компьютерными программами, так как
проведение эконометрических расчетов возможно лишь с использованием современных информационных технологий.
Методические указания созданы с целью обеспечения методической поддержки практических занятий, проводимых преподавателями
кафедры мировой экономики и статистики экономического факультета ЯрГУ им. П.Г. Демидова. Пособие ориентировано на начальный
курс эконометрики. Оно может оказать практическую помощь в решении наиболее распространенных задач по дисциплине «Эконометрика» для студентов всех форм обучения. В пособии рассматриваются такие вопросы, как построение эконометрических моделей, выбор
метода оценки параметров модели, интерпретация результатов, получение прогнозных оценок, принятие решений о спецификации и
идентификации модели.
Принята следующая структура изложения материала:
• Краткие методические комментарии, включающие основные
понятия, определения и формулы;
• Решение типовых задач «вручную»;
• Реализация типовых задач на компьютере с использованием
табличного процессора Exсel.
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часть 1. Теоретические аспекты
курса «Эконометрика»
Тема 1. Основные понятия корреляционного
и регрессионного анализа
Проблема изучения взаимосвязей экономических показателей является одной из важнейших в экономическом анализе. Любая экономическая политика заключается в регулировании экономических переменных, и она должна основываться прежде всего на знании того,
как эти переменные влияют на другие переменные, являющиеся ключевыми для принимающего решение политика. Так, в рыночной экономике не представляется возможным непосредственно регулировать
темп инфляции, но на него можно воздействовать средствами бюджетно-налоговой и кредитно-денежной политики.
В наиболее общем виде при изучении взаимосвязей исследователя интересует количественная оценка их наличия и направления, а
также характеристика силы и формы влияния одних факторов на другие. Для решения этого вопроса применяются две группы методов,
одна из которых включает в себя методы корреляционного анализа, а
другая - регрессионный анализ. В то же время ряд исследователей
объединяют эти методы в корреляционно-регрессионный анализ, что
объясняется наличием целого ряда схожих вычислительных процедур, взаимодополнения при интерпретации результатов, и др.
Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости,
определения функции регрессии, оценки неизвестных значений зависимой переменной.
Решение указанных выше задач опирается на соответствующие
приемы, алгоритмы, показатели, применение которых дает основание
говорить о статистическом изучении взаимосвязей. Вычислительные
процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или
иных методов интерпретации результатов являются обязательным
условием исследования.
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Невозможно строить, проверять или улучшать экономические
модели без статистического анализа их переменных с использованием реальных статистических данных. Вся сфера экономических исследований может быть в определенном смысле охарактеризована
как изучение взаимосвязей экономических переменных. При этом
инструментарием их базового анализа являются методы статистики и
эконометрики.
Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального
распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального
распределения. Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин.
Простейшим приемом выявления связи между изучаемыми признаками х и у является построение корреляционной таблицы. Ее наглядным изображением служит корреляционное поле, представляющее собой график, где на оси абсцисс откладываются значения хi, по
оси ординат – уi. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи между изучаемыми признаками х и у.
Последовательность точек хi (i = 1, …, n) и среднего значения уi,
т.е. у, позволяет построить график, который иллюстрирует зависимость среднего значения результативного признака у от факторного
х - эмпирическую линию регрессии.
По существу, корреляционная таблица, корреляционное поле,
эмпирическая линия регрессии предварительно уже характеризуют
взаимосвязь, когда выбраны факторный и результативный признаки и
требуется сформулировать предположение о форме и направленности
связи.
На практике для количественной оценки тесноты связи для линейной регрессии используется линейный коэффициент парной корреляции rxy, (-1≤ rxy ≤ 1), который может определяться следующим
образом:
r xy = b
σ x cov( x, y) yx − y x
=
=
σy
σ xσ y ;
σx σy
5
(1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b=
x=
cov( x, y)
σ x2
1
n
n
xi ;
∑
i
=1
=
y=
yx − y x
x2 − x 2
1
n
n
yi ;
∑
i
;
(2)
yx =
=1
1
n
n
yi
∑
i
=1
xi ,
(3)
Λ
где b - коэффициент линейной регрессии y i = a + bxi ;
σх, σу - среднее квадратическое отклонение соответствующей
случайной величины;
σх2 - дисперсия признака х.
Ковариацией (или корреляционным моментом) случайных величин х и у называется математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т.е.:
cov( x, y) = M [(x − M ( x) )( y − M ( y) )],
(4)
где cov (x, y) - ковариация признаков х и у;
М(х), М(у) - математическое ожидание случайных величин х и у
соответственно.
Для оценки тесноты связи нелинейной регрессии строится индекс корреляции ρху (0 ≤ ρху ≤ 1):
n
ρ
ху
= 1−
Λ
∑
σ ост 2
i =1
=
−
1
,
n
2
σу
2
∑ ( уi − у)
( уi − y i ) 2
(5)
i =1
Λ
где y i = a + bxi .
(6)
Коэффициент (индекс) корреляции является безразмерной величиной, так как его значение не зависит от выбора единиц измерения
обеих переменных.
Близкая к нулю величина коэффициента корреляции свидетельствует об отсутствии линейной связи переменных, но не об отсутствии связи между ними вообще. Например, если показатель корреляции величин уровней инфляции и безработицы для периода 1970 1980-х годов для экономики некоторой страны практически равен нулю, не следует говорить сразу о независимости этих показателей в
данный период. Следует попытаться построить более сложную модель их связи, учитывающую, возможно, как нелинейность самой зависимости, так и наличие в ней запаздываний во времени (лагов), а
также инерционность динамики соответствующих величин.
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Равенство нулю коэффициента корреляции для генеральной совокупности еще не означает, что он будет в точности нулевым для
выборки. Наоборот, он обязательно будет отклоняться от истинного
значения, но, чем больше такое отклонение, тем менее оно вероятно
при данном объеме выборки. При каждом конкретном значении коэффициента корреляции величин х и у для генеральной совокупности
выборочный коэффициент корреляции является случайной величиной.
Следовательно, случайной величиной является также любая его
функция, и требуется указать такую функцию, которая имела бы одно
из известных распределений, удобное для табличного анализа. Для
выборочного коэффициента корреляции rxy такой функцией является
t-статистика, рассчитываемая по формуле
t = r xy
n−2
1 − r xy
2
(7)
и имеющая распределение Стьюдента с (n-2) степенями свободы.
Число степеней свободы меньше числа наблюдений на 2, поскольку в
формулу коэффициента корреляции входят средние значения х и у,
для расчета которых используются две линейные формулы их зависимости от наблюдений случайных величин. Для коэффициента корреляции будет проверяться нулевая гипотеза Н0, т.е. гипотеза о равенстве его нулю в генеральной совокупности (более подробно – см.
следующую тему).
Тема 2. Статистическая проверка гипотез
Оценку генерального параметра получают на основе выборочного показателя с учетом ошибки репрезентативности. Ошибка выборки – это разница между значениями показателя, полученного по
выборке, и генеральным параметром. В другом случае в отношении
свойств генеральной совокупности выдвигается некоторая гипотеза о
величине средней, дисперсии, характере распределения, форме и тесноте связи между переменными. Проверка гипотезы осуществляется
на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений относительно правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Основой проверки статистических ги7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
потез являются данные случайных выборок. При этом безразлично,
оцениваются ли гипотезы в отношении реальной или гипотетической
генеральной совокупности. Последнее открывает путь применения
этого метода за пределами собственно выборки: при анализе результатов эксперимента данных сплошного наблюдения, но малой численности. В этом случае рекомендуется проверить, не вызвана ли установленная закономерность стечением случайных обстоятельств,
насколько она характерна для того комплекса условий, в которых находится изучаемая совокупность.
Статистической гипотезой (обозначается Н) называется произвольное предположение о свойстве генеральной совокупности, которое проверяется, опираясь на данные выборки. Так может быть выдвинута гипотеза о том, что средняя µ в генеральной совокупности
равна некоторой величине а (записывается Н: µ = а) или о том, что
генеральная средняя больше некоторой величины Н : µ > в.
Различают простые и сложные гипотезы. Гипотеза называется
простой, если она однозначно характеризуется параметром распределения случайной величины. Например, Н: µ = а. Гипотеза называется сложной, если она состоит из конечного или бесконечного числа простых гипотез, при этом указывается некоторая область вероятных значений параметра. Например, Н: µ > в. Эта гипотеза состоит из
множества простых гипотез Н: µ = с, где с – любое число, большее в.
Гипотезы о параметрах генеральной совокупности называются
параметрическими, о распределениях – непараметрическими.
Гипотеза о том, что две совокупности, сравниваемые по одному
или нескольким признакам, не отличаются, называется нулевой гипотезой, или нуль-гипотезой (обозначается Н0). При этом предполагается, что действительное различие сравниваемых величин равно
нулю, а выявленное по данным отличие от нуля носит случайный характер. Например, Н0: µ1 = µ2, и т.д.
Нулевая гипотеза отвергается в том случае, если по выборке
получается результат, который при истинности выдвинутой нулевой
гипотезы маловероятен. Границей невозможного или маловероятного обычно считают α = 0,05, т.е. 5%, или 0,01, 0,001. Если ориентироваться на правило «трех сигм» (оно состоит в следующем:
σ = 1/6 (хmах - хmin), так как в нормальном распределении в размахе
вариации «укладывается» 6σ (±3σ)), то вероятность ошибки α должна
быть равна 0,0027. Однако для этого уровня вероятности ошибки зна8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
чений критериев редко табулируются: как правило, значения критериев в статистико-математических таблицах рассчитаны для вероятностей ошибки 0,05; 0,01; 0,001.
Статистическим критерием называют правило, устанавливающее условия отклонения проверяемой нулевой гипотезы.
Проверка статистических гипотез состоит из следующих этапов:
• формулируется в виде статистической гипотезы задача исследования;
• выбирается статистическая характеристика гипотезы;
• выбираются испытуемая и альтернативная гипотезы на основе
анализа возможных ошибочных явлений и их последствий;
• определяется область допустимых значений, критическая область, а также критическое значение статистического критерия (t; F;
χ2) по соответствующей таблице;
• вычисляется фактическое значение статистического критерия;
• проверяется гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо нет.
При проверке гипотез по одному из критериев возможны два
ошибочных решения:
1) неправильное отклонение Н0: ошибка 1-го рода;
2) неправильное принятие Н0: ошибка 2-го рода.
В то время как фактически Н0 верна (1) и Н0 не верна (2), принимают два ошибочных решения:
• Н0 отклоняется и принимается альтернативная гипотеза;
• Н0 не отклоняется.
Если, например, установлено, что новое минеральное удобрение
лучше, хотя на самом деле его действие не отличается от старого, то
это ошибка 1-го рода. Если мы решили, что оба вида удобрения одинаковы, то допущена ошибка 2-го рода.
Вероятности, соответствующие неверным решениям, называются
риском 1 и риском 2. Риск 1 равен вероятности ошибки α (уровню
значимости), риск 2 равен вероятности ошибки β. Поскольку α всегда
больше 0, то всегда есть риск ошибки β. Обычно задают значение α и
пытаются сделать β возможно малым. Вероятность 1-β называется
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
мощностью критерия: чем она больше, тем меньше вероятность
ошибки 2-го рода.
Альтернативная гипотеза Н1 может быть сформулирована поразному в зависимости от того, какие отклонения от гипотетической
величины нас особенно беспокоят: положительные, отрицательные,
либо и те, и другие. Соответственно альтернативные гипотезы могут
быть записаны:
Н1: µ > а, Н1: µ < а, Н1: µ ≠ а.
Тема 3. Линейная регрессия.
Оценка качества регрессионной модели
Начальным пунктом эконометрического анализа зависимостей
обычно является оценка линейной зависимости переменных. Это
объясняется простотой исследования линейной зависимости. Поэтому проверка наличия такой зависимости, оценивание ее индикаторов
и параметров является одним из важнейших направлений приложения математической статистики.
Наиболее простым для изучения является случай взаимосвязи
двух переменных х и у. Если это реальные статистические данные, то
мы никогда не получим простую линию – линейную, квадратичную,
экспоненциальную и т.д. Всегда будут присутствовать отклонения зависимой переменной, вызванные ошибками измерения, влиянием неучтенных величин или случайных факторов. Связь переменных, на
которую накладываются воздействия случайных факторов, называется статистической связью. Наличие такой связи заключается в том,
что изменение одной переменной приводят к изменению математического ожидания другой переменной.
Выделяют два типа взаимосвязей между переменными х и у:
1) переменные равноправны, т.е. может быть неизвестно, какая из
двух переменных является независимой, а какая – зависимой;
2) две исследуемые переменные неравноправны, но одна из них
рассматривается как объясняющая (или независимая), а другая как
объясняемая (или зависящая от первой).
В первом случае говорят о статистической взаимосвязи корреляционного типа. При этом возникают проблемы оценки связи между
переменными. Например, связь показателей безработицы и инфляции
в данной стране за определенный период времени. Может стоять во10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
прос, связаны ли между собой эти показатели, и при положительном
ответе на него встает задача нахождения формы связи. Вопрос о наличии связи между экономическими переменными сводится к определению конкретной формулы (спецификации) такой связи, устойчивой к изменению числа наблюдений. Для этого используются специальные статистические методы и, соответственно, показатели, значения которых определенным образом (и с определенной вероятностью) свидетельствуют о наличии или отсутствии линейной связи
между переменными.
Во втором случае, когда изменение одной из переменных служит
причиной для изменения другой, должно быть оценено уравнение
регрессии вида
y = f(x).
(8)
Уравнение регрессии – это формула статистической связи между
переменными. Формула статистической связи двух переменных называется парной регрессией, зависимость от нескольких переменных множественной регрессией. Например, Дж. Кейнсом была предложена линейная формула зависимости частного потребления С от располагаемого личного дохода Yd : С = С0 + b Yd, где С0 > 0 – величина
автономного потребления, 1> b >0 – предельная склонность к потреблению.
Выбор формулы связи переменных называется спецификацией
уравнения регрессии. В данном случае выбрана линейная формула.
Далее требуется оценить значения параметров и проверить надежность оценок.
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки линейных параметров регрессий используют метод
наименьших квадратов (МНК), который позволяет получить такие
оценки параметров, при которых сумма квадратов отклонений фактических значений yi результативного признака у от теоретических ŷi
минимальна, т.е.
Λ
n
∑ ( yi − yi ) 2 → min .
i =1
Λ
(9)
В линейном случае yi = a + bxi задача сводится к решению следующей системы линейных уравнений:
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
n

+
=
na
b
x
yi
∑
∑
i


i =1
i =1
 n
n
n
a x + b x 2 =
yi xi
∑
∑
i
i
 ∑
i =1
i =1
i =1
(10)
Для нахождения а и в воспользуемся готовыми формулами, которые легко получаются решением системы:
a + b x = y

a x + b x 2 = xy
y⋅x − y⋅x
b
=
a = y − bx ,
.
σ2
(11)
(12)
x
Оценку качества построенной модели даст коэффициент R2 =
rxy2 (R2 = ρxy2 индекс) детерминации, а также средняя ошибка аппроксимации:
Λ
n
 A = ∑ Ai
n
1
i =1
=
1
n
n
∑
i
=1
yi − yi
100% .
yi
(13)
Традиционно считается, что допустимый предел значений А не
более 8 - 10%. В этом случае модель оценивается как достаточно точная, в противном случае говорят о плохом качестве построенной модели.
Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, или, как говорят, мерой качества подгонки регрессионной модели к наблюдаемым
значениям, характеристикой прогностической силы анализируемой
регрессионной модели является коэффициент детерминации
(0 ≤ R2 ≤ 1), определяемый по формуле:
R2 =
Q
QR
=1− e .
Q
Q
(14)
Коэффициент детерминации R2 показывает, какая часть (доля)
дисперсии результативного признака у обусловлена вариацией объясняющей переменной. Показатель (1 - R2) характеризует долю дисперсии у, вызванную влиянием остальных, не учтенных в модели факторов. Например, если R2 = 0,982, уравнением регрессии объясняется
98,2% результативного признака, а на долю прочих факторов прихо12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
дится лишь 1,8% ее дисперсии (так называемая остаточная дисперсия). Чем ближе значение R2 к единице, тем большую долю изменения результативного фактора у можно объяснить за счет вариации
включенного в модель фактора х, меньше роль прочих факторов, и,
следовательно, линейная модель хорошо аппроксимирует исходные
данные (наблюдения «теснее примыкают» к линии регрессии), и модель можно использовать для прогноза значений результативного
признака.
Заметим, что коэффициент детерминации R2 имеет смысл рассматривать только при наличии свободного члена в уравнении регрессии, так как лишь в этом случае верны равенства:
Q = QR + Qe;
Q
Q
R2 = R = 1 − e .
Q
Q
(15)
Если известен коэффициент детерминации R2, то критерий значимости уравнения регрессии или самого коэффициента детерминации может быть записан в виде
R2 ( n − m)
F=
> Fα ;k1;k 2 .
(1 − R2 )( m − 1)
(16)
В случае парной линейной модели коэффициент детерминации
равен квадрату коэффициента корреляции. Тогда
R =r
2
2
xy
σ 2 у объясн
= 2
σ у.общ
.
(17)
Существуют 2 этапа интерпретации уравнения регрессии.
Первый состоит в словесном истолковании уравнения так, чтобы
оно было понятно человеку, не являющемуся специалистом в области
эконометрики и статистики.
На втором этапе необходимо решить, следует ли ограничиться
первым этапом или провести более детальное исследование зависимости.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1-й этап будет проиллюстрирован моделью регрессии для функции спроса, т.е. регрессией между расходами потребителя на питание
у и располагаемым личным доходом х по данным, приведенным в
таблице 1 для США за период с 1959 по 1983 год1.
Таблица 1
Личные потребительские расходы на питание населения
с 1959 по 1983 год
Год
х
у
1959 1960 1961 1962 1963 1964 1965 1966
479,7 489,7 503,8 524,9 542,3 580,8 616,3 646,8
99,7 100,9 102,5 103,5 104,6 108,8 113,7 116,6
Год
х
у
1967
673,5
118,6
1968
701,3
123,4
1969 1970 1971 1972 1973 1974 1975 1976 1977 1978
722,5 751,6 779,2 810,3 865,3 858,4 875,8 906,8 942,9 988,8
125,9 129,4 130,0 132,4 129,4 128,1 132,3 139,7 145,2 146,1
Год
х
у
1979
1015,5
149,3
1980
1021,6
153,2
1981
1049,3
153,0
1982
1058,3
154,6
1983
1095,4
161,2
среднее
780,032
128,084
Предположим, что истинная модель представлена в аддитивной
линейной форме вида:
(18)
y = α + βx + u
Λ
и оценена регрессия: y = 55,009 + 0,093 x
Коэффициент при х, называемый коэффициентом наклона, показывает, что если х увеличивается на одну единицу, то у возрастает на
0,093 единицы. Как х, так и у измеряются в миллиардах долларов в
постоянных ценах, таким образом коэффициент наклона показывает,
что если доход увеличивается на 1 млрд. дол., то расходы на питание
возрастают на 93 млн. дол. Другими словами, из каждого дополнительного доллара дохода 9,3 цента будут израсходованы на питание.
Относительно постоянной в уравнении а можно сказать, что она показывает прогнозируемый уровень у, когда х = 0. Если х = 0 находится достаточно далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам; даже если линия регрессии достаточно точно описывает значения наблюдаемой
1
Данные взяты из учебника К. Доугерти «Введение в эконометрику».
14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборки, нет гарантии, что так же будет при экстраполяции влево
или вправо. В данном случае константа выполняет единственную
функцию: она позволяет определить положение линии регрессии на
графике.
Тема 4. Оценка существенности параметров
линейной регрессии и корреляции. F-критерий
Фишера. Дисперсионный анализ
После построения уравнения линейной регрессии проводится
оценка значимости как уравнения в целом, так и отдельных его параметров.
Проверить значимость уравнения регрессии – это установить,
соответствует ли математическая модель, выражающая зависимость
между переменными, экспериментальным данным и достаточно ли
включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза,
что коэффициент регрессии равен нулю, следовательно, фактор х не
оказывает влияния на результат у.
Величина F-отношения (F-критерий) получается при сопоставлении факторной и остаточной дисперсии в расчете на одну степень
свободы.
F= Dфакт / Dост.
(19)
F-критерий проверки для нулевой гипотезы
Н0: Dфакт = Dост.
(20)
Если нулевая гипотеза справедлива, то факторная и остаточная
дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, если факторная дисперсия превышает остаточную в несколько раз.
Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности
нулевой гипотезы и различном числе степеней свободы. Табличное
значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении
для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1), если оно больше табличного. В этом случае нулевая гипотеза об
отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: если Fфакт > Fтабл, то Н0 отклоняется.
Если же величина оказалась меньше табличной Fфакт < Fтабл, то
вероятность нулевой гипотезы меньше заданного уровня (например,
0,05), и она не может быть отклонена без серьезного риска сделать
неправильный вывод о наличии связи.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент
(метод) статистического анализа. В эконометрике же он применяется
как вспомогательное средство для изучения качества модели. Центральное место в анализе дисперсии занимает разложение общей
суммы квадратов отклонений переменной у от среднего значения у
на 2 части - «объясненную» и «необъясненную» и может быть представлена следующим образом:
Общая сумма квад- = Сумма квадратов
ратов отклонений
отклонений, объясненная регрессией
n
∑ ( yi − y) =
2
i =1
Λ
n
∑ ( yi − y) +
2
i =1
+ Остаточная сумма квадратов отклонений
Λ
n
∑ ( yi − yi ) 2 ,
i =1
(21)
Λ
где y i = a + bxi ,
или
Q = QR + Qe,
(22)
где Q - общая сумма квадратов отклонений;
QR - сумма квадратов отклонений, обусловленная регрессией;
Qe - остаточная сумма квадратов отклонений.
n
Q=
( yi − y)
∑
i
=1
n
n
2
= ∑ yi2 − ny 2 ;
i =1
Λ
(23)
n
2
2
2
QR = ∑ ( yi − y) = b ∑ ( xi − x ) ;
i =1
i =1
n
Λ
2
Qe = ∑ ( yi − yi ) .
i =1
16
(24)
(25)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 2
Компоненты
дисперсии
Регрессия
Остаточная
Общая
Схема дисперсионного анализа
Сумма
Число степеней
Средние
квадратов
свободы
квадраты
m–1
Q = ∑ ( y − y)
Dфакт = s R2 = QR
Λ
n
R
2
i
i =1
Λ
n
Qe = ∑ ( yi − yi ) 2
m −1
Dост = s 2 = QR
n−m
n–m
i =1
n
Q = ∑ ( yi − y) 2
n–1
i =1
Средние квадраты s R2 и s2 представляют собой несмещенные
оценки зависимой переменной, обусловленные соответственно регрессией или объясняющей переменной х и воздействием неучтенных
случайных факторов и ошибок; m – число оцениваемых параметров
регрессии, n – число наблюдений.
При отсутствии линейной зависимости между зависимой и объ2
ясняющей(ими) переменной случайные величины s R и s2 имеют χ2 –
распределение соответственно с (m-1) и (n-m) степенями свободы, а
их отношение – F-распределение с теми же степенями свободы. Поэтому уравнение регрессии значимо на уровне α, если фактически наблюдаемое значение статистики больше Fα, k1, k2:
QR ( n − m) s R2
F=
=
> Fα ;k1;k 2 ,
Qe ( m − 1) s 2
(26)
где Fα ;k1;k 2 - табличное значение F – критерия Фишера, определенное на уровне значимости α при k1 = m-1 и k2 = n-m числе степеней
свободы.
Учитывая смысл величин s R2 и s2, можно сказать, что значение F
показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.
В случае парной линейной регрессии m = 2, и уравнение регрессии значимо на уровне α, если
F=
Q R ( n − 2)
> Fα ;1;n −2 .
Qe
17
(27)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В линейной регрессии обычно оценивается значимость не только
уравнения в целом, но и отдельных его параметров. С этой целью по
каждому из параметров определяется его стандартная ошибка, называемая стандартной ошибкой коэффициента.
Оценки истинных, но неизвестных значений параметров – это
числа, зависящие от количества и состава наблюдений, т.е. от выборки. При различных выборках мы получили бы различные оценки. Если продолжать брать все больше выборок и получать дополнительные оценки, то оценки каждого параметра будут соответствовать некоторому распределению вероятностей, которое может быть суммировано как среднее, и мера дисперсиовательно, сравниваемые параметры распределены нормально. Нормальное распределение имеет
следующее свойство: область, находящаяся в пределах 1,96 стандартного отклонения от его среднего значения, составляет 95% всей области. Учитывая это, можно указать такой интервал вокруг оценки
параметра, что с вероятностью 95% истинное значение параметра лежит внутри этого интервала. Данный интервал, называемый 95%-ным
доверительным интервалом, определяется так:
b ± 1,96 среднего квадратического отклонения от b.
Можно проверить гипотезу о том, что истинное значение параметра равно нулю, изучая ее t-статистику, которая определяется следующим образом:
t=
b
.
ст андарт на я ошибка b
(28)
В ряде прикладных задач требуется оценить значимость коэффициента корреляции r. При этом исходят из того, что при отсутствии
корреляционной связи t-статистика, найденная по формуле
n−2
t = r xy
имеет t-распределение Стьюдента с (n-2) степенями
2
1 − r xy
свободы.
Коэффициент корреляции rxy значим на уровне α, (иначе – гипотеза Н0 о равенстве генерального коэффициента корреляции нулю отвергается), если
n−2
> t1−α ;n − 2 ,
t = r xy
(29)
2
1 − r xy
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где t1−α ;n−2 - табличное значение t- критерия Стьюдента, определенное
на уровне значимости α при числе степеней свободы (n-2).
Процедура оценивания существенности коэффициента корреляции не отличается от рассмотренной выше для коэффициента регрессии: вычисляется значение t-критерия, его величина сравнивается с
табличным значением при (n-2) степенях свободы.
Проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного
уравнения регрессии.
Часть 2. Решение типовых задач
Задача 1
По семи территориям Уральского региона за 2002 год известны
значения двух признаков:
• у - расходы на покупку продовольственных товаров в общих
расходах, %;
• х - среднедневная заработная плата одного работающего, руб.
Номер
1
2
3
4
5
6
7
Исходные данные
Район
Удмуртская респ.
Свердловская обл.
Башкортостан
Челябинская обл.
Пермская обл.
Курганская обл.
Оренбургская обл.
Таблица 3
у
68,8
61,2
59,9
56,7
55
54,3
49,3
х
45,1
59
57,2
61,8
58,8
47,2
55,2
Задание
1. Для характеристики зависимости у от х рассчитать параметры
следующих функций:
1) линейной;
2) степенной;
3) показательной;
4) равносторонней гиперболы.
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценить каждую модель через коэффициент детерминации R2,
среднюю ошибку аппроксимации А и F-критерий Фишера.
Решение
1) Линейная регрессия ŷ = а + b х.
n
n

na + b∑ xi = ∑ yi

i =1
i =1
 n
n
n
a x + b x 2 =
yi xi
∑
∑
i
i
 ∑
i =1
i =1
i =1
Для определения параметров а и в линейной регрессии по исходn
n
n
n
n
i =1
i =1
i =1
i =1
i =1
ным данным рассчитываем ∑ yi , ∑ xi , ∑ xi yi , ∑ xi 2 , ∑ yi 2 . Результаты
промежуточных вычислений приведены в таблице 4.
Таблица 4
1
2
3
4
5
6
7
Итого
Среднее
значение
σ
σ2
b=
Вычисления для линейной функции
y
68,8
61,2
59,9
56,7
55,0
54,3
49,3
405,2
57,89
x
45,1
59,0
57,2
61,8
58,8
47,2
55,2
384,3
54,90
yx
3102,88
3610,80
3426,28
3504,06
3234,00
2562,96
2721,36
22162,34
3166,05
x2
2034,01
3481,00
3271,84
3819,24
3457,44
2227,84
3047,04
21338,41
3048,34
y2
4733,44
3745,44
3588,01
3214,89
3025,00
2948,49
2430,49
23685,76
3383,68
ŷ
61,3
56,5
57,1
55,5
56,5
60,5
57,8
405,2
х
у–ŷ
7,5
4,7
2,8
1,2
-1,5
-6,2
-8,5
0,0
х
Ai
10,9
7,7
4,7
2,1
2,7
11,4
17,2
56,7
8,1
5,74
32,92
5,86
34,34
х
х
х
х
х
х
х
х
х
х
х
х
у⋅х- у⋅х
σх
2
=
3166,05 − 57,89 ⋅ 54,9
≈
2
5,86
-0,35;
a = у - b ⋅ х = 57,89 + 0,35 ⋅ 54,9 ≈ 76,88 .
Уравнение регрессии: ŷ = 76,88 - 0,35 х.
С увеличением среднедневной заработной платы на 1 руб. доля
расходов на покупку продовольственных товаров снижается в среднем на 0,35-процентного пункта.
Для определения направления и тесноты связи рассчитаем линейный коэффициент парной корреляции:
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
r xy = b
5,86
σx
= −0,35 ⋅
= −0,357
5,74
σy
Связь по тесноте умеренная, по направлению - обратная.
Определим коэффициент детерминации. Для этого:
• можно рассчитать по формуле R2 = rxy2 = (-0,357) 2 = 0,127;
• получить в рамках оценивания параметров регрессии на компьютере. Вариация результата на 12,7% объясняется вариацией фактора х.
Подставляя в уравнение регрессии фактические значения хi, определим теоретические (расчётные) значения
ŷ i. Найдём величину
средней ошибки аппроксимации А . Проведем расчеты согласно формуле, промежуточные вычисления даны в таблице 4.
Λ
y
1 n
1 n yi − i
100%
A=
∑ A =
∑

.
n i =1 i n i =1 y
i
А = 8,1%. В среднем расчётные значения отклоняются от фактических на 8,1%.
Рассчитаем F-критерий Фишера:
• через коэффициент детерминации R2 по формуле:
R2
F=
( n − 2)
1 − R2
0,125
× 5 = 0,714.
0,875
Критические значения берутся из статистических таблиц согласно приведенному в теоретической части построению.
Fкритическое при α=1% = 16,26.
Fкритическое при α=5% = 6,61.
Fфактическое > Fкритическое при α=5%. Гипотеза H0 не принимается
при 5%-ном уровне значимости, что говорит о значимости уравнения
регрессии в целом.
Fфактическое < Fкритическое при α=1%. Полученное значение указывает на
необходимость принять гипотезу H0 о случайной природе выявленной
зависимости и статистической незначимости параметров уравнения и
показателя тесноты связи.
Fфакт ическое =
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
• значение F-статистики можно получить в рамках оценивания
регрессии, что будет продемонстрировано далее в рамках проведения
регрессионного анализа на компьютере с использованием встроенных
функций.
2) Степенная модель: ŷ = a хb.
Проведём процедуру линеаризации путём логарифмирования
обеих частей уравнения:
lg y = lg a + b ⋅ lg x ,
Υ = C + b⋅X ,
где Y = lg y, X = lg x, C = lg a.
Промежуточные вычисления с использованием
логарифмов исходных данных
Y
X
1,8376 1,6542
1
1,7868 1,7709
2
1,7774 1,7574
3
1,7536 1,7910
4
1,7404 1,7694
5
1,7348 1,6739
6
1,6928 1,7419
7
Итого 12,3234 12,1587
Среднее 1,7605 1,7370
значение
0,0425 0,0484
σ
2
0,0018 0,0023
σ
Таблица 5
YX
3,0398
3,1642
3,1236
3,1407
3,0795
2,9039
2,9487
21,4003
3,0572
Y2
3,3768
3,1927
3,1592
3,0751
3,0290
3,0095
2,8656
21,7078
3,1011
X2
2,7364
3,1361
3,0885
3,2077
3,1308
2,8019
3,0342
21,1355
3,0194
ŷ
61,0
56,3
56,8
55,5
56,3
60,2
57,4
403,5
Х
у–ŷ
7,8
4,9
3,1
1,2
-1,3
-5,9
-8,1
1,7
х
(у – ŷ)2
60,8
24,0
9,6
1,4
1,7
34,8
65,6
197,9
28,27
Ai
11,3
8,0
5,2
2,1
2,4
10,9
16,4
56,3
8,0
х
х
х
х
х
х
Х
Х
х
х
х
х
х
х
Рассчитаем С (или lg a) и b:
b=
Y⋅ X −Y⋅ X
σx
2
=
3,0572 − 1,7605 ⋅ 1,7370
0,0484
≈ −0,298
2
C = Y − b ⋅ X = 1,7605 + 0,298 ⋅1,7370 = 2,278 .
Получим линейное уравнение: Ŷ = 2,278 – 0,298Х. Выполнив его
потенцирование, перейдем к следующему виду:
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Λ
y = 10 2,278 ⋅ xi
− 0,298
= 189,7 ⋅ х − 0,298 .
i
Подставляя в данное уравнение фактические значения хi, получаем теоретические значения результата ŷi. По ним рассчитаем показатели: тесноты связи – индекс корреляции ρ ху и среднюю ошибку ап-
проксимации
А:
n
ρ
σ ост
= 1−
σ у2
2
ху
= 1−
∑
i
=1
n
∑
i
=1
Λ
( уi − yi ) 2
=
( уi − у)
1−
2
28,27
32,92
= 0,3758,
А = 8,0% .
Характеристики степенной модели указывают, что она несколько
лучше линейной функции описывает взаимосвязь.
ρ 2 xy n − m − 1 0,1555
=
⋅
=
⋅ 5 = 0,92
F
2
факт
0
,
8445
m
1− ρ x
уровне значимости α = 0,05.
Следовательно, принимается гипотеза Но о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить
сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
где
F табл = 6,6 > F факт , при
3) Показательная функция: ŷ = а bx.
Уравнение
регрессии
показательной
ŷ = 77,24 * 0,9947х.
Решение аналогично предыдущей задаче 1.
функции:
Задача 2
По совокупности 30-ти предприятий торговли изучается зависимость между признаками: х – цена за товар А, тыс. руб.; у – прибыль
торгового предприятия, млн. руб. При оценке регрессионной модели
были получены следующие промежуточные результаты:
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Λ
n
( yi − yi )
∑
i
2
=39000,
=1
n
2
y
y
(
)
−
= 120000.
∑ i
i =1
• Поясните, какой показатель корреляции можно определить по
этим данным.
• Проведите дисперсионный анализ для расчета F-критерия Фишера.
Для вычислений будем использовать следующие формулы:
n
( yi − y)
∑
i
n
= ∑ yi2 − ny 2 - общая сумма квадратов отклонений;
2
=1
n
Λ
i =1
( yi − y)
∑
i
=b
2
n
2
=1
( xi − x )
∑
i
2
=1
– сумма квадратов отклонений,
обусловленная регрессией;
n
Λ
( yi − yi )
∑
i
=1
2
– остаточная сумма квадратов отклонений.
• Сравните фактическое значение F-критерия с табличным. Сделайте выводы.
Решение
• По указанным данным можно определить индекс корреляции
рху для нелинейной регрессии:
Λ
n
−
у
y
(
)2
∑
2
i
i
σ
ρ ху = 1 − ост = 1 − i = 1
n
σ 2
2
∑ ( у − у)
у
i
i =1
Λ
Dфакт
∑ ( yi − y) ,
=
1
Λ
2
Dост
= 0,822.
∑ ( yi − yi ) ,
=
n−2
2
F=
Dфакт
Dост
или
F=
p xy2
1 − p xy2
⋅ (n − 2) .
Dфакт = 120000 – 39000 = 81000; Dост = 39000 / 28 = 1393;
тогда F = 58 или
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
F=
0,676
⋅ (30 − 2) ≈ 58
1 − 0,676
Fα =0, 05 = 4,20;
Fα =0, 01 = 7,64.
Поскольку Fфакт>Fтабл как при 1%-ном, так и при 5%-ном уровне
значимости, то можно сделать вывод о значимости уравнения регрессии.
Задача 3
Для трех видов продукции А, В и С модели зависимости удельных постоянных расходов от объема выпускаемой продукции выглядит следующим образом:
Y A = 600

YB = 80 + 0,7 x

0,5
YC = 40 x
• Определите коэффициент эластичности по каждому виду продукции и поясните их смысл.
• Каким должен быть объем выпускаемой продукции, чтобы коэффициенты эластичности для продукции В и С были равны?
Решение
Э А = 0 − зависимост ь абсолют но неэласт ична

0,7 х 


Э В =
+
80
0
,
7
х
 − зависимост и мало эласт ичны


ЭС = 0,5

Коэффициент эластичности функции В зависит от значений фактора х.
Объем выпускаемой продукЭ В = ЭС
ции в случае равенства коэффи0,7 x
циентов эластичности для про= 0,5
80 + 0,7 x
дукции В и С должен быть равен
114,3.
(80 + 0,7 x ) ⋅ 0,5 = 0,7 x
40 = 0,35 x
x ≈ 114,3
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часть 3. Реализация типовых задач
на компьютере
Посредством табличного процессора Exсel существует возможность ускорить вычисления необходимых статистических характеристик.
Следует учесть, что при вычислении среднего значения, дисперсии, среднеквадратического отклонения берется генеральная совокупность, а не выборка. Воспользовавшись оператором «Мастер
функций» в категории «Статистические», вызываем функции:
1. СРЗНАЧ (число 1, число 2, …) - для расчета среднего значения;
2. ДИСПР (число 1, число 2, …) – генеральной дисперсии;
3. СТАНДОТКЛОНП (число 1, число 2, …) – стандартного отклонения.
4. КОРРЕЛ (массив 1, массив 2) – коэффициента корреляции между двумя множествами данных;
5. ЛИНЕЙН – для вычисления параметров линейной регрессии;
6. ЛГРФПРИБЛ – для вычисления параметров экспоненциальной
функции.
На основе данных таблицы 3 проведем расчет статистических характеристик с использованием компьютера.
Таблица 6
Результат вычисления функции ЛИНЕЙН
b
Стандартная ошибка b
Коэффициент
детерминации
F статистика
Регрессионная сумма
квадратов
-0,34593
0,4097
0,12479
76,8771
22,6202
6,35151
0,71292
28,7603
5
Число степеней свободы
201,708
Остаточная сумма
a
Стандартная ошибка а
Стандартная ошибка у
квадратов
Построение уравнения регрессии показательной кривой в значительной степени облегчает работа со встроенной статистической
функцией ЛГРФПРИБЛ. Порядок вычисления аналогичен применению функции ЛИНЕЙН.
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 7
Результат вычисления функции ЛГРФПРИБЛ
b
Стандартная ошибка b
Коэффициент
детерминации
F статистика
Регрессионная сумма
квадратов
0,99467
0,00707
0,10259
77,2403
0,39011
0,10954
a
Стандартная ошибка а
Стандартная ошибка у
0,57157
0,00686
5
0,05999
Число степеней свободы
Остаточная сумма квадратов
Задача 4
По территориям региона приводятся данные за 2002 год (табл. 8).
Исходные данные
Номер территории
региона
1
2
3
4
5
6
7
8
9
10
11
12
Итого
Среднее
σ2
σ
х - прожиточный
минимум, руб.
78
82
87
79
89
106
67
88
73
87
76
115
1027
85,58333
167,7431
12,95157
Таблица 8
у - среднедневная
заработная плата, руб.
133
148
134
154
162
195
139
158
152
162
159
173
1869
155,75
273,3542
16,53343
Задание
1. Для характеристики зависимости у от х рассчитать параметры
следующих функций:
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1) линейной;
2) показательной.
2. Оценить статистическую значимость параметров регрессии и
корреляции.
Решение
Уравнение линейной регрессии имеет вид: ŷ = а + в х.
Результат вычисления функции ЛИНЕЙН
b
Стандартная ошибка b
Коэффициент
детерминации
F статистика
Регрессионная сумма
квадратов
Таблица 9
0,920431
0,279716
0,519877
76,97649
24,21156
12,54959
a
Стандартная ошибка а
Стандартная ошибка у
10,82801
1705,328
10
1574,922
Число степеней свободы
Остаточная сумма
квадратов
Таблица 10
Расчет прогнозируемых значений
и их отклонений от фактических
Номер территории
региона
1
2
3
4
5
6
7
8
9
10
11
12
Итого
среднее
σ2
σ
х
у
ŷ
у- ŷ
78
82
87
79
89
106
67
88
73
87
76
115
1027
85,58333
167,7431
12,95157
133
148
134
154
162
195
139
158
152
162
159
173
1869
155,75
273,3542
16,53343
148,76
152,44
157,04
149,68
158,88
174,52
138,64
157,96
144,16
157,04
146,92
182,8
1868,84
-15,76
-4,44
-23,04
4,32
3,12
20,48
0,36
0,04
7,84
4,96
12,08
-9,8
0,16
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Уравнение регрессии показательной функции будет найдено в
виде: ŷ = а bx.
Исходное уравнение: y = a bx для приведения к линейному виду
прологарифмировано. Получено уравнение: ln y = ln a + х ln b.
Произведем замену ln y = Y, ln b = B, ln a = C.
Получено Y = C + Bx.
Таблица 11
Расчет прогнозируемых значений
и их отклонений от фактических
х
78
82
87
79
89
106
67
88
73
87
76
115
у
133
148
134
154
162
195
139
158
152
162
159
173
lny(Y)
4,89
5,00
4,90
5,04
5,09
5,27
4,93
5,06
5,02
5,09
5,07
5,15
ŷ
148,41
151,80
156,15
149,25
157,92
173,84
139,47
157,03
144,28
156,15
146,74
182,90
у-ŷ
-15,41
-3,80
-22,15
4,75
4,08
21,16
-0,47
0,97
7,72
5,85
12,26
-9,90
Воспользуемся функцией ЛИНЕЙН для получения оценок параметров регрессии и статистических характеристик.
Таблица 12
Результат вычисления функции ЛИНЕЙН
В
Стандартная ошибка В
Коэффициент детерминации
F статистика
Регрессионная сумма
квадратов
0,005648
0,001791
0,498671
9,946979
0,064202
29
4,559469
С
0,154997 Стандартная ошибка С
0,08034 Стандартная ошибка У
10
Число степеней свободы
0,064544
Остаточная сумма
квадратов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 13
Исходные и промежуточные параметры регрессии
lnb(B)
b
0,01
1,01
4,56
95,53
lna(C)
a
Λ
=
+
Получили уравнение регрессии вида Y 4,56 0,01 x
Потенцированием получим значение a. Тогда исходное уравнение регрессии имеет следующий вид:
ŷ = 95,53×1,01x.
Можно использовать встроенную статистическую функцию
ЛГРФПРИБЛ. Тогда не потребуется предварительного вычисления
логарифмов исходных данных. Параметры уравнения регрессии будут найдены непосредственно из первой строки таблицы, полученной
с помощью функции ЛГРФПРИБЛ.
Таблица 14
Результат вычисления функции ЛГРФПРИБЛ
b
Стандартная ошибка b
Коэффициент детерминации
F статистика
Регрессионная сумма
квадратов
1,005664
0,001791
0,498671
9,946979
0,064202
95,53277
0,154997
0,08034
10
0,064544
а
Стандартная ошибка а
Стандартная ошибка у
Число степеней свободы
Остаточная сумма
квадратов
Уравнение регрессии показательной функции: ŷ = 95,53×1,01x.
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Введение ..................................................................................................... 3
Часть 1 Теоретические аспекты курса «Эконометрика» ................ 4
Тема 1. Основные понятия корреляционного и регрессионного
анализа ......................................................................................... 4
Тема 2. Статистическая проверка гипотез........................................... 7
Тема 3. Линейная регрессия. Оценка качества регрессионной
модели ....................................................................................... 10
Тема 4. Оценка существенности параметров линейной
регрессии и корреляции. F-критерий Фишера.
Дисперсионный анализ ............................................................ 15
Часть 2. Решение типовых задач ........................................................ 19
Часть 3. Реализация типовых задач на компьютере ...................... 26
31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Учебное издание
Составитель Зеткина Оксана Валерьевна
Примеры решения задач
по дисциплине «Эконометрика»
Редактор, корректор А.А. Антонова
Компьютерная верстка И.Н. Ивановой
Подписано в печать 16.09.2004. Формат 60х84/16.
Бумага тип. Усл. печ. л. 1,9. Уч.-изд. л. 1,3.
Тираж 100 экз. Заказ .
Оригинал-макет подготовлен в редакционно-издательском отделе
Ярославского государственного университета.
Отпечатано на ризографе.
Ярославский государственный университет.
150000 Ярославль, ул. Советская, 14.
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Примеры решения задач
по дисциплине «Эконометрика»
34
Документ
Категория
Без категории
Просмотров
291
Размер файла
405 Кб
Теги
дисциплины, решение, эконометрика, указания, методические, 124, задачи, пример
1/--страниц
Пожаловаться на содержимое документа