close

Вход

Забыли?

вход по аккаунту

?

638

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Федеральное агентство по образованию
Государственное образовательное учреждение
высшего профессионального образования
Казанский государственный технологический университет
Н.Н.Валеев, А.В.Аксянова, Г.А.Гадельшина
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
И ПРОГНОЗИРОВАНИЕ
Учебное пособие
Казань
КГТУ
2010
– 1 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 338.27
ББК 65.23
Анализ временных рядов и прогнозирование: учебное
пособие / Н.Н.Валеев, А.В.Аксянова, Г.А.Гадельшина.– Казань:
Изд-во Казан. гос. технол. ун-та; 2010.– 160 с.
ISBN 978-5-7882-0862-6
Пособие является методическим обеспечением учебной
дисциплины «Методы социально-экономического прогнозирования» и предназначена для студентов, обучающихся по
специальностям: 061800 «Математические методы в экономике». Изложение сопровождается подробным разбором теоретического материала на конкретных примерах.
Может быть использовано при самостоятельной работе в дисплейных классах.
Пособие предназначено для студентов, магистров и аспирантов,
сталкивающихся с необходимостью решения математических задач
и оформления их в виде высококачественных документов: курсовых, дипломных работ, диссертаций.
Подготовлено на кафедре химической кибернетики.
Печатается по решению экспертного совета по информатизации
Рецензенты:
зав.
каф. ЭПС КГАСА, д.э.н.,
Г.М.Загидуллина
зав. каф. ЭиУ НХТИ, д.э.н., профессор,
Д.Ш.Султанова
профессор,
 Н.Н.Валеев, А.В.Аксянова, Г.А.Гадельшина
 Казанский государственный
технологический университет, 2010
– 2 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
В условиях перехода экономики на рыночные отношения
возрастает роль прогнозов для руководителей различных уровней в принятии научно обоснованных управленческих решений.
В связи с этим статистические методы прогнозирования стали
важным инструментом в деятельности плановых, аналитических, маркетинговых отделов производственных предприятий и
объединений, торговых, страховых компаний, банков, правительственных учреждений.
Широкому внедрению статистических методов анализа и
прогнозирования развития социально-экономических процессов
способствовало стремительное распространение эконометрического программного обеспечения.
Использование современных статистических пакетов прикладных программ превратило статистическую обработку данных в увлекательное исследование, позволило сделать доступными и наглядными современные методы и подходы статистического прогнозирования. Теперь пользователь освобождается
от всей черновой работы (от проведения трудоемких расчетов,
построения таблиц и графиков), на его долю приходится лишь
творческая: постановка задачи, выбор методов прогнозирования,
оценка качества полученных моделей, интерпретация результатов. Для выполнения такой работы необходимо иметь определенную подготовку в области прикладной статистики, знать методы и подходы статистического анализа и прогнозирования
временных рядов.
Статистические методы прогнозирования стали важной
частью блока дисциплин прикладной статистики и эконометрики, изучаемых в экономических вузах. В учебном пособии в
систематизированном виде изложены статистические методы
прогнозирования временных рядов, наиболее часто используемые в экономической практике. Структура изложения соответствует логической последовательности основных этапов анализа
и прогнозирования временных рядов. Большое внимание уделя– 3 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ется подробному обсуждению примеров и решению задач, в основном базирующихся на реальных данных.
Отметим, что успешное применение статистических методов прогнозирования на практике возможно лишь при сочетании
знаний в области самих методов с глубоким знанием объекта
исследования, с содержательным экономическим анализом изучаемого явления.
В.1. Типы экономических прогнозов
Среди основных задач статистики видное место отводится
описанию изменений показателей во времени, изучению динамики развития социально-экономических процессов. В современных условиях управленческие решения должны приниматься
лишь на основе тщательного анализа имеющейся информации, с
учетом прогнозов состояния рынка, при оценивании возможных
рисков. В противном случае могут опередить конкуренты,
умеющие лучше оценивать и прогнозировать перспективы развития. Каковы колебания курса доллара? Какая тенденция прослеживается в изменении важнейших макроэкономических показателей? Какие ценные бумаги окажутся наиболее доходными? Ответы на эти и аналогичные вопросы могут быть получены
с помощью специальных статистических методов, анализирующих временные ряды. Статистические методы прогнозирования
позволяют выявлять закономерности на фоне случайностей, делать обоснованные прогнозы, оценивать их надежность и достоверность.
Под прогнозом понимается научно обоснованное описание
возможных состояний объектов в будущем, а также альтернативных путей и сроков достижения этого состояния. Процесс
разработки прогнозов называется прогнозированием (от греч.
prognosis – предвидение, предсказание ) и предполагает выявление ответов на два вопроса:
– Что вероятнее всего ожидать в будущем?
– Каким образом нужно изменить условия, чтобы достичь
заданного конечного состояния прогнозируемого объекта?
– 4 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозы, отвечающие на вопросы первого типа, называются поисковыми, второго – нормативными.
Важной характеристикой является время (период) упреждения прогноза – отрезок времени от момента, для которого
имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз.
По времени упреждения экономические прогнозы можно
разделить на следующие виды:
– оперативные (с периодом упреждения до одного месяца);
– краткосрочные (период упреждения - от одного, нескольких месяцев до года);
– среднесрочные (период упреждения более 1 года, но не
превышает 5 лет);
– долгосрочные (с периодом упреждения более 5 лет).
Следует обратить внимание на разнообразие прогнозов в
зависимости от масштабности объекта прогнозирования. Экономические прогнозы могут охватывать все уровни: микро-, мезо-, макро- уровни, а также глобальный уровень. Например, прогнозы развития отдельных предприятий, производств относятся
к прогнозам на микроуровне, региональные и отраслевые прогнозы – к мезоуровню. Прогнозы на макроуровне анализируют
экономическое развитие в масштабе страны, прогнозы на глобальном уровне опираются на исследование существующих закономерностей в мировом масштабе.
Статистические методы прогнозирования опираются на
анализ временных рядов.
Временным рядом (рядом динамики, динамическим рядом)
называется последовательность значений статистического показателя (признака), упорядоченная в хронологическом порядке, т.
е. в порядке возрастания временного параметра. Отдельные наблюдения временного ряда называются уровнями этого ряда.
В англоязычной литературе для временных рядов используется термин time series.
Каждый ряд динамики содержит два элемента:
1) значения времени;
– 5 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2) соответствующие им значения уровней ряда.
В качестве показателя времени в рядах динамики могут
указываться либо определенные моменты времени (даты), либо
отдельные периоды (сутки, месяцы, кварталы, полугодия, годы
и т.д.). В зависимости от характера временного параметра ряды
делятся на моментные и интервальные.
В моментных рядах динамики уровни характеризуют значения показателя по состоянию на определенные моменты времени. Например, моментными являются временные ряды цен на
определенные виды товаров, ряды курсов акций, уровни которых фиксируются для конкретных чисел. Примерами моментных рядов динамики могут служить также ряды численности
населения или стоимости основных фондов, так как значения
уровней этих рядов определяются ежегодно на одно и то же
число.
В.2. Основные элементы временного ряда
Эконометрическую модель можно построить, используя
два типа исходных данных:
– данные, характеризующие совокупность различных объектов в определенный момент (период) времени;
– данные, характеризующие один объект за ряд последовательных моментов (периодов) времени.
Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные по
данным второго типа, называются моделями временных рядов.
Временной ряд – это совокупность значений какого-либо
показателя за несколько последовательных моментов (периодов)
времени. Каждый уровень временного ряда формируется под
воздействием большого числа факторов, которые условно можно подразделить на три группы:
– факторы, формирующие тенденцию ряда;
– факторы, формирующие циклические колебания ряда;
– случайные факторы.
При различных сочетаниях этих факторов зависимость
– 6 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
уровней ряда от времени может принимать разные формы.
Во-первых, большинство временных рядов экономических
показателей имеют тенденцию, характеризующую совокупное
долговременное воздействие множества факторов на динамику
изучаемого показателя. По всей видимости, эти факторы, взятые
в отдельности, могут оказывать разнонаправленное воздействие
на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. На
рис.В.1 а, б, в показаны компоненты гипотетического временного ряда, содержащего возрастающую тенденцию.
Во-вторых, изучаемый показатель может быть подвержен
циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей зависит от времени года (например, цены на сельскохозяйственную продукцию в летний период ниже, чем в зимний;
уровень безработицы в курортных городах в зимний период
выше по сравнению с летним). При наличии больших массивов
данных за длительные промежутки времени можно выявить
циклические колебания, связанные с общей динамикой конъюнктуры рынка, а также с фазой бизнес-цикла, в которой находится экономика страны. На рис.В.1 б представлен гипотетический временной ряд, содержащий только сезонную компоненту.
yt
yt
t
а
t
б
– 7 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
yt
t
в
Рис.В.1. Основные компоненты временного ряда
Некоторые временные ряды не содержат тенденции и циклическую компоненту, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Пример ряда,
содержащего только случайную компоненту, приведен на
рис.В.1 в.
Очевидно, что реальные данные не соответствуют полностью ни одной из описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется
под воздействием тенденции, сезонных колебаний и случайной
компоненты.
В большинстве случаев фактический уровень временного
ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой
временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение
перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования отдельного временного ряда – выявление и придание
количественного выражения каждой из перечисленных выше
компонент, с тем чтобы использовать полученную информацию
для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.
– 8 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1. Автокорреляция уровней временного ряда и
выявление его структуры
При наличии тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих
значений. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией
уровней ряда.
Количественно ее можно измерить с помощью линейного
коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов по времени.
Пример 1.1. Пусть имеются следующие условные данные
о средних расходах на конечное потребление (yt, д.е.) за 8 лет –
табл.1.1.
Таблица 1.1. Расчет коэффициента автокорреляции первого порядка
t
1
2
3
4
5
6
7
8
Итого
yt
7
8
8
10
11
12
14
16
86
yt-1
yt–y1
7
8
8
10
11
12
14
70
–3,2857
–3,2857
–1,2857
–0,2857
0,71429
2,71429
4,71429
0
yt-1–y2 (yt–y1)(yt-1–y2)
–3
–2
–2
0
1
2
4
0
9,857142857
6,571428571
2,571428571
0
0,714285714
5,428571429
18,85714286
44
(yt–y1)2
(yt-1–y2)2
10,79592
10,79592
1,653061
0,081633
0,510204
7,367347
22,22449
53,42857
9
4
4
0
1
4
16
38
Разумно предположить, что расходы на конечное потребление в текущем году зависят от расходов на конечное потребление предыдущих лет.
Определим коэффициент корреляции между рядами yt и yt–
и
измерим
тесноту связи между расходами на конечное по1
требление текущего и предыдущего годов. Добавим в табл.1.1
временной ряд yt–1.
Одна из рабочих формул для расчета коэффициента корре– 9 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ляции имеет вид:
rxy =
∑ ( xi − x ) ⋅ ( y i − y ) .
2
2
∑ ( xi − x ) ⋅ ∑ ( y i − y )
В качестве переменной x будем рассматривать ряд y2, y3,…,
y8; в качестве переменной y – ряд y1, y2,…, y7. Тогда формула
примет вид:
n
r1 =
∑ ( yt − y1 ) ⋅ ( yt −1 − y2 )
,
t =2
n
n
(1.1)
∑ ( yt − y1 ) ⋅ ∑ ( yt −1 − y 2 )
2
t =2
2
t =2
где
n
y1 =
n
∑ yt
t =2
n −1
;
y2 =
∑ yt −1
t =2
.
(1.2)
n −1
Эту величину называют коэффициентом автокорреляции
уровней ряда первого порядка, так как он измеряет зависимость
между соседними уровнями ряда t и t-1, т.е. при лаге 1.
Для данных из примера 1.1 соотношения (1.2) составят:
y1 =
8 + 8 + K + 16 79
=
= 11,29 ;
8 −1
7
7 + 8 + K + 14 70
=
= 10 .
8 −1
7
Воспользовавшись формулой (1.1), получим коэффициент
автокорреляции уровней ряда первого порядка:
y2 =
r1 =
44
= 0,977 .
53,43 ⋅ 38
Полученное значение свидетельствует об очень тесной зависимости между расходами на конечное потребление текущего
и непосредственно предшествующего годов и, следовательно, о
– 10 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
наличии во временном ряде расходов на конечное потребление
сильной линейной тенденции.
Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями ряда yt и yt–2 и определяется по формуле
n
r2 =
∑ (y
t
t =3
n
∑ (y
t =3
t
− y3 ) ⋅ ( yt − 2 − y4 )
,
n
(1.3)
− y3 ) ⋅ ∑ ( yt − 2 − y4 )
2
2
t =3
где
n
y3 =
n
∑ yt
t =3
;
y4 =
n−2
Для данных из примера 1.1 получим:
y3 =
∑ yt −1
t =3
n−2
.
(1.4)
8 + 10 + K + 16 71
=
= 11,83 ;
8−2
6
7 + 8 + K + 12 56
=
= 9,33 .
8 −1
6
Для расчета коэффициента автокорреляции второго порядка построим табл.1.2.
Подставив полученные значения в формулу (1.3), получим:
y4 =
r2 =
27,3334
= 0,973 .
40,8334 ⋅ 19,3334
Полученные результаты еще раз подтверждают вывод о
том, что ряд расходов на конечное потребление содержит линейную тенденцию.
Число периодов, по которым рассчитывается коэффициент
автокорреляции, называется лагом. С увеличением лага число
пар значений, по которым рассчитывается коэффициент авто– 11 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
корреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило «максимальный лаг должен быть не больше n/4».
Таблица 1.2. Расчет коэффициента автокорреляции второго порядка
t
1
2
3
4
5
6
7
8
Итого
yt
7
8
8
10
11
12
14
16
86
yt–2
yt–y3
yt–2–y4
(yt–y3)(yt–2–y4)
(yt–y3)2
(yt–2–y4)2
7
8
8
10
11
12
56
–3,83333
–1,83333
–0,83333
0,166667
2,166667
4,166667
0
–2,33333
–1,33333
–1,33333
0,666667
1,666667
2,666667
0
8,944444444
2,444444444
1,111111111
0,111111111
3,611111111
11,11111111
27,33333333
14,69444
3,361111
0,694444
0,027778
4,694444
17,36111
40,83333
5,444444
1,777778
1,777778
0,444444
2,777778
7,111111
19,33333
Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и, таким образом, характеризует тесноту
только линейной связи текущего и предыдущего уровней ряда.
Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту),
коэффициент автокорреляции уровней исходного ряда может
приближаться к нулю.
Во-вторых, по знаку коэффициента автокорреляции нельзя
делать вывод о возрастающей или убывающей тенденции в
уровнях ряда. Большинство временных рядов экономических
данных содержат положительную автокорреляцию уровней, однако при этом они могут иметь убывающую тенденцию.
Последовательность
коэффициентов
автокорреляции
уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее
– 12 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.
Анализ автокорреляционной функции и коррелограммы
позволяет определить лаг, при котором автокорреляция наиболее высокая, следовательно, лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при
помощи j анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка τ, ряд содержит циклические колебания с
периодичностью в τ моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать предположение относительно структуры этого ряда: либо
ряд не содержит тенденции и циклических колебаний и имеет
структуру, сходную со структурой случайного ряда (см. рис.2.1
в), либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во
временном ряде наличия или отсутствия трендовой компоненты
Т и циклической (сезонной) компоненты S.
Временной ряд расходов на конечное потребление (см.
пример 1.1) содержит только тенденцию, так как коэффициенты
автокорреляции его уровней высокие.
Пример 1.2. Пусть имеются условные данные об объемах
потребления электроэнергии жителями региона за 16 кварталов
(табл.1.3).
– 13 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 1.3. Потребление электроэнергии жителями региона,
млн. кВт ⋅ ч
t
1
2
з
4
5
6
7
8
9
10
11
12
13
14
15
16
уt
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
7,0
10,8
уt–1
–
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
7,0
уt–2
–
–
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
уt–3
–
–
–
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
уt–4
–
–
–
–
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
Нанесем значения у, на график (рис.1.1).
Определим коэффициент автокорреляции первого порядка
(добавим уt–1 в табл.1.3 и воспользуемся формулой расчета линейного коэффициента корреляции). Он составит: r1 = 0,165. Это
значение свидетельствует о слабой зависимости текущих уровней ряда от непосредственно предшествующих им уровней. Однако, как следует из графика, структура данного ряда такова, что
каждый следующий уровень уt зависит от уровней уt–4 и уt–2 в
гораздо большей степени, чем от уровня уt–1. Построим ряд уt–2
(см. табл.1.3). Рассчитав коэффициент автокорреляции второго
порядка r2, получим количественную характеристику корреляционной связи рядов уt, уt–2: r2 = 0,567. Продолжив расчеты, получим автокорреляционную функцию этого ряда (табл.1.4).
Анализ значений автокорреляционной функции позволяет
сделать вывод о наличии в изучаемом временном ряде, вопервых, линейной тенденции, во-вторых, сезонных колебаний
периодичностью в четыре квартала. Данный вывод подтвержда– 14 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ется и графическим анализом структуры ряда (рис.1.1).
уt
12
10
8
6
4
2
0
1
2
з
4
5
6
7
8
9
10 11 12 13 14 15 16
t
Рис.1.1. Потребление электроэнергии жителями региона
Таблица 1.4. Коэффициенты автокорреляции
Лаг
1
2
3
4
5
6
7
8
Коэффициент автокорреляции
0,165155
0,566873
0,113558
0,983025
0,118711
0,722046
0,003367
0,973848
На рис.1.2 приведена получившаяся по данным примера
коррелограмма.
Аналогично, если, например, при анализе временного ряда
наиболее высоким оказался коэффициент автокорреляции второго порядка, ряд содержит циклические колебания с циклом,
равным двум периодам времени, т.е. имеет пилообразную
структуру.
– 15 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коэффициенты автокорреляции
1,2
1
0,8
0,6
0,4
0,2
0
0
2
4
6
8
10
Лаг
Рис.1.2. Коррелограмма
1.1. Практические примеры
Практический пример 1.1
Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РФ:
Год
1999
2000
2001
2002
Квартал
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Количество возбужденных дел, yt
375
371
869
1015
357
471
992
1020
390
355
992
905
461
454
920
927
– 16 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построим исходную зависимость от времени:
yt
1200
1000
800
600
400
200
t
0
0
2
4
6
8
10
12
14
16
Уже исходя из графика, видно, что значения y образуют
пилообразную фигуру. Рассчитаем несколько последовательных
коэффициентов автокорреляции. Для этого составляем вспомогательную таблицу.
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
∑
yt
375
371
869
1015
357
471
992
1020
390
355
992
905
461
454
920
927
10499
yt–1
–
375
371
869
1015
357
471
992
1020
390
355
992
905
461
454
920
9947
yt–y1
–
–328,33
169,67
315,67
–342,33
–228,33
292,67
320,67
–309,33
–344,33
292,67
205,67
–238,33
–245,33
220,67
227,67
9,05
yt–1–y2 (yt–y1)(yt–1–y2)
–
–
–288,13
94601,72
–292,13
–49565,70
205,87
64986,98
351,87
–120455,66
–306,13
69898,66
–192,13
–56230,69
328,87
105458,74
356,87
–110390,60
–273,13
94046,85
–308,13
–90180,41
328,87
67638,69
241,87
–57644,88
–202,13
49588,55
–209,13
–46148,72
256,87
58481,59
0,05
74085,16
(yt–y1)2
–
107800,59
28787,91
99647,55
117189,83
52134,59
85655,73
102829,25
95685,05
118563,15
85655,73
42300,15
56801,19
60186,81
48695,25
51833,63
1153766
(yt–1–y2)2
–
83018,90
85339,94
42382,46
123812,50
93715,58
36913,94
108155,48
127356,20
74600,00
94944,10
108155,48
58501,10
40856,54
43735,36
65982,20
1187470
Вычисляем коэффициент автокорреляции первого порядка:
– 17 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
r1 =
74085,16
1153756,39 ⋅ 1187469,73
= 0,063294 .
Аналогично находим коэффициенты автокорреляции более
высоких порядков, а все полученные значения заносим в сводную таблицу:
Лаг
1
2
3
4
5
6
7
8
9
10
11
12
Коэффициент автокорреляции уровней
0,063294
–0,961183
–0,036290
0,964735
0,050594
–0,976516
–0,069444
0,964629
0,162064
–0,972918
–0,065323
0,985761
По полученным результатам строим коррелограмму:
r
1 ,5
1
0 ,5
0
-0 ,5 0
лаг
2
4
6
8
10
12
-1
-1 ,5
Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом
временном ряде сезонных колебаний периодичностью в четыре
квартала.
– 18 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Практический пример 1.2
Пусть имеются данные о численности городского населения в Республике Татарстан за 1995-2008 гг.:
Годы
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Численность городского населения, yt
2747,7
2756,9
2764,5
2772,2
2789,7
2788,9
2787,4
2790,7
2791
2793,7
2806,8
2803,9
2806,2
2811
Нанесем значения y, на график:
yt
2820
2810
2800
2790
2780
2770
2760
t
2750
2740
0
2
4
6
8
10
12
14
Определим обычным способом коэффициент автокорреляции первого порядка. Он составит: r1= 0,951. Это значение свидетельствует об очень тесной зависимости между текущей численностью городского населения и значениями предшествующих годов и, следовательно, о наличии во временном ряде чис– 19 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ленности населения сильной линейной тенденции. Рассчитав
также коэффициент автокорреляции второго порядка, получим
количественную характеристику корреляционной связи рядов yt,
yt-2. r2= 0,896. Продолжив расчеты, получим автокорреляционную функцию этого ряда:
Коэффициенты автокорреляции
Лаг
1
2
3
4
5
6
7
8
Коэффициент автокорреляции
0,950731
0,89638
0,852871
0,723203
0,828665
0,253508
0,88091
0,002344
Анализ значений автокорреляционной функции позволяет
сделать вывод о наличии в изучаемом временном ряду линейной
тенденции. Данный вывод подтверждается и графическим анализом структуры ряда.
На следующем рисунке приведена получившаяся по данным примера коррелограмма.
r
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0
2
4
6
8
Лаг
Из рисунка видно, что с увеличением лага автокорреляция
существенно снижается.
– 20 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. Моделирование тенденции временного ряда
Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от
времени, или тренд. Этот способ называют аналитическим выравниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Чаще всего применяются следующие функции:
– линейный тренд;
– гипербола;
– экспоненциальный тренд;
– тренд в форме степенной функции;
– парабола второго и более высоких порядков.
Параметры каждого тренда можно определить обычным
МНК, используя в качестве независимой переменной время, а в
качестве зависимой переменной – фактические уровни временного ряда. Для нелинейных трендов предварительно проводят
стандартную процедуру их линеаризации.
Известно несколько способов определения типа тенденции; к наиболее распространенным относятся качественный
анализ изучаемого процесса, построение и визуальный анализ
графика зависимости уровня ряда от времени, расчет некоторых
основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип
тенденции можно определить путем сравнения коэффициентов
автокорреляции первого порядка, рассчитанных по исходным и
преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни yt и yt–1 тесно коррелируют. В этом случае коэффициент автокорреляции первого
порядка уровней исходного ряда должен быть высоким. Если
временной ряд содержит нелинейную тенденцию, например, в
форме экспоненты, то коэффициент автокорреляции первого
порядка по логарифмам уровней исходного ряда будет выше,
– 21 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
чем соответствующий коэффициент, рассчитанный по уровням
ряда. Чем сильнее выражена нелинейная тенденция в изучаемом
временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, если ряд содержит
нелинейную тенденцию, можно осуществить путем перебора
основных форм тренда, расчету по каждому уравнению скор2
ректированного коэффициента детерминации R и выбора
уравнения тренда с максимальным значением скорректированного коэффициента детерминации. Реализация этого метода относительно проста при компьютерной обработке данных.
Пример 2.1. Имеются помесячные данные о темпах роста
номинальной заработной платы в РФ за 10 месяцев 1999 г. к декабрю 1998 г. (табл.2.1). Требуется выбрать наилучший тип
тренда и определить его параметры.
Таблица 2.1. Темпы роста номинальной заработной платы в РФ
за 10 месяцев 1999 г., % к декабрю 1998 г.
Месяц
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Темпы роста номинальной месячной заработной платы
82,9
87,3
99,4
104,8
107,2
121,6
118,6
114,1
123,0
127,3
График данного временного ряда представлен на рис.2.1.
Из рис.2.1 видно наличие возрастающей тенденции, возможно существование линейного тренда.
– 22 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
yt
130
120
110
100
90
t
80
0
1
2
3
4
5
6
7
8
9
10
Рис.2.1. Динамика темпов роста номинальной заработной платы
в РФ за 10 месяцев 1999 г.
Для дальнейшего анализа определим коэффициенты автокорреляции по уровням этого ряда и их логарифмам (табл.2.2).
Таблица 2.2. Автокорреляционная функция временного ряда
Лаг
1
2
3
Автокорреляционная функция
по уровням ряда
по логарифмам уровней ряда
0,901
0,914
0,805
0,832
0,885
0,896
Высокие значения коэффициентов автокорреляции первого, второго и третьего порядков свидетельствуют о том, что ряд
содержит тенденцию. Приблизительно равные значения коэффициентов автокорреляции по уровням ряда и по логарифмам
уровней позволяют сделать следующий вывод: если ряд содержит нелинейную тенденцию, то она выражена в неявной форме.
Поэтому для моделирования его тенденции в равной мере целе– 23 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сообразно использовать и линейную, и нелинейную функцию,
например, степенной или экспоненциальный ряд.
Для выявления наилучшего уравнения тренда определим
параметры основных видов трендов. Результаты этих расчетов
представлены в табл.2.3, согласно данным которой, наилучшей
является степенная форма тренда, для которой значение скорректированного коэффициента детерминации наиболее высокое.
Это уравнение выглядит следующим образом:
yˆ t = 80,344 ⋅ t 0,1935
Таблица 2.3. Уравнения трендов для временного ряда
Тип тренда
Линейный
Парабола
Степенной
Экспоненциальный
Гиперболический
Логарифмический
Уравнение
yt = 82,66 + 4,72 ⋅ t
yt = 72,9 + 9,6 ⋅ t – 0,444 ⋅ t2
yt = 80,344 ⋅ x0,1935
yt = 83,956 ⋅ e0,0451x
yt = 4,43 – 47,63/t
yt = 78,575 + 19,891 ⋅ ln(x)
R2
0,887
0,937
0,939
0,872
0,758
0,924
Наиболее простую экономическую интерпретацию имеют
параметры линейного и экспоненциального трендов.
Параметры линейного тренда можно интерпретировать
так: a – начальный уровень временного ряда в момент времени t
= 0; b – средний за период абсолютный прирост уровней ряда.
Применительно к данному временному ряду можно сказать, что
темпы роста номинальной месячной заработной платы за 10 месяцев изменялись от уровня 82,66% со средним за месяц абсолютным приростом, равным 4,72%.
Расчетные значения уровней временного ряда по линейному тренду определяются двумя способами. Во-первых, можно
последовательно подставлять в найденное уравнение тренда
значения t = 1, 2, …, т.е.
yˆ1лин = 82,66 + 4,72 ⋅ 1 = 87,38 ;
yˆ 2лин = 82,66 + 4,72 ⋅ 2 = 92,10 и т.д.
– 24 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Во-вторых, в соответствии с интерпретацией параметров
линейного тренда каждый последующий уровень ряда – это
сумма предыдущего уровня и среднего цепного абсолютного
прироста, т.е.
yˆ 2лин = yˆ1лин + b = 87,38 + 4,72 = 92,10 .
yˆ 3лин = yˆ 2лин + b = 92,10 + 4,72 = 96,81 и т.д.
График линейного тренда приведен на рис.2.1.
Параметры экспоненциального тренда имеют следующую
интерпретацию. Параметр a – это начальный уровень временного ряда в момент времени t = 0. Величина eb – это средний за
единицу времени коэффициент роста уровней ряда.
Для нашего примера уравнение экспоненциального тренда
имеет вид:
yˆ t = 83,96 ⋅ e 0, 451t = 83,96 ⋅ 1,046t
Таким образом, начальный уровень ряда в соответствии с
уравнением экспоненциального тренда составляет 83,96% (сравните с начальным уровнем 82,66% в линейном тренде), а средний цепной коэффициент роста – 1,046. Следовательно, можно
сказать, что темпы роста номинальной месячной заработной изменялись от уровня 83,96% со средним за месяц цепным темпом
роста, равным104,6%. Иными словами, средний за месяц цепной
темп прироста временного ряда составил 4,6%.
По аналогии с линейной моделью расчетные значения
уровней ряда по экспоненциальному тренду можно получить
как путем подстановки в уравнение тренда значений t = 1, 2, …,
n, так и в соответствии с интерпретацией параметров экспоненциального тренда: каждый последующий его уровень – это произведение предыдущего уровня на соответствующий коэффициент роста:
yˆ1эксп = yˆ 0эксп ⋅ 1,046 = 83,96 ⋅ 1,046 = 87,82 .
yˆ 2эксп = yˆ1эксп ⋅ 1,046 = 87,82 ⋅ 1,046 = 91,87 и т.д.
При наличии неявной нелинейной тенденции следует до– 25 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
полнять описанные выше методы выбора наилучшего уравнения
тренда качественным анализом динамики изучаемого показателя, с тем чтобы избежать ошибок спецификации при выборе вида тренда. Качественный анализ предполагает изучение проблемы возможного наличия в исследуемом временном ряде поворотных точек и изменения темпов прироста, или ускорения темпов прироста, начиная с определенного момента (периода) времени под влиянием ряда факторов и т.д. В случае, если уравнение тренда выбрано неверно при больших значениях t, результаты анализа и прогнозирования динамики временного ряда с использованием выбранного уравнения будут недостоверными
вследствие ошибки спецификации.
Если наилучшей формой тренда является парабола второго
порядка, в то время как на самом деле имеет место линейная
тенденция, то при больших значениях t парабола и линейная
функция будут по разному описывать тенденцию в уровнях ряда. При t > t* парабола второго порядка характеризует убывающую тенденцию в уровнях ряда yt, а линейная функция – возрастающую (рис.2.2).
yt
t
t*
Рис.2.2. Ошибка специализации при выборе уравнения тренда
– 26 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.1. Практические примеры
Практический пример 2.1
Рассмотрим на примере официальных данных статистики
РФ выбор вида тенденции временного ряда для изменения численности экономически активного населения РТ.
Получены исходные данные:
Год
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
№ п/п
1
2
3
4
5
6
7
8
9
10
y
1829
1807
1739
1748
1813
1845
1823
1877
1887
1871
Наличие тенденции временного ряда можно определить
при помощи коэффициентов автокорреляции. Для того чтобы
выявить характер тенденции необходимо знать коэффициенты
автокорреляции первого, второго и третьего порядков исходного
ряда и его логарифмов.
Вычисляем коэффициенты автокорреляции по формулам
типа (1.2) и результаты представим в виде следующей таблицы:
Лаг
1
2
3
Автокорреляционная функция
по уровням ряда по логарифмам уровней ряда
0,677317919
0,673251321
0,211664214
0,199650223
0,087722022
0,076904039
По результатам данной таблицы делаем следующий вывод:
ни один из коэффициентов автокорреляции не является значимым, следовательно, ряд не содержит тенденции и циклических
колебаний и имеет структуру, сходную со структурой случайного ряда, либо ряд содержит сильную нелинейную тенденцию,
– 27 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
для выявления которой нужно провести дополнительный анализ. Приблизительно равные значения коэффициентов автокорреляции по уровням ряда и по логарифмам уровней показывают
что, если ряд содержит нелинейную тенденцию, то она выражена в неявной форме. Поэтому для моделирования его тенденции
в равной мере целесообразно использовать и линейную, и нелинейную функцию.
Коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во
временном ряде наличия или отсутствия трендовой компоненты
Т и циклической (сезонной) компоненты S.
Так как ряд содержит нелинейную тенденцию, выбор наилучшего уравнения осуществляем путем перебора основных
форм тренда, при этом рассчитывая по каждому уравнению
скорректированный коэффициент детерминации. Выбор уравнения тренда осуществляем по максимальному значению скорректированного коэффициента детерминации.
Определим параметры основных видов трендов и занесем
их в таблицу:
Тип тренда
Линейный
Парабола
Степенной
Экспоненциальный
Гиперболический
Логарифмический
Уравнение
y = 1761,1 + 11,424 ⋅ x
y = 1813,3 – 14,701 ⋅ x + 2,375 ⋅ x2
y = 1772,4 ⋅ x0,0187
y = 1761,6 ⋅ e0,0063x
y = 1/(0,00057 – 0,000034 ⋅ x)
y = 1772,1 + 34,289 ⋅ ln x
R2
0,4709
0,6012
0,2435
0,4638
0,4566
0,2487
Согласно данным этой таблицы наилучшей является параболическая форма тренда, для которой значение скорректированного коэффициента детерминации наиболее высокое (R²=
0,6012). Это уравнение выглядит следующим образом:
y = 1813,3 – 14,701 ⋅ x + 2,375 ⋅ x2
По данному уравнению рассчитываем расчетные значения
y.
– 28 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
год
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
№
1
2
3
4
5
6
7
8
9
10
у
1829
1807
1739
1748
1813
1845
1823
1877
1887
1871
yr по параболе
1800,974
1793,398
1790,572
1792,496
1799,17
1810,594
1826,768
1847,692
1873,366
1903,79
Строим график по исходным и расчетным значениям:
1950
у
1900
1850
1800
1750
1700
1650
1600
1995
1997
1999
2001
2003
год
Таким образом, для математического представления изменения численности экономически активного населения РТ во
времени лучшим уравнением регрессии выбран полином второго порядка.
3. Моделирование сезонных и циклических колебаний
Известно несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания (моделирование циклических колебаний в целом осуществляется аналогично моделированию сезонных колебаний, поэтому мы рассмотрим только методы моделирования последних).
Простейший подход – расчет значений сезонной компо– 29 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ненты методом скользящей средней и построение аддитивной
или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
Y = T + S + E.
(3.1)
Эта модель предполагает, что каждый уровень временного
ряда может быть представлен как сумма трендовой Т, сезонной
S и случайной Е компонент. Общий вид мультипликативной модели выглядит так:
Y=T⋅S⋅E
(3.2)
Данная модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой
Т, сезонной S и случайной Е компонент. Выбор одной из двух
моделей проводится на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна,
строят аддитивную модель временного ряда, в которой значения
сезонной компоненты предполагаются постоянными для
различныx циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей
сводится к расчету значений Т, S и Е для каждого уровня ряда.
Процесс построения модели включает в себя следующие
шаги.
Шаг 1. Выравнивание исходного ряда методом скользящей
средней.
Шаг 2. Расчет значений сезонной компоненты S.
Шаг 3. Устранение сезонной компоненты из исходных
уровней ряда и получение выровненных данных (Т + Е) в аддитивной или (Т ⋅ Е) в мультипликативной модели.
Шаг 4. Аналитическое выравнивание уровней (Т + Е) или
(Т ⋅ Е) и расчет значений Т с использованием полученного уравнения тренда.
Шаг 5. Расчет полученных по модели значений (Т + S) или
– 30 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(Т ⋅ Е).
Шаг 6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок Е для анализа
взаимосвязи исходного ряда и других временных рядов.
3.1. Аддитивная модель временного ряда
Рассмотрим методику построения аддитивной модели временного ряда на примере.
Пример 3.1. Обратимся к данным об объеме потребления
электроэнергии жителями региона за последние четыре года.
Таблица 3.1. Расчет оценок сезонной компоненты в аддитивной
модели
Номер Потреблекварта- ние электрола, t
энергии, у
1
6,0
2
4,4
3
5,0
4
9,0
5
7,2
6
4,8
7
6,0
8
10,0
9
8,0
10
5,6
11
6,4
12
11,0
13
9,0
14
6,6
15
7,0
16
10,8
Итого за
четыре
квартала
–
24,4
25,6
26,0
27,0
28,0
28,8
29,6
30,0
31,0
32,0
33,0
33,6
33,4
–
Скользящая
средняя за четыре квартала
–
6,10
6,40
6,50
6,75
7,00
7,20
7,40
7,50
7,75
8,00
8,25
8,40
8,35
–
Сглаженная
скользящая
средняя
–
–
6,250
6,450
6,625
6,875
7,100
7,300
7,450
7,625
7,875
8,125
8,325
8,375
–
–
Оценка сезонной компоненты
–
–
–1,250
2,550
0,575
–2,075
–1,100
2,700
0,550
–2,025
–1,475
2,875
0,675
–1,775
–
–
В примере 1.2 было показано, что данный временной ряд
содержит сезонные колебания периодичностью 4. Объемы по– 31 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
требления электроэнергии в осенне-зимний период времени (I и
IV кварталы) выше, чем весной и летом (II и III кварталы). По
графику этого ряда (см. рис.3.1) можно установить наличие
приблизительно равной амплитуды колебаний. Это свидетельствует о соответствии этого ряда аддитивной модели. Рассчитаем
ее компоненты.
Шаг 1. Проведем выравнивание исходных уровней ряда
методом скользящей средней. Для этого:
– просуммируем уровни ряда последовательно за каждые
четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии
(гр.3 табл.3.1);
– разделив полученные суммы на 4, найдем скользящие
средние (гр.4 табл.3.1). Отметим, что полученные таким образом
выровненные значения уже не содержат сезонной компоненты;
– приведем эти значения в соответствие с фактическими
моментами времени, для чего найдем средние значения из двух
последовательных скользящих средних – сглаженные скользящие средние (гр.5 табл.3.1).
Шаг 2. Найдем оценки сезонной компоненты как разность
между фактическими уровнями ряда и сглаженными скользящими средними (гр.6 табл.3.1). Используем эти оценки для расчета значений сезонной компоненты S (табл.3.2).
Таблица 3.2. Расчет значений сезонной компоненты в аддитивной модели
Год
1
2
3
4
Итого за квартал
Средняя
Скорректированная
I
Квартал
III
–1,25
–2,075
–1,1
–2,025
–1,475
–1,775
–5,875
–3,825
–1,95833
–1,275
–1,97708 –1,29375
II
0,575
0,55
0,675
1,8
0,6
0,58125
IV
2,55
2,7
2,875
8,125
2,708333
2,689583
Для этого найдем средние за каждый квартал (по всем го– 32 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
дам) оценки сезонной компоненты Si. В моделях с сезонной
компонентой обычно предполагается, что сезонные воздействия
за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем
кварталам должна быть равна нулю. Для данной модели имеем:
0,6 – 1,958 – 1,275 + 2,708 = 0,075.
Определим корректирующий коэффициент:
k = 0,075 / 4 = 0,01875.
Рассчитаем скорректированные значения сезонной компоненты как разность между ее средней оценкой и корректирующим коэффициентом k:
Si = Si − k
(3.3)
Проверим условие равенства нулю суммы значений сезонной компоненты:
0,581 – 1,977 – 1,294 + 2,690 = 0.
Таким образом, получены следующие значения сезонной
компоненты:
I квартал: SI = 0,581;
II квартал: SII = –1,977;
III квартал: SIII = –1,294;
IV квартал: SIV = 2,690.
Занесем полученные значения в табл.3.3 для соответствующих кварталов каждого года.
Шаг 3. Элиминируем влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим: T + E = y – S (табл.3.3). Эти значения рассчитываются для каждого момента времени и содержат только тенденцию и случайную компоненту.
Шаг 4. Определим компоненту T данной модели. Для этого
проведем аналитическое выравнивание ряда (T + Е) с помощью
– 33 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
линейного тренда. Результаты следующие:
Константа
Коэффициент регрессии
Стандартная ошибка коэффициента
R2
5,715416667
0,186421569
0,01518843
0,91497068835
Таблица 3.3. Расчет выровненных значений и ошибок в аддитивной модели
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
у
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
7,0
10,8
S
0,58125
–1,97708
–1,29375
2,689583
0,58125
–1,97708
–1,29375
2,689583
0,58125
–1,97708
–1,29375
2,689583
0,58125
–1,97708
–1,29375
2,689583
T+E=y–S
5,41875
6,377083
6,29375
6,310417
6,61875
6,777083
7,29375
7,310417
7,41875
7,577083
7,69375
8,310417
8,41875
8,577083
8,29375
8,110417
T
5,901838
6,08826
6,274681
6,461103
6,647525
6,833946
7,020368
7,206789
7,393211
7,579632
7,766054
7,952475
8,138897
8,325319
8,51174
8,698162
T+S
E=y–(T+S)
E2
6,483088 –0,483088 0,233374
4,111176 0,288824 0,083419
4,980931 0,019069 0,000364
9,150686 –0,150686 0,022706
7,228775 –0,028775 0,000828
4,856863 –0,056863 0,003233
5,726618 0,273382 0,074738
9,896373 0,103627 0,010739
7,974461 0,025539 0,000652
5,602549 –0,002549 6,5E–06
6,472304 –0,072304 0,005228
10,64206 0,357941 0,128122
8,720147 0,279853 0,078318
6,348235 0,251765 0,063385
7,21799
–0,21799
0,04752
11,38775 –0,587745 0,345444
1,0981
Σ
Таким образом, имеем линейный тренд:
T = 5,715 + 0,186 ⋅ t.
Подставив в это уравнение значения t = 1, …, 16, найдем
уровни T для каждого момента времени (5 гр. в табл.3.3). График уравнения тренда приведен на рис.3.1.
Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной компоненты для соответствующих кварталов. Графически значения T+S представлены на рис.3.1.
– 34 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12
y
10
8
у
6
T+S
тренд
4
2
t
0
0
5
10
15
20
Рис.3.1. Потребление электроэнергии жителями региона
Шаг 6. В соответствии с методикой построения аддитивной модели расчет ошибки проводится по формуле
E = Y – (T+S)
(3.4)
Это абсолютная ошибка. Численные значения абсолютных
ошибок приведены в гр. 7 табл.3.3. Эту же ошибку можно определить как разность между значениями (T + E) и T.
По аналогии с моделью регрессии для оценки качества построения модели, а также для выбора наилучшей модели можно
использовать сумму квадратов абсолютных ошибок. Для данной
аддитивной модели сумма квадратов абсолютных ошибок равна
1,10. По отношению к общей сумме квадратов отклонений
уровней ряда от его среднего уровня, равной 71,59, эта величина
составляет чуть более 1,5%:
∆=
1,10
⋅ 100 = 1,534 .
71,59
Следовательно, можно сказать, что аддитивная модель
объясняет 98,5% общей вариации уровней временного ряда потребления электроэнергии за последние 16 кварталов.
– 35 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.2. Мультипликативная модель временного ряда
Рассмотрим методику построения мультипликативной модели временного ряда на примере.
Пример 3.2. Пусть имеются поквартальные данные о прибыли компании за последние 4 года (табл.3.4).
Таблица 3.4. Прибыль компании, тыс. долл. США
Год
1
2
3
4
I
72
70
62
52
Квартал
II
III
100
90
92
80
80
68
60
50
IV
64
58
48
30
График данного временного ряда (рис.3.2) свидетельствует
о наличии сезонных колебаний (период колебаний равен четырем) и общей убывающей тенденции ряда. Прибыль компании в
весенне-летний период выше, чем в осенне-зимний период. Поскольку амплитуда сезонных колебаний уменьшается можно
предположить наличие мультипликативной модели. Определим
ее компоненты.
yt
100
90
80
70
60
50
40
30
20
10
t
0
0
2
4
6
8
10
Рис.3.2. Прибыль компании
– 36 –
12
14
16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Шаг 1. Проведем выравнивание исходных уровней ряда
методом скользящей средней. Методика, применяемая на этом
шаге, полностью совпадает с методикой построения аддитивной
модели. Результаты расчетов представлены в табл.3.5.
Таблица 3.5. Расчет оценок сезонной компоненты в мультипликативной модели
Номер Потребление
квар- электроэнертала, t
гии, у
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
72
100
90
64
70
92
80
58
62
80
68
48
52
60
50
30
Итого за
Скользящая
Сглаженная
четыре
средняя за че- скользящая
квартала тыре квартала
средняя
–
326
324
316
306
300
292
280
268
258
248
228
210
192
–
–
81,5
81
79
76,5
75
73
70
67
64,5
62
57
52,5
48
–
–
–
81,25
80
77,75
75,75
74
71,5
68,5
65,75
63,25
59,5
54,75
50,25
–
–
Оценка сезонной
компоненты
–
–
1,10769231
0,8
0,90032154
1,21452145
1,08108108
0,81118881
0,90510949
1,21673004
1,07509881
0,80672269
0,94977169
1,19402985
–
–
Шаг 2. Найдем оценки сезонной компоненты как частное
от деления фактических уровней ряда на сглаженные скользящие средние (гр.6 табл.3.5). Используем эти оценки для расчета
сезонной компоненты S (табл.3.6). Для этого найдем средние за
каждый квартал оценки сезонной компоненты Si. Взаимопогашаемость сезонных воздействий в мультипликативной модели
выражается в том, что сумма значений сезонной компоненты по
всем кварталам должна быть равна числу периодов в цикле, т.е.
четырем, так как в нашем случае число периодов одного цикла
(год) равно четырем кварталам.
– 37 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 3.6. Расчет значений сезонной компоненты в мультипликативной модели
Год
1
2
3
4
Итого за квартал
Средняя
Скорректированная
I
II
–
0,900322
0,905109
0,949772
2,755203
0,918401
0,91366
–
1,214521
1,21673
1,19403
3,625281
1,208427
1,202189
Квартал
III
1,107692
1,081081
1,075099
–
3,263872
1,087957
1,082341
IV
0,8
0,811188811
0,806722689
–
2,4179115
0,8059705
0,801809924
Для данной модели имеем:
0,918 + 1,208 + 1,088 + 0,806 = 4,021.
Рассчитаем корректирующий коэффициент:
k =4 / 4,021 = 0,995.
Определим скорректированные значения сезонной компоненты, умножив ее средние оценки на корректирующий коэффициент k:
Si = Si ⋅ k
(3.5)
Проверим условие равенства четырем суммы значений сезонной компоненты:
0,914 + 1,202 + 1,082 + 0,802 = 4.
Получим следующие значения сезонной компоненты:
I квартал: SI = 0,914;
II квартал: SII = 1,202;
III квартал: SIII = 1,082;
IV квартал: SIV = 0,802.
Занесем полученные значения в табл.3.7 для соответствующих кварталов каждого года.
Шаг 3. Разделим каждый уровень исходного ряда на соответствующее значение сезонной компоненты. Получим: T ⋅ E = Y
– 38 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
/ S (гр.4 табл.3.7), которые содержат только тенденцию и случайную компоненту.
Таблица 3.7. Расчет выровненных значений T и ошибок E в
мультипликативной модели
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
у
S
T
T⋅E = Y/S
T⋅S
E=y/(T⋅S) E’=y–(T⋅S)
72 0,9137 78,8039 87,7919 80,22 0,897622
–8,2112
100 1,2022 83,1816 85,0187 102,21 0,978392
–2,2085
90 1,0823 83,1531 82,2454 89,02 1,011036
0,9824
64 0,8018 79,8194 79,4721 63,72
1,00437
0,2784
70 0,9137 76,6149 76,6989 70,08 0,998905
–0,0767
92 1,2022 76,5271 73,9256 88,87
1,03519
3,1274
80 1,0823 73,9138 71,1524 77,01
1,03881
2,9889
58 0,8018 72,3363 68,3791 54,83 1,057872
3,1729
62 0,9137 67,8589 65,6059 59,94 1,034342
2,0585
80 1,2022 66,5453 62,8326 75,54 1,059088
4,4633
68 1,0823 62,8268 60,0594 65,00 1,046078
2,9953
48 0,8018 59,8646 57,2861 45,93
1,04501
2,0674
52 0,9137 56,9140 54,5129 49,81 1,044046
2,1938
60 1,20229 49,9090 51,7396 62,20 0,964618
–2,2008
50 1,0823 46,1962 48,9664 53,00 0,943426
–2,9983
30 0,8018 37,4154 46,1931 37,04 0,809977
–7,0381
E2
67,44
4,88
0,97
0,08
0,01
9,78
8,93
10,07
4,24
19,92
8,97
4,27
4,81
4,84
8,99
49,53
Шаг 4. Определим компоненту Т в мультипликативной
модели. Для этого рассчитаем параметры линейного тренда, используя уровни (T ⋅ E). Результаты аналитического выравнивания этого ряда представлены ниже.
Константа
90,56515364
Коэффициент регрессии
–2,773251842
Стандартная ошибка коэффициента
0,2255567479
2
R
0,915239087
Уравнение тренда имеет следующий вид
T = 90,59 – 2,773 ⋅ t.
Подставив в это уравнение значения t = 1, …, 16, найдем
уровни T для каждого момента времени (5 гр. в табл.3.7). График уравнения тренда приведен на рис.3.3.
Шаг 5. Найдем уровни ряда по мультипликативной моде– 39 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ли, умножив уровни T на значение сезонной компоненты для
соответствующих кварталов (см. рис.3.3).
Шаг 6. Расчет ошибки в мультипликативной модели проводится по формуле
E = Y : (T⋅S)
(3.6)
Численные значения ошибки приведены в гр.7 табл.3.7.
Если временной ряд ошибок не содержит автокорреляции, его
можно использовать вместо исходного ряда для изучения взаимосвязи с другими рядами. Для того, чтобы сравнить мультипликативную модель с другими моделями временного ряда, можно по аналогии с аддитивной моделью использовать сумму
квадратов абсолютных ошибок.
yt
100
90
80
70
60
y
T
T⋅S
50
40
30
20
10
t
0
0
2
4
6
8
10
12
14
16
Рис.3.3. Прибыль компании (фактические и выровненные значения)
Абсолютные ошибки в мультипликативной модели определяются как
E = yt – (T⋅S)
– 40 –
(3.7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В данной модели сумма квадратов абсолютных ошибок составляет 207,73. Общая сумма квадратов отклонений фактических уровней этого ряда от среднего значения равна 5023. Таким
образом, доля объясненной дисперсии уровней ряда равна:
 207,73 
1 −
 ⋅ 100 = 0,959 или 95,9%.
5023 

3.3. Использование сезонных моделей для прогноза
Выявление и устранение сезонного эффекта (или «десезонализация уровней ряда) используются в двух направлениях.
Во-первых, воздействие сезонных колебаний следует устранять
на этапе предварительной обработки исходных данных при изучении взаимосвязи нескольких временных рядов. Поэтому в
российских и международных статистических сборниках часто
публикуются данные, в которых устранено влияние сезонной
компоненты (если это помесячная или поквартальная статистика), например показатели объемов производства в отдельных
отраслях промышленности, уровня безработицы и т.д. Вовторых, выявление сезонного эффекта производится в анализе
структуры одномерных временных рядов с целью прогнозирования уровня ряда в будущие моменты времени.
Пример 3.3. Предположим, требуется дать прогноз потребления электроэнергии жителями региона в течение первого
полугодия ближайшего следующего года, используя данные
примера 3.1.
Прогнозное значение Ft уровня временного ряда в аддитивной модели в соответствии с соотношением (3.1) – это сумма
трендовой и сезонной компонент.
Объем электроэнергии, потребленной в течение первого
полугодия ближайшего следующего, т.е. 5-го года, рассчитывается как сумма объемов потребление электроэнергии в I и во II
кварталах 5-го года, соответственно F17 и F18 . Для определения
трендовой компоненты воспользуемся уравнением тренда
T = 5,715 + 0,186 ⋅ t.
– 41 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Получим:
T17 = 5,715 + 0,186 ⋅ 17 = 8,885;
T18 = 5,715 + 0,186 ⋅ 18 = 9,071.
Значения сезонной компоненты равны: SI = 0,581 (I квартал); SII = –1,977 (II квартал).
Таким образом,
F17 = T17 + SI = 8,885 + 0,581 = 9,466;
F18 = T18 + SII = 9,071 – 1,977 = 7,094.
Прогноз объема потребления электроэнергии на первое
полугодие ближайшего следующего года составит:
9,466 + 7,094 = 16,560 кВт⋅ч.
Пример 3.4. Предположим, необходимо сделать прогноз
ожидаемой прибыли по данным примера 3.2 компании за первое
полугодие ближайшего следующего года.
Прогнозное значение Ft уровня временного ряда в мультипликативной модели в соответствии с соотношением (3.2) – это
произведение трендовой и сезонной компонент. Для определения трендовой компоненты за каждый квартал воспользуемся
уравнением тренда
T = 90,57 – 2,273 ⋅ t.
Получим:
T17 = 90,57 – 2,273 ⋅ 17 = 43,420;
T18 = 90,57 – 2,273 ⋅ 18 = 40,647.
Значения сезонной компоненты равны: SI = 0,914 (I квартал); SII = 1,202 (II квартал).
Таким образом,
F17 = T17 ⋅ SI = 43,420 ⋅ 0,914 = 39,671;
F18 = T18 ⋅ SII = 40,647 ⋅ 1,202 = 48,865.
– 42 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогноз ожидаемой прибыли компании на первое полугодие ближайшего следующего года составит:
(39,671 + 48,865) = 88,536 кВт⋅ч.
3.4. Практические примеры
Практический пример 3.1
Обратимся к данным об объеме продаж мороженого одной
из фирм г. Нижнего Новгорода за последние четыре года:
Номер квартала, t Объем сбыта мороженого, у, тыс. руб
1
5763,65
2
15397,189
3
17759,93
4
8626,59
5
6340,02
6
16936,9064
7
19535,92
8
9489,25
9
7430,85
10
17830,568
11
20455,67
12
9550,23
13
8457,67
14
18534,456
15
20550,67
16
10345,23
Данный временной ряд содержит сезонные колебания периодичностью 4. Объемы сбыта мороженого в осенне-зимний
период времени (I и IV кварталы) меньше, чем весной и летом
(II и III кварталы). По графику этого ряда можно установить наличие приблизительно равной амплитуды колебаний. Это свидетельствует о соответствии этого ряда аддитивной модели. Рассчитаем ее компоненты.
1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
– просуммируем уровни ряда последовательно за каждые
четыре квартала со сдвигом на один момент времени и опреде– 43 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лим условные годовые объемы сбыта мороженого;
– разделив полученные суммы на 4, найдем скользящие
средние. Отметим, что полученные таким образом выровненные
значения уже не содержат сезонной компоненты;
– приведем эти значения в соответствие с фактическими
моментами времени, для чего найдем средние значения из двух
последовательных скользящих средних – сглаженные скользящие средние.
t
у
1
5763,65
2 15397,189
3
17759,93
4
8626,59
5
6340,02
6 16936,9064
7
19535,92
8
9489,25
9
7430,85
10 17830,568
11 20455,67
12
9550,23
13
8457,67
14 18534,456
15 20550,67
16 10345,23
Скользящая средняя Сглаженная сколь- Оценка сезонной
за четыре квартала
зящая средняя
компоненты
–
–
–
11886,84
–
–
12030,93
11958,886
5801,044
12415,86
12223,397
-3596,81
12859,86
12637,86
-6297,84
13075,52
12967,692
3969,215
13348,23
13211,878
6324,042
13571,65
13459,939
-3970,69
13801,58
13686,616
-6255,77
13816,83
13809,207
4021,361
14073,53
13945,182
6510,488
14249,51
14161,521
-4611,29
14273,26
14261,382
-5803,71
14472,01
14372,632
4161,825
–
–
–
–
–
–
1. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и сглаженными скользящими
средними (гр.6 таблицы). Используем эти оценки для расчета
значений сезонной компоненты S. Для этого найдем средние за
каждый квартал (по всем годам) оценки сезонной компоненты.
Все промежуточные расчеты в следующей таблице.
В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В
аддитивной модели это выражается в том, что сумма значений
сезонной компоненты по всем кварталам должна быть равна ну– 44 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лю. Для этого применяется корректирующий коэффициент.
Год
1
2
3
4
Итого
Средняя
Скорректированная
I
0
–6297,84
–6255,77
–5803,71
–18357,32
–6119,11
–6140,095
Квартал
II
III
IV
0
5801,044
–3596,81
3969,2148 6324,042
–3970,69
4021,361 6510,488
–4611,29
4161,82
0
0
12152,40 18635,57 –12178,79
4050,80
6211,86
–4059,60
4029,8109 6190,8689 –4080,5848
83,9567
Для данной модели имеем:
–6119,1 + 405,8 + 6211,86 – 4059,6 = 83,9567
Определим корректирующий коэффициент:
k = 83,9567 / 4 = 20,9.
Рассчитаем скорректированные значения сезонной компоненты как разность между ее средней оценкой и корректирующим коэффициентом k:
Si = S i − k .
Проверим условие равенства нулю суммы значений сезонной компоненты:
–6140,095 + 4029,8109 + 6190,8689 – 4080,5848 = 0.
Таким образом, получены следующие значения сезонной
компоненты:
I квартал: SI = –6140,095;
II квартал: SII = 4029,8109;
III квартал: SIII = 6190,8689;
IV квартал: SIV = –4080,5848.
3. Элиминируем влияние сезонной компоненты, вычитая
ее значение из каждого уровня исходного временного ряда. Получим: T + E = y – S. Эти значения рассчитываются для каждого
момента времени и содержат только тенденцию и случайную
компоненту. Все промежуточные расчеты в следующей таблице.
4. Определим компоненту T данной модели. Для этого
проведем аналитическое выравнивание ряда (T + Е) с помощью
– 45 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
линейного тренда. Результаты следующие:
Константа
Коэффициент регрессии
Таким образом, имеем линейный тренд:
11534,66
209,193
T = 11534,66 + 209,193 ⋅ t.
Подставив в это уравнение значения t = 1, …, 16, найдем
уровни T для каждого момента времени (5 гр. в таблице).
t
у
S
T+E=y–S
T
T+S
E2=(y–(T+S))2
1
5763,65 -6140,09504 11903,745 11743,86 5603,7608
11903,745
2 15397,189 4029,810923 11367,378 11953,05 15982,859
343009,69
3
17759,93 6190,868873 11569,061 12162,24 18353,11
351862,27
4
8626,59 -4080,58475 12707,175 12371,43 8290,8487
112722,2
5
6340,02 -6140,09504 12480,115 12580,63 6440,531
10102,458
6 16936,9064 4029,810923 12907,095 12789,82 16819,63
13753,87
7
19535,92 6190,868873 13345,051 12999,01 19189,88
119743,68
8
9489,25 -4080,58475 13569,835 13208,2 9127,6189
130777,03
9
7430,85 -6140,09504 13570,945 13417,4 7277,3012
23577,236
10 17830,568 4029,810923 13800,757 13626,59 17656,4
30334,592
11 20455,67 6190,868873 14264,801 13835,78 20026,65
184057,97
12
9550,23 -4080,58475 13630,815 14044,97 9964,3891
171527,8
13
8457,67 -6140,09504 14597,765 14254,17 8114,0714
118059,99
14 18534,456 4029,810923 14504,645 14463,36 18493,17
1704,5401
15 20550,67 6190,868873 14359,801 14672,55 20863,42
97812,829
16 10345,23 -4080,58475 14425,815 14881,74 10801,159
207871,58
5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной
компоненты для соответствующих кварталов. Графически уравнения тренда и значения T + S представлены на следующем рисунке.
6. В соответствии с методикой построения аддитивной модели расчет ошибки проводится по формуле
E = Y – (T + S).
Это абсолютная ошибка. Эту же ошибку можно определить как разность между значениями (T + E) и T.
– 46 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
25000
y
20000
15000
T+ S
Y
T
10000
5000
t
0
1
3
5
7
9
11
13
15
17
19
Сумма квадратов ошибок по данным таблицы =
14279865,71; общая сумма квадратов отклонений = 450388738,8.
(14279865,71)/(450388738,8) ⋅ 100= 3,17.
Следовательно, можно сказать, что аддитивная модель
объясняет 96,83% общей вариации уровней временного ряда
объема сбыта мороженого за последние 16 кварталов, а 3,17%
случайные компоненты.
7. Сделаем прогноз продажи мороженого (тыс. руб.) на
следующий год:
Квартал
17
18
19
20
S
–6140,0950
4029,8109
6190,8689
–4080,5848
T
15090,94
15300,13
15509,32
15718,51
T+S
8950,84
19329,94
21700,19
11637,93
Практический пример 3.2
Решим задачу о продаже мороженого с помощью мультипликативной модели. В этом случае сезонная компонента определяется как отношение исходных данных к сглаженной скользящей средней.
– 47 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Номер
квартала, t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Скользящая
Сглаженная
средняя за че- скользящая средтыре квартала
няя
5763,65
–
–
15397,189
11886,84
–
17759,93
12030,93
11958,886
8626,59
12415,86
12223,397
6340,02
12859,86
12637,86
16936,9064
13075,52
12967,692
19535,92
13348,23
13211,878
9489,25
13571,65
13459,939
7430,85
13801,58
13686,616
17830,568
13816,83
13809,207
20455,67
14073,53
13945,182
9550,23
14249,51
14161,521
8457,67
14273,26
14261,382
18534,456
14472,01
14372,632
20550,67
–
–
10345,23
–
–
Прибыль, y
Оценка сезонной компоненты
–
–
1,485082306
0,705744079
0,501668781
1,306084916
1,478663383
0,704999465
0,542928225
1,291208684
1,466862892
0,674378856
0,593047034
1,289565936
–
–
В таблице приведены и промежуточные расчеты сезонной
компоненты, которая в данном случае определяется как отношение исходного значения к сглаженной скользящей средней,
т.е. T⋅E = Y / S. Скользящие и сглаженные средние вычисляются,
как и в предыдущем примере по 4-м кварталам.
Для расчета значений сезонной компоненты S найдем
средние за каждый квартал (по всем годам) оценки сезонной
компоненты. Все промежуточные расчеты в следующей таблице.
Год
I
1
–
2
0,501668781
3
0,542928225
4
0,593047034
Итого за квартал
1,637644041
Средняя
0,545881347
Скорректированная 0,544057188
Квартал
II
III
–
1,485082306
1,306084916 1,478663383
1,291208684 1,466862892
1,289565936
–
3,886859537 4,430608581
1,295619846 1,476869527
1,291290304 1,471934308
– 48 –
IV
0,705744079
0,704999465
0,674378856
–
2,0851224
0,6950408
0,692718199
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В
мультипликативной модели это выражается в том, что сумма
значений сезонной компоненты по всем кварталам должна быть
равна числу периодов, в данном случае – 4. Для этого применяется корректирующий коэффициент.
Для данной модели имеем: 0,5459 + 1,2956 + 1,4769 +
0,6950 = 4,0134
Определим корректирующий коэффициент: k = 4 / 4,0134 =
0,9966.
Рассчитаем скорректированные значения сезонной компоненты как произведение средней оценки и корректирующего коэффициента k:
Si = Si ⋅ k
Проверим условие равенства 4 суммы значений сезонной
компоненты:
0,5441 + 1,2913 + 1,4719 + 0,6927 = 4.
Таким образом, получены следующие значения сезонной
компоненты:
I квартал: SI = 0,5441;
II квартал: SII = 1,2913;
III квартал: SIII = 1,4719;
IV квартал: SIV = 0,6927.
Элиминируем влияние сезонной компоненты, находя отношение уровня исходного временного ряда к ней. Получим: T ⋅
E = y / S. Эти значения рассчитываются для каждого момента
времени и содержат только тенденцию и случайную компоненту. Все промежуточные расчеты в следующей таблице.
Определим компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T ⋅ Е) с помощью линейного тренда. Результаты следующие:
Константа
11232,647
Коэффициент регрессии
242,646
Таким образом, имеем линейный тренд:
T = 11232,647 + 242,646 ⋅ t.
– 49 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
t
у
S
T
E2=(y–(T+S))2
T⋅E=y/S
T⋅S
1
5763,65 0,5441 10593,83 11475,29 6243,22 229983,0062
2 15397,189 1,2913 11923,88 11717,94 15131,26 70717,9096
3
17759,93 1,4719 12065,71 11960,58 17605,20 23942,9060
4
8626,59 0,6927 12453,25 12203,23 8453,40 29994,7487
5
6340,02 0,5441 11653,22 12445,88 6771,27 185975,5217
6 16936,9064 1,2913 13116,27 12688,52 16384,57 305079,1575
7
19535,92 1,4719 13272,28 12931,17 19033,83 252093,0050
8
9489,25 0,6927 13698,57 13173,82 9125,74 132138,4452
9
7430,85 0,5441 13658,21 13416,46 7299,32 17299,5749
10 17830,568 1,2913 13808,33 13659,11 17637,87 37131,4526
11 20455,67 1,4719 13897,14 13901,75 20462,47
46,2083
12
9550,23 0,6927 13786,60 14144,40 9798,08 61431,0491
13
8457,67 0,5441 15545,55 14387,05 7827,38 397271,1438
14 18534,456 1,2913 14353,44 14629,69 18891,18 127251,1898
15 20550,67 1,4719 13961,68 14872,34 21891,10 1796763,2554
16 10345,23 0,6927 14934,25 15114,98 10470,42 15673,6071
Расчетные значения получаются с учетом сезонной компоненты, а именно как произведения линейного тренда на сезонную компоненту. Результаты расчетов представлены на следующем рисунке:
y
25000
20000
Y
15000
T
10000
T*S
5000
t
0
1
3
5
7
9
11
13
15
17
19
Расчет ошибки мультипликативной модели выполняется
аналогично аддитивной модели. Сумма квадратов ошибок по
данным таблицы = 3682792,2; общая сумма квадратов отклоне– 50 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ний (как и в практическом примере 3.1) = 450388738,8.
(3682792,2)/(450388738,8) ⋅ 100= 0,818.
Следовательно, можно сказать, что аддитивная модель
объясняет 99,18% общей вариации уровней временного ряда
объема сбыта мороженого за последние 16 кварталов, а 0,82%
случайные компоненты.
Сделаем прогноз продажи мороженого (тыс. руб.) на следующий год:
Квартал
17
18
19
20
S
0,5441
1,2913
1,4719
0,6927
T
15357,63
15600,28
15842,92
16085,57
T+S
8355,43
20144,49
23319,74
11142,77
Таким образом, мультипликативная модель лучше описывает объем продаж мороженого, чем аддитивная модель.
4. Применение фиктивных переменных для
моделирования сезонных колебаний
Рассмотрим еще один метод моделирования временного
ряда, содержащего сезонные колебания, – построение модели
регрессии с включением фактора времени и фиктивных переменных. Количество фиктивных переменных в такой модели
должно быть на единицу меньше числа моментов (периодов)
времени внутри одного цикла колебаний. Например, при моделировании поквартальных данных модель должна включать 4
независимые переменные – фактор времени и три фиктивные
переменные. Каждая фиктивная переменная отражает сезонную
(циклическую) компоненту временного ряда для какого-либо
одного периода. Она равна единице для данного периода и нулю
для всех остальных периодов.
Пусть имеется временной ряд, содержащий циклические
колебания периодичностью k. Модель регрессии с фиктивными
переменными для этого ряда будет иметь вид:
yt = a + b ⋅ t +c1x1 +…+ cjxj +…+ ck–1xk–1 + εt
– 51 –
(4.1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1 для каждого j внутри каждого цикла,
где x j = 
0 во всех остальных случаях.
Например, при моделировании сезонных колебаний на основе поквартальных данных за несколько лет число кварталов
внутри одного года k = 4, а общий вид модели следующий:
(4.2)
yt = a + b ⋅ t +c1x1 + c2x2 + c3x3 + εt
1 для первого квартала,
где x1 = 
0 во всех остальных случаях;
1 для второго квартала,
x2 = 
0 во всех остальных случаях;
1 для третьего квартала,
x3 = 
0 во всех остальных случаях;
Уравнение тренда для каждого квартала буде иметь следующий вид:
для I квартала
yt = a + b ⋅ t + c1 + εt
(4.3)
для II квартала
yt = a + b ⋅ t + c2 + εt
(4.4)
для III квартала
yt = a + b ⋅ t + c3 + εt
(4.5)
для IV квартала
yt = a + b ⋅ t + εt
(4.6)
Таким образом, фиктивные переменные позволяют дифференцировать величину свободного члена уравнения регрессии
для каждого квартала. Она составит:
для I квартала
(a + c1);
для II квартала
(a + c2);
для III квартала
(a + c3);
для IV квартала
a.
Параметр b в этой модели характеризует среднее абсолютное изменение уровней ряда под воздействием тенденции. В
сущности, модель (4.2) есть аналог аддитивной модели временного ряда, поскольку фактический уровень временного ряда –
– 52 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
это сумма трендовой, сезонной и случайной компонент.
Пример 4.1. Построим модель регрессии с включением
фактора времени и фиктивных переменных для данных о потреблении электроэнергии из примера 1.2. В данной модели четыре независимые переменные: t, x1, x2, x3 и результативная переменная y. Составим матрицу исходных данных – табл.4.1.
Таблица 4.1. Исходные данные по потреблению электроэнергии
с фиктивными переменными
t
x1
x2
x3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
Сумма
yt
ŷt
( yt − yˆ t ) 2
6
4,4
5
9
7,2
4,8
6
10
8
5,6
6,4
11
9
6,6
7
10,8
6,425
4,225
4,975
9,075
7,175
4,975
5,725
9,825
7,925
5,725
6,475
10,575
8,675
6,475
7,225
11,325
0,180625
0,030625
0,000625
0,005625
0,000625
0,030625
0,075625
0,030625
0,005625
0,015625
0,005625
0,180625
0,105625
0,015625
0,050625
0,275625
1,01
Оценим параметры уравнения регрессии (4.2) обычным
МНК. Результаты приведены в табл.4.2.
Таблица 4.2. Уравнение регрессии с фиктивными переменными
Переменная Коэффициенты Стандартная ошибка t-статистика
y-пересечение
8,325
0,227261
36,63183
t
0,1875
0,016939
11,06909
x1
–2,0875
0,220208
–9,47968
x2
–4,475
0,216926
–20,6292
x3
–3,9125
0,214933
–18,2034
– 53 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Уравнение регрессии имеет вид:
yt = 8,33 + 0,19 ⋅ t – 2,09x1 – 4,48x2 – 3,91x3.
Проанализируем эти результаты. Влияние сезонной компоненты в каждом квартале статистически значимо (фактические значения t-критерия по модулю больше tтабл = 2,12 для параметров при переменных x1, x2, x3 и константы a). Параметр a =
8,33 – это сумма начального уровня ряда и сезонной компоненты в IV квартале. Сезонные колебания в I, II и III кварталах приводят к снижению этой величины, о чем свидетельствуют отрицательные оценки параметров при переменных x1, x2 и x3. Отметим, что эти параметры не равны значениям сезонной компоненты, поскольку они характеризуют не сезонные изменения
уровней ряда, а их отклонения от уровней, учитывающих сезонные воздействия в IV квартале. Положительная величина параметра b = 0,19 при переменной времени свидетельствует о наличии возрастающей тенденции в уровнях ряда. Его абсолютное
значение говорит о том, что средний за квартал абсолютный
прирост объема потребления электроэнергии составляет 0,19
млн. кВт⋅ч, или 190 тыс. кВт⋅ч. Поскольку фактическое значение
t-критерия Стьюдента равно 11,1, можно утверждать, что существование в уровнях ряда тенденции установлено надежно.
Коэффициент детерминации в данной модели R2 = 0,985.
Общая сумма квадратов уровней ряда yt, составляет:
C общ = ∑ ( yi − y ) = 67,1 .
2
Определим остаточную сумму квадратов:
Cост = (1 − R 2 ) ⋅ Cобщ = (1 − 0,985) ⋅ 67,1 = 1,01 .
Остаточная сумма квадратов по аддитивной модели (сумма
квадратов абсолютных ошибок) была рассчитана ранее
(табл.3.3) и составляет 1,10. Следовательно, модель регрессии с
фиктивными переменными описывает динамику временного ряда потребления электроэнергии лучше, чем аддитивная модель.
Полученная модель может использоваться для прогнози– 54 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
рования потребления электроэнергии на будущее. Для этого
достаточно подставить в нее соответствующие значения факторов. Для примера рассмотрим прогноз на следующий год, т.е. на
4 квартала, которые в нашем временном ряду принимают значения от 17 до 20. Результаты прогноза сведем в следующую таблицу:
t
17
18
19
20
x1
1
0
0
0
x2
0
1
0
0
x3
0
0
1
0
Прогноз
9,425
7,225
7,975
12,075
Сравним полученные результаты прогноза с примером 3.3,
в котором прогнозировалось потребление электроэнергии за
ближайшие полгода. В нашем случае это потребление равно:
9,425 + 7,225 = 16,650 кВт⋅ч.
Различия между двумя прогнозами (16,650 – 16,560 =
0,090) менее 1%, следовательно, оба рассмотренных метода могут применяться для прогнозирования.
Основной недостаток модели с фиктивными переменными
для описания сезонных и циклических колебаний – наличие
большого количества переменных. Если, например, строить модель для описания помесячных периодических колебаний за несколько лет, то такая модель будет включать 12 независимых
переменных (11 фиктивных переменных и фактор времени). В
такой ситуации число степеней свободы невелико, что снижает
вероятность получения статистически значимых оценок параметров уравнения регрессии.
4.1. Практические примеры
Практический пример 4.1
В качестве примера рассмотрим изменение численности
экономически активного населения Российской Федерации с
2000 по 2008 гг.
– 55 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Год
2000
2001
2002
2003
2004
2005
2006
2007
2008
Квартал
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
Экономически активное население, у, тыс. чел
72174
73440
73134
72332
71135
71593
72048
71411
71630
72141
73237
72421
71436
72162
73133
72835
72117
73148
73624
72909
72918
73262
74197
73811
73467
74099
74946
74156
74580
75111
75884
75060
74799
75728
76608
75892
Для изучения сезонности этого явления применим фиктивные переменные. Так как исходный временной ряд построен по
кварталам, количество фиктивных переменных равно 3.
– 56 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Промежуточные расчеты сведем в следующую таблицу:
t
x1
x2
x3
у
ŷt
( yt − yˆ t ) 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
72174
73440
73134
72332
71135
71593
72048
71411
71630
72141
73237
72421
71436
72162
73133
72835
72117
73148
73624
72909
72918
73262
74197
73811
73467
74099
74946
74156
74580
75111
75884
75060
74799
75728
76608
75892
70857,91
71572,13
72252,91
71588,02
71317,21
72031,43
72712,21
72047,32
71776,51
72490,73
73171,51
72506,62
72235,81
72950,03
73630,81
72965,92
72695,11
73409,33
74090,11
73425,22
73154,41
73868,63
74549,41
73884,52
73613,71
74327,93
75008,71
74343,82
74073,01
74787,23
75468,01
74803,12
74532,31
75246,53
75927,31
75262,42
1316,09
1867,87
881,09
743,98
–182,21
–438,43
–664,21
–636,32
–146,51
–349,73
65,49
–85,62
–799,81
–788,03
–497,81
–130,92
–578,11
–261,33
–466,11
–516,22
–236,41
–606,63
–352,41
–73,52
–146,71
–228,93
–62,71
–187,82
506,99
323,77
415,99
256,88
266,69
481,47
680,69
629,58
Применение процедуры Регрессии из Анализа данных
– 57 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
приводит к следующим результатам:
Коэффициенты
Стандартная ошибка t-статистика
y-пересечение 71128,72222
296,0365
240,2701
t
114,825
10,29627
11,15209
x1
–385,6361111
302,3554
–1,27544
x2
213,7611111
301,4775
0,709045
x3
779,7138889
300,9496
2,590845
Регрессионная статистика
Множественный R
0,90816113
R-квадрат
0,824756638
Нормированный R-квадрат 0,802144591
Стандартная ошибка
638,0367502
Наблюдения
36
Регрессия
Остаток
Итого
Дисперсионный анализ
df
SS
MS
F
4
59393282 14848321 36,47421
31
12619818 407090,9
35
72013100
Полученное уравнение регрессии имеет вид:
yt = 71128,7 + 114,8 ⋅ t – 385,6x1 + 213,8x2 + 779,7x3.
Влияние сезонной компоненты на функцию значимо только для 3-го квартала, у которого значение t-критерия по модулю
больше tтабл = 2,028. Сезонные составляющие 1-го и 2-го кварталов существенно не влияют на результат.
Однако, высокое значение коэффициента детерминации
(R2 = 0,825) позволяет использовать полученное уравнение регрессии для прогноза развития явления на будущее.
Приведем прогноз экономически активного населения на
2009 г. в следующей таблице:
Год
2009
Квартал
I
II
III
IV
t
37
38
39
40
x1
1
0
0
0
– 58 –
x2
0
1
0
0
x3
0
0
1
0
Прогноз
74991,61
75705,83
76386,61
75721,72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Изобразим полученные результаты на графике:
экономически активное население по РФ
77000
76000
75000
экономически
активное население,
тыс.чел
74000
По уравнению
регрессии
73000
72000
71000
70000
0
10
20
30
40
кварталы
Таким образом, мы получили модель временного ряда с
фиктивными переменными, которую можно использовать для
прогнозирования.
5. Моделирование тенденции временного ряда
при наличии структурных изменений
От сезонных и циклических колебаний следует отличать
единовременные изменения характера тенденции временного
ряда, вызванные структурными изменениями в экономике или
иными факторами. В этом случае, начиная с некоторого момента
времени t*, происходит изменение характера динамики изучаемого показателя, что приводит к изменению параметров тренда,
описывающего эту динамику. Схематично такая ситуация изображена на рис.5.1.
Момент (период) времени t* сопровождается значительными изменениями ряда факторов, оказывающих сильное воздействие на изучаемый показатель yt. Чаще всего эти изменения
вызваны изменениями в общеэкономической ситуации или факторами (событиями) глобального характера, приведшими к из– 59 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
менению структуры экономики (например, начало крупных экономических реформ, изменение экономического курса, нефтяные кризисы и прочие факторы). Если исследуемый временной
ряд включает в себя соответствующий момент (период) времени, то одной из задач его изучения становится выяснение вопроса о том, значимо ли повлияли общие структурные изменения на
характер этой тенденции.
yt
(2)
(3)
(1)
t
t*
Рис.5.1. Изменение характера тенденции временного ряда
Если это влияние значимо, то для моделирования тенденции данного временного ряда следует использовать кусочнолинейные модели регрессии, т. е. разделить исходную совокупность на две подсовокупности (до момента времени t* и после
момента t*) и построить отдельно по каждой подсовокупности
уравнения линейной регрессии (на рис.5.1 этим уравнениям соответствуют прямые (1) и (2)). Если структурные изменения незначительно повлияли на характер тенденции ряда yt, то ее можно описать с помощью единого для всей совокупности данных
уравнения тренда (на рис.5.1 этому уравнению соответствует
– 60 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
прямая (3)).
Каждый из описанных выше подходов имеет свои положительные и отрицательные стороны. При построении кусочнолинейной модели происходит снижение остаточной суммы
квадратов по сравнению с единым для всей совокупности уравнением тренда. Однако разделение исходной совокупности на
две части ведет к потере числа наблюдений и, следовательно, к
снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Построение единого для всей совокупности уравнения тренда, напротив, позволяет сохранить число наблюдений n исходной совокупности, однако остаточная сумма
квадратов поэтому уравнению будет выше по сравнению с кусочно-линейной моделью. Очевидно, что выбор одной из двух
моделей (кусочно-линейной или единого уравнения тренда) будет зависеть от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.
Таблица 5.1. Условные обозначения для алгоритма теста Чоу
Номер
уравнения
Вид уравнения
Число наблюдений в
совокупности
ОстаЧисло паточная
Число степеней
раметров в
сумма
свободы остаточуравнеквадраной дисперсии
нии1
тов
Кусочно-линейная модель
(1)
(2)
(l)
у = а1 +
b1t
у(2) = а2 +
b2t
п1
C1ост
k1
п 1 – k1
п2
C2ост
k2
п 2 – k2
Уравнение тренда по всей совокупности
(3)
= а3 +
п – k3=(п1 + п2) –
п
C3ост
k3
b3t
k3
1 В рассматриваемой нами формулировке число параметров всех уравнений
k1 = k2 = k3 = 2. В общем случае число параметров в каждом уравнении может различаться.
(3)
у
Формальный статистический тест для оценки этого соот– 61 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ношения был предложен Грегори Чоу. Применение этого теста
предполагает расчет параметров уравнений трендов, графики
которых изображены на рис.5.1 прямыми (1), (2) и (3). Введем
систему обозначений, приведенную в табл.5.1.
Выдвинем гипотезу H0 о структурной стабильности тенденции изучаемого временного ряда.
Остаточную сумму квадратов по кусочно-линейной модели (Склост) можно найти как сумму С1ост и С2ост:
Склост = С1ост + С2ост.
(5.1)
Соответствующее ей число степеней свободы составит:
(n1 – k1) + (n2 – k2) = (n – k1 – k2).
(5.2)
Тогда сокращение остаточной дисперсии при переходе от
единого уравнения тренда к кусочно-линейной модели можно
определить следующим образом (предполагается, что С3ост всегда больше, чем Склост):
∆Сост = С3ост – Склост
(5.3)
Число степеней свободы, соответствующее ∆ Сост, с учетом
соотношения (5.2) будет равно:
n – k3 – (n – k1 – k2) = k1 + k2 – k3.
(5.4)
Далее в соответствии с предложенной Г.Чоу методикой
определяется фактическое значение F-критерия по следующим
дисперсиям на одну степень свободы вариации:
Fфакт =
Д ∆C ∆Сост : (k1 + k 2 − k 3 )
=
кл
Д кл
Сост
: (n − k1 − k 2 )
(5.5)
Найденное значение Fфакт сравнивают с табличным, полученным по таблицам распределения Фишера для уровня значимости α и числа степеней свободы (k1 + k2 – k3) и (n – k1 – k2).
Если Fфакт > Fтабл, то гипотеза о структурной стабильности
тенденции отклоняется, а влияние структурных изменений на
динамику изучаемого показателя признают значимым. В этом
случае моделирование тенденции временного ряда следует осу– 62 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ществлять с помощью кусочно-линейной модели. Если Fфакт <
Fтабл, то нет оснований отклонять нулевую гипотезу о структурной стабильности тенденции. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения
тренда.
Пример 5.1. Пусть имеются следующие условные данные
о производстве какого-либо изделия за 20 периодов времени –
табл.5.2.
Таблица 5.2. Производство изделия y (шт.)
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
y
30
34
41
46
52
58
65
73
81
90
109
131
153
174
196
216
239
264
296
331
Требуется провести анализ структурной стабильности данного временного ряда с помощью теста Чоу.
Решение. Графический анализ исходных данных, приведенный на рис.5.1, показывает, что характер тенденции ряда в
момент времени t* = 10 изменяется.
– 63 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y
350
300
250
200
150
100
50
t
0
0
2
4
6
8
10
12
14
16
18
20
Рис.5.1 Производство изделия y
Разобьем исходный ряд на 2 подсовокупности: до момента
времени t* и после и определим параметры уравнений регрессии
для каждой из них, а также для всей совокупности. Все результаты, включая расчетные значения каждой совокупности, сведем
в табл.5.3. Полученные прямые изображены на рис.5.2.
y
350
(2)
300
250
200
(3)
150
100
50
(1)
t
0
0
2
4
6
8
10
12
14
16
18
20
-50
Рис.5.2. Расчетные прямые
Статистические параметры полученных уравнений регрессии представлены в табл.5.4.
– 64 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 5.3. Результаты расчетов по тесту Чоу
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
y
30
34
41
46
52
58
65
73
81
90
109
131
153
174
196
216
239
264
296
331
(3)
-11,80
3,54
18,88
34,23
49,57
64,91
80,25
95,59
110,94
126,28
141,62
156,96
172,31
187,65
202,99
218,33
233,67
249,02
264,36
279,70
(1)
27,22
33,84
40,45
47,07
53,69
60,31
66,93
73,55
80,16
86,78
y1
30
34
41
46
52
58
65
73
81
90
y2
(2)
90
109
131
153
174
196
216
239
264
296
331
83,27
109
131
153
174
196
216
239
264
296
331
Таблица 5.4. Статистические параметры уравнений регрессии
Параметр
Свободный член (а)
Коэффициент регрессии (b)
Число наблюдений (n)
Остаточная сумма (Сост)
Число степеней свободы
Коэффициент детерминации (R2)
(1)
20,6
6,618182
10
4,059091
8
0,9911
(2)
–150
23,32727
11
48,34747
9
0,9928
(3)
–27,1421
15,34211
20
697,1734
18
0,9258
Определяем фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:
Fфакт =
Д ∆C ∆Сост : (k1 + k 2 − k 3 ) 697,17 − (4,06 + 48,35) 4,06 + 48,35
=
=
:
= 98,43
кл
Д кл
Сост
: (n − k1 − k 2 )
2
20 − 2 − 2
– 65 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Найденное значение Fфакт сравниваем с табличным Fтабл,
для степеней свободы 2 и 16 и уровня значимости α = 0,05, которое равно 3,63. Так как Fфакт > Fтабл, то гипотеза о структурной
стабильности тенденции отклоняется, а влияние структурных
изменений на динамику изучаемого показателя признаем значимым. В этом случае моделирование тенденции временного ряда
следует осуществлять с помощью кусочно-линейной модели.
Отметим следующие особенности применения теста Чоу.
1. Если число параметров во всех уравнениях (1), (2), (3)
(см. рис.5.1 и табл.5.1) одинаково и равно k, то формула (5.5)
упрощается:
∆С : k
(5.6)
Fфакт = кл ост
Сост : (n − 2k )
2. Тест Чоу позволяет сделать вывод о наличии или отсутствии структурной стабильности в изучаемом временном ряде.
Если Fфакт < Fтабл, то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их
параметров a1 и a2, а также b1 и b2 соответственно статистически
незначимы. Если же Fфакт > Fтабл, то гипотеза о структурной стабильности отклоняется, что означает статистическую значимость различий в оценках параметров уравнений (1) и (2).
3. Применение теста Чоу предполагает соблюдение предпосылок о нормальном распределении остатков в уравнениях (1)
и (2) и независимость их распределений.
Если гипотеза о структурной стабильности тенденции ряда
yt отклоняется, дальнейший анализ может заключаться в исследовании вопроса о причинах этих структурных различий и более
детальном изучении характера изменения тенденции. В принятых нами обозначениях эти причины обусловливают различия в
оценках параметров уравнений (1) и (2).
Возможны следующие сочетания изменений численных
оценок параметров этих уравнений (рис.5.2):
– 66 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
yt
(2)
(1)
t
t*
а
yt
(2)
(1)
t
t*
б
yt
(2)
(1)
t
t*
в
Рис.5.2. Изменение тенденции временного ряда при различном
сочетании статистической значимости изменений параметров
– 67 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– изменение численной оценки свободного члена уравнения тренда a2 по сравнению с a1 при условии, что различия между b1 и b2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) параллельны (рис.5.2 а). В данной ситуации можно говорить о скачкообразном изменении уровней
ряда yt в момент времени t* при неизменном среднем абсолютном приросте за период;
– изменение численной оценки параметра b2 по сравнению
с b1 при условии, что различия между a1 и a2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) пересекают ось ординат в одной точке (рис.5.2 а). В этом случае
изменение тенденции связано с изменением среднего абсолютного прироста временного ряда, начиная с момента времени t*,
при неизменном начальном уровне ряда в момент времени t = 0;
– изменение численных оценок параметров a1 и a2, а также
b1 и b2. Геометрически эта ситуация изображена на рис.5.2 в.
Она означает, что изменение характера тенденции сопровождается изменением как начального уровня ряда, так и среднего за
период абсолютного прироста.
Один из статистических методов тестирования при применении перечисленных выше ситуаций для характеристики тенденции изучаемого временного ряда был предложен американским экономистом Д.Гуйарати. Этот метод основан на включении в модель регрессии фиктивной переменной Zt, которая принимает значение 1 для всех t < t*, принадлежащие промежутку
времени до изменения характера тенденции, далее – промежутку
(1), и значения 0 для всех t > t*, принадлежащие промежутку
времени после изменения характера тенденции, далее – промежутку (2). Д.Гуйарати предлагает определять параметры следующего уравнения регрессии:
y t = a + b ⋅ Z t + c ⋅ t + d ⋅ (Z t ⋅ t ) + ε t
(5.7)
Таким образом, для каждого промежутка времени получим
следующие уравнения:
промежуток (1)
Z = 1 yt = (a + b ) + (c + d ) ⋅ t + ε t ;
– 68 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
промежуток (2)
Z = 0 yt = a + c ⋅ t + ε t .
Сопоставив полученные уравнения с уравнениями (1) и (2)
табл.5.1, нетрудно заметить, что
a1 = (a + b ); b1 = (c + d );
a 2 = a;
b2 = c.
(5.8)
Параметр b есть разница между свободными членами
уравнений (1) и (2), а параметр d – разница между параметрами
b1 и b2 уравнений (1) и (2). Оценка статистической значимости
различий a1 и a2, а также b1 и b2 эквивалентна оценке статистической значимости параметров b и d уравнения (5.7). Эту оценку
можно провести при помощи t-критерия Стьюдента.
Таким образом, если в уравнении (5.7) b является статистически значимым, а d – нет, то изменение тенденции вызвано
только различиями параметров a1 и a2 (см. рис.5.2 а). Если в
этом уравнении параметр d статистически значим, а b – нет, то
изменение характера тенденции вызвано различиями параметров b1 и b2 (рис.5.2 б). Наконец, если оба коэффициента b и d являются статистически значимыми, то на изменение характера
тенденции повлияли как различия между a1 и a2, так и различия
между b1 и b2 (рис.5.2 в).
Этот метод можно использовать не только в дополнение к
тесту Чоу, но и самостоятельно для проверки гипотезы о структурной стабильности тенденции изучаемого временного ряда.
Основное его преимущество перед тестом Чоу состоит в том,
что нужно построить только одно, а не три уравнения тренда.
Применим метод Д.Гуйарати для нашего примера. Для
этого сформируем новую расчетную таблицу – табл.5.5.
Применив процедуру Регрессия из Анализа данных получаем следующие значения коэффициентов:
a = –157,6242424; b = 178,2242424; c = 23,77575758; d = –
17,15757576
Значения t-критерия Стьюдента для коэффициентов b и d
равны 19,08179438 и –22,00565552 соответственно, что означает
их статистическую значимость. Следовательно, на изменение
– 69 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
характера тенденции влияют все различия между параметрами
уравнений (1) и (2), что подтверждает вывод из теста Чоу: моделирование тенденции временного ряда следует осуществлять с
помощью кусочно-линейной модели.
Таблица 5.5. Исходные данные для метода Д.Гуйарати
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Z
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
Z⋅t
1
2
3
4
5
6
7
8
9
10
0
0
0
0
0
0
0
0
0
0
y
30
34
41
46
52
58
65
73
81
90
109
131
153
174
196
216
239
264
296
331
Предсказанное y
27,21818
33,83636
40,45455
47,07273
53,69091
60,30909
66,92727
73,54545
80,16364
86,78182
103,9091
127,6848
151,4606
175,2364
199,0121
222,7879
246,5636
270,3394
294,1152
317,8909
Дополнительной иллюстрацией к выводам служит график,
изображенный на рис.5.3.
Мы рассмотрели простейший случай применения теста
Чоу для моделирования линейной тенденции, однако этот тест
(а также модель (5.7) с фиктивной переменной может использоваться (и действительно используется во многих прикладных
исследованиях) при проверке гипотез о структурной стабильности и в более сложных моделях взаимосвязи двух и более временных рядов.
– 70 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y
350
300
250
200
y
Предсказанное y
150
100
50
t
0
0
5
10
15
20
Рис.5.3. Исходные данные и расчетные по уравнению (5.7)
5.1. Практические примеры
Практический пример 5.1
Имеются следующие данные о средних ценах на первичном рынке жилья по Российской Федерации за 20 периодов:
t
1
2
3
4
5
6
7
8
9
10
y
4764
4789
4820
4859
4900
4953
4997
5051
5104
5050
t
11
12
13
14
15
16
17
18
19
20
y
6999
8678
10567
12939
16320
20810
25394
36221
47482
52504
Требуется:
1. Проверить гипотезу о структурной стабильности тенденции ряда по тесту Чоу.
2. Проверить гипотезу о структурной стабильности тен– 71 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
денции ряда по методу Д.Гуйарати.
3. Сделать прогноз по двум уравнениям на ближайшие 4
периода и сравнить их между собой.
Решение
1. Сначала необходимо сделать график на основе исходных данных, по которому мы определяем в каком именно из
моментов времени тенденция ряда изменяется.
В нашем случае, по графику можно сделать вывод, что характер тенденции ряда изменяется в момент времени t* = 10 –
смотри рисунок:
y
60000
50000
40000
30000
20000
10000
t
0
0
5
10
15
20
Далее для проверки гипотезы о структурной стабильности
тенденции ряда по тесту Чоу, разобьем исходный ряд на 2 подсовокупности: до момента t* и после:
t
1
2
3
4
5
6
7
8
9
10
y
4764
4789
4820
4859
4900
4953
4997
5051
5060
5289
y1
4764
4789
4820
4859
4900
4953
4997
5051
5060
5289
t
10
11
12
13
14
15
16
17
18
19
20
– 72 –
y
5289
6999
8678
10567
12939
16320
20810
25394
36221
47482
52504
y2
5289
6999
8678
10567
12939
16320
20810
25394
36221
47482
52504
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Определяем параметры уравнений регрессии для каждого
из них (1 и 2), а также для всей совокупности (3):
Параметр
Свободный член (а)
Коэффициент регрессии (b)
Число наблюдений (n)
Остаточная сумма (Сост)
Число степеней свободы
Коэффициент детерминации (R2)
1
4673,4
49,96364
10
2707
8
0,9049
2
3
–48548,9545 –7292,26842
4710,5545
2063,0541
11
20
31209123
75315627
9
18
0,8968
0,6761
Определяем фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:
Fфакт =
Д ∆C 75315627 − (270 + 31209123) 2707 + 31209123
=
:
= 111,22
Д кл
2
20 − 2 − 2
Найденное значение Fфакт сравниваем с табличным Fтабл,
для степеней свободы 2 и 16 и уровня значимости α = 0,05, которое равно 3,63. Так как Fфакт > Fтабл, то гипотеза о структурной
стабильности тенденции отклоняется, а влияние структурных
изменений на динамику изучаемого показателя признаем значимым. В этом случае моделирование тенденции временного ряда
следует осуществлять с помощью кусочно-линейной модели.
Сделаем прогноз о средних ценах на первичном рынке жилья по Российской Федерации на следующий год:
Квартал
21
22
23
24
S
50372,691
55083,245
59793,800
64504,355
Полученные прямые с учетом прогноза изображены на рисунке:
– 73 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
70000
y
60000
50000
3.Общая
совокупность
40000
1.До момента t*
30000
2.После момента t*
20000
10000
t
0
0
5
10
15
20
25
2. Исходные данные для метода Д.Гуйарати приведены в
таблице:
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Z
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
Z×t
1
2
3
4
5
6
7
8
9
10
0
0
0
0
0
0
0
0
0
0
y
4764
4789
4820
4859
4900
4953
4997
5051
5060
5289
6999
8678
10567
12939
16320
20810
25394
36221
47482
52504
– 74 –
Предсказанное y
4723,363636
4773,327273
4823,290909
4873,254545
4923,218182
4973,181818
5023,145455
5073,109091
5123,072727
5173,036364
574,1818182
5733,563636
10892,94545
16052,32727
21211,70909
26371,09091
31530,47273
36689,85455
41849,23636
47008,61818
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Применив процедуру Регрессия из Анализа данных, получаем следующие значения коэффициентов:
Коэффициенты Стандартная ошибка t-статистика
-56179
6353,537
-8,84216
60852,42
6827,997
8,912192
5159,382
403,0439
12,80104
-5109,42
569,9902
-8,96405
Y-пересечение
Переменная X 1
Переменная X 2
Переменная X 3
Значения t-критерия Стьюдента для коэффициентов b и d
равны 8,912 и –8,964 соответственно, что означает их статистическую значимость. Следовательно, на изменение характера
тенденции влияют все различия между параметрами уравнений
(1) и (2), что подтверждает вывод из теста Чоу: моделирование
тенденции временного ряда следует осуществлять с помощью
кусочно-линейной модели.
Прогноз о средних ценах на первичном рынке жилья по
полученному уравнению на следующий год:
Квартал
21
22
23
24
y
52168,00
57327,38
62486,76
67646,15
Прогнозы по двум методам не сильно отличаются друг от
друга. Дополнительной иллюстрацией к выводам служит график:
y
70000
60000
50000
40000
Предсказанное у
у
30000
20000
10000
t
0
0
5
10
15
– 75 –
20
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Практический пример 5.2
Имеются данные о производстве изделия за два года по
месяцам:
Месяц, t
1
2
3
4
5
6
7
8
9
10
11
12
Производство, y
32
37
41
46
52
58
65
73
81
90
99
110
Месяц, t
13
14
15
16
17
18
19
20
21
22
23
24
Производство, y
137
167
196
221
256
296
330
370
406
444
486
524
График производства представлен на рисунке:
у
600
500
400
300
200
100
t
0
0
2
4
6
8
10
12
14
16
18
20
22
24
Требуется проверить гипотезу о структурной стабильности
тенденции ряда по двум тестам.
Решение
По графику делаем вывод, что точкой перегиба линии
– 76 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
производства является значение t* =12.
Разбиваем исходный ряд на 2 подсовокупности: до момента t* и после:
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
y
32
37
41
46
52
58
65
73
81
90
99
110
137
167
196
221
256
296
330
370
406
444
486
524
y1
32
37
41
46
52
58
65
73
81
90
99
110
y2
110
137
167
196
221
256
296
330
370
406
444
486
524
Определяем параметры уравнений регрессии для каждого
из них (1 и 2), а также для всей совокупности (3):
Параметр
Свободный член (а)
Коэффициент регрессии (b)
Число наблюдений (n)
Остаточная сумма (Сост)
Число степеней свободы
Коэффициент детерминации (R2)
1
19,788
7,007
12
13,166
10
0,982
– 77 –
2
-323,626
34,830
13
89,4081
11
0,996
3
-72,609
21,199
24
2681,6920
22
0,898
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Определяем фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:
Fфакт =
Д ∆C 2681,692 − (13,17 + 89,41) 13,17 + 89,41
=
:
= 251,44
Д кл
2
24 − 2 − 2
Сравниваем Fфакт с табличным Fтабл, для степеней свободы
2 и 16 и уровня значимости α = 0,05, которое равно 3,63. Так как
Fфакт > Fтабл, то гипотеза о структурной стабильности тенденции
отклоняется, а влияние структурных изменений на динамику
изучаемого показателя признаем значимым. В этом случае моделирование тенденции временного ряда следует осуществлять
с помощью кусочно-линейной модели.
Сделаем прогноз о производстве изделия на следующий
год:
Квартал
25
2226
2327
2428
у
547,12
581,95
616,77
651,60
Полученные прямые с учетом прогноза изображены на рисунке:
y
700
600
500
400
1
2
300
3
200
100
0
t
0
5
10
15
-100
– 78 –
20
25
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. Исходные данные для метода Д.Гуйарати приведены в
таблице:
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Z
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
Z×t
1
2
3
4
5
6
7
8
9
10
11
12
0
0
0
0
0
0
0
0
0
0
0
0
y
32
37
41
46
52
58
65
73
81
90
99
110
137
167
196
221
256
296
330
370
406
444
486
524
Предсказанное y
26,79487179
33,8018648
40,80885781
47,81585082
54,82284382
61,82983683
68,83682984
75,84382284
82,85081585
89,85780886
96,86480186
103,8717949
123,9358974
159,4778555
195,0198135
230,5617716
266,1037296
301,6456876
337,1876457
372,7296037
408,2715618
443,8135198
479,3554779
514,8974359
Результаты процедуры Регрессия:
Коэффициенты Стандартная ошибка t-статистика
Y-пересечение
-338,1095571
9,806463451
-34,47823558
Переменная X 1
357,8974359
10,52969978
33,98932954
Переменная X 2
35,54195804
0,521085
68,20760147
Переменная X 3
-28,53496503
0,736925475
-38,72164284
Значения t-критерия Стьюдента для коэффициентов b и d
равны 33,99 и –38,722 соответственно, что означает их статистическую значимость. Следовательно, на изменение характера
– 79 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
тенденции влияют все различия между параметрами уравнений
(1) и (2), что подтверждает вывод из теста Чоу: моделирование
тенденции временного ряда следует осуществлять с помощью
кусочно-линейной модели.
Прогноз о производстве по полученному уравнению на
следующий год:
Квартал
25
26
27
28
y
550,44
585,98
621,52
657,07
Прогнозы по двум методам не сильно отличаются друг от
друга. Дополнительной иллюстрацией к выводам служит график:
700
y
600
500
400
Предсказанное y
y
300
200
100
t
0
0
10
20
30
6. Динамические эконометрические модели
6.1. Общая характеристика моделей с распределенным
лагом и моделей авторегрессии
В эконометрике к числу динамических относятся не все
модели, построенные по временным рядам данных. Термин
– 80 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
«динамический» в данном случае характеризует каждый момент
времени t в отдельности, а не весь период, для которого строится модель. Эконометрическая модель является динамической,
если в данный момент времени t она учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к
предыдущим моментам времени, т. е. если эта модель отражает
динамику исследуемых переменных в каждый момент времени.
Можно выделить два основных типа динамических эконометрических моделей. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых
значения переменной за прошлые периоды времени (лаговые
переменные) непосредственно включены в модель. Модели второго типа учитывают динамическую информацию в неявном виде. В эти модели включены переменные, характеризующие ожидаемый или желаемый уровень результата, или один из факторов в момент времени t. Этот уровень считается неизвестным и
определяется экономическими единицами с учетом информации, которой они располагают в момент t – 1.
В зависимости от способа определения ожидаемых значений показателей различают модели неполной корректировки,
адаптивных ожиданий и рациональных ожиданий. Оценка параметров этих моделей сводится к оценке параметров моделей авторегрессии.
При исследовании экономических процессов нередко приходится моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты
времени t – 1, t – 2, ..., t – l. Например, на выручку от реализации
или прибыль компании текущего периода могут оказывать
влияние расходы на рекламу или проведение маркетинговых исследований, сделанные компанией в предшествующие моменты
времени. Величину l, характеризующую запаздывание в воздействии фактора на результат, в эконометрике называют лагом, а
временные ряды самих факторных переменных, сдвинутые на
один или более моментов времени, – лаговыми переменными.
– 81 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Разработка экономической политики как на макро-, так и
на микроуровне требует решения обратного типа задач, т. е. задач, определяющих, какое воздействие окажут значения управляемых переменных текущего периода на будущие значения
экономических показателей. Например, как повлияют инвестиции в промышленность на валовую добавленную стоимость
этой отрасли экономики будущих периодов или как может измениться объем ВВП, произведенного в периоде t + 1, под воздействием увеличения денежной массы в периоде t?
Эконометрическое моделирование охарактеризованных
выше процессов осуществляется с применением моделей, содержащих не только текущие, но и лаговые значения факторных
переменных. Эти модели называются моделями с распределенным лагом. Модель вида.
yt = a + b0 ⋅ xt + b1 ⋅ xt–1 + b2 ⋅ xt–2 + εt
(6.1)
является примером модели с распределенным лагом.
Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего
периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Например, потребление в момент
времени t формируется под воздействием дохода текущего и
предыдущего периодов, а также объема потребления прошлых
периодов, например потребления в период t – 1. Эти процессы
обычно описывают с помощью моделей регрессии, содержащих
в качестве факторов лаговые значения зависимой переменной,
которые называются моделями авторегрессии. Модель вида
yt = a + b0 ⋅ xt + c1 ⋅ yt–1 + εt
(6.2)
относится к моделям авторегрессии.
Построение моделей с распределенным лагом и моделей
авторегрессии имеет свою специфику. Во-первых, оценка параметров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть проведена с помощью обычного МНК ввиду нарушения его предпосылок и требует специальных статистических методов. Во-вторых, исследо– 82 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вателям приходится решать проблемы выбора оптимальной величины лага и определения его структуры. Наконец, в-третьих,
между моделями с распределенным лагом и моделями авторегрессии имеется определенная взаимосвязь, и в некоторых случаях необходимо осуществлять переход от одного типа моделей к
другому.
6.2. Интерпретация параметров моделей
с распределенным лагом и моделей авторегрессии
Рассмотрим модель с распределенным лагом в ее общем
виде в предположении, что максимальная величина лага конечна:
(6.3)
yt = a + b0 ⋅ xt + b1 ⋅ xt–1 +…+ bp ⋅ xt–p + εt
Данная модель говорит о том, что если в некоторый момент времени t происходит изменение независимой переменной
x, то это изменение будет влиять на значения переменной y в течение l следующих моментов времени.
Коэффициент регрессии b0 при переменной xt характеризует среднее абсолютное изменение yt при изменении xt на 1 единицу своего измерения в некоторый фиксированный момент
времени t, без учета воздействия лаговых значений фактора x.
Этот коэффициент называют краткосрочным мультипликатором.
В момент t + 1 совокупное воздействие факторной переменной xt на результат yt составит (b0 + b1) условных единиц, в
момент t + 2 это воздействие можно охарактеризовать суммой
(b0 + b1 + b2) и т.д. Полученные таким образом суммы называют
промежуточными мультипликаторами.
С учетом конечной величины лага можно сказать, что изменение переменной xt в момент t на 1 у.е. приведет к общему
изменению результата через l моментов времени на (b0 + b1 + …
+ bl) абсолютных единиц.
Введем следующее обозначение:
b0 + b1 + … +bl = b
– 83 –
(6.4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Величину b называют долгосрочным мультипликатором,
который показывает абсолютное изменение в долгосрочном периоде t + l результата у под влиянием изменения на 1 ед. фактора х.
Предположим,
βj =bj / b,
j=0:l
(6.5)
Назовем полученные величины относительными коэффициентами модели с распределенным лагом. Если все коэффициенты bj имеют одинаковые знаки, то для любого j
0 < βj <1 и
l
∑ β j = 1.
j =0
В этом случае относительные коэффициенты βj являются
весами для соответствующих коэффициентов bj. Каждый из них
измеряет долю общего изменения результативного признака в
момент времени t + j.
Зная величины βj с помощью стандартных формул можно
определить еще две важные характеристики модели множественной регрессии: величину среднего и медианного лагов.
Средний лаг рассчитывается по формуле средней арифметической взвешенной:
l
l = ∑ j⋅βj
(6.6)
j =0
и представляет собой средний период, в течение которого будет
происходить изменение результата под воздействием изменения
фактора в момент времени t. Небольшая величина среднего лага
свидетельствует об относительно быстром реагировании результата на изменение фактора, тогда как высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени. Медианный лаг
– это величина лага, для которого
l Ме
∑ β j ≈ 0,5 .
j =0
– 84 –
Это тот период
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
времени, в течение которого с момента времени t будет реализована половина общего воздействия фактора на результат.
Рассмотрим условный пример.
Пример 6.1. По результатам изучения зависимости объемов продаж компании в среднем за месяц от расходов на рекламу была получена следующая модель с распределенным лагом
(млн. руб.):
yt = –0,67 + 4,5 ⋅ xt + 3,0 ⋅ xt–1 + 1,5⋅ xt–2 + 0,5⋅ xt–3.
В данной модели краткосрочный мультипликатор равен
4,5. Это означает, что увеличение расходов на рекламу на 1 млн.
руб. ведет в среднем к росту объема продаж компании на 4,5
млн. руб. в том же периоде. Под влиянием увеличения расходов
на рекламу объем продаж компании возрастет в момент времени
t + 1 – на 4,5 + 3,0 = 7,5 млн. руб., t + 2 – на 7,5 + 1,5 = 9,0 млн.
руб. Наконец, долгосрочный мультипликатор для данной модели составит: b = 4,5 + 3,0 + 1,5 + 0,5 = 9,5.
В долгосрочной перспективе (например, через 3 мес.) увеличение расходов на рекламу на 1 млн. руб. в настоящий момент
времени приведет к общему росту объема продаж на 9,5 млн.
руб.
Относительные коэффициенты регрессии в этой модели
равны:
βl = 4,5/9,5 = 0,474; β2 = 3,0/9,5 = 0,316;
β3 = 1,5/9,5 = 0,158; β4 = 0,5/9,5 = 0,053.
Следовательно, 47,4% общего увеличения объема продаж,
вызванного ростом затрат на рекламу, происходит в текущем
моменте времени; 31,6% – в момент t + 1; 15,8% – в момент t + 2
и только 5,3% этого увеличения приходится на момент времени
t + 3.
Средний лаг в данной модели определяется как
l = 0 ⋅ 0,474 + 1 ⋅ 0,316 + 2 ⋅ 0,158 + 3 ⋅ 0,053 = 0,791 мес.
Небольшая величина лага (менее 1 мес.) еще раз подтвер– 85 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ждает, что большая часть эффекта роста затрат на рекламу проявляется сразу же. Медианный лаг в данном примере также составляет чуть более 1 мес.
Изложенные выше приемы анализа параметров модели с
распределенным лагом действительны только в предположении,
что все коэффициенты при текущем и лаговых значениях исследуемого фактора имеют одинаковые знаки. Это предположение
вполне оправданно с экономической точки зрения: воздействие
одного и того же фактора на результат должно быть однонаправленным независимо от того, с каким временным лагом измеряется сила или теснота связи между этими признаками. Однако на практике получить статистически значимую модель, параметры которой имели бы одинаковые знаки, особенно при
большой величине лага l, чрезвычайно сложно.
Применение обычного МНК к таким моделям в большинстве случаев затруднительно по следующим причинам.
Во-первых, текущие и лаговые значения независимой переменной, как правило, тесно связаны друг с другом. Тем самым
оценка параметров модели проводится в условиях высокой
мультиколлинеарности факторов.
Во-вторых, при большой величине лага снижается число
наблюдений, по которому строится модель, и увеличивается
число ее факторных признаков, что ведет к потере числа степеней свободы в модели.
В-третьих, в моделях с распределенным лагом часто возникает проблема автокорреляции остатков. Вышеуказанные обстоятельства приводят к значительной неопределенности относительно оценок параметров модели, снижению их точности и
получению неэффективных оценок. Чистое влияние факторов на
результат в таких условиях выявить невозможно. Поэтому на
практике параметры моделей с распределенным лагом учитывают определенные ограничения на коэффициенты регрессии и
условия выбранной структуры лага.
Обратимся теперь к модели авторегрессии. Пусть имеется
следующая модель:
– 86 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
yt = a + b0 ⋅ xt + c1 ⋅ yt–1 + εt
(6.7)
Как и в модели с распределенным лагом, b0 в этой модели
характеризует краткосрочное изменение yt под воздействием
.изменения xt на 1 ед. Однако промежуточные и долгосрочный
мультипликаторы в моделях авторегрессии несколько иные. К
моменту времени t + 1 результат yt изменился под воздействием
изменения изучаемого фактора в момент времени t на b0 единиц,
а yt + 1 – под воздействием своего изменения в непосредственно
предшествующий момент времени на c1 единиц. Таким образом,
общее абсолютное изменение результата в момент t + 1 составит
b0 ⋅ c1 единиц. Аналогично в момент времени t + 2 абсолютное
изменение результата составит b0 ⋅ c12 единиц и т. д. Следовательно, долгосрочный мультипликатор в модели авторегрессии
можно рассчитать как сумму краткосрочного и промежуточного
мультипликаторов:
b = b0 + b0 ⋅ с1 + b0 ⋅ c12 + b0 ⋅ c13 + …
(6.8)
Учитывая, что практически во все модели авторегрессии
вводится так называемое условие стабильности, состоящее в
том, что коэффициент регрессии при переменной yt – 1 по абсолютной величине меньше единицы |c1| < 1, соотношение (6.8)
можно преобразовать следующим образом:
b = b0 ⋅ (1 + c1 + c12 + c13 + K) =
b0
1 − c1
(6.9)
где |c1| < 1.
Такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на
предпосылке о наличии бесконечного лага в воздействии текущего значения зависимой переменной на ее будущие значения.
Пример 6.2. Предположим, по данным о динамике показателей потребления и дохода в регионе была получена модель
авторегрессии, описывающая зависимость среднедушевого объема потребления за год (С, млн. руб) от среднедушевого совокупного годового дохода (У, млн. руб) и объема потребления
– 87 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
предшествующего года:
Cˆ t = 3 + 0,85 ⋅ Yt + 0,10 ⋅ Ct −1 .
Краткосрочный мультипликатор равен 0,85. В этой модели
он представляет собой предельную склонность к потреблению в
краткосрочном периоде. Следовательно, увеличение среднедушевого совокупного дохода на 1 млн. руб. приводит к росту
объема потребления в тот же год в среднем на 850 тыс. руб.
Долгосрочную предельную склонность к потреблению в данной
модели можно определить в соответствии с формулой (6.9) как
b=
0,85
= 0,944 .
1 − 0,1
В долгосрочной перспективе рост среднедушевого совокупного дохода на 1 млн. руб. приведет к росту объема потребления в среднем на 944 тыс. руб. Промежуточные показатели
предельной склонности к потреблению можно определить, рассчитав необходимые частные суммы за соответствующие периоды времени. Например, для момента времени t + 1 получим:
(0,85 + 0,85 ⋅ 0,1) = 0,935.
Это означает, что увеличение среднедушевого совокупного дохода в текущем периоде на 1 млн. руб. ведет к увеличению
объема потребления в среднем на 935 тыс. руб. в ближайшем
следующем периоде.
6.3. Изучение структуры лага и выбор вида модели с
распределенным лагом
Текущие и лаговые значения факторной переменной оказывают различное по силе воздействие на результативную переменную модели. Количественно сила связи между результатом и
значениями факторной переменной, относящимися к различным
моментам времени, измеряется с помощью коэффициентов регрессии при факторных переменных. Если построить график зависимости этих коэффициентов от величины лага, можно полу– 88 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
чить графическое изображение структуры лага, или распределения во времени воздействия факторной переменной на результат. Структура лага может быть различной (рис.6.1).
Если с ростом величины лага коэффициенты при лаговых
значениях переменной убывают во времени, то имеет место линейная (ее называют также треугольной – рис.6.1а) или геометрическая структура лага (рис.6.1б). Если лаговые воздействия
фактора на результат не имеют тенденцию к убыванию во времени, то имеет место один из вариантов, показанных на
рис.6.1в-е. Структуру лага (см. рис.6.1в) называют «перевернутой» V-образной структурой. Основная ее особенность – симметричность лаговых воздействий относительно некоторого
среднего лага, который характеризуется наиболее сильным воздействием фактора на результат. Графики, представленные на
рис.6.1г-е, свидетельствуют о полиномиальной структуре лага.
Графический анализ структуры лага аналогичным образом
можно проводить и с помощью относительных коэффициентов
регрессии βj Основная трудность в выявлении структуры лага
состоит в том, как получить значения параметров bj (или βj).
Выше уже отмечалось, что обычный МНК редко бывает полезным в этих целях. Поэтому в большинстве случаев предположения о структуре лага основаны на общих положениях экономической теории, на исследованиях взаимосвязи показателей либо
на результатах проведенных ранее эмпирических исследований
или иной априорной информации.
bj
bj
а
j, лаг
– 89 –
б
j, лаг
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
bj
bj
в
j, лаг
г
j, лаг
bj
bj
д
j, лаг
е
j, лаг
Рис.6.1. Основные формы структуры лага: а – линейная; б – геометрическая; в – перевернутая V–образная; г-е – полиномиальная
6.3.1. Лаги Алмон
Рассмотрим общую модель с распределенным лагом,
имеющую конечную максимальную величину лага l, которая
описывается соотношением (6.3). Предположим, было установлено, что в исследуемой модели имеет место полиномиальная
структура лага, т. е. зависимость коэффициентов регрессии bj от
величины лага описывается полиномом k-й степени. Частным
случаем полиномиальной структуры лага является линейная модель (см. рис.6.1а). Примерами лагов, образующих полином
второй степени, являются варианты рис.6.1г и д. Перевернутая
V–образная структура лага также может быть аппроксимирована
с помощью полинома первой степени. Наконец, график (см.
рис.6.1е) является примером модели лагов в форме полинома 3й степени. Лаги, структуру которых можно описать с помощью
полиномов, называют также лагами Алмон, по имени Ш.Алмон,
– 90 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
впервые обратившей внимание на такое представление лагов.
Формально модель зависимости коэффициентов bj от величины лага j в форме полинома можно записать так:
– для полинома первой степени bj = c0 + c1 ⋅ j;
– для полинома второй степени bj = c0 + c1 ⋅ j + c2 ⋅ j2;
– для полинома третьей степени bj = c0 + c1 ⋅ j + c2 ⋅ j2 + c3 ⋅
j3 т.д.
В наиболее общем виде для полинома k-й степени имеем
(степень полинома лага меньше максимальной величины лага):
bj = c0 + c1 ⋅ j + c2 ⋅ j2 + … + ck ⋅ jk
(6.10)
Тогда каждый из коэффициентов bj модели (6.3) можно
выразить следующим образом:
b0 = c0;
b1 = c0 + c1 + … + ck;
b2 = c0 + 2 ⋅ c1 + 4 ⋅ c2 +…+ 2k ⋅ ck;
b3 = c0 + 3 ⋅ c1 + 9 ⋅ c2 +…+ 3k ⋅ ck;
…………………………………….
bl = c0 + l ⋅ c1 + l2 ⋅ c2 +… + lk ⋅ ck.
(6.11)
Подставив в (6.3) найденные соотношения для bj получим:
yt = a + c0 ⋅ xt + (c0 + c1 + … + ck) ⋅ xt–1 + (c0 + 2 ⋅ c1 + 4 ⋅ c2 +… + 2k ⋅ ck) ⋅
xt–2 +
+ (c0 + 3 ⋅ c1 + 9 ⋅ c2 +…+ 3k ⋅ ck) ⋅ xt–3 +…+ (c0 + l ⋅ c1 + l2 ⋅ c2 +…+ lk ⋅ ck)
⋅ xt–l + εt
(6.12)
Перегруппируем слагаемые в (6.12):
yt = a + c0 ⋅ (xt + xt–1 + ⋅ xt–2 +…+ xt–l) + c1 ⋅ (xt–1 + 2 ⋅ xt–2 + 3 ⋅ xt–3 +…+ l ⋅
xt–l) +
+ c2 ⋅ (xt–1 + 3 ⋅ xt–2 + 9 ⋅ xt–3 +…+ l2 ⋅ xt–l)+…+ ck ⋅ (xt–1 + 2k ⋅ xt–2 + 3k ⋅ xt–3
+…+ lk ⋅ xt–l)
+ εt
– 91 –
(6.13)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обозначим слагаемые в скобках при cj как новые переменные:
z0 = xt + xt–1 + ⋅ xt–2 +…+ xt–l = ∑ xt–j;
z1 = xt–1 + 2 ⋅ xt–2 + 3 ⋅ xt–3 +…+ l ⋅ xt–l = ∑ j ⋅ xt–j;
z2 = xt–1 + 3 ⋅ xt–2 + 9 ⋅ xt–3 +…+ l2 ⋅ xt–l = ∑ j2 ⋅ xt–j;
……………………………………………………
zk = xt–1 + 2k ⋅ xt–2 + 3k ⋅ xt–3 +…+ lk ⋅ xt–l = ∑ jk ⋅ xt–j.
(6.14)
Перепишем модель (6.13) с учетом соотношений (6.14):
yt = a + c0 ⋅ z0 + c1 ⋅ z1 + c2 ⋅ z2 + … + ck ⋅ zk
(6.15)
Процедура применения метода Алмон для расчета параметров модели с распределенным лагом выглядит следующим
образом.
1. Определяется максимальная величина лага l.
2. Определяется степень полинома k, описывающего
структуру лага.
3. По соотношениям (6.14) рассчитываются значения переменных z0, ... , zk
4. Определяются параметры уравнения линейной регрессии (6.15).
5. С помощью соотношений (6.11) рассчитываются параметры исходной модели с распределенным лагом.
Применение метода Алмон сопряжено с рядом проблем.
Во-первых, величина лага 1 должна быть известна заранее.
При ее определении лучше исходить из максимально возможного лага, чем ограничиваться лагами небольшой длины. Выбор
меньшей величины лага по сравнению с его реальным значением приведет к тому, что в модели регрессии не будет учтен фактор, оказывающий значительное влияние на результат, т. е. к неверной спецификации модели. Влияние этого фактора в такой
модели будет выражено в остатках. Тем самым в модели не будут соблюдаться предпосылки МНК о случайности остатков, а
полученные оценки ее параметров окажутся неэффективными и
– 92 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
смещенными. Выбор большей величины лага по сравнению с ее
реальным значением будет означать включение в модель статистически незначимого фактора и снижение эффективности полученных оценок, однако эти оценки все же будут несмещенными.
Известно несколько практических подходов к определению реальной величины лага, например построение нескольких
уравнений регрессии и выбор наилучшего из этих уравнений
или применение формальных критериев, например критерия
Шварца. Однако наиболее простым способом является измерение тесноты связи между результатом и лаговыми значениями
фактора. Кроме того, оптимальную величину лага можно приближенно определить на основе априорной информации экономической теории или проведенных ранее эмпирических исследований.
Во-вторых, необходимо установить степень полинома k.
Обычно на практике ограничиваются рассмотрением полиномов
второй и третьей степени, применяя следующее простое правило: выбранная степень полинома k должна быть на единицу
больше числа экстремумов в структуре лага. Если априорную
информацию о структуре лага получить невозможно, величину k
проще всего определить путем сравнения моделей, построенных
для различных значений k, и выбора наилучшей модели.
В-третьих, переменные Z, которые рассчитываются как
линейные комбинации исходных переменных Х, будут коррелировать между собой в случаях, когда наблюдается высокая связь
между самими исходными переменными. Поэтому оценку параметров модели (6.15) приходится проводить в условиях мультиколлинеарности факторов. Однако мультиколлинеарность факторов z0, ... , zk в модели (6.15) сказывается на оценках параметров b0, … , bl в несколько меньшей степени, чем если бы эти
оценки были получены путем применения обычного МНК непосредственно к модели (6.15) в условиях мультиколлинеарности
факторов xt, …, xt–l. Это связано с тем, что в модели (6.15) мультиколлинеарность ведет к снижению эффективности оценок c0,
– 93 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
… , ck, поэтому каждый из параметров b0, … , bl, которые определяются как линейные комбинации оценок c0, … , ck будет
представлять собой более точную оценку, а стандартные ошибки этих параметров не будут превышать стандартные ошибки
параметров, полученных по модели (6.3) обычным МНК (доказательство этого утверждения достаточно сложное и в данном
пособии не приводится).
Метод Алмон имеет два неоспоримых преимущества:
– он достаточно универсален и может быть применен для
моделирования процессов, которые характеризуются разнообразными структурами лагов;
– при относительно небольшом количестве переменных в
(6.15) (обычно выбирают k = 2 или k = 3), которое не приводит к
потере значительного числа степеней свободы, с помощью метода Алмон можно построить модели с распределенным лагом
любой длины.
Пример 6.3. В табл. 6.1 представлены данные об объеме
выпуска продукции в бизнес-секторе экономики США (в % к
уровню 1982 г.) и общей сумме расходов на приобретение новых заводов и оборудования в промышленности за 1959-1990 гг.
(млрд. долл. США).
Построим модель с распределенным лагом для l = 4 в
предположении, что структура лага описывается полиномом
второй степени. Общий вид этой модели:
yt = a + b0 ⋅ xt + b1 ⋅ xt–1 + b2 ⋅ xt–2 + b3 ⋅ xt–3 + b4 ⋅ xt–4 + εt.
Для полинома второй степени имеем:
bj = c0 + c1 ⋅ j + c2 ⋅ j2,j = 0 ÷ 4.
Для расчета параметров этой модели необходимо преобразовать исходные данные в новые переменные z0, z1 и z2.
Это преобразование в соответствии с (6.14) выглядит следующим образом:
z0 = xt + xt–1 + xt–2 + xt–3 + xt–4;
z1 = xt–1 + 2 ⋅ xt–2 + 3 ⋅ xt–3 + 4 ⋅ xt–4;
– 94 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
z2 = xt–1 + 4 ⋅ xt–2 + 9 ⋅ xt–3 + 16 ⋅ xt–4.
Таблица 6.1. Динамика объемов ВВП CШA (у) и валовых внутренних инвестиций в экономику CIIIA (х) в ценах 1987 г., млрд.
долл. США
Год
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
у
1931,3
1973,2
2025,6
2129,8
2218,0
2343,3
2473,5
2622,3
2690,3
2801,0
2877,1
2875,8
2965,1
3107,1
3268,5
3248,1
3221,7
3380,8
3533,2
3703,5
3796,8
3776,3
3843,1
3760,3
3906,6
4148,5
4279,8
4404,5
4540,0
4781,6
4836,9
4884,9
4848,4
х
296,4
290,8
289,4
321,2
343,3
371,8
413,0
438,0
418,6
440,1
461,3
429,7
481,5
532,2
591,7
543,0
437,6
520,6
600,4
664,6
669,7
594,4
631,1
540,5
599,5
757,5
745,9
735,1
749,3
773,4
789,2
749,5
672,6
z0
–
–
–
–
1541,1
1616,5
1738,7
1887,3
1984,7
2081,5
2171,0
2187,7
2231,2
2344,8
2496,4
2578,1
2586,0
2625,1
2693,3
2766,2
2892,9
3049,7
3160,2
3100,3
3035,2
3123,0
3274,5
3378,5
3587,3
3761,2
3792,9
3796,5
3734,0
z1
–
–
–
–
2958,0
3017,1
3179,6
3471,3
3752,6
4020,8
4243,3
4349,3
4347,0
4485,2
4629,5
4819,4
5249,0
5427,5
5391,6
5126,4
5177,6
5882,5
6329,2
6487,4
6264,7
5951,4
6102,4
6221,4
6897,4
7487,2
7460,9
7524,3
7645,3
z2
–
–
–
–
8838,4
8885,5
9266,2
10129,1
10929,0
11836,4
12664,5
12997,1
12933,4
13393,6
13706,3
13929,2
15403,6
16450,1
16625,2
15309,2
14753,2
17061,3
18861,0
19669,6
19129,7
17951,8
18117,6
17819,4
20128,2
22522,8
22320,9
22388,1
22855,7
(Источник: Economic Report of the President. – Washington: US
– 95 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Government Printing Office, 1992. – Р. 300).
Значения переменных z0, z1 и z2 приведены в табл.6.1. Отметим, что число наблюдений, по которым проводится расчет
этих переменных, составляет 28 (четыре наблюдения потеряно
вследствие сдвига факторного признака xt на 4 момента времени).
Расчет параметров уравнения регрессии (6.15) обычным
МНК по процедуре Регрессия приводит к следующим результатам:
Коэффициенты
с0
с1
с2
с3
Значения
288,7157
1,939602
-0,94334
0,188841
Стандартная ошибка
66,98855
0,204197
0,294933
0,072242
t-статистика
4,309926
9,498696
–3,1985
2,614023
Регрессионная статистика
Множественный R
0,99535
R-квадрат
0,990722
Нормированный R-квадрат
0,989609
Стандартная ошибка
81,5864
Наблюдения
29
Регрессия
Остаток
Итого
Дисперсионный анализ
df
SS
MS
3 17769798 5923266
25 166408,5 6656,341
28 17936207
F
889,8682
В результате получили следующее уравнение:
yt = 288,7 + 1,940 ⋅ z0 – 0,943 ⋅ z1 + 0,189 ⋅ z2;.
Воспользуемся найденными коэффициентами регрессии
при переменных z0, z1 и z2 и соотношениями (6.11) и рассчитаем
коэффициенты регрессии исходной модели:
b0 = 1,940;
b1 = 1,940 – 0,943 + 0,189 = 1,185;
b2 = 1,940 + 2 ⋅ (–0,943) + 4 ⋅ 0,189 = 0,808;
– 96 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b3 = 1,940 + 3 ⋅ (–0,943) + 9 ⋅ 0,189 = 0,809;
b4 = 1,940 + 4 ⋅ (–0,943) + 16 ⋅ 0,189 = 1,188.
Модель с распределенным лагом имеет вид:
yt = 288,7 + 1,940 ⋅ xt + 1,185 ⋅ xt–1 + 0,808 ⋅ xt–2 + 0,809 ⋅ xt–3 +
1,188 ⋅ xt–4.
Представим полученные значения коэффициентов в виде
графика – рис.6.2.
2
bj
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
j, лаг
0
1
2
3
4
5
Рис.6.2. Структура лага в модели зависимости объема ВВП от
объема инвестиций в экономику
Долгосрочный мультипликатор равен:
b = 1,940 + 1,185 + 0,808 + 0,809 + 1,188 = 5,930.
Мультипликатор показывает, что рост инвестиций в экономику США на 1 млрд долл. в текущем периоде приведет через
4 года к росту ВВП в среднем на 5,93 млрд долл. США.
Определим относительные коэффициенты регрессии:
β0 =
1,940
1,185
0,808
= 0,327 ; β1 =
= 0,200 ; β 2 =
= 0,136 ;
5,930
5,930
5,930
– 97 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
β3 =
0,809
= 0,136 ;
5,930
β4 =
1,188
= 0,200 .
5,930
Более половины воздействия фактора на результат реализуется с лагом в 1 год, причем 32,7% этого воздействия реализуется сразу же, в текущем периоде.
Средний лаг этой модели составит:
l = 0,327 ⋅ 0 + 0,200 ⋅ 1 + 0,136 ⋅ 2 + 0,136 ⋅ 3 + 0,200 ⋅ 4 = 1,683 .
В среднем увеличение инвестиций в экономику США приведет к увеличению ВВП через 1,683 года.
Чтобы сделать прогноз объема ВВП в следующем году,
необходимо задаться значением валовых внутренних инвестиций и использовать полученное уравнение. Если принять х 700
млрд. долл., то объем ВВП по этой модели составит 4606,482
млрд. долл.
Для сравнения приведем результаты применения обычного
МНК для расчета параметров исходной модели (6.3):
Коэффициенты
a
b0
b1
b2
b3
b4
Значения
286,657
2,096913
0,788388
1,272646
0,432523
1,345698
Стандартная ошибка t-статистика
67,81836
4,226835
0,306127
6,849821
0,418427
1,88417
0,430327
2,957391
0,422581
1,023526
0,316746
4,248506
Регрессионная статистика
Множественный R
0,995673
R-квадрат
0,991365
Нормированный R-квадрат 0,989488
Стандартная ошибка
82,05843
Наблюдения
29
Дисперсионный анализ
df
SS
MS
Регрессия 5 17781334 3556267
Остаток
23 154872,5 6733,586
Итого
28 17936207
– 98 –
F
528,1386
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В результате получили следующее уравнение:
yt = 286,7 + 2,097 ⋅ xt + 0,788 ⋅ xt–1 + 1,273 ⋅ xt–2 + 0,433 ⋅ xt–3 +
1,345 ⋅ xt–4.
Несмотря на то, что коэффициент детерминации этой модели несколько выше, стандартные ошибки коэффициентов регрессии в модели, полученной с учетом ограничений на полиномиальную структуру лага, значительно снизились. Кроме того,
модель, полученная обычным МНК, обладает более существенным недостатком: коэффициенты регрессии при лаговых переменных xt–1 и xt–3 нельзя считать статистически значимыми.
Прогноз объема ВВП по этой модели при заданном значении валовых внутренних инвестиций 700 млрд. долл. немного
отличается от прогноза по предыдущей модели и составляет
4620,724 млрд. долл.
6.3.2. Метод Койка
Рассмотренные выше модели были построены в предположении о том, что величина лага l конечна. Допустим теперь,
что для описания некоторого процесса используется модель с
бесконечным лагом вида:
yt = a + b0 ⋅ xt + b1 ⋅ xt–1 + b2 ⋅ xt–2 + … + εt.
(6.16)
Очевидно, что параметры такой модели обычным МНК
или с помощью иных стандартных статистических методов определить нельзя, поскольку модель включает бесконечное число
факторных переменных. Однако, приняв определенные допущения относительно структуры лага, оценки ее параметров все же
можно получить. Эти допущения состоят в наличии геометрической структуры лага, т.е. такой структуры, когда воздействия
лаговых значений фактора на результат уменьшаются с увеличением величины лага в геометрической прогрессии. На рис.6.1
геометрической структуре лага соответствует вариант 6.1б.
Изложенный здесь подход к оценке параметров моделей с
распределенным лагом типа (6.16) впервые был предложен
Л.М.Койком. Он предположил, что существует некоторый по– 99 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
стоянный темп λ (0 < λ < 1) уменьшения во времени лаговых
воздействий фактора на результат. Если, например, в период t
результат изменялся под воздействием изменения фактора в
этот же период времени на b0 ед., то под воздействием изменения фактора, имевшего место в период t – 1, результат изменится на b0 ⋅ λ ед.; в период t – 2 – на b0 ⋅ λ⋅ λ ед. и т.д. Для некоторого периода t – l это изменение результата составит: b0 ⋅ λ l ед.
В более общем виде можно записать:
b j = b0 ⋅ λ j ;
j = 0,1,2,K, l 0 < λ < 1
(6.17)
Ограничение на значение λ > 0 обеспечивает одинаковые
знаки для всех коэффициентов bj > 0, а ограничение λ < 1 означает, что с увеличением лага значения параметров модели (6.16)
убывают в геометрической прогрессии. Чем ближе λ к 0, тем
выше темп снижения воздействия фактора на результат во времени и тем большая доля воздействия на результат приходится
на текущее значение фактора xt.
Выразим с помощью формулы (6.17) все коэффициенты в
модели (6.16) через b0 и λ:
yt = a + b0 ⋅ xt + b0 ⋅ λ ⋅ xt–1 + b0 ⋅ λ2 ⋅ xt–2 + … + εt.
(6.18)
Тогда для периода t – 1 модель (6.18) можно записать следующим образом:
yt = a + b0 ⋅ xt–1 + b0 ⋅ λ ⋅ xt–2 + b0 ⋅ λ2 ⋅ xt–3 + … + εt–1.
(6.19)
Умножив обе части уравнения (6.19) на λ, получим:
λ ⋅ yt = λ ⋅ a + b0 ⋅ λ ⋅ xt–1 + b0 ⋅ λ2 ⋅ xt–2 + b0 ⋅ λ3 ⋅ xt–3 + … + λ ⋅ εt–1.(6.20)
Вычтем найденное соотношение (6.20) из (6.18):
yt – λ ⋅ yt = a – λ ⋅ a + b0 ⋅ xt + εt – λ ⋅ εt–1.
(6.21)
В результате преобразований (6.21) мы получаем модель
Койка:
yt = a ⋅ (1 – λ) + b0 ⋅ xt + λ ⋅ yt–1 + ut.
– 100 –
(6.22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где ut = εt – λ ⋅ εt–1.
Полученная модель – это модель двухфакторной линейной
регрессии (точнее – авторегрессии). Определив ее параметры,
мы найдем λ и оценки параметров a и b0 исходной модели. Далее с помощью соотношений (6.17) несложно определить параметры b1, b2, … модели (6.16). Применив обычный МНК к оценке параметров модели (6.22), получим смещенные оценки параметров ввиду наличия в этой модели в качестве фактора лаговой
результативной переменной yt–1.
Описанный алгоритм получил название «преобразования
Койка». Это преобразование позволяет перейти от модели с бесконечными распределенными лагами к модели авторегрессии,
содержащей две независимые переменные xt и yt–1.
Несмотря на бесконечное число лаговых переменных в
модели (6.16), геометрическая структура лага позволяет определить величины среднего и медианного лагов в модели Койка.
Поскольку сумма коэффициентов регрессии в модели (6.16) –
это сумма геометрической прогрессии, т.е.
∞
∑ b j = b0 + b0 ⋅ λ + b0 ⋅ λ2 + b0 ⋅ λ3 + K =
j =0
1
= b0 ⋅ (1 + λ + λ2 + λ3 + K) = b0 ⋅
1− λ
(6.23)
то средний лаг определяется как
∞
∑ j ⋅ bj
b0 ⋅ λ ⋅ (1 + 2 ⋅ λ2 + 3 ⋅ λ3 + K)
=
=
l=
1
b0 ⋅
∑bj
1− λ
j =0
1
b0 ⋅ λ ⋅
(1 − λ )2 = λ
=
1
1− λ
b0 ⋅
1− λ
j =0
∞
– 101 –
(6.24)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Нетрудно заметить что при λ = 0,5 средний лаг l = 1, а при
λ < 0,5 средний лаг l < 1, то есть воздействие фактора на результат в среднем занимает менее одного периода времени. Величину (1 – λ) интерпретируют обычно как скорость, с которой происходит адаптация результата во времени к изменению факторного признака. Для расчета медианного лага необходимо выполнение следующего условия:
l Me −1
b0 ⋅ λ j
=
∑ λ j ⋅ (1 − λ ) = 0,5 (6.25)
∞
1
j =0
j =0
j =0
j =0
b0 ⋅
∑bj
1− λ
j =0
Поэтому медианный лаг в модели Койка равен (если
q
1 − λq +1
∑ λi = 1 − λ ):
i =0
ln 0,5
(6.26)
lMe =
ln λ
l Me −1
l Me −1
∑ βj = ∑
bj
=
l Me −1
∑
Применим метод Койка к данным из примера 6.3. Результаты расчетов по процедуре Регрессия для модели (6.22) следующие:
Коэффициенты
a ⋅ (1 – λ)
b0
λ
Значения
85,70211
1,179702
0,806448
Стандартная ошибка
33,45666
0,163956
0,028438
t-статистика
2,561586
7,195215
28,35844
Регрессионная статистика
Множественный R
0,998632
R-квадрат
0,997267
Нормированный R-квадрат 0,997078
Стандартная ошибка
47,73682
Наблюдения
32
Регрессия
Остаток
Итого
df
2
29
31
Дисперсионный анализ
SS
MS
24111294
12055647
66085,32
2278,804
24177380
– 102 –
F
5290,339
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, мы получили значение постоянного темпа
λ = 0,806 и значения коэффициентов b0 = 1,180 и а = 85,7 / (1 –
0,806) = 442,8. Теперь можно вычислить все коэффициенты модели (6.16):
b0 = 1,179702;
b1 = b0 ⋅ λ = = 1,180 ⋅ 0,806 = 0,951368;
b2 = 0,767229;
b3 = 0,61873;
b4 = 0,498973;
b5 = 0,402396 и т.д.
Определение расчетных значений по модели с бесконечным лагом предполагает какое-то конкретное конечное значение
лага. Это значение определяется точностью вычислений, т.е. необходимо ограничить число членов ряда в зависимости от абсолютного значения разницы между двумя последовательными
значениями, полученными с разным лагом. В данном примере
ограничение составило 16 лагов. Результаты расчетов с разным
числом лагов приведены в следующей таблице:
Год
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
x
437,6
520,6
600,4
664,6
669,7
594,4
631,1
540,5
599,5
757,5
745,9
735,1
749,3
773,4
789,2
749,5
672,6
y
3221,7
3380,8
3533,2
3703,5
3796,8
3776,3
3843,1
3760,3
3906,6
4148,5
4279,8
4404,5
4540
4781,6
4836,9
4884,9
4848,4
y5
2672,038
2715,271
2827,468
2977,232
3084,717
3098,371
3186,88
3124,443
3117,797
3277,996
3391,849
3495,361
3583,68
3712,736
3816,306
3801,723
3703,007
– 103 –
y10
3156,489
3199,683
3325,89
3505,553
3654,079
3682,679
3752,537
3696,258
3714,863
3909,673
4058,484
4177,418
4280,897
4383,944
4478,58
4507,5
4448,438
y15
3281,828
3335,498
3472,973
3658,376
3813,076
3847,925
3917,769
3866,27
3895,073
4103,883
4257,791
4370,363
4475,943
4587,603
4694,045
4734,889
4681,088
y16
3293,019
3346,477
3483,9
3670,503
3826,037
3861,963
3933,363
3882,807
3910,878
4120,499
4275,209
4386,587
4494,122
4607,697
4716,385
4755,39
4697,61
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следует заметить, что применение этой модели приводит к
потере исходных данных, так как каждое следующее слагаемое
умножается на xt–i (i – номер лага).
Средний лаг по полученным результатам равен:
l=
λ
1− λ
=
0,806
= 4,17 .
1 − 0,806
Медианный лаг:
lMe =
ln 0,5
ln 0,5
=
= 3,22 .
ln λ
ln 0,806
Прогноз по этой модели также предполагает определенное
значение валовых внутренних инвестиций, примем его равным
700 млрд. долл. Результат расчета прогноза по модели с бесконечным лагом составляет 4686,55 млрд. долл.
Таким образом, результаты, полученные по модели Койка,
существенно отличаются от результатов по модели с распределенным лагом, что говорит о сложности изучаемого явления и
неоднозначности самих методов.
7. Изучение взаимосвязей временных рядов
Изучение причинно-следственных зависимостей переменных, представленных в форме временных рядов, является одной
из самых сложных задач эконометрического моделирования.
Применение в этих целях традиционных методов корреляционно-регрессионного анализа может привести к ряду серьезных
проблем, возникающих как на этапе построения, так и на этапе
анализа эконометрических моделей. В первую очередь эти проблемы связаны со спецификой временных рядов как источника
данных в эконометрическом моделировании. Известно, что каждый уровень временного ряда содержит три основные компоненты: тенденцию, циклические (или сезонные) колебания и
случайную компоненту. Рассмотрим подробнее, каким образом
наличие этих компонент сказывается на результатах корреляционно-регрессионного анализа временных рядов данных.
– 104 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Предварительный этап такого анализа заключается в выявлении структуры изучаемых временных рядов. Если на этом
этапе было выявлено, что временные ряды содержат сезонные,
или циклические, колебания, то перед проведением дальнейшего исследования взаимосвязи необходимо устранить сезонную,
или циклическую, компоненту из уровней каждого ряда, поскольку ее наличие приведет к завышению истинных показателей силы и тесноты связи изучаемых временных рядов в случае,
если оба ряда содержат циклические колебания одинаковой периодичности, либо к занижению этих показателей в случае, если
сезонные, или циклические, колебания содержат только один из
рядов или если периодичность колебаний в рассматриваемых
временных рядах различна.
Устранение сезонной компоненты из уровней временных
рядов можно проводить в соответствии с методикой построения
аддитивной и мультипликативной моделей. При дальнейшем
изложении методов анализа взаимосвязей мы примем предположение, что изучаемые временные ряды не содержат периодических колебаний. Допустим, что изучается зависимость между
рядами х и у. Для количественной характеристики этой зависимости используется линейный коэффициент корреляции. Если
рассматриваемые временные ряды имеют тенденцию, коэффициент корреляции по абсолютной величине будет высоким (положительным в случае совпадения и отрицательным – в случае
противоположной направленности тенденций рядов х и у). Однако из этого еще нельзя делать вывод о том, что х – причина у,
или наоборот. Высокий коэффициент корреляции в данном случае – это результат того, что х и у зависят от времени, или содержат тенденцию. При этом одинаковую или противоположную тенденцию могут иметь ряды, совершенно не связанные
друг с другом причинно-следственной зависимостью.
При изучении взаимосвязей между временными рядами
требуется определить коэффициенты корреляции, характеризующие причинно-следственную связь между изучаемыми рядами. А для того чтобы получить данные коэффициенты, следу– 105 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ет избавиться от так называемой ложной корреляции, вызванной
наличием тенденции в каждом ряде. Обычно это осуществляют
с помощью одного из методов исключения тенденции.
Анализ влияния фактора времени на динамику в уровнях
каждого ряда выражается в корреляционной зависимости между
значениями остатков εt за текущий и предыдущие моменты времени, которая получила название автокорреляция в остатках.
Автокорреляция в остатках – это нарушение одной из основных
предпосылок МНК – предпосылки о случайности остатков, полученных по уравнению регрессии. Один из возможных путей
решения этой проблемы состоит в применении обобщенного
МНК к оценке параметров модели.
В качестве объекта изучения будут выступать данные о
расходах на конечное потребление населения в РФ и о совокупном доходе за 10 лет (период с 1998 по 2007 годы).
Соответственно, предметом анализа будет являться измерение взаимосвязи между исходными рядами данных (расходами и доходами) с применением различных методов.
7.1. Методы исключения тенденции
Предположим, что по двум временным рядам хt и уt строится уравнение нелинейной регрессии вида:
yt = a + b xt + εt
(7.1)
Наличие тенденции в каждом из этих временных рядов означает, что на зависимую yt и независимую xt переменные модели оказывает воздействие фактор времени, который непосредственно в модели не учтен.
Сущность всех методов исключения тенденции заключается в том, чтобы устранить или зафиксировать воздействие фактора времени на формирование уровней ряда. Основные методы
исключения тенденции можно разделить на две группы:
– методы, основанные на преобразовании уровней исходного ряда в новые переменные, не содержащие тенденции. Полученные переменные используются далее для анализа взаимо– 106 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
связи изучаемых временных рядов. Эти методы предполагают
непосредственное устранение трендовой компоненты Т из каждого уровня временного ряда. Два основных метода в данной
группе – это метод последовательных разностей и метод отклонений от трендов;
– методы, основанные на изучении взаимосвязи исходных
уровней временных рядов при элиминировании воздействия
фактора времени на зависимую и независимую переменные модели. В первую очередь – это метод включения в модель регрессии по временным рядам фактора времени.
Рассмотрим подробнее методику применения, преимущества и недостатки каждого из указанных методов.
7.1.1. Метод отклонений от тренда
Пусть имеются два временных ряда хt и уt, каждый из которых содержит трендовую компоненту Т и случайную компоненту ε. Аналитическое выравнивание каждого из этих рядов
позволяет найти параметры соответствующих уравнений трендов и определить расчетные по тренду уровни хt р и уt р соответственно. Эти расчетные значения можно принять за оценку
трендовой компоненты Т каждого ряда. Поэтому влияние тенденции можно устранить путем вычитания расчетных значений
уровней ряда из фактических. Эту процедуру проделывают для
каждого временного ряда в модели. Дальнейший анализ взаимосвязи рядов проводят с использованием не исходных уровней, а
отклонений от тренда хt - хt р и уt - уt р при условии, что последние не содержат тенденции.
Пример 7.1. Пусть имеются данные о расходах на конечное потребление и данные о совокупном доходе. Исходные данные за 10 лет представлены в табл.7.1. Требуется охарактеризовать тесноту и силу связи между временными рядами совокупного дохода хt и расходов на конечное потребление уt.
Корреляционно-регрессионный анализ, проведенный по
исходным данным рядов, приводит к следующим результатам:
ytP = 89,990 + 0,964 ⋅ xt ;
r2xy = 0,9998; rxy = 0,9999.
– 107 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 7.1. Расходы на конечное потребление и совокупный
доход (усл.ед.) в РФ.
Год / Показатель
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
Расходы на конечное потребление, уt , млрд. руб
1746,661
2853,528
3870,675
5214,384
6710,064
8644,392
10780,179
13614,231
16706,069
20489,589
Совокупный доход, хt,
млрд. руб
1776,016
2908,001
3983,757
5324,518
6829,298
8885,610
10976,293
13818,975
17289,938
21308,583
Далее необходимо рассчитать коэффициенты автокорреляции первого порядка для каждого уровня ряда: ry1 и rх1 . Для этого воспользуемся следующей формулой:
∑ (kt − k1 )⋅ (kt −1 − k2 )
n
r k1 =
t =2
∑ (kt − k1 ) ⋅ ∑ (kt −1 − k2 )
n
2
t =2
где k1 =
t =2
n −1
,
(7.2)
2
t =2
n
n
∑ kt
n
и k2 =
∑ kt −1
t =2
n −1
, а kt и kt-1 – значение фактора в пе-
риоде t и t-1.
В нашем случае 2 фактора: расходы на конечное потребление (у) и совокупный доход (х). Следовательно, рассчитаем 2
коэффициента автокорреляции первого порядка: по ряду расходов на конечное потребление ry1 = 0,9998 и по ряду совокупного
дохода rx1 = 0,9997. Предположим, что полученные результаты
содержат ложную корреляцию ввиду наличия в каждом из рядов
линейной или близкой к линейной тенденции. Применим метод
устранения тенденции по отклонениям от тренда. В нашем слу– 108 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
чае, очевидно, необходимо построить нелинейные тренды по
каждому из рядов (наиболее подходящая функция имеет вид: y =
а0 + a1 ⋅ t + a2 ⋅ t2). Результаты расчета представлены в табл.7.2.
Таблица 7.2. Результаты расчета параметров нелинейных трендов
Показатель
a0
a1
a1
rxy
R2
По
Совокупный доход, хt
1933,1755
33,0364
186,8889
0,999096134
0,998193085
трендам
Расходы на конечное потребление, уt
1767,0457
116,1090
172,9177
0,999440888
0,998882089
ytp = 1767,0457 + 116,109 ⋅ t + 172,9177 ⋅ t 2
и
x = 1933,1755 + 33,0364 ⋅ t + 186,8889 ⋅ t определим расчетные значения и отклонения от трендов ∆ yt = yt − ytp и ∆ xt = xt − xtp
2
p
t
(табл.7.3).
Таблица 7.3. Трендовая компонента и ошибки временных рядов
t
yt
хt
ytp
xtp
∆ yt = yt − ytp
∆ xt = xt − xtp
1
2
3
4
5
6
7
8
9
10
1746,66
2853,53
3870,68
5214,38
6710,06
8644,39
10780,18
13614,23
16706,07
20489,59
1776,02
2908,00
3983,76
5324,52
6829,30
8885,61
10976,29
13818,98
17289,94
21308,58
2056,07
2690,93
3671,63
4998,17
6670,53
8688,74
11052,78
13762,65
16818,36
20219,91
2153,10
2746,80
3714,28
5055,54
6770,58
8859,39
11321,99
14158,36
17368,51
20952,43
–309,41
162,59
199,04
216,22
39,53
–44,35
–272,60
–148,42
–112,29
269,68
–377,08
161,20
269,47
268,97
58,72
26,22
–345,69
–339,38
–78,57
356,15
Проверим полученные отклонения на автокорреляцию.
Коэффициенты автокорреляции первого порядка по отклонениям от трендов составляют: r ∆x1 = 0,363 ; r ∆y1 = 0,267 .
Следовательно, временные ряды отклонений от трендов
– 109 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
можно использовать для получения количественной характеристики тесноты связи исходных временных рядов (расходов на
конечное потребление и общего дохода). Коэффициент корреляции по отклонениям от трендов r∆x∆y = 0,973 (сравните это
значение с коэффициентом корреляции по исходным уровням
рядов rxy = 0,9999). Связь между расходами на конечное потребление и совокупным доходом прямая и тесная.
Результаты построения модели регрессии по отклонениям
от трендов:
Показатель
a0
a1
r∆x∆y
R2
Значение
–5,323E-13
0,7378
0,97300
0,9467
Содержательная интерпретация параметров этой модели
затруднительна, однако ее можно использовать для прогнозирования. Для этого необходимо следовать алгоритму:
1. Определить трендовое значение факторного признака
p
xt ;
2. С помощью одного из методов оценить величину предполагаемого отклонения фактического значения от трендового
xt − xtp ;
3. По уравнению тренда для результативного признака определяют трендовое значение ytp ;
4. По уравнению регрессии по отклонениям от трендов находят величину отклонения yt − y tp ;
5. рассчитать точечный прогноз фактического значения yt
по формуле:
yt = ytp + yt − ytp .
(
)
Спрогнозируем расходы на конечное потребление для t =
11, следуя вышеописанному алгоритму:
1. xtp = 1933,1755 + 33,0364 ⋅ 11 + 186,8889 ⋅ 112 = 24910,14 ;
– 110 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. xt − xtp = 21308,58 + 3744,80 − 24910,1318 = 143,2522 ;
3. ytp = 1767,0457 + 116,109 ⋅ 11 + 172,9178 ⋅ 112 = 23967,2878 ;
4. yt − ytp = −5,322 *10−13 + 0,738 ⋅143,2522 = 105,6784 ;
5. Точечный прогноз фактического значения:
23967 , 2878 + 105 ,6784 = 24072 ,9663 д.е.
7.1.2. Метод последовательных разностей
В ряде случаев вместо аналитического выравнивания временного ряда с целью устранения тенденции можно применить
более простой метод – метод последовательных разностей.
Если временной ряд содержит ярко выраженную линейную тенденцию, ее можно устранить путем замены исходных
уровней ряда цепными абсолютными приростами (первыми разностями). Пусть:
(7.3)
yt = ytp + ε t
где εt – случайная ошибка;
ytp = a + b ⋅ t
(7.4)
Тогда
∆ t = yt − yt −1 = a + b ⋅ t + ε t − (a + b ⋅ (t − 1) + ε t −1 ) = b + (ε t − ε t −1 ) (7.5)
Коэффициент b – константа, которая не зависит от времени. При наличии сильной линейной тенденции остатки εt достаточно малы и в соответствии с предпосылками МНК носят случайный характер. Поэтому первые разности уровней ряда ∆t не
зависят от переменной времени, их можно использовать для
дальнейшего анализа.
Если временной ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные уровня ряда на вторые разности.
Пусть имеет место соотношение (7.4), однако
ytp = a + b1 ⋅ t + b2 ⋅ t 2 .
– 111 –
(7.6)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Тогда
(
)
∆ t = yt − yt −1 = a + b1 ⋅ t + b2 ⋅ t 2 + ε t − a + b1 ⋅ (t − 1) + b2 ⋅ (t − 1) + ε t −1 (7.7)
= b1 − b2 + 2 ⋅ b2 ⋅ t + (ε t − ε t −1 )
2
Как показывает это соотношение, первые разности ∆t непосредственно зависят от фактора времени t и, следовательно,
содержат тенденцию.
Определим вторые разности:
∆ t 2 = ∆ t − ∆ t −1 = b1 − b2 + 2 ⋅ b2 ⋅ t + (ε t − ε t −1 ) −
− (b1 − b2 + 2 ⋅ b2 ⋅ (t − 1) + (ε t −1 − ε t − 2 )) = 2 ⋅ b2 + (ε t − 2 ⋅ ε t −1 + ε t − 2 )
(7.8)
Очевидно, что вторые разности ∆t2 не содержат тенденции,
поэтому при наличии в исходных уровнях тренда в форме параболы второго порядка их можно использовать для дальнейшего
анализа. Если тенденции временного ряда соответствует экспоненциальный или степенной тренд, метод последовательных
разностей следует применять не к исходным уровням ряда, а к
их логарифмам.
Пример 7.2. Изучение зависимости расходов на конечное
потребление от совокупного дохода с помощью метода последовательных разностей.
Обратимся вновь к данным о расходах на конечное потребление yt и совокупном доходе xt (табл.7.1).Проанализируем
зависимость между этими рядами, используя вторые разности,
такой выбор объясняется наличием в исходных уровнях тренда в
форме параболы второго порядка (табл.7.4).
Проверка временных рядов вторых разностей на автокорреляцию дает следующие результаты: r∆ty = –0,333; r∆tx = –0,006.
Поскольку полученные ряды не содержат автокорреляции, мы
можем использовать их вместо исходных данных для измерения
зависимости между расходами на конечное потребление и совокупным доходом. Коэффициент корреляции рядов вторых разностей составляет r∆ty∆tx = 0,827. В данном случае можно подтвердить вывод о наличии тесной прямой связи между расходами на конечное потребление и совокупным доходом, приведен– 112 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ный в примере 7.1.
Таблица 7.4. Вторые разности временных рядов
t
1
2
3
4
5
6
7
8
9
10
yt
1746,66
2853,53
3870,68
5214,38
6710,06
8644,39
10780,18
13614,23
16706,07
20489,59
∆′′ty
–
–
–89,72
326,56
151,97
438,65
201,46
698,26
257,79
691,68
хt
1776,02
2908,00
3983,76
5324,52
6829,30
8885,61
10976,29
13818,98
17289,94
21308,58
∆′′tx
–
–
–56,23
265,01
164,02
551,53
34,37
752,00
628,28
547,68
Построение уравнения регрессии зависимости расходов на
конечное потребление от совокупных доходов по вторым разностям привело к следующим результатам:
Показатель
a0
a1
R2
r∆ty∆tx
Значение
65,5594
0,7456
0,6835
0,8267
Уравнение регрессии приняло вид:
(∆ t y ) p = 65,5594 + 0,746 ⋅ ∆ t x .
В отличие от уравнения регрессии по отклонениям от
тренда, параметрам данного уравнения легко дать интерпретацию. При изменении прироста дохода на 1 д.е. прирост потребления изменится в среднем на 0,746 д.е. в том же направлении.
При всей своей простоте метод последовательных разностей имеет два существенных недостатка. Во-первых, его применение сильно связано с сокращением числа пар наблюдений,
по которым строится уравнение регрессии, а, следовательно, с
потерей числа степеней свободы. Во-вторых, использование
– 113 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вместо исходных уровней временных рядов их приростов, или
ускорений, приводит к потере информации, содержащейся в исходных данных. Следовательно, данное расчетное уравнение не
позволяет нам сделать прогноз на дальнейшие периоды.
7.2. Методы исключения фактора времени
7.2.1.Представление исходного ряда в виде тренда
Рассмотрим два временных ряда y(t), x(t) и будем изучать
зависимость между ними. Особенность этой задачи состоит в
том, что обе переменные являются случайными функциями времени t. Как функции от t они могут изменяться в очень согласованной форме. Поэтому их совместное рассмотрение и попытка
построить зависимость вида
(7.9)
y(t) = b0 + b1 x(t) + ε(t)
могут привести к неверным результатам и выводам.
Отсюда следует, что зависимость (7.9) или ее аналоги напрямую применять нельзя. Один из способов проверки зависимости между y(t) и x(t) состоит в том, чтобы устранить влияние
основной переменной t. Для этого поступают следующим образом.
Будем считать, что y(t) и x(t) описываются трендовыми моделями, а именно:
y(t) = g1(t) + ε1(t);
(7.10)
x(t) = g2(t) + ε2(t).
(7.11)
Найдем тренды g1(t) и g2(t) и введем новые переменные
(устранение трендов):
x1(t) = x(t) – g2(t);
y1 = y(t) – g1(t).
(7.12)
Теперь влияние переменной t в значительной степени устранено, и можно изучать линейную зависимость
y1 (t) = b0 + b1 x1 + ε
(7.13)
Для анализа зависимости (7.13), ее значимости или незначимости применяются стандартные методики, рассмотренные
– 114 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ранее.
В приложениях используются и другие подходы, позволяющие изучать зависимость между временными рядами y(t) и
x(t). Например, в зависимости (7.9) явным образом учитывают
время. При таком подходе вместо формулы (7.1) рассматривают
ее обобщение:
y(t) = b0 + b1 x(t) + b2 t + ε(t),
(7.14)
где время t выступает как еще одна объясняющая переменная.
Пример 7.3. Имеется набор данных, отражающих изменение во времени следующих переменных: y = y(t) – объем реализации предприятия оптовой торговли (у.е.); x = x(t) – размер торговой площади (м2); t – время (квартал). Требуется найти линейные тренды в динамике x(t) и y(t), установить или опровергнуть
зависимость изменения объема реализации от размера торговой
площади. Исходные данные представлены в табл.7.5.
Таблица 7.5. Зависимость объема реализации и торговой площади от времени
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
xt
127,2
129
131,2
134,8
136,6
138,6
143,2
144,3
145,6
148,7
150,4
154,7
158,2
159,3
159,6
163,6
164,9
169,4
– 115 –
yt
15,12
16,62
17,16
17,63
18,14
16,92
17,66
18,4
19,97
21,35
20,16
21,04
20,27
23,33
21,67
23,05
23,9
23,85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Будем считать, что выполнены все предположения МНК
относительно случайных составляющих ε1(t), ε2(t) и ε, входящих
в отношения (7.10)-(7.11). Уровень значимости выберем 0,05.
Решение.
1) Предположим, что уравнения (7.10) и (7.11) содержат
линейные тренды:
g1(t) = a0 + a1t,
g2(t) = c0 + c1t.
Вычисляя оценки параметров этих трендов, получаем, что
a0 = 15,16; a1 = 0,49; c0 = 124,5; c1 = 2,45.
Сформируем новые переменные x1 и y1 по формуле (7.12) и
сведем все результаты в табл.7.6.
Таблица 7.6. Исходные и расчетные значения переменных
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
xt
127,2
129
131,2
134,8
136,6
138,6
143,2
144,3
145,6
148,7
150,4
154,7
158,2
159,3
159,6
163,6
164,9
169,4
yt
15,12
16,62
17,16
17,63
18,14
16,92
17,66
18,4
19,97
21,35
20,16
21,04
20,27
23,33
21,67
23,05
23,9
23,85
g1
15,64778
16,13523
16,62268
17,11013
17,59758
18,08503
18,57248
19,05993
19,54739
20,03484
20,52229
21,00974
21,49719
21,98464
22,47209
22,95954
23,44699
23,93444
g2
126,9468
129,3929
131,839
134,2852
136,7313
139,1774
141,6236
144,0697
146,5158
148,962
151,4081
153,8542
156,3003
158,7465
161,1926
163,6387
166,0849
168,531
x1
0,253216
–0,39291
–0,63904
0,514826
–0,1313
–0,57743
1,576436
0,230306
–0,91582
–0,26195
–1,00808
0,845786
1,899656
0,553526
–1,5926
–0,03873
–1,18486
0,869006
y1
–0,52778
0,484771
0,53732
0,519869
0,542418
–1,16503
–0,91248
–0,65993
0,422614
1,315163
–0,36229
0,030261
–1,22719
1,345359
–0,80209
0,090458
0,453007
–0,08444
По данным табл.7.6 получим зависимость (7.13): b0 = –
2,8⋅1015; b1 = –0,176. Величина F-критерия равна Fрасч = 0,768.
Табличное значение F-критерия с 1 и 16 степенями свободы и α
= 0,05 равно Fтабл = 4,49. Так как Fрасч < Fтабл, зависимость (7.13)
является незначимой. Следовательно, между переменными x1 и
– 116 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y1 нет линейной зависимости, и отсутствует линейная связь между объемом реализации и размером торговой площади. Обе
переменные растут относительно согласованно, но на y(t) влияют какие-то другие, не учтенные факторы.
2) Для получения модели (7.14), рассматривающей время
как дополнительную влияющую переменную, достаточно применить к исходным данным традиционный МНК (или процедуру Регрессия из Анализа данных). Результаты расчетов представлены в табл.7.7.
Таблица 7.7. Результаты расчетов по МНК
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
xt
127,2
129
131,2
134,8
136,6
138,6
143,2
144,3
145,6
148,7
150,4
154,7
158,2
159,3
159,6
163,6
164,9
169,4
170,98
173,42
yt
15,12
16,62
17,16
17,63
18,14
16,92
17,66
18,4
19,97
21,35
20,16
21,04
20,27
23,33
21,67
23,05
23,9
23,85
ytr
15,6031
16,20456
16,73544
17,01929
17,62075
18,18692
18,29433
19,0193
19,70898
20,08106
20,70016
20,8605
21,162
21,88697
22,7531
22,96638
23,65606
23,78111
24,4219
24,90935
yt – ytr
-0,4831
0,415443
0,424563
0,610709
0,51925
-1,26692
-0,63433
-0,6193
0,26102
1,268942
-0,54016
0,179498
-0,892
1,443027
-1,0831
0,083623
0,243941
0,068889
Значения коэффициентов регрессии представлены в следующей таблице:
b0
b1
b2
Коэффициенты
37,12806
–0,17645
0,919063
– 117 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Статистические параметры полученной модели – в следующей таблице:
Регрессия
Остаток
Итого
Коэффициент детерминации R2
df
2
15
17
SS
MS
F
115,5893 57,79464 88,96513
9,744489 0,649633
125,3338
0,9223
Полученные результаты говорят о том, что модель (7.14)
адекватно описывает зависимость объема реализации от торговой площади и времени (высокие коэффициент детерминации и
значение F-критерия, явно превышающее F табличное). Следовательно, уравнение
y(t) = 37,128 – 0,176 ⋅ x(t) + 0,919 ⋅ t
можно использовать для прогнозирования объема реализации.
Прогноз на предстоящие два периода представлен в
табл.7.7. При этом значения x(t) получены по уравнению (7.11).
7.2.2. Включение в модель регрессии фактора времени
В корреляционно-регрессионном анализе можно устранить
воздействие какого-либо фактора, если зафиксировать воздействие этого фактора на результат и другие включенные в модель
факторы. Данный прием широко применяется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной.
Модель вида
yt = a + b1 xt + b2 t + εt
(7.15)
относится к группе моделей, включающих фактор времени.
Очевидно, что число независимых переменных в такой модели
может быть больше единицы. Кроме того, это могут быть не
только текущие, но и лаговые значения независимой и результативной переменных.
Преимущество данной модели перед методами отклонений
от трендов и последовательных разностей состоит в том, что она
позволяет учесть всю информацию, содержащуюся в исходных
– 118 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
данных, поскольку значения yt и xt – это уровни исходных временных рядов. Кроме того, модель строится по всей совокупности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа
наблюдений. Параметры модели с включением фактора времени
определяются обычным МНК. Покажем это на примере 7.4.
Пример 7.4. Построение модели регрессии с включением
фактора времени.
Вернемся к данным табл.7.1. Построим уравнение регрессии, описывающее зависимость расходов на конечное потребление yt от совокупного дохода xt и фактора времени t. Для расчета
параметров уравнения регрессии (7.15) воспользуемся обычным
МНК. Система нормальных уравнений имеет вид:
n ⋅ a + b1 ⋅ ∑ xt + b2 ⋅ ∑ t = ∑ yt

2
a ⋅ ∑ xt + b1 ⋅ ∑ xt + b2 ⋅ ∑ t ⋅ xt = ∑ xt ⋅ yt

2
a ⋅ ∑ t + b1 ⋅ ∑ t ⋅ xt + b2 ⋅ ∑ xt = ∑ t ⋅ yt
(7.16)
Решив эту систему относительно а, b1 и b2, находим:
а = –36,242; b1 = 0,919; b2 = 99,571.
Следовательно, уравнение регрессии имеет вид:
ytp = −36,242 + 0,919 ⋅ xt + 99,571 ⋅ t + ε t
Упростить расчет коэффициентов а, b1 и b2 можно с помощью процедуры Регрессия (в надстройке Анализ данных).
Расчетные значения и их отклонения от исходных приведены в
следующей таблице.
Интерпретация параметров этого уравнения следующая.
Параметр b1 = 0,919 характеризует, что при увеличении совокупного дохода на 1 д.е. расходы на конечное потребление возрастут в среднем на 0,919 д.е. в условиях существования неизменной тенденции. Параметр b2 = 99,571 означает, что воздействие всех факторов, кроме совокупного дохода, на расходы на
конечное потребление приведет к его среднегодовому абсолют– 119 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ному приросту на 99,571 д.е.
хt
1776,02
2908,00
3983,76
5324,52
6829,30
8885,61
10976,29
13818,98
17289,94
21308,58
t
1
2
3
4
5
6
7
8
9
10
yt
1746,66
2853,53
3870,68
5214,38
6710,06
8644,39
10780,18
13614,23
16706,07
20489,59
yr
1694,65
2833,98
3921,66
5252,76
6734,51
8722,86
10742,78
13453,43
16741,17
20531,98
yt – yr
52,01
19,55
–50,99
–38,37
–24,44
–78,47
37,40
160,80
–35,11
–42,39
Применение полученного уравнения для прогноза на предстоящие периоды предполагает знание о значениях зависимой
переменной xt в эти периоды. Для этого можно воспользоваться
уравнением линейного тренда из табл.7.2.
Например, в нашем случае сделаем прогноз расходов на
конечное потребление для t = 11. Сначала определяем трендовое
значение факторного признака:
xtp = 1933,1755 + 33,0364 ⋅ t + 186,8889 ⋅ t 2 = 24910 ,1348 ,
затем прогнозное значение по уравнению:
ytp = −36,242 + 0,919 ⋅ 24910,1348 + 99,571 ⋅ 11 = 23939,6742 д.е.,
что практически не отличается от прогноза по отклонениям от
тренда.
7.3. Автокорреляция в остатках.
Критерий Дарбина-Уотсона
7.3.1. Определение критерия Дарбина-Уотсона
Рассмотрим уравнение регрессии вида
k
yt = a + ∑ b j ⋅ x jt + ε t ,
j =1
где k – число независимых переменных модели.
– 120 –
(7.17)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для каждого момента (периода) времени
компоненты εt определяется как
t = 1, n значение
ε t = yt − ytp
(7.18)
или
k
ε t = yt − (a + ∑ b j ⋅ x jt ) .
(7.19)
j =1
Рассматривая последовательность остатков как временной
ряд, можно построить график их зависимости от времени. В соответствии с предпосылками МНК остатки εt должны быть случайными (рис.7.1а). Однако при моделировании временных рядов нередко встречается ситуация, когда остатки содержат тенденцию (рис.7.1б и в) или циклические колебания (рис.7.1г). Это
свидетельствует о том, что каждое следующее значение остатков зависит от предшествующих. В этом случае говорят о наличии автокорреляции остатков.
εt
εt
t
0
t
0
а
б
εt
εt
t
0
0
t
г
в
Рис.7.1. Модели зависимости остатков от времени
– 121 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака. Вовторых, в ряде случаев причину автокорреляции остатков следует искать в формулировке модели. Модель может не включать
фактор, оказывающий существенное влияние на результат,
влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто
этим фактором является фактор времени t. Кроме того, в качестве таких существенных факторов могут выступать лаговые значения переменных, включенных в модель. Либо модель не учитывает несколько второстепенных факторов, совместное влияние которых на результат значительно ввиду совпадения тенденций их изменения или фаз циклических колебаний.
От истинной автокорреляции остатков следует отличать
ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом
случае следует изменить форму связи факторных и результативного признаков, а не использовать специальные методы расчета
параметров уравнения регрессии при наличии автокорреляции
остатков.
Известны два наиболее распространенных метода определения автокорреляции остатков. Первый метод – это построение
графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод
использование критерия Дарбина-Уотсона и расчет величины
n
d=
∑ (ε t − ε t −1 )
2
t =2
n
∑ε
t =1
.
(7.20)
2
t
Таким образом, d – это отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме
квадратов по модели регрессии. Практически во всех статисти– 122 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ческих пакетах прикладных программ значение критерия Дарбина-Уотсона указывается наряду с коэффициентом детерминации, значениями t- и F-критериев.
Коэффициент автокорреляции остатков первого порядка
определяется как
n
∑ (ε t − ε 1 ) ⋅ (ε t −1 − ε 2 )
ε
r1 =
,
t =2
n
n
(7.21)
∑ (ε t − ε 1 ) ⋅ ∑ (ε t −1 − ε 2 )
2
t =2
2
t =2
где
n
n
ε1 =
∑εt
t =2
n −1
ε2 =
;
∑ ε t −1
t =2
n −1
.
(7.22)
Поскольку εt – остатки, полученные по уравнению регрессии, параметры которого определены обычным методом наименьших квадратов, в соответствии с предпосылками МНК их
сумма и среднее значение равны нулю.
n
n
∑εt
t =1
εt =
=0
∑εt
t =1
n
= 0.
(7.23)
Следовательно, без уменьшения общности можно предположить, что
(7.24)
ε1 = ε 2 = 0 .
Предположим также
n
n
t =2
t =2
∑ ε t2 ≈ ∑ ε t2−1 .
(7.25)
С учетом соотношений (7.24) и (7.25) формула для расчета
коэффициента автокорреляции остатков (7.2) преобразуется
следующим образом:
– 123 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
r1ε =
n
∑ ε t ⋅ ε t −1
t =2
n
n
∑ (ε t ) ⋅ ∑ (ε t −1 )
2
2
t =2
t =2
≈
∑ ε t ⋅ ε t −1
t =2
n
∑ε
t =2
.
(7.26)
2
t
Преобразуем теперь формулу (7.20) расчета критерия Дарбина-Уотсона:
n
d=
∑ (ε t − ε t −1 )
2
t =2
n
∑ε
t =1
2
t
=
n
n
n
t =2
t =2
n
t =2
∑ ε t2 − 2 ⋅ ∑ ε t ⋅ ε t −1 + ∑ ε t2−1
∑ε
t =1
.
(7.27)
2
t
С учетом (7.19) имеем:
n
d=
n
2 ⋅ ∑ ε t2 − 2 ⋅ ∑ ε t ⋅ ε t −1
t =2
t =2
n
∑ ε t2
t =1
n


 ∑ ε t ⋅ ε t −1 
 . (7.28)
= 2 ⋅ 1 − t = 2 n

∑ ε t2 


t =1

Сравнив выражения (7.26) и (7.28), нетрудно вывести следующее соотношение между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка:
d ≈ 2 ⋅ (1 − r1ε ).
(7.29)
Таким образом, если в остатках существует полная положительная автокорреляция и rε1 = 1, то d = 0. Если в остатках
есть полная отрицательная автокорреляция, то rε1 = –1 и, следовательно, d = 4. Если автокорреляция остатков отсутствует, то
rε1 = 0 и d = 2. Значит,
0 ≤ d ≤ 4.
Алгоритм выявления автокорреляции остатков на основе
критерия Дарбина-Уотсона следующий:
1. Выдвигается гипотеза Н0 об отсутствии автокорреляции
остатков (альтернативные гипотезы Н1 и Н*1 состоят соответст– 124 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
венно в наличии положительной или отрицательной автокорреляции в остатках);
2. Далее по специальным таблицам определяются критические значения критерия Дарбина-Уотсона dL и dU для заданного
числа наблюдений n, числа независимых переменных модели k и
уровня значимости α;
3. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1 – α) представлено на рис.7.2.
Есть
положительная
автокорреляция
остатков.
Н0 отклоняется.
С вероятностью
P = (1 – α)
принимается Н1
0
Зона
неопределенности
dL
Нет оснований
отклонять Н0
(автокорреляция
остатков
отсуствует)
2
dU
Зона
неопределенности
4 – dU
Есть
отрицательная
автокорреляция
остатков.
Н0 отклоняется.
С вероятностью
P = (1 – α)
принимается Н*1
4 – dL
4
Рис.7.2. Проверка гипотезы о наличии автокорреляции остатков
4. Если фактическое значение критерия Дарбина-Уотсона
попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу Н0.
Пример 7.5 Проверка гипотезы о наличии автокорреляции
в остатках.
Проверим гипотезу о наличии автокорреляции в остатках
для модели зависимости расходов на конечное потребление от
совокупного дохода (см. пример 7.1).
Было получено следующее уравнение регрессии:
ytp = 89,9903 + 0,964 ⋅ xt + ε t
Исходные данные, значения εt и результаты промежуточных расчетов представлены в табл.7.8.
Фактическое значение критерия Дарбина-Уотсона для этой
модели составляет: d = 103359,98 = 1,209 .
85468
– 125 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 7.8. Расчет критерия Дарбина-Уотсона
t
yt
1746,66
2853,53
3870,68
5214,38
6710,06
8644,39
10780,18
13614,23
16706,07
20489,59
Суммы
1
2
3
4
5
6
7
8
9
10
xt
y tp
1776,02
2908,00
3983,76
5324,52
6829,30
8885,61
10976,29
13818,98
17289,94
21308,58
1801,70
2892,69
3929,50
5221,71
6672,00
8653,86
10668,84
13408,59
16753,87
20627,00
εt
–55,04
–39,17
–58,82
–7,33
38,06
–9,47
111,34
205,64
–47,80
–137,42
εt – εt–1
15,87
–19,66
51,50
45,39
–47,53
120,81
94,30
–253,44
–89,61
(εt – εt–1)2
εt 2
3029,08
251,87
1534,03
386,38
3460,18
2651,84
53,69
2059,98
1448,54
2258,76
89,62
14594,12 12396,46
8892,77 42288,17
64233,82 2285,13
8030,44 18883,10
103359,98 85468,00
По таблицам значений критерия Дарбина-Уотсона (приложение 1) определим для числа наблюдений n = 10, числа независимых переменных модели k′ = 1 и уровня значимости α = 0,05
критические значения dL = 0,88 и dU = 1,32. Фактическое значение d = 1,209 попадает в промежуток от dU до 4 – dU. Следовательно, нет оснований отклонять гипотезу Н0 об отсутствии автокорреляции в остатках.
Есть несколько существенных ограничений на применение
критерия Дарбина-Уотсона.
1. Во-первых, он неприменим к моделям, включающим в
качестве независимых переменных лаговые значения результативного признака, т. е. к моделям авторегрессии. Для тестирования на автокорреляцию остатков моделей авторегрессии используется критерий h Дарбина.
2. Во-вторых, методика расчета и использования критерия
Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка. При проверке остатков на автокорреляцию более высоких порядков следует применять другие
методы.
3. В-третьих, критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок. В этом смысле
результаты примера 1.4 нельзя считать 100% достоверными
ввиду малого числа наблюдений n = 10, по которым построена
– 126 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
модель регрессии.
7.3.2. Оценивание параметров уравнения регрессии
при наличии автокорреляции в остатках
Обратимся вновь к уравнению регрессии (7.1). Примем некоторые допущения относительно этого уравнения:
– пусть yt и xt не содержат тенденции, например, представляют собой отклонения выровненных по трендам значений от
исходных уровней временных рядов;
– пусть оценки a и b параметров уравнения регрессии найдены обычным МНК;
– пусть критерий Дарбина-Уотсона показал наличие автокорреляции в остатках первого порядка.
Для того чтобы понять, каковы последствия автокорреляции в остатках для оценок параметров модели регрессии, найденных обычным МНК, построим формальную модель, описывающую автокорреляцию в остатках. Автокорреляция в остатках
первого порядка предполагает, что каждый следующий уровень
остатков εt зависит от предыдущего уровня εt–1. Следовательно,
существует модель регрессии вида
εt = c + d ⋅ εt–1 + ut,
(7.30)
где с и d – параметры уравнения регрессии.
В соответствии с рабочими формулами МНК имеем:
c = ε t − d ⋅ ε t −1 ; d =
ε t ε t −1 − ε t ⋅ ε t −1 .
ε t2−1 − ε t −1
(7.31)
С учетом соотношений (7.23) и (7.24) получим:
n
c = 0; d =
∑ ε t ⋅ ε t −1
ε t ε t −1 t = 2
= b
≈ r1ε ,
2
ε t −1
∑ ε t2−1
(7.32)
t =2
где rε1 – коэффициент автокорреляции остатков первого порядка.
– 127 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, имеем:
εt = rε1 ⋅ εt–1 + ut,
(7.33)
где ut – случайная ошибка.
Заметим, что |rε1| < 1.
Учитывая соотношение (7.33), уравнение (7.1) можно переписать в виде
yt = a + b xt + rε1 ⋅ εt–1 + ut.
(7.34)
Найденные соотношения показывают, что текущий уровень ряда yt зависит не только от факторной переменной xt, но и
от остатков предшествующего периода εt–1.
Допустим, мы не принимаем во внимание эту информацию
и оцениваем параметры a и b уравнения (7.1) обычным МНК.
Тогда можно показать, что полученные оценки неэффективны,
т. е. они не имеют минимальную дисперсию. Это приводит к
увеличению стандартных ошибок, снижению фактических значений t-критерия и широким доверительным интервалам для коэффициента регрессии. На основе таких результатов можно сделать ошибочный вывод о незначимом влиянии исследуемого
фактора на результат, в то время как на самом деле его влияние
статистически значимо.
Отметим, что при соблюдении прочих предпосылок МНК
автокорреляция остатков не влияет на свойства состоятельности
и несмещенности оценок параметров уравнения регрессии
обычным методом наименьших квадратов, за исключением моделей авторегрессии. Применение МНК к моделям авторегрессии ведет к получению смещенных, несостоятельных и неэффективных оценок.
Рассмотрим основной подход к оценке параметров модели
регрессии в случае, когда имеет место автокорреляция остатков.
Для этого вновь обратимся к исходной модели (7.1). Для момента времени t – 1 эта модель примет вид:
yt–1 = a + b ⋅ xt–1 + εt–1.
– 128 –
(7.35)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Умножим обе части уравнения (7.35) на rε1:
rε1 ⋅ yt–1 = rε1 ⋅ a + rε1 ⋅ b ⋅ xt–1 + rε1 ⋅ εt–1.
(7.36)
Вычтем почленно из уравнения (7.1.) уравнение (7.36):
yt – rε1 ⋅ yt–1 = a – rε1 ⋅ a + b ⋅ xt – rε1 ⋅ b ⋅ xt–1 + εt – rε1 ⋅ εt–1.
(7.37)
Проведя тождественные преобразования в (7.37), имеем:
где
y’t = a’ + b ⋅ x’t + ut.
(7.38)
y’t = yt – rε1 ⋅ yt–1;
(7.39)
x’t = xt – rε1 ⋅ xt–1;
(7.40)
ut = εt – rε1 ⋅ εt–1;
(7.41)
a’ = a ⋅ (1 – rε1).
(7.42)
Поскольку ut – случайная ошибка, для оценки параметров
уравнения (7.38) можно применять обычный МНК.
Итак, если остатки по исходному уравнению регрессии содержат автокорреляцию, то для оценки параметров уравнения
используют обобщенный метод наименьших квадратов. Для его
реализации необходимо выполнять следующие условия:
1. Преобразовать исходные переменные yt и xt к виду (7.39)
и (7.40).
2. Применив обычный МНК к уравнению (7.38), определить оценки параметров a’ и b’.
3. Рассчитать параметр а исходного уравнения из соотношения (7.42) как
a=
a′
1 − r1ε
(7.43)
4. Выписать исходное уравнение (7.1).
Обобщенный метод наименьших квадратов аналогичен
– 129 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
методу последовательных разностей. Однако мы вычитаем из yt
(или xt) не все значение предыдущего уровня yt–1 (или xt–1), а некоторую его долю – rε1 ⋅ yt–1 или rε1 ⋅ xt–1. Если rε1 = 1, данный
метод это просто метод первых разностей, так как
y’t = yt – yt–1
(7.44)
x’t = xt – xt–1
(7.45)
и
Поэтому в случае, если значение критерия ДарбинаУотсона близко к нулю, применение метода первых разностей
вполне обоснованно. Если rε1 = –1, т. е. в остатках наблюдается
полная отрицательная автокорреляция, то изложенный выше метод модифицируется следующим образом:
y’t = yt – (–1) ⋅ yt–1 = yt + yt–1.
(7.46)
x’t = xt – (–1) ⋅ xt–1 = xt + xt–1.
(7.47)
a’ = a ⋅ (1 – rε1) = 2 ⋅ a,
(7.48)
yt + yt–1 = 2 ⋅ a + b ⋅ ( xt + xt–1) + ut,
(7.49)
Аналогично
Поскольку
имеем
Следовательно
(yt + yt–1)/2= a + b ⋅ ( xt + xt–1)/2 + ut/2. (7.50)
В сущности, в модели (7.50) мы определяем средние за два
периода уровни каждого ряда, а затем по полученным усредненным уровням обычным МНК рассчитываем параметры а и b.
Данная модель называется модель регрессии по скользящим
средним.
Главная проблема, связанная с применением данного метода, заключается в том, как получить оценку rε1. Известно
множество способов оценить численное значение коэффициента
автокорреляции остатков первого порядка. Однако основными
способами являются оценка этого коэффициента непосредственно по остаткам, полученным по исходному уравнению регрессии, и получение его приближенного значения из соотноше– 130 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ния между коэффициентом автокорреляции остатков первого
порядка и критерием Дарбина-Уотсона: rε1 = 1 – d/2.
Пример 7.6. Расчет параметров уравнения регрессии при
наличии автокорреляции остатков.
Пусть имеются данные о среднедушевом располагаемом
доходе и среднедушевом расходе на конечное потребление в
США за период с 1960 по 1991 гг. (табл.7.9). Требуется рассчитать параметры уравнения регрессии, проанализировав автокорреляцию остатков в США за рассматриваемый период.
Коэффициент корреляции, рассчитанный по уровням временных рядов, равен 0,997. Это говорит об очень тесной прямой
связи между расходами на конечное потребление и среднедушевым доходом в США за период с 1960 по 1991 г. Однако при
расчете параметров уравнения регрессии мы сталкиваемся с
другой проблемой – автокорреляцией в остатках (фактическое
значение критерия Дарбина-Уотсона составляет 0,519, что свидетельствует о наличии положительной автокорреляции в остатках). Поэтому найденные оценки параметров уравнения регрессии а0= -174,305 и а1=0,922 не являются эффективными ввиду
нарушения предпосылок МНК в этом уравнении.
Для получения новых оценок параметров, для которых не
нарушается свойство эффективности, воспользуемся методом
расчета параметров уравнения регрессии при наличии автокорреляции в остатках.
1. Найдем оценку коэффициента автокорреляции остатков
первого порядка. Ее можно получить двумя способами. Воспользовавшись приближенным соотношением между критерием
Дарбина-Уотсона и коэффициентом автокорреляции остатков
первого порядка, которое описывается формулой (7.41), имеем:
r1ε = 1 −
0,519
= 0,740
2
– 131 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 7.9. Среднедушевой располагаемый доход и среднедушевые расходы на конечное потребление в CIIIA за период с
1960 по 1991 гг. (в сопоставимых ценах 1987 г.)
Среднедушевой
располагаемый
Год
доход (долл.
США)
t
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
xt
7264
7382
7583
7718
8140
8508
8822
9114
9399
9606
9875
10111
10414
11013
10832
10906
11192
11406
11851
12039
12005
12156
12146
12349
13029
13258
13552
13545
13890
14030
14154
13987
Среднедушевые расходы
на конечное
потребление
(долл. США)
yt
6698
6740
6931
7089
7384
7703
8005
8163
8506
8737
8842
9022
9425
9752
9602
9711
10121
10425
10744
10867
10746
10770
10782
11179
11617
12015
12336
12568
12903
13027
13051
12889
Остатки
ετ
173,8364121
107,0231838
112,6718373
146,1821269
52,03651387
31,68678494
44,13294016
–67,13369258
13,05469671
53,17047419
–89,88680049
–127,5132571
–3,923495837
–229,2889513
–212,3805249
–171,6193291
–25,35308579
81,30766968
–10,04730144
–60,41074991
–150,0577858
–265,3018322
–244,0803722
–34,27601069
–223,3352924
–36,50672697
13,38234829
251,8373703
268,6969994
263,5965591
173,2504548
165,2488372
– 132 –
Скорректированные на
коэффициент автокорреляции остатков значения
дохода
расхода
x't
–
2088,873423
2203,889264
2192,42472
2516,053012
2576,550339
2622,39635
2685,591044
2757,816682
2757,143076
2875,306457
2915,29172
3046,323401
3424,533567
2807,054655
3012,945611
3245,023342
3250,621056
3539,683682
3403,421385
3232,429673
3408,20477
3288,174192
3498,460986
4030,539084
3764,037146
3891,169582
3669,937862
4020,038618
3908,644252
3930,629148
3673,272912
y't
–
1859,30592
2019,70139
2038,52364
2218,3923
2322,4319
2391,9832
2329,92205
2557,79072
2538,85371
2475,52879
2579,01746
2850,85518
2884,19741
2495,91928
2714,22117
3044,79513
3050,03661
3147,51809
3038,06939
2827,44184
2939,61203
2934,12373
3322,37958
3471,09389
3549,93235
3580,91798
3579,01191
3744,95831
3624,85074
3558,49451
3379,0062
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приблизительно этот же результат можно получить, если
рассчитать коэффициент автокорреляции уровней первого порядка по временному ряду остатков (гр. 4 табл.7.9): r1ε = 0,729.
2. Проведем пересчет исходных данных в соответствии с
формулами (7.40) и (7.41). Новые переменные x’t и y’t приведены
в гр. 5 и 6 табл.7.6 соответственно. При пересчете данных мы
использовали величину коэффициента автокорреляции 0,729.
Однако в равной степени допустимо применять и другую его
оценку 0,740, полученную из соотношения между коэффициентом автокорреляции остатков и критерием Дарбина-Уотсона.
3. Определим параметры уравнения регрессии y’t на x’t
обычным МНК (уравнение 7.39). Получим:
y’t = –88,714 + 0,935 ⋅ x’t + ut.
4. Воспользуемся формулой (7.43) для расчета параметра а
исходного уравнения (7.39):
a=−
88,714
= −326,971
1 − 0,729
5. Уравнение регрессии зависимости среднедушевых расходов на конечное потребление от среднедушевого располагаемого дохода имеет вид:
y’t = –326,971 + 0,935 ⋅ x’t + ut.
Коэффициент детерминации для этого уравнения равен
0,963. Для коэффициента регрессии t-критерий составил 27,328.
Полученные результаты можно считать статистически значимыми.
Следовательно, предельная склонность к потреблению в
США за период с 1960 по 1991 г. была равна 0,935. Это означает, что с увеличением среднедушевого располагаемого дохода
на 1 долл. США среднедушевые расходы на конечное потребление возрастали в среднем на 93,5 цента.
– 133 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.4. Коинтеграция временных рядов
Общий недостаток методов исключения тенденции заключается в том, что эти методы предполагают некоторую модификацию модели (7.1) вследствие либо замены переменных, либо
добавления в эту модель фактора времени. Однако большая
часть соотношений, постулируемых экономической теорией,
верификацией которых занимается эконометрика, сформулирована в терминах уровней временных рядов, а не их последовательных разностей или отклонений от трендов и предполагает
измерение взаимосвязи переменных без включения в модель каких-либо дополнительных факторов (например, переменной
времени).
В ряде случаев наличие в одном из временных рядов тенденции может быть следствием именно того факта, что другой
ряд, включенный в модель, тоже содержит тенденцию, а не просто является результатом прочих случайных причин. Поэтому
одинаковая или противоположная направленность тенденций
рядов может иметь устойчивый характер и наблюдаться на протяжении длительного промежутка времени, а коэффициент корреляции, рассчитанный по уровням временных рядов, может соответственно не содержать ложной корреляции и характеризовать истинную причинно-следственную зависимость между ними.
Начиная с 1970-х гг. эти предположения были положены в
основу новой теории о коинтегpации временных рядов. Под коинтеграцией понимается причинно-следственная зависимость в
уровнях двух (или более) временных рядов, которая выражается
в совпадении или противоположной направленности их тенденций и случайной колеблемости.
Не останавливаясь детально на положениях и концепциях
теории коинтеграции (глубокое ее рассмотрение потребовало бы
подготовки отдельного учебного пособия), в данном разделе мы
кратко охарактеризуем основные статистические методы и критерии, применяемые для проверки гипотез о наличии
коинтегpации временных рядов данных.
– 134 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В соответствии с этой теорией между двумя временными
рядами коинтеграция существует в случае, если линейная комбинация временных рядов – это стационарный временной ряд
(т.е. ряд, содержащий только случайную компоненту и имеющий постоянную дисперсию на длительном промежутке времени). (Статистические критерии, предназначенные для проверки
гипотезы о коинтеграции, основаны не на проверке стационарности остатков, а на проверке менее жесткой гипотезы – гипотезы об отсутствии во временном ряде единичного корня).
Рассмотрим уравнение регрессии вида (1.1). Остатки εt в
этом уравнении представляют собой линейную комбинацию рядов yt и xt:
εt = yt –a – b ⋅ xt.
(7.51)
Одним из методов тестирования гипотезы о коинтегpации
временных рядов yt и xt является критерий Ингла-Грэнджера.
Алгоритм применения этого критерия следующий.
1. Выдвигается нулевая гипотеза об отсутствии
коинтегpации между рядами yt и xt.
2. Рассчитывают параметры уравнения регрессии вида
∆εt = a + b ⋅ εt–1.
(7.52)
где ∆εt – первые разности остатков, полученных из соотношения
(3.1).
3. Определяют фактическое значение t-критерия для коэффициента регрессии b в уравнении (7.52).
4. Сравнивают полученное значение с критическим значением статистики τ. Критические значения τ, рассчитанные Инглом и Грэнджером для уровней значимости 1; 5 и 10%, составляют соответственно 2,5899; 1,9439 и 1,6177. Если фактическое
значение t больше критического значения τ для заданного уровня значимости α, нулевую гипотезу об отсутствии коинтеграции
исследуемых временных рядов отклоняют и с вероятностью (1 –
α) принимают альтернативную гипотезу о том, что между рядами yt и xt есть коинтеграция. В противном случае гипотеза об
отсутствии коинтеграции между исследуемыми рядами не от– 135 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
клоняется.
Другой метод тестирования нулевой гипотезы об отсутствии коинтеграции между двумя временными рядами основан на
использовании величины критерия Дарбина-Уотсона, полученной для уравнения (7.51). Однако в отличие от традиционной
методики его применения в данном случае проверяют гипотезу
о том, что полученное фактическое значение критерия ДарбинаУотсона в генеральной совокупности равно нулю.
Ряд авторов приводят следующие критические значения
критерия Дарбина-Уотсона, полученные методом Монте-Карло
для ближайших уровней значимости: 1 % – 0,511; 5% – 0,386;
10% – 0,322. Если результаты тестирования показывают, что
фактическое значение критерия Дарбина-Уотсона нельзя признать равным нулю (т.е. оно превышает критическое значение
для заданного уровня значимости), нулевую гипотезу об отсутствии коинтеграции временных рядов отклоняют.
Если фактическое значение критерия Дарбина-Уотсона
меньше критического значения для заданного уровня значимости, то нулевая гипотеза об отсутствии коинтеграции не отклоняется.
Коинтеграция двух временных рядов значительно упрощает процедуры и методы, используемые в целях их анализа, поскольку в этом случае можно строить уравнение регрессии и определять показатели корреляции, применяя в качестве исходных
данных непосредственно уровни изучаемых рядов, учитывая тем
самым информацию, содержащуюся в исходных данных, в полном объеме. Однако поскольку коинтеграция означает совпадение динамики временных рядов в течение длительного промежутка времени, то сама эта концепция применима только к временным рядам, охватывающим сравнительно длительные (например, в несколько десятилетий) промежутки времени. При
наличии коротких временных рядов данных, даже если формальные критерии показали присутствие их коинтеграции, моделирование взаимосвязей по уровням этих рядов может привести к неверным результатам ввиду нарушения предпосылок
– 136 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
теории коинтеграции.
Пример 7.7. Анализ взаимосвязи временных рядов среднедушевого располагаемого дохода и среднедушевого расхода
на конечное потребление.
Пусть имеются данные о среднедушевом располагаемом
доходе и среднедушевом расходе на конечное потребление в
США за период с 1960 по 1991 гг. (табл.7.9). Проверить изучаемые временные ряды на наличие коинтеграции.
Построим графики временных рядов среднедушевого дохода и потребления (рис.7.3). Видно, что тенденции этих рядов
совпадают. Проведем тестирование на коинтеграцию временных
рядов среднедушевого дохода и расхода на потребление.
16000
yt x t
14000
12000
10000
доходы
8000
расходы
6000
4000
2000
t
0
1960
1964
1968
1972
1976
1980
1984
1988
Рис.7.3. Динамика среднедушевого дохода и расходов на конечное потребление в США с 1960 по 1991 гг.
Нулевая гипотеза состоит в том, что коинтеграция между
этими рядами отсутствует.
В примере 7.6 были рассчитаны параметры уравнения регрессии зависимости среднедушевых расходов уt от среднедушевого дохода хt.
Регрессионный анализ зависимости среднедушевых расходов на конечное потребление от среднедушевого располагаемо– 137 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
го дохода показал следующее:
а0 = –174,305;
а1 = 0,922;
R2 = 0,994;
εt.
Критерий Дарбина-Уотсона = 0,519.
Уравнение регрессии имеет вид: уt = –174,305 + 0,922 ⋅ хt +
Применим критерий Ингла-Грэнджера. В примере 7.5 остатки ετ (графа 4 табл.7.9). Определим параметры уравнения регрессии (7.52):
а0 = –1,729;
а1 = –0,272;
R2 = 0,137;
Фактическое значение t-критерия, рассчитанное по данным
уравнения регрессии, равно –2,149. Поскольку полученное фактическое значение по абсолютной величине превышает критическое значение t0,05 = 1,9439, с вероятностью 95% можно отклонить нулевую гипотезу и сделать вывод о коинтеграции временных рядов среднедушевого дохода и среднедушевых расходов наконечное потребление.
Этот же вывод подтверждается и другим критерием. Полученное значение критерия Дарбина-Уотсона для уравнения регрессии, рассчитанного по уровням временных рядов, d = 0,519
превышает его критическое значение при уровне значимости
0,01, равное 0,511, и тем более превышает его критические значения при повышении уровня значимости. Это свидетельствует
о том, что в генеральной совокупности критерий ДарбинаУотсона не равен нулю и, следовательно, временные ряды дохода и потребления коинтегрируют.
Делаем обобщенный вывод: для определения показателей
силы и тесноты их взаимосвязи можно работать с уровнями рядов.
– 138 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.5. Модель распределенных лагов
Модель распределенных лагов используется для построения регрессии между временными рядами y(t) и x(t). Особенность такой регрессии состоит в том, что зависимая переменная
y(t) учитывает не только текущие значения независимой переменной x(t), но и ее предшествующие значения:
y(t) = c + c0 ⋅ x(t) + c1⋅ x(t – 1) + … +ck ⋅ x(t – k) + ε(t) (7.53)
Модель (7.53) применяется в тех случаях, когда на значения переменной y(t) существенно влияют лаговые переменные
x(t – 1), x(t – 2),…, x(t – k). Принято, что случайная составляющая ε(t), входящая в (9.1), предполагается такой, что
M(ε(t)) = 0;
D((ε(t)) = σ2 = const > 0,
(7.54)
а случайные величины ε(t1), ε(t2),…, ε(tn), взаимно независимы и
имеют нормальное распределение. Эти условия соответствуют
основным предположениям МНК, что дает возможность применить регрессионный анализ.
Коэффициенты с, с0, с1, …,сk являются параметрами модели и должны вычисляться по набору данных. Модель (7.53) позволяет прогнозировать значения y(t) на несколько шагов вперед
на основе ранее полученных значений лаговых переменных.
Работа с моделью (7.53) включает несколько этапов. Первый из них предполагает содержательный анализ данных, в том
числе и графический. На этом этапе необходимо решить вопрос
о длине лага (параметр k). Второй этап связан с оценками коэффициентов выбранной модели. Третий этап предполагает интерпретацию полученных оценок коэффициентов модели. Пусть в
модели (7.53) все найденные коэффициенты имеют одинаковые
знаки. Тогда модель допускает четкую интерпретацию, состоящую в том, что переменная x(t) оказывает влияние на переменную y(t) и это влияние распространяется на определенный период времени. Здесь также используются такие понятия как средний и медианный лаг. Коэффициенты модели интерпретируются
как мультипликаторы.
– 139 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если коэффициенты будут иметь различные знаки, то возможно, что модель (7.53) или ее порядок выбраны неудачно, либо взаимосвязь между y(t) и x(t) имеет достаточно сложный характер, который нужно дополнительно изучать.
Пример 7.8. Рассмотрим набор данных, который характеризует зависимость объемов продаж компании за месяц y(t) от
расходов на рекламу x(t) (млн. руб). эти данные представлены в
табл.7.10.
Таблица 7.10. Зависимость объемов продаж компании за месяц
от расходов на рекламу
Месяц, t Расходы на рекламу, xt Объем продаж, yt
1
1,52
17,955
2
1,23
16,842
3
1,78
18,448
4
1,45
18,286
5
1,48
17,388
6
1,12
16,345
7
1,34
15,029
8
1,38
15,626
9
1,45
16,241
10
1,14
16,100
11
1,58
17,446
12
1,45
17,351
13
1,24
16,872
14
1,35
16,087
15
1,68
17,496
16
1,65
18,844
17
1,56
18,904
18
1,50
19,214
Графический анализ данных (рис.7.4) показывает, что динамика переменных y(t) и x(t) имеет согласованный характер.
Для построения связи между y(t) и x(t) можно использовать
линейную регрессионную зависимость. Зафиксируем порядок
модели k = 3 и рассмотрим зависимость
y(t) = c + c0 ⋅ x(t) + c1⋅ x(t – 1) + c2⋅ x(t – 2) +c3 ⋅ x(t – 3) + ε(t). (7.55)
– 140 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
25
20
15
xt
yt
10
5
t
0
0
5
10
15
20
Рис.7.4. Расходы на рекламу и объем продаж по месяцам
Введем новые переменные:
y = y(t); x1 = x(t), x2 = x(t – 1), x3 = x(t – 2), x4 = x(t – 3), ε = ε(t) (7.56)
Кроме того, зададим параметры:
b0 = c, b1 = c0, b2 = c1, b3 = c2, b4 = c3.
(7.57)
С учетом обозначений зависимость (7.55) будет представлена в форме
y(t) = b0 + b1 ⋅ x1 + b2 ⋅ x2 + b3 ⋅ x3 + b4 ⋅ x4 + ε(t)
(7.58)
Оценка параметров модели (7.58) проводится традиционным МНК (в Excel с помощью процедуры Регрессия из Анализа данных). Значения переменных (7.56) задаются из табл.7.10 с
учетом сдвижки данных, начиная с t = 4 и далее. Например:
y1 = y(4) = 18,286; x11 = x(4) = 1,45; x21 = x(3) = 1,78 и т.д.
В результате получается табл.7.11.
Оценки параметров модели таковы:
b0 = c = 0,021187;
b1 = c0 = 4,461027;
– 141 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b2 = c1 = 4,19125;
b3 = c2 = 2,158897;
b4 = c3 = 1,170873.
Таблица 7.11. Исходные данные для расчетов по МНК
x1
1,45
1,48
1,12
1,34
1,38
1,45
1,14
1,58
1,45
1,24
1,35
1,68
1,65
1,56
1,50
x2
1,78
1,45
1,48
1,12
1,34
1,38
1,45
1,14
1,58
1,45
1,24
1,35
1,68
1,65
1,56
x3
1,23
1,78
1,45
1,48
1,12
1,34
1,38
1,45
1,14
1,58
1,45
1,24
1,35
1,68
1,65
x4
1,52
1,23
1,78
1,45
1,48
1,12
1,34
1,38
1,45
1,14
1,58
1,45
1,24
1,35
1,68
y
18,286
17,388
16,345
15,029
15,626
16,241
16,100
17,446
17,351
16,872
16,087
17,496
18,844
18,904
19,214
Поскольку все коэффициенты больше нуля, можно сделать
вывод, что переменная x(t) оказывает влияние на переменную
y(t). Из результатов видно, что влияние лаговых переменных на
y(t) уменьшается с увеличением величины лага. Иначе говоря,
расходы на рекламу в предшествующие месяцы оказывают все
меньшее воздействие на объем продаж в текущем месяце.
8. Адаптивные методы прогнозирования
8.1. Применение адаптивных методов
при краткосрочном прогнозировании
При использовании традиционных подходов и методов для
прогнозирования важнейших экономических показателей на
макро-, мезо- и микроуровнях часто выдвигается гипотеза о том,
что основные тенденции и факторы, выявленные из предысто– 142 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
рии, сохранятся и для периода упреждения (на прогнозируемый
период). Таким образом, процесс экстраполяции выявленных
закономерностей, тенденций базируется на предположении об
инерционности анализируемых экономических систем.
В последнее время в процессе коренных социальноэкономических преобразований в России подвижность этих систем возрастает. возрастает быстрота реакции на конъюнктуру
внешнего и внутреннего рынка, на правительственные решения,
на новые социально-экономические условия. Даже наиболее
инерционные макроэкономические характеристики становятся
более подвижными. В связи с этим для прогнозирования таких
сложных процессов требуется гибкий и современный статистический инструментарий.
В настоящее время одними из наиболее перспективных в
исследовании и прогнозировании одномерных временных рядов
считаются адаптивные методы.
Термин адаптация происходит от лат. adaptatio – приспособление. В биологии это слово означает совокупность различных особенностей (морфологических, поведенческих и других)
биологического вида, обеспечивающих приспособление к определенным условиям существования, к специфическим особенностям внешней среды. Адаптацией также называется и сам
процесс выработки приспособлений. Применительно к прогнозированию процесс адаптации состоит в следующем.
При обработке временных рядов, как правило, наиболее
ценной является информация последнего периода, так как необходимо знать, как будет развиваться тенденция, существующая
в данный момент, а не сложившаяся в среднем на рассматриваемом периоде. Адаптивные методы позволяют учесть различную
информационную ценность уровней временного ряда, степень
«устаревания» данных с помощью системы весов, придаваемых
этим уровням.
Важнейшее достоинство адаптивных методов – построение
самокорректирующихся моделей, способных учитывать результат прогноза, сделанного на предыдущем шаге. Пусть модель
– 143 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
находится в некотором состоянии, для которого определены текущие значения ее коэффициентов. На основе этой модели делается прогноз. При поступлении фактического значения оценивается ошибка прогноза (разница между этим значением и полученным по модели). Ошибка через обратную связь поступает в
модель и учитывается в ней в соответствии с принятой процедурой перехода от одного состояния в другое. В результате вырабатываются «компенсирующие» изменения, состоящие в коррекции параметров с целью непосредственного согласования
поведения модели с динамикой ряда. Затем рассчитывается прогнозная оценка на следующий момент времени, и весь процесс
повторяется вновь.
Таким образом, адаптация осуществляется итеративно с
получением каждой новой фактической точки ряда. Модель постоянно «впитывает» новую информацию, приспосабливается к
ней и поэтому отражает тенденцию развития, существующую в
данный момент.
Скорость реакции модели на изменения в динамике процесса характеризует так называемый параметр адаптации. Этот
параметр адаптации должен быть выбран таким образом, чтобы
обеспечивалось адекватное отображение тенденции при одновременной фильтрации случайных отклонений.
На основе рассмотренных особенностей дадим определение группы методов прогнозирования, объединенных общим
названием «адаптивные». Адаптивными называются методы
прогнозирования, позволяющие строить самокорректирующиеся
(самонастраивающиеся) экономико-математические модели, которые способны оперативно реагировать на изменение условий
путем учета результата прогноза, сделанного на предыдущем
шаге, и учета различной информационной ценности уровней ряда.
В связи с отмеченными свойствами адаптивные методы
можно рассматривать как эффективное средство краткосрочного
прогнозирования показателей, характеризующих развитие российской экономики. Указав основные характерные черты, при– 144 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сущие рассматриваемому подходу, следует отметить, что деление на адаптивные и неадаптивные модели в то же время носит
достаточно условный характер. У истоков адаптивных методов
находится модель экспоненциального сглаживания.
Предположим, что временной ряд может быть представлен
в виде:
yt =a1 + εt,
где a1 = const; εt – случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и дисперсией σ2.
Модель экспоненциального сглаживания ряда описывается
следующей рекуррентной формулой:
St = αyt + βSt–1,
(8.1)
где St – значение экспоненциальной средней в момент t; α – параметр сглаживания, α = const; 0 < α <1; β = 1 –α.
Если последовательно использовать соотношение (8.1), то
экспоненциальную среднюю St можно выразить через предшествующие значения уровней временного ряда.
Таки образом, экспоненциальная средняя может быть
представлена в виде:
n −1
S t = α ∑ β i yt −i + β n S 0 ,
(8.2)
i =0
где n – длина ряда; S0 – начальное значение экспоненциальной
средней.
Из (8.2) видно, что величина St оказывается взвешенной
суммой всех членов ряда. Причем веса отдельных уровней ряда
убывают по мере их удаления в прошлое соответственно экспоненциальной функции (в зависимости от «возраста» наблюдений). Именно поэтому модель (8.1) получила название модели
экспоненциального сглаживания.
Например, пусть α = 0,1. Тогда все текущего наблюдения
yt будет равен 0,1; вес предыдущего уровня yt–1 будет соответствовать αβ = 0,1 ⋅ 0,9 = 0,09; для уровня yt–2 вес составит αβ2 =
– 145 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
0,081; для yt–3 – αβ3 = 0,0729 и т.д.
При расчете экспоненциальной средней в момент времени
t всегда требуется значение экспоненциальной средней в предыдущий момент времени, поэтому на первом шаге должна быть
определена некоторая величина S0, предшествующая St. Часто на
практике в качестве начального значения S0 используется среднее арифметическое значение из всех имеющихся уровней временного ряда или из какой-то их части. Из выражения (8.2) следует, что вес, приписываемый этому значению, уменьшается по
экспоненциальной зависимости по мере удаления от первого
уровня. Поэтому для длинных временных рядов влияние неудачного выбора S0 погашается.
Рассмотрим выражение (8.2) при n → 0. Очевидно, что βn
→ 0, следовательно,
∞
S t = α ∑ β i yt −i ,
(8.3)
i=0
Автор модели Р.Браун показал, что математическое ожидание временного ряда и экспоненциальной средней совпадут,
но в то же время дисперсия экспоненциальной средней D[St] будет меньше дисперсии временного ряда (σ2).
Представим выражение (8.3) в следующем виде:
∞
∞
∞
i =0
i =0
i =0
S t = α ∑ β i yt −i = α ∑ β i (a1 + ε t −1 ) = a1 + α ∑ β i ε t −i .
Отсюда очевидно, что математическое ожидание M(St) =
a1, так же как и математическое ожидание самого временного
ряда.
Дисперсия экспоненциальной средней D[St] определяется
выражением:
[
]
2
 ∞
2
 
D[S t ] = M (S t − a1 ) = M  α ∑ β i ε t −i   .
 
 i =0
Учитывая свойства εt, можно записать:
– 146 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
∞
α
i =0
2 −α
D[S t ] = α 2 ∑ β 2iσ 2 =
σ2 .
Таким образом,
D[S t ] =
α
2 −α
σ2
(8.4)
Так как 0 < α <1, то D[St] меньше дисперсии временного
ряда, равной σ2.
Из (8.4) видно, что при высоком значении α дисперсия
экспоненциальной средней незначительно отличается от дисперсии ряда. С уменьшением α дисперсия экспоненциальной
средней сокращается, возрастает ее отличие от дисперсии ряда.
Тем самым экспоненциальная средняя начинает играть роль
«фильтра», поглощающего колебания временного ряда.
Таким образом, с одной стороны, следует увеличивать вес
более свежих наблюдений, что может быть достигнуто повышением α, с другой стороны, для сглаживания случайных отклонений величину α нужно уменьшить. Эти два требования находятся в противоречии. Поиск компромиссного значения параметра
сглаживания α с учетом специфики решаемой задачи составляет
важную часть исследования.
Пример 8.1. Требуется рассчитать экспоненциальную
среднюю для временного ряда курса EURO с 2 октября 2006 г.
по 31 октября 2006 г. (табл.8.1). В качестве начального значения
экспоненциальной средней взять среднее значение пяти первых
уровней. Расчеты провести для трех различных значений параметров адаптации α = 0,2; α = 0,5; α = 0,8.
Сравнить исходный временной ряд и экспоненциально
сглаженные временные ряды при различных значениях параметра адаптации. Какой временной ряд носит более гладкий характер.
– 147 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 8.1. Экспоненциальные средние для временного ряда
курса EURO
Дата
t
Курс EURO
2 октября 2006 г.
3 октября 2006 г.
4 октября 2006 г.
5 октября 2006 г.
6 октября 2006 г.
7 октября 2006 г.
10 октября 2006 г.
11 октября 2006 г.
12 октября 2006 г.
13 октября 2006 г.
14 октября 2006 г.
17 октября 2006 г.
18 октября 2006 г.
19 октября 2006 г.
20 октября 2006 г.
21 октября 2006 г.
24 октября 2006 г.
25 октября 2006 г.
26 октября 2006 г.
27 октября 2006 г.
28 октября 2006 г.
31 октября 2006 г.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
33,9783
33,9651
34,1013
34,0745
34,0458
33,99
33,8757
33,8828
33,7945
33,7963
33,8393
33,7247
33,7588
33,7983
33,782
33,9048
33,8532
33,7603
33,8003
33,9272
33,9677
34,0284
Экспоненциальная средняя
α = 0,5
α = 0,8
34,02206 34,00565 33,98924
34,01067 33,98538 33,96993
34,02879 34,04334 34,07503
34,03794 34,05892 34,07461
34,03951 34,05236 34,05156
34,02961 34,02118 34,00231
33,99883 33,94844 33,90102
33,97562 33,91562 33,88644
33,9394
33,85506 33,81289
33,91078 33,82568 33,79962
33,89648 33,83249 33,83136
33,86213 33,77859 33,74603
33,84146
33,7687
33,75625
33,83283
33,7835
33,78989
33,82266 33,78275 33,78358
33,83909 33,84377 33,88056
33,84191 33,84849 33,85867
33,82559 33,80439 33,77997
33,82053 33,80235 33,79623
33,84187 33,86477 33,90101
33,86703 33,91624 33,95436
33,89931 33,97232 34,01359
α = 0,2
Решение
Определим S 0 =
1 5 .
∑ yt
5 i =1
Найдем значения экспоненциальной средней при α = 0,2.
Согласно (8.1)
S1 = αy1 + (1 – α)S0; S1 = 0,2⋅33,9783 + 0,8⋅34,033 = 34,0221;
S2 = αy2 + (1 – α)S1; S2 = 0,2⋅33,9651 + 0,8⋅34,0221 = 34,0107 и т.д.
Аналогичны вычисления для α = 0,5 и α = 0,8. Результаты
расчетов экспоненциально сглаженных рядов при различных
– 148 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значениях параметров адаптации представлены в табл.8.1.
На рис.8.1 наглядно проявляется характер сглаженного ряда. При α = 0,2 экспоненциальная средняя носит более гладкий
характер, так как в этом случае в наибольшей степени поглощаются случайные колебания временного ряда.
y
34,15
34,1
34,05
34
y
33,95
0,2
0,5
33,9
0,8
33,85
33,8
33,75
t
33,7
0
5
10
15
20
25
Рис.8.1. Экспоненциальное сглаживание временного ряда курса
EURO при различных значениях параметра адаптации
При использовании экспоненциальной средней для краткосрочного прогнозирования предполагается, что модель ряда
имеет вид:
yt =a1,t + εt,
(8.5)
где a1,t – варьирующий во времени средний уровень ряда; εt –
случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и постоянной дисперсией σ2.
Прогнозная модель определяется равенством:
yˆτ (t ) = aˆ1,t ,
(8.6)
где yˆτ (t ) – прогноз, сделанный в момент t на τ единиц времени
– 149 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(шагов) вперед; aˆ1,t – оценка a1,t.
Единственный параметр модели aˆ1,t определяется с помощью экспоненциальной средней:
aˆ1,t = S t ;
aˆ1,0 = S 0 .
Выражение (8.1) можно представить по-другому, перегруппировав члены:
St = St–1 + α(yt –St–1).
(8.7)
Величину (уt – St–1) можно рассматривать как погрешность
прогноза. Тогда новый прогноз S, получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом
и состоит адаптация модели.
При краткосрочном прогнозировании желательно как
можно быстрее отразить изменения ряда и в то же время очистить ряд, отфильтровав случайные колебания. Для этого величине α следует присвоить одно из промежуточных значений в
интервале от 0 до 1. Если в результате экспериментальных расчетов получено наилучшее значение α, близкое к 1, то целесообразно проверить правомерность выбора модели данного типа.
Р.Браун рекомендовал брать значения α в пределах 0,1-0,3. Во
многих работах некритически повторяются эти рекомендации.
Однако опыт практических исследований экономических временных рядов свидетельствует о том, что часто эти значения далеки от оптимальных.
Иногда поиск этого значения параметра осуществляется
путем перебора на сетке значений. В этом случае в качестве оптимального выбирается то значение α, при котором получена
наименьшая дисперсия ошибки. В большинстве эконометрических пакетов, например, «Мезозавр», «SPSS», «STATISTICA» и
др., при построении этих моделей предусмотрена удобная для
пользователя возможность реализации поиска значений параметров адаптации по предложенной схеме.
– 150 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следует отметить, что выбор значения параметра α должен
зависеть от периода упреждения прогноза. Для оперативных,
конъюнктурных прогнозов в большей степени должна учитываться свежая информация, поэтому значение α следует брать
большим. При увеличении срока прогнозирования более поздняя информация, последние данные должны иметь несколько
меньший вес, конъюнктурные колебания должны быть сглажены, но прошлые уровни – учтены. Для этих целей значение α
следует уменьшить.
Таким образом, экспоненциальное сглаживание является
примером самообучающейся модели. К ее безусловным достоинствам относится чрезвычайная простота вычислений, выполняемых итеративно, причем массив прошлой информации
уменьшен до единственного значения St–1.
Если для прогнозирования временного ряда, имеющего ярко выраженную линейную тенденцию, использовать подход
(8.6), опирающийся на модель экспоненциального сглаживания,
то модель, как правило, будет давать смещенные прогнозы, т. е.
систематическую ошибку. Для таких временных рядов целесообразно использовать модели линейного роста, также применяющие процедуру экспоненциального сглаживания.
В этих моделях прогноз может быть получен с помощью
следующего выражения:
yˆτ (t ) = aˆ1,t + aˆ 2,tτ
(8.8)
где aˆ1,t и aˆ 2,t – текущие оценки коэффициентов; t - время упреждения прогноза.
Наиболее известны три модели данного типа: двухпараметрическая Ч.Хольта, однопараметрическая Р.Брауна и трехпараметрическая Дж.Бокса и Г.Дженкинса, отличающиеся рекуррентными выражениями для пересчета текущих оценок коэффициентов.
В эконометрических пакетах чаще представлена модель
Ч.Хольта с возможностью выбора оптимальных параметров
адаптации по критерию минимума среднеквадратической ошиб– 151 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ки путем перебора на сетке возможных значений. Оценки коэффициентов в этой модели определяются с помощью выражений:
aˆ1,t = α1 yt + (1 − α1 ) ⋅ (aˆ1,t −1 + aˆ 2,t −1 ) ;
aˆ 2,t = α 2 ⋅ (aˆ1,t − aˆ1,t −1 ) + (1 − α 2 ) ⋅ aˆ 2,t −1 ;
где 0 < α1, α2 <1.
Понятие экспоненциальной средней можно обобщить в
случае экспоненциальных средних более высоких порядков.
Выравнивание p-го порядка:
S t( p ) = αS t( p −1) + βS t(−p1)
(8.9)
является простым экспоненциальным сглаживанием, примененным к результатам сглаживания (p-1)-го порядка.
Если предполагается, что тренд некоторого процесса может быть описан полиномом степени n, то коэффициенты предсказывающего полинома могут быть вычислены через экспоненциальные средние соответствующих порядков.
В случае, когда исследуемый процесс, состоящий из детерминированной и случайной компоненты, описывается полиномом n-го порядка, прогноз на τ шагов вперед осуществляется
по формуле:
1
1
yˆτ (t ) = aˆ1 + aˆ 2τ + aˆ 3τ 2 + K + aˆ n +1τ n
2
n!
(8.10)
где aˆ1 , aˆ 2 ,K, aˆ n +1 – оценки параметров.
Фундаментальная теорема метода экспоненциального
сглаживания и прогнозирования, впервые доказанная Р.Брауном
и Р.Майером, говорит о том, что (n + 1) неизвестных коэффициентов полинома n-го порядка aˆ1 , aˆ 2 ,K, aˆ n +1 могут быть оценены
с помощью линейных комбинаций экспоненциальных средних
S t(i ) где i = 1 ÷ (n + 1). Следовательно, задача сводится к вычислению экспоненциальных средних, порядок которых изменяется
от 1 до n + 1, а затем к переходу через их линейные комбинации
– к определению коэффициентов полинома. На практике обычно
– 152 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
используются полиномы не выше второго порядка. В приложении приведены формулы, необходимые для расчета по моделям
нулевого, первого и второго порядков.
Важная составная часть современных эконометрических
пакетов прикладных программ, ориентированных на решение
задач прогнозирования, – адаптивные тренд-сезонные модели.
Очевидно, что можно составить множество адаптивных сезонных моделей, перебирая различные комбинации типов тенденций в сочетании с сезонными эффектами аддитивного и мультипликативного вида. Выбор той или иной модели будет продиктован характером динамики исследуемого процесса.
В табл.8.2 представлены две наиболее часто используемые
на практике тренд-сезонные модели: модель Хольта-Уинтерса и
модель Тейла-Вейджа. Первая из этих моделей представляет собой объединение двухпараметрической модели линейного роста
Хольта и сезонной модели Уинтерса. Прогноз по модели Хольта-Уинтерса на τ шагов вперед определяется выражением:
yˆτ (t ) = (aˆ1,t + τaˆ 2,t ) ⋅ fˆt −l +τ
(8.11)
где aˆ1,t и aˆ 2,t – текущие оценки коэффициентов в модели линейного
роста;
τ – время упреждения прогноза;
fˆt , fˆt −1 ,K, fˆt −l +τ – мультипликативный сезонный фактор; l – количество фаз в полном сезонном цикле (для ежемесячных наблюдений l = 12, для квартальных – l = 4).
В качестве коэффициента сезонности в выражении (8.11)
берется его наиболее поздняя оценка, сделанная для аналогичной фазы цикла fˆt −l +τ .
Как видно из табл.8.2 оценки коэффициентов модифицируются по процедуре, аналогичной экспоненциальному сглаживанию. Оптимальные значения для параметров адаптации α1, α2,
α3 (0 < α1, α2, α3 <1) П.Уинтерс предлагал находить экспериментальным путем, перебирая возможные комбинации этих параметров на сетке значений. Критерием сравнения при этом выступает величина среднеквадратической ошибки.
– 153 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 8.2. Тренд-сезонные адаптивные модели
Основные
формулы
Вид модели
Модель линейного роста с
Модель линейного роста с аддимультипликативной сезоннотивной сезонностью
стью
(модель Тейла-Вейджа)
(модель Хольта-Уинтерса)
Оценка
текущих
y
aˆ1,t = α1 t + (1 − α1 )(aˆ1,t −1 + aˆ 2,t −1 ) aˆ1,t = α1 ( yt − gˆ t −l ) + (1 − α1 )(aˆ1,t −1 + aˆ2,t −1 )
коэфˆf
t −l
фици; aˆ 2,t = α 3 aˆ1,t − aˆ1,t −1 + (1 − α 3 )aˆ 2,t −1
;
aˆ 2 ,t = α 3 (aˆ1,t − aˆ1,t −1 ) + (1 − α 3 )aˆ 2 ,t −1
ентов
(
)
aˆ1,t ; aˆ 2,t
Оценка
сезонности
Модель
прогноза
y
fˆt = α 2 t + (1 − α 2 ) fˆt −l
aˆ1,t
gˆ t = α 2 ( yt − aˆ1,t ) + (1 − α 2 )gˆ t −l
yˆτ (t ) = (aˆ1,t + τaˆ 2,t ) fˆt −i +τ
yˆτ (t ) = aˆ1,t + aˆ 2,tτ + gˆ t −i+τ
Примером другого подхода – с аддитивной сезонностью –
может служить модель сезонных явлений с линейным ростом,
предложенная Г.Тейлом и С.Вейджем. Практическая значимость
этой модели объясняется не только тем, что в экономических
временных рядах довольно часто можно встретить этот тип динамики развития. Опыт проведения экспериментальных расчетов свидетельствует о том, что динамика многих экономических
показателей может быть описана с помощью модели, сочетающей в себе экспоненциальную тенденцию с мультипликативным
сезонным эффектом. Прологарифмировав исходный временной
ряд, на практике часто преобразуют экспоненциальную тенденцию в линейную и одновременно мультипликативный сезонный
эффект в аддитивный. Таким образом, динамику преобразованного показателя можно моделировать и прогнозировать с помощью модели Г.Тейла и С.Вейджа.
Прогноз на τ шагов вперед по этой тренд-сезонной модели,
– 154 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сочетающей линейный рост с аддитивной сезонностью, определяется выражением:
yˆτ (t ) = aˆ1,t + aˆ 2,tτ + gˆ t −l +τ
– 155 –
(8.12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложения
Приложение 1. Значения статистик Дарбина-Уотсона dL dU при
5%-ом уровне значимости.
n
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
k′′=1
dL
dU
0,61
1,4
0,7
1,36
0,76 1,33
0,82 1,32
0,88 1,32
0,93 1,32
0,97 1,33
1,01 1,34
1,05 1,35
1,08 1,36
1,10 1,37
1,13 1,38
1,16 1,39
1,18 1,40
1,20 1,41
1,22 1,42
1,24 1,43
1,26 1,44
1,27 1,45
1,29 1,45
1,30 1,46
1,32 1,47
1,33 1,48
1,34 1,48
1,35 1,49
k′′=2
dL
dU
–
–
0,47
–
0,56 1,78
0,63
1,7
0,7
1,64
0,66
1,6
0,81 1,58
0,86 1,56
0,91 1,55
0,95 1,54
0,98 1,54
1,02 1,54
1,05 1,53
1,08 1,53
1,10 1,54
1,13 1,54
1,15 1,54
1,17 1,54
1,19 1,55
1,21 1,55
1,22 1,55
1,24 1,56
1,26 1,56
1,27 1,56
1,28 1,57
k′′=3
dL
dU
–
–
–
–
0,37 2,29
0,46 2,13
0,53 2,02
0,6
1,93
0,66 1,86
0,72 1,82
0,77 1,78
0,82 1,75
0,86 1,73
0,90 1,71
0,93 1,69
0,97 1,68
1,00 1,68
1,03 1,67
1,05 1,66
1,08 1,66
1,10 1,66
1,12 1,66
1,14 1,65
1,16 1,65
1,18 1,65
1,20 1,65
1,21 1,65
– 156 –
k′′=4
dL
dU
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
0,69 1,97
0,74 1,93
0,78 1,90
0,82 1,87
0,86 1,85
0,90 1,83
0,93 1,81
0,96 1,80
0,99 1,79
1,01 1,78
1,04 1,77
1,06 1,76
1,08 1,76
1,10 1,75
1,12 1,74
1,14 1,74
k′′=5
dL
dU
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
0,56 2,21
0,62 2,15
0,67 2,10
0,71 2,06
0,75 2,02
0,79 1,99
0,83 1,96
0,86 1,94
0,90 1,92
0,93 1,90
0,95 1,89
0,98 1,88
1,01 1,86
1,03 1,85
1,05 1,84
1,07 1,83
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Библиографический список
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика.
Основы эконометрики: Учебник.– М.: ЮНИТИ-ДАНА, 2001.–
432 с.
2. Аксянова А.В., Валеев Н.Н., Гумеров Ас.М. Теория и
практика статистики.– М.: КолосС, 2008.– 284 с.
3. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование.– М.: Финансы и статистика, 2001.– 234
с.
4. Глущенко В.В. Прогнозирование –2-е изд., Испр. и доп.
–СПб: СПГУВК, 1999.–245 с.
5. Гранберг А.Г. Статистическое моделирование и прогнозирование, Учебное пoсобие, M. – 1990.– 228 с.
6. Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике.– М.: Статистика, 1972.– 436 с.
7.
Дуброва
Т.А.
Прогнозирование
социальноэкономических процессов. Статистические методы и модели:
учеб. пособие / Т.А.Дуброва.– М.: Маркет ДС, 2007.– 192 с.
(Университетская серия).
8. Дуброва T.А., Архипова M.Ю. Статистические методы
прогнозирования в экономике, M. – 2004.– 188 с.
9. Лукашин Ю.П. Адаптивные методы краткосрочного
прогнозирования временных рядов.– М.: Финансы и статистика,
2003.– 316 с.
10. Четыркин Е.М. Статистические методы прогнозирования.– М.: Статистика, 1977.– 199 с.
11.
Эконометрика:
Учебник
/
И.И.Елисеева,
С.В.Курышева, Т.В.Костеева и др.;Под ред. И.И.Елисеевой.– М.:
Финансы и статистика, 2005.– 576 с.
– 157 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Введение ............................................................................................ 1
В.1. Типы экономических прогнозов.............................................. 4
В.2. Основные элементы временного ряда ................................ 6
1. Автокорреляция уровней временного ряда и выявление его
структуры .......................................................................................... 9
1.1. Практические примеры ....................................................... 16
Практический пример 1.1 ...................................................... 16
Практический пример 1.2 ...................................................... 19
2. Моделирование тенденции временного ряда........................... 21
2.1. Практические примеры ....................................................... 27
Практический пример 2.1 ...................................................... 27
3. Моделирование сезонных и циклических колебаний......... 29
3.1. Аддитивная модель временного ряда ................................ 31
3.2. Мультипликативная модель временного ряда.................. 36
3.3. Использование сезонных моделей для прогноза.............. 41
3.4. Практические примеры ....................................................... 43
Практический пример 3.1 ...................................................... 43
Практический пример 3.2 ...................................................... 47
4. Применение фиктивных переменных для моделирования
сезонных колебаний ....................................................................... 51
4.1. Практические примеры ....................................................... 55
Практический пример 4.1 ...................................................... 55
5. Моделирование тенденции временного ряда....................... 59
при наличии структурных изменений ...................................... 59
5.1. Практические примеры ....................................................... 71
Практический пример 5.1 ...................................................... 71
Практический пример 5.2 ...................................................... 76
6. Динамические эконометрические модели................................ 80
6.1. Общая характеристика моделей с распределенным лагом
и моделей авторегрессии ........................................................... 80
6.2. Интерпретация параметров моделей ................................. 83
с распределенным лагом и моделей авторегрессии ................ 83
– 158 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6.3. Изучение структуры лага и выбор вида модели с
распределенным лагом............................................................... 88
6.3.1. Лаги Алмон ................................................................... 90
6.3.2. Метод Койка.................................................................. 99
7. Изучение взаимосвязей временных рядов ............................. 104
7.1. Методы исключения тенденции........................................... 106
7.1.1. Метод отклонений от тренда..................................... 107
7.1.2. Метод последовательных разностей......................... 111
7.2. Методы исключения фактора времени............................ 114
7.2.1.Представление исходного ряда в виде тренда .......... 114
7.2.2. Включение в модель регрессии фактора времени... 118
7.3. Автокорреляция в остатках. ............................................. 120
Критерий Дарбина-Уотсона..................................................... 120
7.3.1. Определение критерия Дарбина-Уотсона ................ 120
7.3.2. Оценивание параметров уравнения регрессии ........ 127
при наличии автокорреляции в остатках............................ 127
7.4. Коинтеграция временных рядов....................................... 134
7.5. Модель распределенных лагов......................................... 139
8. Адаптивные методы прогнозирования................................... 142
8.1. Применение адаптивных методов.................................... 142
при краткосрочном прогнозировании .................................... 142
Приложения................................................................................... 156
Библиографический список ......................................................... 157
– 159 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ответственный за выпуск Е.А.Харитонов.
Лицензия № 020404 от 6.03.97 г.
Подписано в печать
Бумага писчая.
9,5 уч.-изд. л.
Печать офсетная
Тираж 200 экз.
Формат 60∗84 1/16
10 усл. печ. л.
Заказ «С»
Издательство Казанского государственного технологического
университета
Офсетная лаборатория Казанского государственного
технологического университета
420015, Казань, К.Маркса, 68.
– 160 –
Документ
Категория
Без категории
Просмотров
54
Размер файла
970 Кб
Теги
638
1/--страниц
Пожаловаться на содержимое документа