close

Вход

Забыли?

вход по аккаунту

?

Методика определения оптимальной мощности обучающих данных в условиях ограниченности временного ряда.

код для вставкиСкачать
Математика и механика
МАТЕМАТИКА И МЕХАНИКА
УДК 519.248
М.В. Крючков
МЕТОДИКА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОЙ МОЩНОСТИ ОБУЧАЮЩИХ ДАННЫХ
В УСЛОВИЯХ ОГРАНИЧЕННОСТИ ВРЕМЕННОГО РЯДА
Предложена методика определения длины временного ряда, достаточной
для построения эффективной модели прогнозирования дальнейших его значений.
В дополнение к теоретическим выкладкам проведен численный эксперимент по
анализу длин доверительных интервалов частоты верных прогнозов, подтверждающий справедливость применения указанной методики.
Временной ряд, обучающая выборка, прогнозирование
M.V. Kryuchkov
A METHOD FOR DETERMINING OPTIMUM CAPACITY OF THE TRAINING DATA
UNDER LIMITED TIME SERIES
The paper proposes new methods developed to determine the length of time series
adequate for the construction of an effective model used to predict its further values. In
addition to theoretical statements, a numerical experiment was conducted to analyze the
length of confidence intervals relating reliable estimates, which confirm the relevance of
proposed methodology.
Time series, training data, forecasting
Рассмотрим систему, функционирующую в определенный дискретный промежуток времени.
Для прогнозирования свойств системы необходимо определить количество наблюдений за ней, достаточное для построения эффективной прогностической модели (ЭПМ) [1]. Под эффективностью
подразумевается способность осуществлять прогноз с точностью (вероятностью) не меньшей априорно заданной. Если для построения модели использовать малое количество наблюдений за объектом, то остается большой временной интервал для моделирования результатов с их последующим
применением, однако возникают сложности настройки, и страдает точность прогноза. Для модели же,
построенной по большой последовательности входных данных, зачастую не остается достаточного
количества времени для ее применения, либо предложенные результаты не могут быть применены
из-за возникающих краткосрочных рисков.
Утверждение: для построения ЭПМ, использующей в качестве входных данных l значений
N 
ограниченного временного ряда, достаточно положить l =   , где N – объем генеральной совокупe
ности наблюдаемой величины (N>25), e ≈ 2.7183 – число Эйлера.
Доказательство. Обозначим события: {Al } – для построения ЭПМ достаточно использовать
l первых значений временного ряда; {Bl } – для построения ЭПМ таких значений требуется больше,
чем l. Идея доказательства будет заключаться в том, чтобы найти такое значение l, начиная с которого для вероятностей соответствующих событий выполняется неравенство p{Al } ≥ p{Bl } .
Проведем серию рассуждений, необходимую для нахождения p{Al } . Для начала заметим,
что p{AN } = 1 , т.е. вероятность построить ЭПМ по всем данным ряда считаем равной 1. Выражение
7
Вестник СГТУ. 2014. № 2 (75)
p{AN −1 } = 1 −
1 N −1
=
N
N
(1)
означает, что вероятность построения ЭПМ по N-1 значению отличается от 1 на вероятность неверно
спрогнозировать 1 элемент (с номером N). Выберем (1) в качестве базы индукции для доказательства
общего вида формулы p{Al } . Далее предположим
{
p{AN − s ) } =
}
N −s
N
(2)
тогда p AN − ( s +1) может быть вычислено как произведение вероятностей того, что по N-(s+1) строится ЭПМ для прогнозирования N-s элемента, которая в то же время является ЭПМ для всего ряда, т.е.
исходя из базового утверждения и индукционного предположения может быть найдена по формуле
1  N − s N − ( s + 1)

.
p{AN −( s +1)) } = 1 −
=
⋅
N
 N −s N
Таким образом, показано, что формула
p{Al } =
(3)
l
N
(4)
справедлива для базового случая, а из предположения ее вида для s наблюдений следует вывод о
справедливости формулы для s+1 значений, что согласно принципам математической индукции означает ее доказанность.
Рассмотрим далее алгоритм нахождения p{Bl } . Для начала заметим, что p{B N } = 0 , т.е. вероятность того, что для построения ЭПМ требуется более N наблюдений, равна нулю. Выражение
p{BN −1 } =
1
N
(5)
означает, что вероятность построить ЭПМ более чем по N-1 значению равна вероятности неверного
прогнозирования последнего элемента. Выбираем (5) в качестве базового выражения и индуктивно
предполагаем
1
1
l  1
(6)
⋅
+
+ ... +  .
N  N −1 N − 2
l
Рассмотрим полную группу событий {H1 , H 2 }: H 1 означает, что l наблюдений достаточно
p{Bl } =
для построения ЭПМ, а H 2 – недостаточно, причем p{H 1 } = , а p{H 2 } = 1 − =
1
l
1
l
l −1
. Тогда по
l
формуле полной вероятности имеем
1 l l −1  1
1
1
p{Bl −1 } = p{H 1 }⋅ p{Al } + p{H 2 }⋅ p{Bl } = ⋅ +
⋅
+
+ ... +  =
l N
l  N −1 N − 2
l
(7)
l −1
l −1  1
1
1 l −1  1
1
1
1 
=
+
⋅
+
+ ... +  =
⋅
+
+ ... + +

N (l − 1)
N  N −1 N − 2
l
N  N −1 N − 2
l l − 1
Последнее выражение подтверждает справедливость формулы (6) на случай l-1, что, согласно
принципам математической индукции, является ее доказательством.
Для завершения доказательства осталось решить неравенство p{Al } ≥ p{Bl } относительно l.
В силу положительности рассматриваемых величин запишем
p{Al }
1
1
1
(8)
=
+
+ ... + ≥ 1 .
p{Bl } N − 1 N − 2
l
Выражение в левой части неравенства (8) представляет собой разность частичных сумм гар-
 N −1 1   l −1 1 
∑  −  ∑  . Воспользуемся асимптотическим разложением
 i =1 i   i =1 i 
монического ряда S N −1 − S l −1 = 
суммы n первых членов гармонического ряда [2], предложенным Л. Эйлером:
S n = ln(n) + γ + en ,
8
(9)
Математика и механика
где γ = 0.5772 – постоянная Эйлера-Маскерони, en – бесконечно малая величина, причем при n>25
разность между асимптотическим разложением и точным значением частичной суммы не превосходит 0.5% [3]. Воспользовавшись формулой (9), пренебрегая малыми величинами, имеем
N
ln(N ) + γ + e N − ln(l ) − γ − el > 1 ⇒ ln  > 1 .
 l 
(10)
Потенцируя последнее неравенство и выражая l, окончательно имеем l <
N
; утверждение
e
доказано.
Представленные выше теоретические выкладки в полной мере справедливы для случайного набора
данных, но в практической деятельности, как правило, приходится иметь дело с псевдослучайными величинами либо с неизвестными законами распределения. Для нахождения оптимальной длины временного ряда,
достаточной для построения ЭПМ, предложим следующую методику. Пусть состояния системы описываются булевым n-компонентным вектором a = {a1 , a 2 ,..., a N }, ai ∈ {0;1}, i = 1, N , каждая из которых
псевдослучайна: принимает значение 1 с вероятностью p и 0 с (1-p). На каждом временном шаге
находим границы двустороннего доверительного интервала доли признака при известном объеме генеральной совокупности [4] при заданном уровне доверия γ по формуле
w − t γ [ N (0;1)] ⋅
w(1 − w) N − n
w(1 − w) N − n
,
⋅
< p < w + t γ [ N (0;1)] ⋅
⋅
n
N −1
n
N −1
где m – число появлений 1, w =
уровня
Φ (x) =
γ
1
2π
функции
x
⋅ ∫e
−
(11),
m
– соответствующая частость, t γ [N (0;1)] – двусторонний квантиль
n
стандартного
нормального
распределения,
задаваемой
формулой
2
t
2
dt . Критерием выбора точки останова в данном случае должны являться показа-
−∞
тели изменения длины построенного доверительного интервала. Оценить эту величину можно двумя
способами: визуально или с помощью разностного аналога [5] второй производной
∂ 2 u u i +1 − 2u i + u i −1
. Равенство второй производной нулю можно интерпретировать, как отсут≈
∂x 2
∆x 2
ствие скорости изменения длины интервала.
Для проведения конкретного численного эксперимента была сгенерирована псевдослучайная
выборка, задающая указанный вектор a для случая N=500 и p=0,6. По результатам численного эксперимента проводилось исследование зависимости от номера шага разности между границами доверительных интервалов (рис. 1) в условиях эмпирического становления вероятности, а также конечноразностный аналог второй производной длины интервала (рис. 2).
Рис. 1. Длины доверительных интервалов
9
Вестник СГТУ. 2014. № 2 (75)
Рис. 2. Численный аналог второй производной
Из первого графика видно, что качественное изменение длины доверительного интервала
прекращается на 170-190 шаге, что подтверждается графиком конечно-разностного аналога второй
производной, построенного для наглядности с интервалом в 6 шагов – устойчивый выход на 0 соответствует значению аргумента примерно равного 30 (т.е. 180 шагам). Следует отметить, что для данного эксперимента  N  =  500  = 184 , что в полной мере подтверждает справедливость теоретиче e 
 e 
ских выводов. Для других значений N и p данные эксперимента также с большой точностью совпадали с результатами, предложенными в теории.
ЛИТЕРАТУРА
1. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов /
Ю.П. Лукашин. М.: Финансы и статистика, 2003. 451 с.
2. Математический анализ. Функции, пределы, ряды, цепные дроби / В.Л. Данилов и др. М.:
Физматгиз, 1961. 439 с.
3. Гармонический ряд: теоретико-числовые свойства частичных сумм [Электронный ресурс] //
Omop.su: Универсальная Энциклопедия. URL: http://omop.su/628652.html (дата обращения:
22.02.2014).
4. Кремер Н.Ш. Теория вероятностей и математическая статистика: учеб. для вузов / Н.Ш.
Кремер. М.: ЮНИТИ-ДАНА, 2004. 573 с.
5. Самарский А.А. Теория разностных схем / А.А. Самарский. М.: Наука, 1989. 616 с.
Крючков Михаил Викторович –
преподаватель кафедры высшей математики
Пермского филиала федерального государственного
автономного образовательного учреждения
высшего профессионального образования
Национальный исследовательский университет
«Высшая школа экономики»
Mikhail V. Kryuchkov –
Lecturer
Department of Higher Mathematics
National Research University
Higher School of Economics
Perm branch
Статья поступила в редакцию 15.03.14, принята к опубликованию 20.06.14
10
Документ
Категория
Без категории
Просмотров
6
Размер файла
159 Кб
Теги
ограниченности, оптимальное, условия, методика, обучающихся, данных, определение, мощности, ряда, временного
1/--страниц
Пожаловаться на содержимое документа