close

Вход

Забыли?

вход по аккаунту

?

Alekseev

код для вставкиСкачать
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего профессионального образования
Санкт-Петербургский государственный университет аэрокосмического приборостроения
А. В. Алексеев
КОМПЬЮТЕРНАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
Учебное пособие
Санкт-Петербург 2010
УДК 004.91
ББК 32.973.202
А47
Рецензенты:
кафедра морского приборостроения СПбМТУ (зав. кафедры доктор технических наук, профессор Е. П. Носов);
доктор технических наук Э. А. Пиль
Утверждено редакционно-издательским советом университета
в качестве учебного пособия
Алексеев, А. В.
А47 Компьютерная обработка результатов эксперимента: учебное пособие / А. В. Алексеев. – СПб.: ГУАП, 2010. – 60 с.: ил.
ISBN 978-5-8088-0591-0
В учебном пособии по дисциплине «Компьютерная обработка
результатов эксперимента» излагаются методы практического подхода при анализе вероятностных характеристик нестационарных
случайных процессов – результатов измерений, полученных при
проведении эксперимента.
Предназначено для студентов специальности 230104 «Системы
автоматизированного проектирования» всех форм обучения.
УДК 004.91
ББК 32.973.202
Учебное издание
Алексеев Анатолий Васильевич
КОМПЬЮТЕРНАЯ ОБРАБОТКА
РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
Учебное пособие
Редактор Г. Д. Бакастова
Верстальщик С. Б. Мацапура
Сдано в набор 27.12.10. Подписано к печати 31.12.12.
Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 3,48.
Уч.-изд. л. 3,65. Тираж 100 экз. Заказ № 621.
Редакционно-издательский центр ГУАП
190000, Санкт-Петербург, Б. Морская ул., 67
ISBN 978-5-8088-0591-0
© Санкт-Петербургский государственный университет аэрокосмического приборостроения (ГУАП), 2010
© А. В. Алексеев, 2010
Предисловие
В практике анализа различных физических явлений при проведении эксперимента в результате испытаний (исследовательских, проверочных и т. д.) технических систем на современном этапе научно-технического прогресса получили широкое распространение методы теории вероятности и математической статистики.
При решении ряда научно-технических задач одной из важнейших можно отметить
задачу повышения качества, надёжности, производительности и гибкости подсистем сбора и обработки информации, позволяющих проводить комплексный статистический анализ случайных процессов.
Весьма важной является задача статистического анализа при автоматизации исследований и испытаний сложных систем автоматического управления подвижных
объектов, в частности электромеханических приборов, поскольку их сложность и
требования, предъявляемые к ним по точности, надежности и долговечности непрерывно возрастают. Под электромеханическими приборами (ЭМП) понимается
широкий класс приборов, включая роботы-манипуляторы, электромеханические
приводы, акселерометры, гироскопические устройства. Оказывается уже недостаточным оценивать их поведение при системе действующих сил, моментов и возмущений, пользуясь детерминированными и вероятностными математическими моделями, основанными только на теории стационарных случайных процессов (СП). Не
учёт нестационарности СП, проявляющейся, как правило, в зависимости среднего
значения и дисперсии процесса от времени при оценивании значений вероятностных характеристик (ВХ) процесса, зачастую приводит к возникновению сколь угодно больших погрешностей измерения и неправильной интерпретации полученных
результатов.
Несмотря на то, что на сегодня имеются работы по обработке нестационарных
случайных процессов (НСП), в этой области существует целый ряд проблем. Они
связаны с выявлением характера нестационарности, алгоритмизацией обработки
НСП и, что особенно важно, доведением до прикладных программ на языках высокого уровня типа С++, практически внедряемых в промышленности. Поэтому необходимо изучение существующих инженерных методов и алгоритмов статистической обработки НСП, характерных при исследовании и испытании ЭМП.
Отметим основные свойства этого класса НСП:
– нестационарность, которая проявляется, как правило, в зависимости математического ожидания и дисперсии от времени;
– анализ вероятностных характеристик НСП по одной выборочной реализации;
– отсутствие полной априорной информации об объекте исследования.
Таким образом, при проведении научно-технического эксперимента с помощью
комплекса программных средств должен базироваться на методах, позволяющих
при наличии всего одной выборочной реализации исследуемого процесса:
– обеспечить допустимую погрешность вычисления ВХ;
– выявить законы изменения присутствующих в процессе детерминированных
составляющих;
– произвести статистическую обработку в условиях априорной неопределенности относительно вида некоторых ВХ;
– произвести оперативный анализ ВХ.
В предлагаемом учебном пособии рассматривается материал, позволяющий организовать целенаправленный подбор практических методов и подходов с целью
получения требуемых ВХ исследуемого НСП. Практические методы позволяют с
помощью современных средств программирования получить компьютерную обработку результатов эксперимента применительно к средствам автоматизации испытаний на конкретном промышленном предприятии.
3
1. МЕСТО ЭКСПЕРИМЕНТА
В ПРОЦЕССЕ ПРОЕКТИРОВАНИЯ
Анализ процесса проектирования технических систем (ТС) показывает, что наибольший вес по трудоёмкости и значимости имеют проектные процедуры, связанные с испытанием макетов, экспериментальных и опытных образцов. Возросшие требования к ТС,
связанные с ростом их сложности и выполняемой функциональной
нагрузкой, приводят к значительному усложнению и увеличению
испытаний.
При создании, проектировании ТС наиболее надёжным способом проверки новых идей и конструкторских решений является
эксперимент, проводимый на всех этапах проектирования. К экспериментальным исследованиям относятся исследования различного рода моделей, в том числе и реализованными средствами вычислительной техники. Эксперимент позволяет снизить затраты и
сократить время на проведение испытаний.
1.1. Понятие испытания
В соответствии с ГОСТ 16504–81 «Система государственных испытаний продукции. Испытания и контроль качества продукции.
Основные термины и определения» под испытаниями понимают
экспериментальное определение количественных и (или) качественных характеристик свойств объекта испытаний как результата воздействия на него при его функционировании, при моделировании объекта и (или) воздействии.
Экспериментальное определение характеристик свойств объекта при испытаниях может проводиться путём использования измерений, анализов, регистрации определённых событий при испытании (отказы, повреждения и т. д.).
Характеристики свойств объекта при испытаниях могут оцениваться, если задачей испытаний является получение количественных или качественных оценок, и могут контролироваться, если
задачей испытаний является только установление соответствия характеристик объекта заданным требованиям. В последнем случае
испытания являются контрольными.
Важнейшим признаком испытаний является принятие на основе
их результатов определённых решений. Другим признаком испы4
таний является задание определённых условий испытаний (реальных или моделируемых), под которыми понимается совокупность
воздействий на объект и режимов функционирования объекта.
Место испытаний в проектном процессе
Рассмотрим типовой процесс проектирования ТС (рис. 1) и, не
раскрывая содержания стадий разработки, покажем в каждой из
них наличие проектных процедур, связанных с испытаниями.
Из анализа процесса проектирования ТС видно, что испытание
макетов начинается уже на первых этапах процесса проектирования, а испытаниями опытных образцов завершается процесс проектирования. При этом переход от одной стадии проектирования
к следующей происходит, если успешно проведены испытания.
В случае несоответствия требованиям ТЗ предыдущие стадии проектирования повторяются. Поэтому главной целью испытаний,
осуществляемых при проектировании ТС, является объективная
оценка новых идей, концепций и технических характеристик, а
также совершенствование проектных решений.
Эта цель достигается решением следующих задач:
1. Сбор данных о свойствах проектируемой ТС и сравнение их с
физическими представлениями о функционировании ТС.
2. Экспериментальная проверка и уточнение характеристик ТС,
полученных с помощью расчётов.
3. Экспериментальная оценка качества принимаемых проектных решений и пути их улучшения.
4. Оценка и отбор существенных факторов, влияющих на функционирование ТС.
1.2. Подсистема испытания в САПР
Снижение затрат на испытания ТС и исключение наиболее дорогих и тяжёлых проектных процедур испытаний (ППИ) может
быть обеспечено за счёт оснащения проектировщика-испытателя
инструментами, позволяющими автоматизировать ППИ.
На разработку систем автоматизации ППИ ведущими зарубежными фирмами, производящими, например, бортовое приборное
оборудование, затрачивается до 15 % от общего объёма ассигнований, выделяемых на разработку новых ТС. Автоматизация ППИ
5
ªË¹½ÁØ
«¾ÎÆÁоÊÃǾÀ¹½¹ÆÁ¾« ¨É¾½»¹ÉÁ˾ÄÕÆÔ»¹ÉÁ¹ÆË« ªË¹½ÁØ
«¾ÎÆÁоÊÃǾÈɾ½ÄÇ¿¾ÆÁ¾
¹»¹ÆÈÉǾÃË
¡ÊÈÔ˹ÆÁØÁÊÊľ½Ç»¹Ë¾ÄÕÊÃÁ¾Åǽ¾Ä¾Â
ŹþËÇ»ÈÉÇËÇËÁÈÇ»
§ÃÇÆй˾ÄÕÆÔ»¹ÉÁ¹ÆË« ªË¹½ÁØ
¶ÊÃÁÀÆÔÂÈÉǾÃË
¡ÊÈÔ˹ÆÁØÁÊÊľ½Ç»¹Ë¾ÄÕÊÃÁ¾Åǽ¾Ä¾Â
ŹþËÇ»ÈÉÇËÇËÁÈǻ˾ÎÆÇÄǼÁоÊÃÁÎ
ǺɹÀÏÇ»
¨ÉÁÆÏÁÈÁ¹ÄÕƹØÊξŹ
ªË¹½ÁØ
«¾ÎÆÁоÊÃǾÁɹºÇо¾ÈÉǾÃËÁÉÇ»¹ÆÁ¾
¡ÊÈÔ˹ÆÁ¾Å¹Ã¾ËÇ»
ªË¹½ÁØ
¡À¼ÇËǻľÆÁ¾ÇÈÔËÆǼÇǺɹÀϹ
ªË¹½ÁØ
¡ÊÈÔ˹ÆÁ¾ÇÈÔËÆǼÇǺɹÀϹ
«¾ÎÆÁоÊùؽÇÃÌžÆ˹ÏÁØ
Рис. 1
должна проводиться в рамках САПР и требует выделения этих задач, в силу их специфики, в отдельную подсистему.
Подсистема испытания – это сложный человеко-машинный
организационно-технический комплекс, предназначенный для
6
обеспечения максимально возможного в данных условиях уровня
автоматизации ППИ. Подсистема испытания включает в себя все
7 компонентов: технические средства, математическое, программное, лингвистическое, информационное, методическое и организационное обеспечения. Подсистема испытания предназначена для
автоматизации ППИ на всех этапах проектирования, начиная от
испытания макетов до испытания опытных образцов.
При разработке подсистемы испытания полезно учитывать ряд
принципов её построения.
Принцип «инструмент за инструментом». Предполагает тщательно продуманный набор разрабатываемых в рамках подсистемы
испытания «инструментов» с предварительным выбором последовательности их ввода в эксплуатацию. Необходимая для этого информация получается:
– в результате предварительного обследования проектного предприятия и получения модели взаимодействия проектных процедур;
– комплексного анализа как объекта испытания, так и формализации и алгоритмизации технологии ППИ.
Принцип «иерархичности». Разбиение структуры подсистемы
испытания, как и структуры САПР по принципу иерархичности.
Это позволяет существенно сократить потоки информации старших
уровней (агрегация информации), рационально распределить управляющие функции между отдельными частями подсистемы, делает
подсистему гибкой и адаптивной к условиям функционирования.
Удобно представить подсистему испытания трёхуровневой иерархической схемой, объединённой в вычислительную сеть. На верхнем
уровне находится вычислитель, который обеспечивает: управление
подсистемой испытания; приём и обработку больших потоков данных испытаний; создание базы данных подсистемы испытания;
связь с другими подсистемами САПР. На среднем уровне находятся
терминальные станции испытателей, которые служат: для управления процессом испытания; оперативной обработки результатов испытания; управления функционированием технических средств испытаний. На нижнем уровне строится проблемно-ориентированная
моделирующая система, которая включает: микропроцессорные
средства; измерительные средства; динамические моделирующие
стенды, обеспечивающие соответствующие механические перемещения объекта испытания; средства задания сигналов и имитаторы
воздействий. Проблемно-ориентированная моделирующая система
должна обеспечить решение следующих задач:
7
– поддержание заданных режимов функционирования объекта
испытания;
– формирование испытательных возмущающих воздействий
на объект испытания как детерминированных – периодических,
импульсных и произвольной формы, так и стационарных или нестационарных случайных процессов с заданными вероятностными
характеристиками;
– управление процессом испытания в части формирования законов управления исполнительными механизмами стендового оборудования;
– физическое воспроизведение внешних воздействий со стороны
стендового оборудования на реальную аппаратуру ТС;
– аналого-цифровое и цифроаналоговое преобразование данных
испытаний;
– обработку результатов испытаний в части опроса измерительных приборов.
Принцип «модульности». Предполагает построение подсистемы испытания из конструктивных и программных модулей, каждый из которых выполняет законченную функцию. Модули сконструированы и устроены так, что они легко стыкуются между собой
в различных вариантах (агрегация структуры).
Принцип «интеллектуальности и адаптации». По мере совершенствования средств САПР всё большее число интеллектуальной
работы проектировщика-испытателя передаётся инструментам
подсистемы испытания: построение математической модели объекта испытания; анализ результатов испытания; моделирование;
экспертные подсистемы. Быстрое изменение номенклатуры и условий работы ТС приводит к необходимости приспосабливать инструменты испытателя к возникающим вновь процедурам испытателя.
Поэтому принцип адаптации должен быть сразу заложен в инструменты подсистемы испытания.
Принцип «многоязычности». Предполагает многоязычность
«входных» и «выходных» информационных потоков подсистемы испытания в соответствии с естественными языками и диалектами проектировщиков-испытателей в их предметной обла- сти.
Принцип «единства». Предполагает единство информационной
базы подсистемы испытания, что позволяет обеспечить хранение
данных об испытаниях не только на этапе проектирования, но и на
этапах изготовления, настройки и эксплуатации ТС.
8
§Èɾ½¾Ä¾ÆÁ¾À¹½¹ÐÁÁÊÈÔ˹ÆÁØ
ÁÀ
¨ÇÊËÉǾÆÁ¾Å¹Ë¾Å¹ËÁоÊÃÇÂ
Åǽ¾ÄÁǺӾÃ˹ÁÊÈÔ˹ÆÁØ
ÁÀ
»
»
»
©¹ÀɹºÇËùÈÉǼɹÅÅÔ
ÁžËǽÁÃÁÁÊÈÔ˹ÆÁØ
ÁÀ
ÁÀ
§ÊƹҾÆÁ¾ÁÊÈÔ˹ÆÁØ
»
»
»
»
»
ÁÀ
ÁÀ
ÁÀ
ÁÀ
ÁÀ
™»ËÇŹËÁÀ¹ÏÁØÁÊÈÔ˹ÆÁØ
¥¾ËǽÔÁÊÈÔ˹ÆÁØ
¨Ä¹ÆÁÉÇ»¹ÆÁ¾ÁÊÈÔ˹ÆÁØ
»
»
»
»
ÁÀ
¨ÉÇ»¾½¾ÆÁ¾ÁÊÈÔ˹ÆÁØ
»
ÁÀ
»
ÁÀ
ÁÀ
ÁÀ
§ºÉ¹ºÇËù
ɾÀÌÄÕ˹ËÇ»ÁÊÈÔ˹ÆÁØ
ÁÀ
™Æ¹ÄÁÀɾÀÌÄÕ˹ËÇ»ÁÊÈÔ˹ÆÁØ
ÁÀ
¨ÉÁÆØËÁ¾É¾Ñ¾ÆÁÂ
ÁÀ
»
»
»
ÁÀ
ÁÀ
»
»
›ÔÎǽƹؽÇÃÌžÆ˹ÏÁØ
Рис. 2
На рис. 2 приведена типовая блок-схема процесса автоматизации испытания ТС, между элементами которой имеются связи:
1 – возможные варианты решений; 2 – требования на построение
математической модели объекта испытания, математической мо9
дели подсистемы испытания; 3 – выбор последовательности, видов и продолжительности испытания; 4 – выбор технического обеспечения испытания; 5 – разработка программного обеспечения;
6 – требования обеспечения единства и требуемой точности проведения испытания; 7 – выбор испытательного оборудования, динамических моделирующих стендов; 8 – выбор оптимального плана
проведения испытания; 9 – требования к статистической обработке
результатов испытания; 10 – выбор критериев оценки результатов
испытания; 11 – требования к анализу результатов испытания; 12 –
исходные данные об объекте испытания, виды испытания, оцениваемые параметры при проведении испытания; 13 – технические
средства для проведения испытания; 14 – методы испытания, условия проведения испытания; 15 – организация, последовательность,
объём испытания; 16 – порядок проведения и представления данных испытания; 17 – оперативный учёт и контроль; 18 – порядок
статистической обработки данных испытания; 19 – порядок оценки
результатов испытания; 20 – правила принятия решения
Рекомендуемая литература
1. Сольницев Р. И. Основы автоматизации проектирования гироскопических систем. М.: Высш. шк., 1985.
2. Испытания радиоэлектронной, электронно-вычислительной аппаратуры и испытательное оборудование: учеб. пособие для вузов / О. П. Глудкин, А. И. Енгалычев, А. И. Коробков, Ю. В. Трегубов; под ред.А. И. Коробкова. М.: Радио и связь, 1987.
3. Адгамов Р. И., Берхеев М. М., Заляев И. А. Автоматизированные испытания в авиостроении. М.: Машиностроение, 1989.
4. Дубиновский А. М., Панков Э. Д. Стендовые испытания и регулировка оптико-электронных приборов. Л.: Машиностроение, 1986.
10
2. ПЛАНИРОВАНИЕ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ
РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
2.1. Анализ и обработка результатов наблюдений
Случайная величина
Случайная величина (СВ) – это величина, измеряемая в эксперименте [1, 2]. Случайная величина полностью определена, если
известен исход эксперимента. Примером СВ может служить погрешность измерения.
Непрерывной СВ называется такая, которая может принимать
любое числовое значение в заданном интервале и для которой при
любом x из этого интервала существует предел
f (x) = lim [(P(x < X < x + ∆x) / ∆x],
∆x→0
именуемый плотностью вероятностей.
Дискретной СВ называется такая, которая принимает различные конечные значения в заданном интервале и может характеризоваться рядом распределения всех возможных значений xi и соответствующих им вероятностей
pi = P(X = xi).
В качестве числовых характеристик СВ, как правило, используются:
1. Математическое ожидание (МО) СВ
n
+∞
i=1
−∞
X = M [X] = ∑ xi pi ; X =
∫
xf (x)dx,
при этом МО неслучайной величины равно самой величине.
2. Дисперсия СВ
n
Dx = D[X] = M [(X − X)2 ] = ∑ (xi − X)2 pi ;
i=1
+∞
Dx =
∫
(x − X)2 f (x)dx.
−∞
11
Дисперсия всегда определена, если определено МО СВ, но может
принимать значение +∞ . Если Dx = 0, то p(x = X) = 1, т. е. СВ с
вероятностью, равной 1, постоянна: x = const.
Среднеквадратическим, или стандартным, отклонением СВ
называется положительный квадратный корень из её дисперсии:
σ x = + Dx .
Задачи
математической статистики
Математическая статистика – раздел теории вероятностей,
включающий в себя методы экспериментального исследования качественных и количественных свойств статистической информации и принятия обоснованных решений.
Статистической информацией являются данные наблюдений,
записи или измерения случайных событий, величин или функций.
Случайный характер погрешностей технических средств измерений и внешних влияющих факторов (температура, влажность,
вибрация и т. д.), сопровождающих процесс измерения физических величин, приводят к тому, что фактически любые результаты
измерений являются статистическими.
Статистические свойства случайных событий, величин и функций объективно определяются их вероятностными характеристиками (ВХ), к которым относятся закон распределения, математическое ожидание, дисперсия, корреляционная функция, спектральная плотность мощности.
Статистические измерения направлены на определение значений вероятностных характеристик (ЗВХ) случайного про- цесса.
Проведение статистических измерений предполагает наличие определённых моделей поведения объекта или его свойств.
Предположения о типах моделей обычно формируются в виде набора суждений (высказываний), называемых гипотезами. Процесс принятия решения о типе модели объекта на основании результатов измерений называется проверкой статистических
гипотез.
12
2.2. Оценивание вероятностных характеристик
случайных величин
Точечные оценки вероятностных характеристик
Задачей математической статистики является экспериментальное определение ЗВХ θ[y(t)] случайного процесса y(t). На основании выборки конечного объёма данных находится оценка θ[y(t)] .
Оператор или алгоритм обработки опытных данных, приводящий
к получению оценки θ[y(t)] также обычно называют оценкой (в некоторой литературе используется термин статистика).
В математической статистике в качестве точечных оценок θ ВХ
θ предлагается использовать оценку, обладающую свойствами несмещённости, состоятельности и эффективности [1, 2].
Несмещённость. Оценка θ называется несмещённой, если она
не приводит к появлению систематической погрешности в определении ВХ θ. Согласно ГОСТ 8.009–84 систематическая погрешность
∆ c θ определяется как разность между M [θ] и θ:
∆ c θ = M [θ − θ] = M [θ] − θ.
В математической статистике систематическую погрешность
называют смещением. Следовательно, оценка θ будет несмещённой, если МО оценки θ будет совпадать с θ: M [θ] = θ. В этом случае
∆ c θ = 0.
Состоятельность. Оценка θ называется состоятельной, если
она имеет вероятностное стремление (сходимость по вероятности)
к ВХ θ при неограниченном увеличении времени наблюдения или
объёма выборочных данных – n:
lim P{| θ − θ |≥ ε} → 0,
n→∞
где ε – сколь угодно малое положительное число.
Достаточным для состоятельности оценки θ является среднеквадратическая сходимость θ к θ:
lim M [θ − θ]2 = lim D[θ] → 0.
n→∞
n→∞
Эффективность. Оценка θ называется эффективной, если среди всех возможных оценок θi (i = 1, 2, 3, ..) она обладает минимальной дисперсией.
13
Интервальная оценка математического ожидания
случайной величины
По опытным данным, представленным в виде выборки независимых значений x1,x2, …, xn объёма n СВ X, одним из возможных
способов находится точечная оценка m x математического ожидания mx.
Предположим, что величина X является гауссовой. В этом случае в качестве эффективной оценки mx используется выражение
1 n
m x = ∑ xi . Убедимся в несмещённости и состоятельности данной
n i=1
оценки.
Для оценки несмещённости рассчитаем математическое ожидание:
1 n
1
M [m x ] = M [ ∑ xi ] = ∑ M [xi ] = mx ,
n i=1
n
следовательно, смещение M [m x − mx ] = M [m x ] − mx = 0.
Для оценки состоятельности рассчитаем дисперсию:
D[m x ] = D[
1 n
1
1
xi ] = 2 ∑ D[xi ] = σ2x .
∑
n i=1
n
n
При n → ∞ и D[m x ] → 0, следовательно, оценка является состоятельной, так как позволяет сделать разброс возможных значений
m x относительно mx сколь угодно малым.
При отсутствии систематической погрешности степень разброса
является мерой точности оценивания любой ВХ, так как указывает
интервал, в котором находится искомое значение данной ВХ.
В соответствии с теоремой Чебышева для оценки m x с вероятность pд не менее 0,9 имеет место неравенство
m x − 3σ[m x ] ≤ mx ≤ m x + 3σ[mx ],
где σ[m x ] =
1 σ .
n x
Неравенство также может быть представлено в виде:
| m x − mx |≤ 3σ[m x ].
Если известна вероятность pд, которая называется доверительной, так как характеризует достоверность выполнения последнего
14
неравенства, то интервал ±3σ[m x ] называется доверительным интервалом нахождения оценки. Величина доверительного интервала, равная в этом случае 6σ[m x ], является мерой точности определения mx.
При оценивании любой ВХ θ стремятся установить вероятностное неравенство
P{| θ − θ |≤ ε} = pä .
Неравенство позволяет охарактеризовать меру точности 2 ε и
вероятности pд определения θ с помощью оценки θ , которую называют доверительной оценкой. Для установления неравенства необходимо знать закон распределения оценки θ .
2.3. Систематизация погрешностей
при планировании статистических измерений
Основным положением теории статистической обработки [4]
является представимость случайного процесса (СП) его статистическими моделями, которые в той или иной степени отражают ВХ
реального процесса. При этом адекватная модель может быть получена только в том случае, когда имеется бесконечный объём выборочных данных. Из этого положения следует теоретическая возможность построения адекватной модели СП по одной реализации
бесконечной протяжённости. Но, как было отмечено ранее, обработка реальных СП, являющихся неотъемлемой компонентой при
измерении параметров физических процессов, накладывает существенные ограничения на процесс исследования:
– реальные СП только с ограниченной точностью можно считать
стационарными, в большинстве случаев они нестационарные;
– анализ по одной реализации при ограниченном объёме выборочных данных;
– отсутствие априорной информации относительно вида некоторых ВХ СП.
Эти ограничения приводят к появлению различных погрешностей в результатах статистического анализа. Систематизация и
количественная оценка этих погрешностей на этапе планирования
статистической обработки результатов измерений физических параметров может в значительной степени улучшить точность получения ЗВХ.
15
Вопросам метрологического обеспечения статистической обработки в литературе [6, 7] уделено большое внимание. Понимая
под погрешностью δθ[y(t)] получения ЗВХ СП y(t) несоответствие
между истинным значением этой характеристики θ[y(t)] и её оценкой θ[y(t)]:
δθ[y(t)] = θ[y(t)] − θ[y(t)], (1)
в наиболее общем виде результирующую погрешность измерений
можно определить суммой методической и аппаратурной составляющих:
δθ[y(t)] = δ ì θ[y(t)] + δ à θ[y(t)]. (2)
При планировании статистической обработки в первую очередь
интересуются составляющей методической погрешности. В [4] рекомендуется её представлять в виде полных групп составляющих,
отражающих
– либо статистические факторы:
δ ì θ[y(t)] = δ ñì θ[y(t)] + δ í.ñ θ[y(t)] + δ ê.â θ[y(t)], (3)
где δсмθ[y(t)] – погрешность, обусловленная смещённостью оценки;
δн.сθ[y(t)] – погрешность, обусловленная несостоятельностью оценки; δк.вθ[y(t)] – погрешность, обусловленная конечностью объёма
выборочных данных;
– либо факторы выбора модели СП:
δ ì θ[y(t)] = δ êë θ[y(t)] + δ opt θ[y(t)],
(4)
где δклθ[y(t)] – погрешность классификации, вызванная неадекватностью выбранной модели; δoptθ[y(t)] – погрешность, соответствующая применению неоптимального алгоритма, определяемого
свойствами адекватной модели.
Попытка обобщить выражения (3) и (4) применительно к статистическим измерениям средствами вычислительной техники
сделана в работе [8], где предлагается погрешность представлять в
виде трёх составляющих:
δ ì θ[y(t)] = δ í.è θ[y(t)] + δ ê.â θ[y(t)] + δ í.à θ[y(t)], (5)
δ í.è θ[y(t)] = δ ïð θ[y(t)] + δ ä θ[y(t)] + δ ÀÖÏ θ[y(t)] – (6)
где
16
погрешность неидеальности оператора измерений, вызванная конечной разрядностью чисел в процессоре и промежуточными округлениями δпр, дискретизацией по времени δд, а также квантованием по уровню в АЦП – δАЦП;
δ ê.â θ[y(t)] = Ln [y(t)] − lim Ln [y(t)] – (7)
n→∞
погрешность, обусловленная конечностью объёма выборочных данных (n) оператора Ln, положенного в основу процедуры статистической обработки;
δ í.à θ[y(t)] = lim Ln [y(t)] − lim Lna [y(t)] – (8)
n→∞
n→∞
погрешность, обусловленная неадекватностью выбранного алгоритма Ln адекватному алгоритму Lnа, обеспечивающему получение
состоятельной оценки при выборе адекватной модели.
В данной трактовке понятие погрешности неадекватности несколько шире погрешности классификации, так как характеризует не только выбор модели, но и выбор алгоритма. Применительно
к обработке нестационарных случайных процессов (НСП) данное
полезное определение нуждается в дополнительной детализации,
учитывающей представление (4), и может быть развёрнуто в виде
следующей полной группы составляющих:
δ í.à θ[y(t)] = δ í.ê θ[y(t)] + δ í.ï θ[y(t)] + δ í.î θ[y(t)]. (9)
В данном выражении:
δ í.ê θ[y(t)] = lim Lnà [y(t) / m] − lim Lna [y(t) / ma ] – n→∞
n→∞
(10)
погрешность неадекватности классификации, обусловленная заменой адекватной модели mа y(t), моделью m при условии использования адекватного (состоятельного и эффективного) оператора Lnа
для последней;
δ í.ï θ[y(t)] = lim Lnp [y(t) / m] − lim Lna [y(t) / m] – (11)
n→∞
n→∞
погрешность неадекватности параметров, обусловленная использованием адекватного оператора с неоптимальными параметрами
Lnp, приводящего, в частности, к получению неэффективных оценок модели m;
δ í.î θ[y(t)] = lim Ln [y(t) / m] − lim Lnp [y(t) / m] – n→∞
n→∞
(12)
17
погрешность неадекватности оператора, обусловленная применением неоптимального оператора, приводящего, в частности, к получению несостоятельных оценок модели m.
Использование систем классификации погрешности вида (5) и
(9) несколько дополняет и уточняет классификации (3) и (4), а при
совпадении δн.иθ[y(t)] и δаθ[y(t)] и классификацию (2).
2.4. Показатель степени нестационарности
Основной задачей при получении ЗВХ по одной реализации СП
является выбор методов (операторов) оценивания, которые, как
правило, определяются принятой вероятностной моделью исследуемого процесса. При этом можно выдвинуть модель стационарного,
локально-стационарного или нестационарного процесса. В первом
случае будут использоваться наиболее изученные и отработанные
методы корреляционного и спектрального анализов, которые относят к категории классических. Применение таких методов не вызывает затруднений, но реальные процессы лишь в ограниченной
мере могут быть отнесены к данному типу. В связи с этим возникает вопрос о степени нестационарности СП y(t) при получении ЗВХ
θ[y(t)]. Очевидно, что в практике статистической обработки сигналов степень нестационарности является понятием относительным
и может быть определена результирующей погрешностью, которую
удобно оценивать с помощью среднеквадратического значения погрешности [3, 4]:
σ(θ) = E1/2 [(θ[y(t)] − θ[y(t)])2 ].
Введём понятие показателя степени нестационарности η(θ) для
исследуемого СП y(t) при расчёте ЗВХ θ[y(t)], который в отличие
от существующих аналогичных оценок [3, 5] имеет более общий
характер, не требует ансамбля реализаций и позволяет принять
решение при планировании статистической обработки результатов измерений о применимости выбранного метода оценивания.
Будем характеризовать показатель либо своим максимальным
значением:
ηì (θ) = lim max{ E[(θ[y(t)] − θ[y(t)])2 ]} / σ2ä (θ),
T →∞
ξ
либо средним значением за интервал изменения аргумента:
18
ηñð (θ) = lim
1
ξ2
2
∫ E[(θ[y(t)] − θ[y(t)])
T →∞ σ2
ä (θ)(ξ2 − ξ1 ) ξ1
dξ,
где ξ1 и ξ2 – нижняя и верхняя границы изменения аргумента ВХ
θ[y(t)], а σд(θ) – допустимое значение среднеквадратической погрешности измерения ЗВХ θ[y(t)].
В случае, когда процесс y(t) – стационарный, большинство классических методов обеспечивают получение состоятельных и асимптотически несмещённых оценок ЗВХ. Это определяет нулевую
нижнюю границу показателей степени нестационарности ηì (θ) и
ηñð (θ). Если показатель η(θ) оказался меньше или равен единице,
то применение классических методов оправдано и процесс y(t) может быть отнесён к типу процессов со слабой степенью нестационарности при расчёте ЗВХ θ[y(t)]. В противном случае y(t) относится к типу процессов с сильной степенью нестационарности. В этом
случае необходимо:
– попытаться свести к неравенству η(θ) ≤ 1, уменьшая либо
составляющую погрешности δн.кθ[y(t)] путём деления процесса на
локально-стационарные участки, либо δн.оθ[y(t)] и δн.пθ[y(t)]. Невыполнение неравенства η(θ) ≤ 1 свидетельствует о том, что получение ЗВХ с заданной точностью невозможно;
– применить методы анализа НСП для уменьшения составляющей методической погрешности – δн.аθ[y(t)]. При этом сначала
исследуется величина погрешности, соответствующая δн.оθ[y(t)].
Если это не приводит к получению допустимой точности оценивания ЗВХ, то необходимо перейти к уточнению параметров
оператора измерения, уменьшая составляющую погрешности δн.пθ[y(t)].
Таким образом:
– дополнение и некоторое уточнение существующей системы
классификации полной методической погрешности открывает дополнительные возможности вариации измерительных процедур
при планировании статистической обработки результатов измерений НСП и указывает пути их направленного перебора, что особенно важно при наличии единственной реализации;
– количественная оценка показателя степени нестационарности
позволяет метрологически обоснованно принять решение о целесообразности использования классических методов анализа СП при
расчёте ЗВХ.
19
2.5. Обоснование модели исследуемого процесса
От того, насколько эффективно и полно будет учтена при проведении статистического анализа исследуемого процесса имеющаяся
априорная информация, зависит выбор метода измерения, их точность, необходимые затраты на организацию и проведение измерений, состав используемых технических средств и т. д. Поэтому перед планированием статистической обработки с помощью средств
измерительно-вычислительной техники необходимо располагать
некоторым объёмом априорных сведений, которые определяют вероятностную модель исследуемого процесса [9, 10, 12]. Вероятностную модель случайного процесса (ВМСП) y(t) в общем виде можно
записать как
y(t) = L {Pi (t)}, i = 1, k,t ∈ [0,T ],
где L – некоторый оператор преобразования; Pi(t) – случайные процессы; k – количество процессов; T – длина реализации.
Под ВМСП понимается такое его представление через совокупность элементарных процессов {Pi(t)}, которое позволяет учесть
формализованную априорную информацию и гипотезы относительно свойств изучаемого объекта и на этой основе вычислить ВХ
y(t), существенные в решаемой задаче.
В настоящее время достаточно чётко определены два типа ВМСП.
Физические модели
Физические модели сводятся к получению решения уравнения
математической физики подходящего вида и к введению в это решение случайных возмущений. Далее на основе задания вероятностных характеристик возмущений определяются соответствующие ВХ исследуемого СП. Разработке такого типа моделей посвящены работы В. Л. Клячкина, В. М. Кудряшова, В. П. Кузнецова,
В. А. Бохана, А. Ф. Котюка и других.
К преимуществам физических моделей можно отнести:
– физическую чёткость постановки задачи;
– математическую строгость решения.
Существенными недостатками физических моделей являются:
– реальные объекты исследования, такие как, например, электромеханические приборы, оказываются существенно сложнее,
20
чем те модели, которые им приписываются и для которых решения
соответствующих уравнений математической физики имеют обозримый и конструктивный вид;
– набор вероятностных характеристик, которые мы можем
определить, весьма ограничен из-за громоздкости и сложности математического аппарата.
Феноменологические модели [11]
Под феноменологическими моделями понимаются представления СП, которые соответствуют его поддающимся измерению проявлениям. Основными достоинствами феноменологических ВМСП
являются:
– структурная простота;
– хорошая интерпретируемость формирования исследуемого
процесса;
– возможность определения широкого набора вероятностных
характеристик процесса.
Следует отметить, что для решения задачи анализа и синтеза систем желательно иметь такое представление выходных процессов,
которое, с одной стороны, было бы адекватным их физической природе, с другой стороны, позволило бы рассчитать ВХ исследуемого
процесса как результат линейных и нелинейных преобразований
процессов с известными (заданными априори) или полученными в
результате исследований вероятностными характеристиками.
Рекомендуемая литература
1. Бендат Дж., Пирсол А. Измерение и анализ случайных процессов.
М.:Мир, 1983. 408 с.
2. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.:
Мир, 1989. 540 с.
3. Сольницев Р. И. Вычислительные машины в судовой гироскопии. Л.:
Судостроение, 1977. 312 с.
4. Цветков Э. И. Основы теории статистических измерений. Л.: Энергия, 1979. 286 с.
5. Семесенко М. П., Кийко А. В. Структурный и корреляционный анализ нестационарных процессов. Киев: ИК, 1974. 42 с.
6. Цветков Э. И. Методические погрешности результатов измерений
значений вероятностных характеристик случайных процессов // Тр. Всесоюз. симп. «Методы представления и аппаратурный анализ случайных
21
процессов и полей». Л.: ВНИИЭП, 1978. Т. 1. С. 3–12.
7. Цветков Э. И. Основные направления развития теории статистических измерений // Тр. Х Всесоюз. симп. «Статистические измерения и
применение микромашинных средств в измерениях». Л.: ВНИИЭП, 1982.
Т. 1. С. 3–15.
8. Соболев В. С. Проблемы аппаратурной классификации случайных
процессов при разработке адаптивных ИИС статистического назначения // Матер. Всесоюз. конф. по измерительным информационным системам «ИИС-81». Львов, 1982. Ч. 1. С. 10–16.
9. Ольшевский В. В. Вероятностные модели, экспериментальные исследования и статистические измерения // Тр. IV Всесоюз. симп. «Методы
представления и аппаратурный анализ случайных процессов и полей». Л.:
ВНИИЭП, 1971. Т. 2. С. 3–21.
10. Ольшевский В. В. О проблеме получения апостериорной модели случайного процесса по конечной совокупности выборочных реализаций //
Тр. V Всесоюз. симп. «Методы представления и аппаратурный анализ случайных процессов и полей». Л.: ВНИИЭП, 1972. Т. 1. С. 3–8.
11. Ольшевский В. В. Феноменологические модели случайных процессов // Тр. VI Всесоюз. симп. «Методы представления и аппаратурный анализ случайных процессов и полей». Л.: ВНИИЭП, 1973. Т. 2. С. 3–12.
12. Ольшевский В. В. Статистические методы в гидролокации. Л.: Судостроение, 1973. 182 с.
22
3. МЕТОДЫ ОБРАБОТКИ НЕСТАЦИОНАРНЫХ
СЛУЧАЙНЫХ ПРОЦЕССОВ
3.1. Случайные процессы
Случайной функцией x(ξ) произвольного аргумента ξ называется такая функция, которая для любых значений ξ2, ξ1, … превращается в случайные величины x(ξ1), x(ξ2), …. Если в качестве аргумента случайной функции рассматривать время t, то случайная
функция x(t) называется случайным процессом (СП).
Аргумент t может изменяться непрерывно или дискретно. В первом случае имеем непрерывный СП, а во втором – случайную последовательность, временной ряд, дискретный СП.
Часть СП, зафиксированная в ходе эксперимента ограниченной
длительности, теряет свою случайность и называется реализацией
СП. Совокупность, или ансамбль, реализаций наглядно отражает вид
СП и может рассматриваться в качестве его модели x(t) (рис. 3).
Для СП x(t) вводится понятие одномерной функции плотности вероятности f(x,t), которая является неслучайной функцией двух аргументов. В любой произвольный момент времени (t = tk) эта функция превращается в функцию плотности вероятности случайной величины x(tk). Данная ВХ характеризует амплитудные вероятностные свойства СП, например вероятность нахождения в некотором интервале.
Более полной ВХ x(t) является двумерная плотность вероятности f(x1,x2,t1,t2), являющаяся неслучайной функцией четырёх
аргументов, которая для фиксированных значений t1 и t2 характеризует динамическую вероятностную связь между x(t1) и x(t2).
YU
Y U
Y U
Y U
5
YU
Рис. 3
23
Аналогично можно ввести трёх-, четырёх- и n-мерные плотности вероятности, более глубоко характеризующие свойства СП.
Для большинства практических задач достаточными характеристиками СП являются математическое ожидание (МО), дисперсия
(Д) и корреляционная функция (КФ).
Математическим ожиданием mx(t) СП x(t) называется неслучайная функция времени
∞
mx (t) =
∫
x(t)f (x,t)dt.
−∞
Корреляционной функцией Rx(t1,t2) СП x(t) называется неслучайная функция времени:
∞ ∞
Rx (t1,t2 ) =
∫ ∫
[x1 (t1 ) − mx (t1 )][x2 (t2 ) − mx (t2 )]f (x1, x2 ,t1,t2 )dx1dx2 .
−∞−∞
Дисперсией Dx(t) СП x(t) является частным случаем его корреляционной функции при t1 = t2 = t, т. е. Dx(t) = Rx(t,t).
3.2. Стационарные случайные процессы
Свойство стационарности случайного процесса
Стационарные СП (ССП) – процессы, отдельные свойства которых не зависят от времени.
Случайный процесс x(t) называется стационарным в широком
смысле, если
mx(t) = mx, Dx(t) = Dx, Rx(t1,t2) = Rx(τ).
Случайный процесс X(t) называется стационарным в узком
смысле, если от времени не зависят все законы распределения: одномерные, например, в форме плотности вероятности f(x,t) = f(x);
двумерные f(x1,x2,t1,t2) = f(x1,x2,τ) и т. д.
Процессы стационарные в узком смысле всегда стационарны в
широком смысле. Обратное утверждение справедливо не всегда.
Для гауссовых СП стационарность в широком и узком смыслах совпадают.
24
Для корреляционной функции ССП характерны свойства:
Rx(t1,t2 – t1) = Rx(τ = 0) = Dx≥0,
Rx(τ) = Rx(–τ), Rx(τ)<Dx.
Таким образом типичная КФ ССП является симметричная убывающая функция (рис. 4):
Значение τ = τкор, при котором корреляционная функция почти
равна нулю
| Rx (τ êîð ) |≤ ε ≤ 1,
называется максимальным интервалом корреляции. Значение ε
выбирается достаточно малым, в пределах: 0,05 ÷ 0,01.
Случайный процесс считается широкополосным, если имеет
апериодически затухающую корреляционную функцию. Примером такого процесса является СП с КФ вида:
Rx (τ) = Dx exp(−α | τ |).
Предельным случаем широкополосного СП является белый
шум, имеющий
Rx(τ) = Dxδ(0),
где δ(0) – дельта-функция Дирака: δ(0) = ∞ при τ = 0 и δ(0) = 0 при
τ ≠ 0.
Белый шум является математической абстракцией, так как
имеет бесконечное значение дисперсии, а его значения некоррелированы при любых τ ≠ 0.
Более наглядно динамические свойства ССП в частотной области определяются спектральной плотностью мощности (СПМ), ко3Y T %Y
E
sT
E
T ÃÇÉ
sT ÃÇÉ
T
Рис. 4
25
торая в случае стационарного СП называется неслучайной функ- цией:
Sx (ω) =
1
π
∞
∫
Rx (τ)e−jωτ dτ.
−∞
Свойство эргодичности случайного процесса
При экспериментальном определении вероятностных характеристик СП в распоряжении исследователя, как правило, оказывается ограниченное число или единственная реализация СП.
Возникает вопрос о возможности распространения свойств этих
реализаций на весь СП. Ответ на этот вопрос позволяет дать понятие эргодичности СП.
По аналогии с понятием стационарности вводится понятие эргодичности в узком смысле. Случайный процесс считается эргодическим в узком смысле, если все его вероятностные характеристики
не зависят от номера реализации.
Случайный процесс считается эргодическим в широком смысле,
если от номера реализации не зависят вероятностные характеристики не выше второго порядка (КФ, СПМ).
Свойствами эргодичности могут обладать только ССП.
Очевидно, что эргодические СП образуют очень важный класс
СП, поскольку все свойства эргодических процессов можно определить по единственной выборочной реализации. К счастью, на практике ССП обычно оказываются эргодическими.
3.3. Нестационарные случайные процессы
К нестационарным случайным процессам (НСП) относятся все
СП, не удовлетворяющие условиям стационарности.
В практике анализа различных физических явлений при проведении испытаний (исследовательских, проверочных и т. д.) технических систем на современном этапе научно-технического прогресса получили широкое распространение методы теории вероятности
и математической статистики.
Весьма важной является задача статистического анализа при
автоматизации исследований и испытаний сложных систем ав26
томатического управления, сложность которых и требования по
точности, надежности и долговечности непрерывно возрастают.
Оказывается уже недостаточным оценивать их поведение при системе действующих сил, моментов и возмущений, пользуясь детерминированными и вероятностными математическими моделями,
основанными только на теории ССП. Неучет нестационарности СП,
проявляющейся, как правило, в зависимости среднего значения и
дисперсии процесса от времени при оценивании значений ВХ процесса, зачастую приводит к возникновению сколь угодно больших
погрешностей измерения и неправильной интерпретации полученных результатов.
Трудности анализа НСП при проведении испытаний технических систем и их компонентов связаны, прежде всего, с тем, что,
как правило, имеется одна выборочная реализация процесса в силу
сложности или невозможности повторения эксперимента; отсутствует достаточно полная априорная информация об исследуемом
процессе. В этих условиях применение физических моделей объекта для получения ВХ затруднительно и поэтому используются
вероятностные модели.
Если не наложены дополнительные ограничения, то свойства
НСП обычно зависят от времени и могут быть установлены только
путём усреднения в отдельные моменты времени по ансамблю выборочных реализаций СП.
Во многих случаях НСП, отвечающие реальным физическим явлениям, имеют особенности, упрощающие их анализ и измерение.
Так, на практике широко применяются феноменологические модели НСП аддитивно-мультипликативного вида:
y(t) = j1(t)x(t) + j2(t), t ∈ [0,T ],
где j1(t) и j2(t) – тренды – неслучайные, детерминированные
функции времени, определяющие законы изменения МО и дисперсии процесса y(t); x(t) – стационарный эргодический процесс с
вероятностными характеристиками: mx = 0, Dx = 0, Dx = 1, Rx(τ), Sx(ω).
Нестационарные случайные процессы, относящиеся к классу
аддитивных вероятностных моделей, приводимы к стационарному
виду и позволяют оценивать ВХ по одной выборочной реализации
процесса.
Большое распространение на практике получили модели, являющиеся частными случаями аддитивно-мультипликативной модели:
27
– аддитивная, составляющая класс процессов, нестационарных
по МО:
y(t) = x(t) + j2(t);
– мультипликативная, составляющая класс процессов, нестационарных по дисперсии:
y(t) = j1(t)x(t).
При анализе аддитивно-мультипликативных НСП приходится
сталкиваться с задачей выявления характера нестационарности,
вызванной присутствием в выборочной реализации функций j1(t)
и j2(t) – трендов по дисперсии и МО. Наиболее часто в инженерной
практике встречаются функции: постоянная величина, линейные,
периодические, нелинейные периодические [1].
При проведении научно-технического эксперимента с помощью
комплекса программных средств должен базироваться на методах,
позволяющих при наличии всего одной выборочной реализации исследуемого процесса:
– обеспечить допустимую погрешность вычисления ВХ;
– выявить законы изменения присутствующих в процессе детерминированных составляющих;
– произвести статистическую обработку в условиях априорной
неопределенности относительно вида некоторых ВХ;
– произвести оперативный анализ ВХ.
3.4. Методы обработки нестационарных
случайных процессов
Как уже было отмечено, если значение показателя степени нестационарности η(θ) для СП y (t ) при расчёте значений вероятностной характеристики ЗВХ θ[y(t)] с помощью оценки θ[y(t)] больше
единицы, т. е. СП относится к процессам с сильной степенью нестационарности, применение используемого классического метода статистического анализа недопустимо. В этом случае необхо- димо:
– либо пользоваться другой оценкой θ[y(t)] , дающей меньшее
значение погрешности измерения ЗВХ θ[y(t)], т. е. снижать величину составляющей δ н.о θ[y(t)] методической погрешности, обусловленной неадекватностью оператора измерения;
28
– либо тщательнее выбирать параметры оператора (если таковые имеются), т. е. снижать величину составляющей δн.пθ[y(t)]
методической погрешности измерения ЗВХ θ[y(t)], обусловленной
неадекватностью параметров оператора их оптимальным значе- ниям.
Если же это не приводит к допустимой точности при оценивании ЗВХ θ[y(t)], то обязательным является применение специальных методов, рассчитанных на обработку НСП. При этом снижается, в первую очередь, составляющая δн.кθ[y(t)] методической
погрешности, обусловленная неадекватностью классификации исследуемого СП. Среди методов, рассчитанных на обработку НСП,
также может быть организован целенаправленный поиск метода,
удовлетворяющего допустимой величине погрешности измерения
ВХ θ[y(t)], путём их последовательного перебора и анализа составляющих δн.оθ[y(t)] и δн.пθ[y(t)].
В настоящее время существует два способа получения ЗВХ:
– непосредственно по реализации НСП;
– с применением стационаризации НСП.
Приведём краткий сравнительный анализ методов указанных
способов с учётом отмеченных ранее требований при проведении
статистического анализа.
Получение ЗВХ непосредственно по реализации НСП
Метод
n-кратного
дифференцирования.
Предназначен
для исключения аддитивной составляющей НСП аддитивномультипликативного вида. Сначала определяют корреляционную
функцию (КФ) n-й производной НСП. Затем производят 2n-кратное
интегрирование результатов и рассчитывают искомую КФ [4]. Разновидностью этого метода является метод, основанный на преобразовании НСП через разности n-го порядка во вспомогательный
стационарный процесс. Искомая КФ вычисляется через КФ вспомогательного процесса [5,6].
Недостатками изложенного метода являются:
– невозможность выявить характер изменения тренда;
– непригодность метода при наличии мультипликативного тренда;
– трудности при использовании для оперативной обработки,
т. е. по мере поступления данных эксперимента.
29
Методы, основанные на аппроксимации вероятностных характеристик регулярными функциями [1, 7–10]. В соответствии
с этими методами неизвестную характеристику находят в следующем виде:
p(t) =
n
∑ aνξ ν (t),
ν=0
где ξν(t) – выбранная система регулярных функций времени: степенные ряды [8, 10]; асимптотические ряды [7]; ортогональные
функции, например полиномы Лежандра, Лагерра [7]; aν – неизвестные коэффициенты разложения, для определения которых по
реализации НСП используют метод наименьших квадратов [10],
максимального правдоподобия [1], усреднения различного порядка [8].
К недостаткам этих методов можно отнести, наряду с отмеченными выше, также применимость того или иного способа аппроксимации лишь для определённого узкого класса исследуемых процессов.
К основным достоинствам следует отнести универсальность относительно исследуемой ВХ и её аналитическое представление. Поэтому
методы, основанные на аппроксимации, удобно использовать как
дополнительные, улучшающие качество измерения ВХ при проведении статистического анализа результатов эксперимента.
Главенствующим в практике статистического анализа СП на сегодня является спектральный анализ (СА). Анализ спектра отдельных интервалов СП позволяет исследовать его структуру на однородность, выявлять скрытые периодичности, представить ВХ СП в целом. Среди методов СА НСП можно выделить следующие:
– спектрально-временной анализ – оценка спектральной плотности мощности (СПМ) классическими методами на ряде не перекрывающихся интервалов ограниченной длительности и их сравнение;
– кратковременный спектральный анализ – поиск структурнооднородных интервалов путём определения СПМ на ряде перекрывающихся интервалов ограниченной длительности и их сравнение,
причём совпадение спектральных характеристик на последовательном ряде интервалов свидетельствует о структурно-однородном характере исследуемой части СП;
– спектральный анализ на конечных нестационарных интервалах времени – расчёт СПМ непосредственно по реализации НСП,
для чего используют формулы для определения СПМ НСП, при30
надлежавшие Раевскому [11], Пейджу – Лэмпарду [11], Бендату –
Пирсолу [9].
Недостатками рассмотренных методов СА НСП являются:
– трудности в определении длины интервалов при разбиении;
– необходимость знания корреляционной функции двух аргументов;
– невозможность выявить характер изменения трендов за исключением периодического аддитивного тренда;
– трудность оперативной обработки результатов эксперимента.
Получение ЗВХ с помощью стационаризации НСП
Под стационаризацией НСП понимается процедура выделения из
него ССП или, что то же самое, получение оценок детерминированных составляющих НСП-трендов, с последующим их исключением.
Использование стационаризации позволяет свести задачу анализа ВХ НСП к исследованию отдельно ВХ ССП, для которых справедливы классические методы корреляционного и спектрального
анализов, и изучению ВХ детерминированных трендов. Такое разделение процесса на составляющие, с одной стороны, значительно увеличивает число методов анализа ВХ, хорошо изученных на
практике; с другой стороны, разделение процесса на составляющие
вносит дополнительную погрешность при оценивании ВХ ССП, обусловленную суммарной погрешностью при стационаризации ССП.
Так, в случае аддитивного НСП в суммарную погрешность входит
погрешность от измерения аддитивного тренда и погрешность от
проведения операции центрирования.
При выделении аддитивного и мультипликативного трендов
удобно применять различные операторы сглаживания. Целесо- образность их использования обусловлена простотой алгоритмов и
схем сглаживания в сочетании с достаточно эффективными сглаживающими свойствами. В настоящее время существуют два типа
операторов сглаживания (ОС):
– операторы оптимальные в статистическом смысле [14, 15],
для которых характерным является экстремальное значение заданного критерия эффективности;
– операторы квазиоптимальные (субоптимальные) в статистическом смысле [7, 16–21] – для них характерным является значение критерия эффективности, близкого к экстремальному.
31
Проведём краткий сравнительный анализ указанных типов ОС:
– специфика задачи построения оптимальных и квазиоптимальных процедур обработки на базе оптимальных и квазиоптимальных
операторов приводит к различным методам их решения. Так, при
синтезе оптимальных процедур используется теория оптимальной
фильтрации Колмогорова – Винера, теория игр, методы динамического программирования. При построении же квазиоптимальных
процедур ограничиваются использованием более простых методов,
связанных с оптимизацией параметров известной структуры;
– классическая задача оптимальной фильтрации, построенная в
работах А. Н. Колмогорова и Н. Винера [14], состоит в нахождении
оптимального в статистическом смысле ОС для выделения детерминированного сигнала из его аддитивной смеси со случайной помехой. Аддитивная модель является лишь частным случаем НСП,
что затрудняет использование результатов теории оптимальной
фильтрации. В случае априорной неопределённости относительно
свойств НСП задача оптимальной фильтрации теряет своё значение;
– оператор, оптимальный для одного процесса, может быть неоптимальным для другого;
– многие из квазиоптимальных ОС реализуются гораздо проще, чем оптимальные, а по точности оценивания ВХ они ненамного
уступают последним.
Рекомендуемая литература
1.  Бендат Дж., Пирсол А. Измерение и анализ случайных процессов.
М.: Мир, 1983. 408 с.
2.  Бендат Дж., Пирсол А. Применение корреляционного и спектрального анализа. М.: Мир, 1983. 312 с.
3.  Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.:
Мир, 1989. 540 с.
4.  Галушкин А. И., Зотов Ю. А., Шикунов Ю. А. Оперативная обработка
экспериментальной информации. М.: Энергия, 1972. 360 с.
5.  Зотов Ю. Я., Шикунов Ю. А. Способ определения корреляционных
функций. Авт. свид. СССР № 228351 // Бюл. изобр. 1968. № 31.
6.  Зотов Ю. А. Взаимно корреляционный анализ одного класса нестационарных случайных процессов // Тр. III Всесоюз. симп. «Методы представления и аппаратурный анализ случайных процессов и полей». Л.:
ВНИИЭП, 1970. Т. 3. С. 37–43.
7.  Романенко А. Ф., Сергеев Г. А. Вопросы прикладного анализа случайных процессов. М.: Сов. радио, 1968. 255 с.
32
8.  Пугачёв В. Н. Комбинированные методы определения вероятностных характеристик. М.: Сов. радио, 1973. 256 с.
9.  Семесенко М. П., Кийко А. В. Структурнвй и корреляционный анализ нестационарных процессов. Киев: ИК, 1974. 42 с.
10.  Шинаков Ю. С. Определение корреляционной функции нестационарного случайного процесса определённого класса по одной реализации
этого процесса с помощью метода наименьших квадратов // Тр. учеб. интов связи. Л., 1966. Вып. 32. С. 68–71.
11.  Раевский С. Я. Тр. ВВИА им. В. В. Жуковского. Л., 1954. Вып. 495.
С. 14–19.
12.  К вопросу об аналитическом и аппаратурном спектрах детерминированных и случайных процессов / Н. Г. Гаткин, В. А.Геранин, Я. Я. Гордиенко, М. И. Карповский // Тр. II Всесоюз. симп. «Методы представления и
аппаратурный анализ случайных процессов и полей» Л.: ВНИИЭП, 1969.
Т. 1. С. 210–214.
13.  Бендат Дж., Пирсол А. Измерение и анализ случайных процессов.
М.: Мир, 1971. 458 с.
14.  Семесенко М. П., Рамазанов С. К. Методы оптимальной фильтрации многомерных случайных процессов для мини-ЭВМ. Препринт 76-41.
Киев, 1976. 49 с.
15.  Трищенко Е. К. Асимптотически эффективные до члена второго порядка малости оценки параметра в гауссовом шуме: автореф. дис. ... канд.
техн. наук. Л., 1979. 15 с.
16.  Шегай А. Д. Исследование и разработка методов анализа случайных тпроцессов по одной реализации: автореф. дис. ... канд. техн. наук.
Л., 1973. 15 с.
17.  Сравнительный анализ алгоритмов фильтрации / Е. И. Бойко,
Ю. И Воловик, М. Н. Медынцев, М. В. Подобед. Л.: Изд-во ЛЭТИ, 1978.
№ 232. С. 97–101.
18.  Ленник Ю. В. Математическая статистика. Л.: Наука, 1982. 284 с.
19.  Шегай А. Д. Методы определения математического ожидания одного класса нестационарных случайных процессов. Л.: Изд-во ЛЭТИ, 1973.
№ 121. С. 44–49.
20.  Хьюлсман Л. П. Активные фильтры. М.: Мир, 1972. 516 с.
21.  Жовинский В. Н., Жовинский А. Н. О корреляционном анализе
одного класса нестационарных процессов // Преобразование и обработка
информации. М.: Изд-во МГУ, 1972. С. 131–138.
33
4. СТАЦИОНАРИЗАЦИЯ
АДДИТИВНО-МУЛЬТИПЛИКАТИВНЫХ
НЕСТАЦИОНАРНЫХ СЛУЧАЙНЫХ
ПРОЦЕССОВ
При статистической обработке результатов эксперимента – НСП
удобно пользоваться процедурой стационаризации, если исследуемый процесс может быть описан феноменологической моделью
аддитивно-мультипликативного вида:
y(t) = j1(t)x(t) + j2(t), t ∈ [0,T ],
где j1(t) и j2(t) – тренды – неслучайные, детерминированные
функции времени, определяющие законы изменения математического ожидания и дисперсии процесса y(t); x(t) – стационарный эргодический процесс с вероятностными характеристиками: mx = 0,
Dx = 0, Dx = 1, Rx(τ), Sx(ω).
Под стационаризацией НСП y(t) понимается процедура получения оценок аддитивного – j2(t) и мультипликативного j1(t) трендов
с последующим проведением операций центрирования и нормирования. Операция центрирования – удаление из исследуемого НСП
аддитивного тренда и, соответственно, операция нормирования –
мультипликативного тренда.
Последовательность выполнения процедур получения оценок и
проведение операций по удалению трендов будет зависеть от требований к оперативности анализа, конкретных свойств исследуемого НСП, характеристик оператора измерения, априорной информации о свойствах исследуемого процесса и т. д. Очевидно, чем
меньше будут значения методических погрешностей δмj2[y(t)] и
δмj1[y(t)] при выделении аддитивного и мультипликативного трендов, тем выше будет точность при оценивании ЗВХ стационарного
случайного процесса x(t).
При выделении аддитивного и мультипликативного трендов
удобно применять различные ОС, целесообразность которых обусловливается простотой алгоритмов и схем сглаживания в сочетании с достаточно эффективными сглаживающими свойствами.
В настоящее время существуют два типа ОС:
– операторы оптимальные в статистическом смысле [13], для
которых характерным является экстремальное значение заданного
критерия эффективности;
34
– операторы квазиоптимальные (субоптимальные) в статистическом смысле, для которых характерным является значение критерия эффективности, близкого к экстремальному.
Проведём краткий сравнительный анализ указанных типов ОС:
– специфика задачи построения оптимальных и квазиоптимальных процедур обработки на базе оптимального и квазиоптимального операторов приводит к различным методам решения. Так, при
синтезе оптимальных процедур используется теория оптимальной
фильтрации Колмогорова – Винера, теория игр, методы динамического программирования. При построении же квазиоптимальных
процедур ограничиваются использованием более простых методов,
связанных с оптимизацией параметров известной структуры;
– классическая задача теории оптимальной фильтрации, поставленная в работах А. Н. Колмогорова и Н. Винера, состоит в
нахождении оптимального, в статистическом смысле, ОС для выделения детерминированного сигнала из его аддитивной смеси со
случайной помехой. Аддитивный же НСП является лишь частным
случаем аддитивно-мультипликативной модели НСП, что делает
малопригодными результаты оптимальной фильтрации. А в условии частичной априорной неопределённости относительно некоторых свойств исследуемого НСП задача оптимальной фильтрации
вообще теряет своё значение;
– оператор, оптимальный для одной выборочной реализации исследуемого процесса, может быть неоптимальным для другой;
– многие из квазиоптимальных ОС реализуются гораздо проще,
чем оптимальные, а по точности измерения ЗВХ они не намного
уступают последним.
4.1. Квазиоптимальные операторы сглаживания
В инженерной практике при статистической обработке реальных процессов, являющихся результатов эксперимента, целесообразно [1] пользоваться квазиоптимальными ОС, поскольку многие из них проще по организации, чем оптимальные, а по точности
уступают оптимальным незначительно. Приведём сравнительный
анализ квазиоптимальных операторов при выделении аддитивного
тренда, принимая во внимание требования к методам при статистической обработке результатов эксперимента по точности и опе35
ративности. Напомним, что под оперативной обработкой мы будем
понимать оценивание результата в темпе поступления данных с
требуемой точностью.
Оператор, основанный
на методе наименьших квадратов [1, 2, 3, 4]
При использовании оператора, основанного на методе наименьших квадратов (МНК), аддитивный тренд процесса y(t), где t ∈ [0,T ],
находят в виде полинома степени m. Определение коэффициентов
полинома ai производят из условия минимума величины:
T
m
0
i=0
ε = ∫ [y(t) − ∑ ai ti ]2 dt.
Дифференцируя ε по ai, где i = 0,m и приравнивая нулю производные, получают систему алгебраических уравнений, из которых
рассчитывают искомые коэффициенты.
Рассматриваемый оператор полностью удовлетворяет требованию по точности оценивания аддитивного тренда, поскольку
точность определяется степенью аппроксимирующего полинома.
При увеличении степени алгоритм расчёта коэффициентов не изменяется (при использования итеративного метода их определения – способ Чебышева [5]), а лишь увеличивается время вычисле- ний.
Для оперативной обработки результатов эксперимента оператор, основанный на МНК, не пригоден потому, что для получения
значений коэффициентов полинома необходимо располагать всеми
значениями исследуемого процесса.
В случае, когда необходимо аналитическое представление аддитивного тренда при анализе НСП, целесообразность в применении
оператора, основанного на МНК, бесспорна.
Оператор, основанный на осреднении разностей
различного порядка [2, 6]
Вычисление коэффициентов ai полинома степени m, аппроксимирующего аддитивный тренд, можно произвести путём осредне36
ния разностей i-го порядка – ai ∇(i) , полученных по мгновенным
значениям исследуемой реализации y(ti), где j = 0,n :
ai =
1
n
∑ ∇(i) y(tk ),
i !ni (n − i + 1) k=i
∇(i) y(tk ) = ∇(i−1) y(tk ) −∇(i−1) y(tk−1 ).
Эффективность оператора определяется дисперсией оценки при
оценивании аддитивного тренда, которая растёт с увеличением порядка разности. Смещение оценки аддитивного тренда практически равно нулю [2].
Оператор, основанный на осреднении разностей различного порядка, для оперативной обработки не пригоден, поскольку предполагает знание всех мгновенных значений исследуемой реализации.
Следует также отметить, что рассматриваемый оператор позволяет
обрабатывать НСП только с постоянной дисперсией, т. е. только аддитивные НСП.
Операторы Баттерворта, Чебышева и Кауэра [7, 8]
Особенностью этих операторов является то, что они позволяют
варьировать не только постоянными времени, но и порядком фильтра, причём увеличение порядка асимптотически приближает
амплитудно-частотную характеристику оператора к прямоугольной характеристике идеального фильтра.
Большое количество переменных у ОС делает их практически
непригодными при оценивании аддитивного тренда аддитивномультипликативного НСП в темпе поступления данных с требуемой точностью. Это объясняется трудностями в перестройке рассматриваемых фильтров.
Оператор экспоненциального сглаживания
[1, 3, 6, 9, 10, 11]
Оценку аддитивного тренда для процесса y(t) = x(t) + j2(t) с помощью оператора экспоненциального сглаживания в непрерывной
форме для конечного t можно записать в следующем виде:
37
ϕ2ýêñï (t) =
1
Tc
t
∫ y(τ)exp[−
0
t−τ
]dτ,
Tc
t ∈ [0,T ],
где Tc – интервал сглаживания.
Анализ литературы показал, что рассматриваемый оператор находит широкое применение в измерительной технике. Это объясняется в первую очередь простой его реализацией. Так, в аналоговом
виде – это RC-цепочка, а в цифровом виде – это рекуррентный алгоритм экспоненциального сглаживания.
Рекуррентный алгоритм экспоненциального сглаживания имеет вид
ϕ2ýêñï (tk ) = ϕ2ýêñï (tk−1 ) + α[y(tk ) − ϕ2ýêñï (tk−1 )], k = 2,n,
где n – число отсчётов исследуемой реализации y(t); α – параметр
сглаживания ( 0 ≤ α ≤ 1 ). Поскольку имеется рекуррентный алгоритм экспоненциального сглаживания, следовательно, оператор
экспоненциального сглаживания удобно использовать при оперативной статистической обработке результатов эксперимента.
Оператор скользящего сглаживания [1, 9, 12]
Оценка аддитивного тренда НСП y(t) с помощью оператора
скользящего сглаживания для конечного t имеет вид:
ϕ2ñê (t) =
1
Tc
t+Tc /2
∫
y(τ)dτ,t ∈ [
t−Tc /2
Tc
T
,T − c ].
2
2
Оператор скользящего сглаживания широко применяется при
оценивании вероятностных характеристик НСП. Это вызвано простой его организацией, а также возможностью оперативной обработки результатов эксперимента.
Существует модификация оператора скользящего сглаживания – оператор выборочного сглаживания, который отличается
тем, что очередные интервалы сглаживания выбираются на определённом расстоянии Tk, т. е.
T T
T
T
T − Tc
t = c , c + Tk , c + 2Tk , ..., c + [
]Ö× ,
2 2
2
2
Tk
где […]ЦЧ – функция целой части.
38
При сравнении операторов следует отметить, что оператор выборочного сглаживания, с одной стороны, менее информативен,
следовательно, погрешность при оценивании аддитивного тренда
больше из-за увеличения, в основном, случайной составляющей
погрешности, с другой стороны, позволяет оперативно обрабатывать более высокочастотные процессы.
Таким образом, на основании проведённого сравнительного анализа ОС можно сделать вывод о том, что практический интерес при
обработке НСП в темпе поступления данных эксперимента представляют операторы экспоненциального и скользящего сглаживания.
Рекомендуемая литература
1.  Романенко А. Ф., Сергеев Г. А. Вопросы прикладного анализа случайных процессов. М.: Сов. радио, 1968. 255 с.
2.  Шегай А. Д. Исследование и разработка методов анализа случайных процессов по одной реализации: автореф. дис. ... канд. техн. наук. Л.,
1973. 15 с.
3.  Сравнительный анализ алгоритмов фильтрации / Е. И. Бойко, Ю. И Воловик, М. Н.Медынцев, М. В. Подобед // Изв. ЛЭТИ. 1978. № 232. С. 97–101.
4.  Линник Ю. В. Математическая статистика. Л.: Наука, 1982. 284 с.
5.  Хотимский В. И. Выравнивание статистических рядов по методу
наименьших квадратов (способ Чебышева). М.: Госстатиздат, 1959. 87 с.
6.  Шегай А. Д. Методы определения математического ожидания одного класса нестационарных случайных процессов // Изв. ЛЭТИ. Л., 1973.
№ 121. С. 44–49.
7.  Хьюлсман Л. П. Активные фильтры. М.: Мир, 1972. 516 с.
8.  Прянишников В. А. Исследование и разработка методов и автоматических устройств для корреляционного анализа СП в условиях априорной
неопределённости: автореф. дис. ... канд. техн. наук. Л., 1980. 15 с.
9.  Цветков Э. И. Основы теории статистических измерений. Л.: Энергия, 1979. 286 с.
10.  Сенин А. Г. К оценке среднего значения случайной величины рекуррентным алгоритмом с постоянным шагом // Автометрия. 1972. № 2.
С. 115–116.
11.  Андреев В. Н., Демин В. А. Об одной модификации алгоритма экспоненциального сглаживания // Тр. IX Всесоюз. симп. «Методы представления и аппаратурный анализ случайных процессов и полей». Л.: ВНИИЭП,
1976. Т. 5. С. 78–81.
12.  Романенко А. Ф., Сергеев Г. А. Аппроксимативные методы анализа
случайных процессов. М.: Энергия, 1974. 177 с.
13.  Семесенко М. П., Рамазанов С. К. Методы оптимальной фильтрации многомерных случайных процессов для мини-ЭВМ. Препринт 76-41.
Киев, 1976. 49 с.
39
5. ИДЕНТИФИКАЦИЯ МОДЕЛИ ПРОЦЕССА
ПРИ ОБРАБОТКЕ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
При вычислении ВХ по одной СП первая задача, которую необходимо решить, заключается в выборе модели процесса. При этом
можно выдвинуть модели стационарного, локально-стационарного
или нестационарного процесса. Большинство результатов теории
вероятности и математической статистики относятся к исследованию ССП или, другими словами, процессов, достигших статистического равновесия.
Для ССП x(t) выполняются следующие условия.
1. Математическое ожидание μx(t) и дисперсия Dx(t) процесса
x(t) постоянны во времени:
μx(t) = μx, Dx(t) = Dx = σ2X для t ∈ [0,T ],
где σ2X – среднеквадратическое отклонение.
2. Корреляция между любыми двумя элементами процесса зависит только от расстояния во времени между этими наблюдениями
или от разности между их номерами
Rx(t1, t2 – t1) = Rx(τ = 0) = Dx ≥ 0 для t ∈ [0,T ],
Rx(τ) = Rx(–τ), Rx(τ) < Dx.
В настоящее время хорошо разработан аппарат анализа ССП.
Отклонение от стационарности, например нестационарность по
математическому ожиданию или нестационарность по дисперсии,
приводит к погрешностям расчетов ВХ: корреляционная функция,
спектральная плотность мощности и т. д. Исходя из этого необходима предварительная идентификация класса модели процесса.
В результате идентификации должна быть принята одна из моделей: процесс стационарный – ССП, процесс нестационарный по математическому ожиданию – аддитивный НСП, процесс нестационарный по дисперсии – мультипликативный НСП.
Один из возможных путей решения проблемы идентификации
вида модели связан с применением набора решающих правил (статистических гипотез) к исходному процессу x(t).
Статистическая гипотеза – это утверждение о некоторой ВХ
исследуемого процесса. Примерами статистических гипотез являются предположения о типе закона распределения наблюдаемой
СВ, о числовых значениях параметров распределения, о типе зави40
симости между наблюдаемыми величинами и др. Выдвинутую гипотезу называют нулевой или основной и обозначают H0, а противоположную ей гипотезу H1 называют альтернативной или конкурирующей. Методы проверки статистических гипотез называются
статистическими критериями.
Пусть выдвигается некоторая гипотеза H0 относительно модели
исследуемого процесса. Решение задачи заключается в вычислении
некоторой статистики критерия, которая имеет свое распределение
и правило принятия или отклонения гипотезы H0 с некой условной
вероятностью.
Предположим, что выборочное значение Z, являющееся оценкой параметра Z, имеет плотность вероятности P(Z). Для простоты
возьмем нормальное (гауссово) распределение. Теперь, если гипотеза H0: Z = Z0 верна, то P(Z) должна иметь среднее значение Z0
(рис. 5). Обычно представляет интерес оценка значения Z, в терминах некоторого интервала Z1 < Z < Z2 , в который Z попадает с
заданной степенью достоверности, характеризуемой параметром α.
Такой интервал можно построить, если известно выборочное распределение рассматриваемой оценки. Вероятность того, что Z окажется меньше нижней границы Z1, равна

P(Z < Z1 ) =
Z1
∫
−∞
  α
P(Z)dZ = ,
2

а вероятность того, что Z превзойдет верхнюю границу Z2, равна
∞

  α
P(Z > Z2 ) = ∫ P(Z)dZ = .
2
Z2
1;
¨ÄÇÒ¹½Õ   s
;
;
;
;
Рис. 5
41

Следовательно, вероятность того, что Z окажется вне интервала
[Z1, Z2], равна α.
Пусть теперь α настолько мала, что представляется крайне не
правдоподобным выход Z за пределы интервала [Z1, Z2]. Если вы
борка была такой, что вычисленное по ней значение Z оказалось
вне интервала, то появились бы серьезные основания сомневаться в истинности исходной гипотезы
Z = Z0, поскольку в случае ее ис
тинности такое значение Z было бы крайне неправдоподобным.
Поэтому гипотезу
 Z = Z0 необходимо отвергнуть. С другой стороны,
если значение Z попадает в интервал, то нет никаких серьезных
оснований для того, чтобы ставить под сомнение истинность исходной гипотезы. Следовательно, гипотеза Z = Z0 может быть принята.
Вероятность α называется уровнем значимости критерия. Область значений Z, при которых гипотеза должна быть отвергнута,
называется областью отклонения гипотезы, или критической областью.
Описанный выше простой критерий испытания называется
двухсторонним критерием, так как в том случае, когда гипотеза
неверна, значение Z может быть либо больше Z0, либо меньше. Следовательно, нужно проверять значимость отклонений Z от Z0 в обе
стороны. В других случаях достаточно бывает односторонних критериев. Например, пусть гипотеза состоит в том, что Z ≥ Z0. Следовательно, в критерии должна использоваться только
нижняя гра
ница, определяемая по плотности вероятности P(Z).
При проверке гипотез возможны два типа ошибок. Во-первых,
гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода. Во-вторых, гипотеза
может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода. На рис. 5 видно, что ошибка
первого рода
происходит в том случае, когда при справедливости

гипотезы Z попадает в область ее отклонения. Следовательно, вероятность ошибки первого рода равна α, т. е. уровню значимости
критерия.
Для определения вероятности ошибки второго рода следует
уточнить отклонение истинного значения параметра от постулируемого гипотезой и подлежащего проверке значения Z0. Предположим, что истинный параметр равен либо Z = Z0 + d, либо Z = Z0–d
(рис. 6). Если гипотеза состоит в том, что Z = Z0, тогда как на самом
42
1;
B
sB
¨ÄÇÒ¹½ÕsB
;sE ;
;
; ;E
;
Рис. 6

деле Z = Z0 + d или Z = Z0 – d, то вероятность того, что Z попадает
в область принятия гипотезы, заключенную между Z1 и Z2, равна
β. Следовательно, вероятность ошибки второго рода равна β при выявлении отклонений величиной +d или –d от гипотетического значения Z0.
Вероятность β называется мощностью критерия. Очевидно, при
любом заданном значении выборки N вероятность ошибки первого рода может быть сделана сколь угодно малой за счет уменьшения уровня значимости α. Однако при этом возрастает вероятность
ошибки второго рода β, т. е. уменьшается мощность критерия.
Единственный способ одновременно уменьшить и α, и β состоит
в увеличении
объема выборки N, используемой для вычисления

оценки Z . Такие соображения лежат в основе выбора нужного объема выборки в статистических экспериментах.
Статистическая гипотеза, являющаяся утверждением о параметрах конкретного вероятностного распределения, например о
среднем, дисперсии, коэффициенте корреляции и др., называется
параметрической.
Статистическая гипотеза называется непараметрической в случае, когда она является:
– утверждением о некоторых свойствах вероятностных распределений исследуемых процессов. Например, симметричности распределения, совпадении функций распределения двух или более
СВ, принадлежности выборки данному классу вероятностных распределений и т. д.;
– независимым от вида вероятностного распределения утверждением о параметрах СВ. Например, о равенстве двух и более средних арифметических или дисперсий при неизвестных вероятностных распределениях этих СВ и т. д.
43
¦ž¨™©™¥ž«©¡°žª£¡ž£©¡«ž©¡¡
¥ÆǼǻԺÇÉÇÐÆÔ¾
»ÌλԺÇÉÇÐÆÔ¾
ªË¹ÏÁÇƹÉÆÇÊËÁ
Êɾ½Æ¾¼Ç
£ÉÁ˾ÉÁÁÇÊÆÇ»¹Æ
ÆԾƹɹƼǻÔÎ
ÊÌÅŹέÉÁ½Å¹Æ¹
ªË¹ÏÁÇƹÉÆÇÊËÁ
Êɾ½Æ¾¼Ç
£ÉÁ˾ÉÁÂ
Ëɾƽ¹
£ÉÁ˾ÉÁÁÇÊÆÇ»¹Æ
ÆԾƹÀƹÃÇ»ÔÎ
ɹƼ¹Î¬ÁÄÃÇÃÊÇƹ
£ÉÁ˾ÉÁÂ
ªÁ½¿¾Ä¹s
«Õ×ÃÁ
£ÉÁ˾ÉÁÂ
™ÆʹÉÁs
šÉÖ½ÄÁ
£ÉÁ˾ÉÁÂ
£ÉÁ˾ÉÁÂ
£ÇÃʹs
«ÖÂĹ
ªËÕ×¹É˹
ªË¹ÏÁÇƹÉÆÇÊËÁ
½ÁÊȾÉÊÁÁ
£ÉÁ˾ÉÁÂ
„ÊÃĹ½ÆǼÇ
ÆÇ¿¹¥ÁÄľɹ”
ªË¹ÏÁÇƹÉÆÇÊËÁ
½ÁÊȾÉÊÁÁ
£ÉÁ˾ÉÁÂ
£ÉÁ˾ÉÁÂ
ÀƹÃÇ»
™ºº¾
ɹÀÆÇÊËÁ
£ÉÁ˾ÉÁÂÅÆÇ¿¾ÊË»¾ÆÆÔÎÊɹ»Æ¾
ÆÁÂÇÊÆÇ»¹ÆÆÔÂƹÊÌÅŹÎ
ɹƼǻ£É¹ÃÊþĹs¬ÇÄѹ
©¹Æ¼Ç»Ô¾
ÃÉÁ˾ÉÁÁ
§½ÆǻԺÇÉÇÐÆÔ¾
£ÉÁ˾ÉÁÂ
ɹÊʾØÆÁØ
£ÉÁ˾ÉÁÂ
ÀƹÃÇ»
­ÁѾɹ
ªË¹ÏÁÇƹÉÆÇÊËÁ
Êɾ½Æ¾¼Ç
ƹÃǻԾ
ÃÉÁ˾ÉÁÁ
£ÉÁ˾ÉÁÂ
ʽ»Á¼¹
©¹Æ¼Ç»Ô¾
ÃÉÁ˾ÉÁÁ
£ÉÁ˾ÉÁÂ
ÀƹÃÇ»ÔÎ
ɹƼǻ
¬ÁÄÃÇÃÊÇƹ
£ÉÁ˾ÉÁÂ
ɹƼǻÔÎ
ÊÌÅÅ
¬ÁÄÃÇÃÊÇƹ
Рис. 7
Если априори известно, что закон распределения исследуемого СП гауссов, то при идентификации класса НСП целесообразно
применять параметрические критерии с использованием принципа сложного критерия, который заключается в последовательной
проверке гипотезы о стационарности относительно каждой его ВХ,
а решение о классе СП выносится на основании результатов проверки ряда гипотез.
44
¨™©™¥ž«©¡°žª£¡ž£©¡«ž©¡¡
¥ÆǼǻԺÇÉÇÐÆÔ¾
§½ÆǻԺÇÉÇÐÆÔ¾
ªË¹ÏÁÇƹÉÆÇÊËÁ
Êɾ½Æ¾¼Ç
'ÃÉÁ˾ÉÁÂ
ǽÆÇ͹ÃËÇÉÆǼÇ
½ÁÊȾÉÊÁÇÆÆǼÇ
¹Æ¹ÄÁÀ¹
½ÁÊȾÉÊÁÁ
ªË¹ÏÁÇƹÉÆÇÊËÁ
½ÁÊȾÉÊÁÁ
£ÉÁ˾ÉÁÂÅÆÇ
¿¾ÊË»¾ÆÆÔÎ
Êɹ»Æ¾ÆÁÂÊɾ½
ÆÁΫÕ×ÃÁ®Ç
ÌÄĹs¿¾Âʹ
«¹ÎŹƹ
»ÌλԺÇÉÇÐÆÔ¾
£ÉÁ˾ÉÁÁƹÈɹ»Ä¾Æ
ÆԾƹÈÉÇ»¾ÉÃÌÃÇÆ
ÃɾËÆÔÎȹɹžËÉÇ»
£ÉÁ˾ÉÁÁš¹ÉËľË˹s £ÉÁ˾ÉÁÁ£ÇÃɾƹ
£¾Æ½¹ÄĹÃ̺Áо
Áš¹ÉËľË˹ÁÊ
ÊÃǼÇÃÇÉÆØÁÊ
ÈÇÄÕÀÌ×ÒÁ¾»ÔºÇ
ÈÇÄÕÀÌ×ÒÁ¾Ê˹ËÁ
ÉÇÐÆÔ¾½ÁÊȾÉÊÁÁ
ÊËÁÃÁËÁȹ
Cû¹½É¹ËÁ'ÇËÆÇ
ѾÆÁÂ
£ÉÁ˾ÉÁÂȹÉÆÔÎ
Êɹ»Æ¾ÆÁÂÊɾ½ÆÁÎ
ªË¹ÏÁÇƹÉÆÇÊËÁ
Êɾ½Æ¾¼Ç
ªË¹ÏÁÇƹÉÆÇÊËÁ
½ÁÊȾÉÊÁÁ
£Ä¹ÊÊÁоÊÃÁÂ
ÃÉÁ˾ÉÁ­ÁѾɹ
£ÉÁ˾ÉÁªËÕ×
½¾Æ˹ÈÉÁž
ÆؾÅÔÂÈÉÁɹ
»¾ÆÊË»¾½ÁÊȾÉ
ÊÁÂÁƾÀ¹»ÁÊÁ
ÅÔλԺÇÉùÎ
£ÉÁ˾ÉÁ¬ÖÄй
ÈÉÁžÆؾÅÔÂ
ÈÉÁƾɹ»¾ÆÊË»¾
½ÁÊȾÉÊÁÂÁƾ
À¹»ÁÊÁÅÔλÔ
ºÇÉùÎ
£ÉÁ˾ÉÁªËÕ×
½¾Æ˹ÈÉÁž
ÆؾÅÔÂÈÉÁƾ
ɹ»¾ÆÊË»¾½ÁÊ
ȾÉÊÁÂÁÀ¹»ÁÊÁ
ÅÔλԺÇÉùÎ
;&5ÃÉÁ˾ÉÁÂ
ÈÉÁžÆؾÅÔ»ÊÄÌй¾
ÁÀ»¾ÊËÆÔνÁÊȾÉÊÁÂ
Рис. 8
Классификации наиболее распространенных непараметрических и параметрических критериев проверки статистических гипотез о стационарности среднего и дисперсии приведены на рис. 7 и
8. Рассмотрим некоторые из этих критериев.
45
5.1. Критерии проверки гипотез о стационарности среднего
Критерий Аббе
Критерий Аббе, называемый иногда критерием среднего квадрата последовательных разностей, применяется для проверки гипотезы H0 о стационарности среднего значения одинаково нормально
распределенных случайных величин Xi , i = 1, N. Параметры распределения μx и Dx неизвестны.
По имеющейся выборке Xi , i = 1, N оценивается Dx = σ2X двумя
способами.
Сначала рассматривается несмещенная оценка
S2 =
1 N
∑ (Xi − X2 ).
N i=1
Во втором способе для оценки σ2X применяется величина
где d2 =
1 N−1
∑ (Xi+1 − Xi )2 .
N −1 i=1
d2
,
2
Если гипотеза H0 верна, то
M (d2 ) =
1 N−1
∑ [D(Xi+1 ) − 2R(Xi+1, Xi ) + D(Xi )] = 2σ2X ,
N −1 i=1
где M – математическое ожидание, а D – дисперсия.
Если гипотеза H0 верна, то математическое ожидание и дисперd2
сию статистики q = 2 можно представить формулами
2S
N −2
M (q) = 1, D(q) =
.
N2 −1
Причем, если N → ∞, то статистика (q −1) (N 2 −1) / (N − 2)
распределена асимптотически по нормальному закону с параметрами μx = 0 и Dx = 1. Сокращенно обозначают N(0,1). Сходимость к стандартному нормальному закону улучшается, если
воспользоваться нелинейным относительно q преобразованием
(q −1) (2N + 1) / (2 − (q −1)2 ).
В качестве альтернативы H0 часто рассматривают гипотезу H1,
по которой каждое последующее наблюдение положительно коррелированно с предыдущим, т. е. имеется тренд.
46
Если верна гипотеза H1, то знаменатель q больше числителя, и поэтому значения этой статистики будут, как правило, меньше значений,
наблюдаемых при справедливости гипотезы H0. Поэтому для приближенных расчетов можно воспользоваться следующим правилом:
– если последовательные значения независимы, то справедливо
соотношение q ≅ 2;
– если имеется тренд, то q < 2, так как соседние значения ближе
друг к другу, чем отдаленные.
В случае, когда N > 60, для вычисления qN(α) рекомендуется
воспользоваться приближенной формулой
qN (α) ≅ 1 +
Uα
N + 0,5(1 + Uα2 )
,
где Uα – квантиль уровня значимости α стандартного нормального
распределения. Если q < qN(α), то гипотеза H0 отвергается. Если q ≥
qN(α), то можно допустить, что наблюдения не содержат систематического сдвига математического ожидания. Случайная величина
T = (q −1) (2N + 1) / (2 − (q −1)2 )
при N→∞ распределена приближенно по нормальному закону с параметрами N(0,1). Поэтому если T > Uα, то гипотезу H0 следует отвергнуть.
Критерий Стьюдента
Критерий Стьюдента основан на анализе двух выборок:
X1i , i = 1, N1 и X2 j , j = 1, N 2 . Предположим, что они получены из
одной и той же нормальной генеральной совокупности. Проверим
эту гипотезу. На практике для проверки гипотезы о двух средних
нормальных генеральных совокупностях используется t-критерий
Стьюдента. Однако часто его применение некорректно, поскольку
предположение о дисперсии распределения опускается. Если же
принять во внимание имеющиеся данные о дисперсии, то математические выражения для вычисления t-критерия будут различными.
Различаются также необходимые в этом случае степени свободы.
Остановимся на этом более подробно. Обозначим μx1, μx2 и
σ2X1, σ2X2 – математические ожидания и дисперсии генеральных
совокупностей соответственно. Рассмотрим несколько случаев.
47
1. Гипотеза H0 : µ X2 = µ0 ; H1: µ X2 ≠ µ0 .
Пусть X2 – оценка μx2 и положим N1 = 1. Вычисляем Т-статистику критерия:
X2 − µ0
T=
N2 .
S2
Степень свободы ν = N2 −1.
2. Гипотеза H0 : µ X1 = µ X2 , σ X1 = σ X2 ; H1: µ X1 ≠ µ X2 .
Вычисляем Т-статистику критерия:
T=
где S =
X2 − X1
1 / N1 + 1 / N2
S
,
(N1 −1)S12 + (N2 −1)S22
.
N1 + N2 − 2
Степень свободы ν = N1 + N2 − 2.
3. Гипотеза H0 : µ X1 = µ X2 , σ X1 ≠ σ X2 ; H1: µ X1 ≠ µ X2 .
Вычисляем Т-статистику критерия
T=
X2 − X1
S12
/ N1 + S22 / N2
.
Степень свободы




(S12 / N1 + S22 / N2 )2
,
ν=
 2

2
2
2


(
S
/
N
)
/
(
N
1
)
(
S
/
N
)
/
(
N
1
)
+
+
+
 1

1
1
2
2
2


где {W} – целая часть числа W.
4. Гипотеза H0 : µ X1 = µ X2 , никаких предположений о σ, N1, N2 ;
H1: µ X1 ≠ µ X2 .
Вычисляем Т-статистику критерия:
T=
(X2 − X1 ) N2
S
N2
∑ (X2i − X1i − (X2 − X1 ))2
где S =
i=1
N2 −1
Степень свободы ν = N2–1.
48
.
,
В условиях справедливости гипотезы H0 статистика критерия T
подчинена t-распределению Стьюдента с ν степенями свободы. Если
вычисленное по выборкам значение статистики T принадлежит
критической области, т. е. | Ò |> t1−α /2 (ν), где t1−α /2 (ν) – квантиль
уровня (1–α/2) t-распределения Стьюдента, то гипотеза о равенстве
средних двух нормальных генеральных совокупностей отвергается, в противном случае гипотеза принимается.
Критерий серий
Критерий серий, основанный на проверке знаковой последовательности на случайность, позволяет проверить гипотезу о стационарности среднего. Рассмотрим последовательность, состоящую из
M элементов + + … + + + и N элементов −− ... −−− . Назовем сериями части последовательности, каждая из которых состоит из элементов одного вида. Если последовательность получена как резульM
тат эксперимента, в котором появление всех возможных CM
+N
(предполагаем M < N) вариантов одинаково вероятно, то отмечают,
что элементы + + … + + + и −− ... −−− в последовательности расположены случайно.
Пусть ν – общее количество серий в данной последовательности.
Гипотезы: H0 – элементы + + … + + + и −− ... −−− расположены
случайно; H1 – в расположении элементов наблюдается закономерность, т. е. появление более длинных серий из элементов какого-то
типа, например −− ... −−− . В этом случае число серий будет меньше, чем при выполнении гипотезы H0.
Для больших значений M и N распределение величины ν аппроксимируется нормальным распределением со средним и дисперсией
µν = 1+
2MN (2MN − M − N)
2MN
2
.
; σν =
M+N
(M + N)2 (M + N −1)
В этом случае статистика критерия
T=
ν − µ ν + 0,5
(0,5 – поправка на непрерывность)
σν
подчиняется нормальному закону N(0,1). Если отношение M/N
мало, то нормальная аппроксимация распределения количества серий может оказаться ненадежной.
49
5.2. Критерии проверки гипотез о стационарности дисперсии
Критерий Фишера
Критерий Фишера применяется для проверки гипотезы о равенстве дисперсий. Пусть S12 и S22 – две независимые оценки дисперсий σ12 и σ22 по выборочным данным объемами N1 и N2 соответственно. С помощью этих двух выборочных дисперсий проверяется
гипотеза H0 : σ12 = σ22 против альтернативной гипотезы H1: σ12 ≠ σ22
при заданном уровне значимости α. В зависимости от объемов выборочных данных возможны различные случаи.
1. При малых (десятки значений) и средних (сотни) объемах выборок статистика критерия для проверки гипотезы H0 против гипотезы H1 имеет вид
S2
2
2
T = 12 , где S1 > S2 .
S2
В условиях справедливости гипотезы H0 статистика критерия
подчинена F-распределению с ν1 = N1 −1 и ν2 = N2 −1 степенями
свободы. Если вычисленное по выборочным дисперсиям значение статистики T (дисперсионное отношение) принадлежит критической области, т. е. Ò ≤ Fα /2 (ν1, ν2 ) или Ò ≤ F1−α /2 (ν1, ν2 ), где
Fα (ν1, ν2 ) – квантиль уровня значимости α F-распределения с ν1
и ν2 степенями свободы, то гипотеза H0 отвергается, в противном
случае гипотеза принимается.
2. При средних и больших объемах выборок статистика критерия для проверки гипотезы H0 против гипотезы H1 имеет вид
T1 =
1 / 2 ln(T) + 1 / 2(1 / ν1 −1 / ν2 )
1 / 2(1 / ν1 + 1 / ν2 )
.
Статистика T1 в условиях справедливости гипотезы H0 подчиняется нормальному распределению N(0,1), т. е. | T1 |< U1−α /2 .
3. При больших и очень больших объемах выборок (N1, N2 >100)
статистика критерия для проверки гипотезы H0 против гипотезы
H1 имеет следующий вид:
T2 =
50
| S1 − S2 |
S12
/ 2N1 + S22 / 2N2
.
Статистика T2 в условиях справедливости гипотезы H0 подчиняется нормальному распределению N(0,1), т. е. | T2 |< U1−α /2 .
Для идентификации класса СП в случае, когда распределение
исследуемой выборочной реализации отлично от нормального (гауссова) или о нем априори ничего не известно, неоспоримы преимущества непараметрических методов проверки гипотез о стационарности. Это обусловлено тем, что они не предназначены для какоголибо конкретного параметрического семейства распределений.
Критерий Ансари – Бредли
Критерий Ансари – Бредли предназначен для проверки гипотезы о стационарности дисперсии. Предположим, что выборки объемами M и N имеют одну и ту же медиану или их медианы известны.
Необходимо выполнить следующие процедуры.
1. Объединить две выборки и упорядочить k = M + N наблюдений в вариационный ряд.
2. Присвоить наблюдениям ранги Ri = 1, k / 2 следующим образом. Наименьшему и наибольшему из наблюдений в объединенной
выборке присвоить ранг 1. Следующей паре – ранг 2 и т. д. Если k
четно, то расположение рангов такого 1, 2, 3, …, k/2, k/2, …, 3, 2,
1, если k нечетно, то 1, 2, 3, …, (k – 1)/2, (k + 1)/2, …, 3, 2, 1. Если
среди k наблюдений есть одинаковые, то заменить их связанными
рангами.
3. Вычислить сумму рангов (статистику)
 M k +1
k + 1 
− | Ri −
T = ∑
|.
2 
i=1 2
4. Для выборок большого объема (k) используется аппроксимация статистики T нормальным распределением:
T1 =
T1 =
T − 0,25M (M + N + 2) / 4
MN (M + N + 2)(M + N − 2) / (48(M + N −1))
T − M (M + N + 1)2 / (4(M + N))
MN (M + N + 1)(3 + (M + N)2 ) / (48(M + N)2 )
, где k – четное;
, где k – нечетное.
Для двухстороннего критерия гипотеза H0 с уровнем значимости
α принимается, если T1 < U1−α /2 , и отвергается, если T1 ≥ U1−α /2 ,
51
где U1−α /2 – квантиль нормального распределения уровня значимости 1–α/2.
При построении модели исследуемого процесса – результата обработки результатов эксперимента целесообразно для преодоления
априорной неопределённости относительно класса СП применение
принципа адаптации [6, 7]. При этом процесс относится к одному
из рассматриваемых классов СП на основе анализа результатов
применения некоторого набора решающих правил (статистик).
Рекомендуемая литература
1. Бендат Дж., Пирсол А. Прикладной анализ случайных данных: пер.
с англ. М.: Мир, 1989. 540 с.
2. Кендалл М. Временные ряды: пер. с англ. М.: Финансы и статистика, 1981. 218 с.
3. Марпл С. Цифровой спектральный анализ и его приложения: пер. с
англ. М.: Мир, 1990. 584 с.
4. Петрович М. Л., Давидович М. И. Статистическое оценивание и проверка гипотез на ЭВМ. М.: Финансы и статистика, 1989. 191 с.
5. Справочник по прикладной статистике: пер. с англ. М.: Финансы и
статистика, 1989. Т. 1. 510 с.; 1990. Т. 2. 526 с.
6. Цыпкин Я. З. Оптимальные адаптивные системы. М.: Наука, 1972.
311 с.
7. Миленький А. В. Классификация сигналов в условиях неопределённости. М.: Сов. радио, 1975. 328 с.
52
6. ПОСТРОЕНИЕ АВТОРЕГРЕССИОННОЙ МОДЕЛИ ПРОЦЕССА
ПО РЕЗУЛЬТАТАМ ЭКСПЕРИМЕНТА
Одной из основных задач при анализе результатов эксперимента является получение модели СП, обладающей максимальной
простотой, минимальным числом параметров и при этом адекватно описывающей наблюдение. Получение таких моделей важно по
следующим причинам.
1. Модели могут помочь понять природу системы, генерирующей временные процессы.
2. Модели можно использовать для оптимального прогнозирования будущих значений временных процессов.
3. Если исследуются два или несколько временных процессов,
то можно расширить модели так, чтобы они описывали динамические взаимосвязи между ними.
4. Модели могут быть использованы для выработки стратегии
оптимального управления. Эта стратегия указывает, каким образом надо изменять регулируемую переменную для того, чтобы минимизировать возмущение некоторой зависимой переменной.
Рассмотрим процесс построения моделей. Он заключается в
установлении соответствия выбранного класса статистических моделей с имеющимися данными эксперимента и существенно более
сложен, чем простая подгонка моделей.
Сначала необходимо применять методы идентификации, предназначенные для определения требуемого класса моделей. Эти методы используют корреляционные и автокорреляционные функции. Подгонка идентифицированной модели к временному ряду
при помощи функции максимального правдоподобия или метода
наименьших квадратов не обязательно дает адекватное описание
процесса. Поэтому необходимо провести диагностическую проверку для выявления неадекватности модели и выработки подходящих изменений. В случае необходимости может быть проведен еще
один или несколько итеративных циклов идентификации, подгонки и диагностической проверки. Очевидно, что важным инструментальным средством решения этой итеративной задачи является
диалоговое программное обеспечение.
Многие встречающиеся на практике СП можно описать с помощью модели авторегрессии порядка p: AP(p). В этой модели текущее значение процесса выражается через конечную линейную совокупность предыдущих значений процесса и величины Zt – неза53
висимых случайных значений с фиксированным распределением.
Обычно распределение гауссово (нормальное) с параметрами Mz
= 0 и DZ = σ2Z = 1 , сокращенно обозначают N(0,1). Такая последовательность случайных значений Zt , Zt−1, Zt−2 , ... называется
«белым шумом». Таким образом, процесс авторегрессии порядка p
можно представить в следующем виде:
Xt = ϕ1 Xt−1 + ϕ2 Xt−2 + ... + ϕ p Xt− p + Zt . (13)
Введем авторегрессионный оператор порядка p
ϕ(B) = 1 − ϕ1β − ϕ2β2 − ϕ3β3 − ... − ϕ pβ p , (14)
где B – оператор сдвига назад, тогда
BXt = Xt−1, ..., B p Xt = Xt− p . (15)
Тогда модель (13) может быть записана более экономно
ϕ(B) Xt = Zt . (16)
В этой модели p + 2 неизвестных параметра: μ, ϕ1, ϕ2 , ..., ϕ p ,
σ2Z , которые должны быть оценены по имеющимся экспериментальным данным об изучаемом процессе. Если последовательно
раскрыть Xt–1, Xt–2, Xt–3, … как Zt–1, Zt–2, Zt–3, …, то получим
эквивалентную запись бесконечной взвешенной суммы реализаций
«белого шума»
Xt = ϕ(B) Zt . (17)
Однако здесь количество неизвестных параметров модели оказывается бесконечным и форма модели (16) будет явно предпочтительнее. Из форм моделей (16) и (17) следует, что
ϕ(B) = ϕ−1 (B). (18)
Авторегрессионные процессы могут быть стационарными и нестационарными. Для того чтобы процесс был стационарным, коэффициенты ϕ должны быть выбраны так, чтобы веса ϕ1, ϕ2 , ϕ3 , ...
в модели (18) образовывали сходящийся ряд.
Автокорреляционная функция является одним из основных
элементов при построении модели авторегрессии вида (13).
Умножим выражение (13) на Xt–k. Берем математическое ожидание и получаем разностное уравнение для автоковариаций γ :
54
γ k = ϕ1 γ k−1 + ϕ2 γ k−2 + ... + ϕ p γ k− p , k > p. (19)
Отметим, что M (Xt−k , Zt ) → 0, когда k > 0, так как Xt–k может
включать реализации «белого шума», имевшие место лишь до момента t – k, а они некоррелированы с Zt. Разделив обе части разностного уравнения на γ 0 , получим, что автокорреляционная функция
удовлетворяет разностному уравнению того же вида
ρk = ϕ1ρk−1 + ϕ2ρk−2 + ... + ϕ p ρk− p . (20)
Заметим, что уравнение аналогично разностному уравнению,
которому удовлетворяет сам процесс Xt. Таким образом, уравнение
(20) можно записать в виде
ϕ(B)ρk = 0. (21)
Если подставить в уравнение (21) значения k = 1, 2, 3, …, p, то
получим систему линейных уравнений для ϕ1, ϕ2 , ϕ3 , ..., ϕ p со свободными членами ρ1,ρ2 ,ρ3 , ..., ρ p:
 ρ1 = ϕ1 + ϕ2ρ1 +... + ϕ p ρ p−1




 ρ2 = ϕ1ρ1 + ϕ2 +... + ϕ p ρ p−2
.


...
...
...
...
...





ρ p = ϕ1ρ p−1 + ϕ2ρ p−2 +... + ϕ p
Это уравнения Юла – Уокера. Заменив теоретические автокорреляции ρk на их оценки rk, получим оценки Юла – Уокера для
параметров модели. Для выбора порядка AP-модели предложено
много различных критериев – своего рода целевых функций.
Два подобных критерия были предложены Акаике.
Первый из критериев Акаике – это окончательная ошибка
предсказания (OOП). Согласно этому критерию выбор порядка APпроцесса осуществляется таким образом, чтобы минимизировать
среднюю дисперсию ошибки на каждом шаге предсказания. Окончательная ошибка предсказания для AP-процесса определяется выражением
OOÏ[ p] = σ2Z
N + ( p + 1)
,
N − ( p + 1)
где p – порядок AP-процесса; σ2Z – оценочное значение дисперсии
«белого шума»; N – число отсчетов данных.
55
Выбирается такое значение порядка, при котором величина
OOП минимальна. Для идеальных AP-процессов данный критерий
обеспечивает отличные результаты, однако применительно к реальным данным эксперимента, как показали Джонни и Берриман,
оказывается слишком консервативным и приводит к выбору заниженного порядка модели авторегрессии.
Второй критерий Акаике основан на методике максимального правдоподобия и получил название информационного критерия Акаике (ИКА). Согласно этому критерию порядок модели
определяется посредством минимизации некоторой теоретикоинформационной функции. Если предположить, что исследуемый
AP-процесс имеет гауссовы характеристики, то ИКА будет определяться следующим выражением:
ÈÊÀ[ p] = N ln(σ2Z ) + 2 p.
Элемент 2p характеризует плату за использование дополнительных AP-коэффициентов, но это не приводит к значительному уменьшению ошибки предсказания. И здесь выбирается порядок модели,
который минимизирует значение ИКА. При N → ∞ первый и второй
критерии Акаике асимптотически эквивалентны. Как и в случае
критерия OOП, порядок модели, выбираемый в соответствии с критериями ИКА, в случае данных, не соответствующих авторегрессионным процессам, очень часто оказывается заниженным.
Отметим, что ИКА оказывается статистически несостоятельным критерием в том смысле, что вероятность ошибки при выборе правильного порядка модели не стремится к нулю при N → ∞.
Это приводит к завышению значения порядка модели в том случае,
когда длина записи данных возрастает. Для устранения указанного недостатка был разработан другой вариант ИКА, который имеет
следующую форму:
ÄÌÎ[ p] = N ln(σ2Z ) + p ln(N),
где ДМО – длина максимального описания, о котором можно сказать, что она статистически состоятельна, поскольку величина
pln(N) растет с увеличением N быстрее, чем в случае с p.
При построении модели вначале неизвестно, какого порядка авторегрессионный процесс надо приблизить к фактическому ряду.
Инструментом решения этой проблемы служит частная автокорреляционная функция.
56
Обозначим j-й коэффициент в авторегрессионном процессе порядка k через ϕkj так, что ϕkk есть последний коэффициент. Величина ϕkk рассматривается как функция от задержки и называется частной автокорреляционной функцией. Частные корреляции
можно оценивать последовательной подгонкой процессов авторегрессии порядка 1, 2, 3, … методом наименьших квадратов и последовательным нахождением оценок коэффициентов.
Если значения параметров не слишком близки к границам нестационарности, то для их оценки можно использовать уравнения
Юла – Уокера. Использование частной автокорреляционной функции для анализа основано на том, что хотя процесс AP(p) имеет бесконечно протяженную функцию автокорреляции, тем не менее он
может быть описан при помощи p нулевых функций от автокорреляций, что приводит к системе уравнений
ρj = ϕk,1ρj−1 + ... + ϕk,(k−1) ρj−k+1 + ϕk,k ρj−k , j = 1, 2, 3, …, k
или в виде системы уравнений Юла – Уокера
 1

 ρ1

 ...

ρ
 k−1
ρ1
1
...
ρk−2
... ρk−1   ϕk,1   ρ1 
  

... ρk−2   ϕk,2  ρ2 

=  .
... ...   ...   ... 
...
1  ϕk,k  ρk 
Простой рекуррентный метод вычисления оценок частных автокорреляций был предложен Дарбином. В этом случае рекуррентные формулы имеют вид
ϕ p+1,j = ϕ p,j − ϕ p+1, p+1ϕ p, p−j+1, j = 1, 2, 3, …, p;
p
rp+1 − ∑ ϕ p,j rp+1−j
ϕ p−1, p+1 =
j=1
p
.
1 − ∑ ϕ p,j rj
j=1
Для авторегрессионного процесса порядка p частая автокорреляционная функция ϕk,k будет отлична от нуля при k ≤ p и равна
нулю при k > p.
Если предположить, что процесс является авторегрессионным
порядка p, то оценка частных ковариаций для задержек p + 1 и
выше распределяются приблизительно независимо с дисперсией
57
D[ϕk,k ] =
1
при k ≥ p + 1.
N
Это и служит критерием определения порядка модели авторегрессии.
Тем не менее окончательный выбор порядка модели для экспериментальных данных, получаемых из реальных записей неизвестных процессов, пока еще носит субъективный, а не точный характер. Поэтому описанные критерии целесообразно использовать
лишь для выбора начального значения порядка модели, поскольку
они обеспечивают хорошие результаты в случае искусственных APпроцессов, моделируемых с помощью ПЭВМ. В случае действительных данных результаты их применения зависят от того, насколько
точно эти данные могут моделироваться с помощью того или иного
AP-процесса.
Одним из полезных способов диагностической проверки модели авторегрессии на адекватность является построение модели несколько более общей, чем та, которая считается истинной, и сравнение обеих моделей. Этот метод предполагает, что возможно определение слабого звена в модели, из-за которого модель может быть
неадекватна. Часто это сделать довольно трудно.
Более формальная проверка основана на анализе автокорреляционной функции остатков. Рассмотрим ее.
Если модель была адекватна исследуемому процессу, то Zi характеризовались бы отсутствием корреляции, а статистические
оценки коэффициентов корреляции rz(k) были бы распределены
около нуля приблизительно нормально с дисперсией 1/N или со
стандартной ошибкой 1/ N . Эти факты можно использовать для
приближенной оценки статистической значимости явных отклонений этих автокорреляций от нуля. Однако необходимо избегать
опасности недооценки статистической значимости отклонений
автокорреляции rz(k) от их теоретических нулевых значений при
использовании стандартной ошибки 1/ N для малых задержек.
Например, для процесса AP(1) с параметром ϕ дисперсия rz(1)
есть ϕ2 / N, что может быть существенно меньше, чем 1/N. Кроме
случаев сравнительно больших задержек, величину 1/ N следует рассматривать как верхнюю границу стандартных ошибок для
rz(k).
Помимо индивидуального анализа коэффициентов rz(k) возможен общий совокупный тест автокорреляционной функции остат58
ков. При этом задаются целью выяснить, не указывают ли первые,
например, 20 автокорреляций остатков, взятые вместе, на адекватность модели. Пусть имеется K автокорреляций rz(k), где k = 1, 2,
3, …, K. Тогда можно показать, что если построенная модель адекватна, то случайная величина
K
Q = m ∑ rZ2 (k),
k=1
где m – число значений процесса, используемых при подгонке, распределена как χ2 (K − p), где p – порядок модели.
Рекомендуемая литература
1. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление: пер. с англ. М.: Мир, 1974. Вып. 1. 406 с.
2. Кендалл М. Временные ряды: пер. с англ. М.: Финансы и статистика, 1981. 218 с.
3. Льюнг Л. Идентификация систем. Теория для пользователя: пер. с
англ. М.: Наука, 1991. 432 с.
4. Марпл С. Цифровой спектральный анализ и его приложения: пер. с
англ. М.: Мир, 1990. 584 с.
59
Содержание
Предисловие.............................................................................. 1. Место эксперимента в процессе проектирования.......................... 2. Планирование статистической обработки результатов наблюдений............................................................................... 3. Методы обработки нестационарных случайных процессов............. 4. Стационаризация аддитивно-мультипликативных нестационарных случайных процессов........................................... 5. Идентификация модели процесса при обработке результатов эксперимента............................................................................. 6. Построение авторегрессионной модели процесса по результатам эксперимента............................................................................. 60
3
4
11
23
34
40
53
Документ
Категория
Без категории
Просмотров
2
Размер файла
1 360 Кб
Теги
alekseevne
1/--страниц
Пожаловаться на содержимое документа