close

Вход

Забыли?

вход по аккаунту

?

9635.Планирование и организация эксперимента в управлении качеством.

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Оренбургский государственный университет»
А. Л. Воробьёв, И. И. Любимов, Д. А. Косых
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ
ЭКСПЕРИМЕНТА В УПРАВЛЕНИИ
КАЧЕСТВОМ
Рекомендовано Учёным советом федерального государственного
бюджетного образовательного учреждения высшего профессионального
образования «Оренбургский государственный университет» в качестве
учебного пособия для студентов обучающихся по программам высшего
профессионального образования по направлениям подготовки 200500.62
Метрология, стандартизация и сертификация, 221700.62 Стандартизация и
метрология и по специальностям 200503.65 Стандартизация и сертификация,
220501.65 Управление качеством
Оренбург
2014
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 519.242: 658.516 (075.8)
ББК 22.17я73+30ц. Я 73
В75
Рецензент – доктор технических наук, профессор В. И. Чепасов
В75
Воробьёв, А. Л.
Планирование и организация эксперимента в управлении
качеством: учебное пособие / А. Л. Воробьёв, И. И. Любимов,
Д. А. Косых. – Оренбург: ООО ИПК «Университет», 2014 – 343 с.
ISBN 978-5-4417-0476-2
В учебном пособии рассмотрены основные вопросы
планирования и организации эксперимента, а именно: рациональное
планирование, экстремальное планирование, построение эмпирических
моделей по данным активного эксперимента, даны планы дробного
факторного эксперимента, обработка результатов эксперимента. Учебное
пособие дополнено практическими примерами и задачами с решениями
для успешного освоения дисциплины, а также представлен пример
выполнения курсовой работы по одноименной дисциплине.
Учебное пособие предназначено для студентов, обучающихся по
программам высшего профессионального образования по направлениям
подготовки 200500.62 – Метрология, стандартизация и сертификация,
221400.62 – Управление качеством, 221700.62 – Стандартизация и
метрология и по специальностям 200503.65 – Стандартизация и
сертификация, 220501.65 – Управление качеством.
УДК 519.242: 658.516 (075.8)
ББК 22.17я73+30ц. Я 73
ISBN 978-5-4417-0476-2
© Воробьёв А. Л.,
Любимов И. И.
Косых Д. А, 2014
© ОГУ, 2014
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
1
1.1
1.2
1.3
1.4
2
2.1
2.2
2.3
2.4
2.5
2.6
3
3.1
3.2
3.3
3.4
3.5
3.6
............................................................................................................... 7
............................................................................. 10
.......................................................................... 10
...................................................................................................... 10
.................................... 16
............................................. 17
–
............................. 23
........................................................................ 28
.
. 28
.............................................................................. 28
(
)
........................................... 34
................................................................................ 40
............................ 44
...... 49
.. 56
................ 59
(
)................ 62
).................................................................................................................. 65
(
) ................................ 67
................................................................................................... 68
«
»
S
z ..................................................... 70
(
) ............. 72
3.7
3.8
.................................................................................... 73
3.9
3.10
3.11
4
4.1
4.2
) ............................................................................................................... 75
(
)............................ 76
............................................. 76
.................................................. 78
......................................................... 80
..... 81
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.3
5
5.1
5.2
6
.............................................................. 85
.............................. 96
........................................................... 96
....................................................... 105
(
6.1
6.2
6.3
7
7.1
8
8.1
8.2
8.3
8.4
8.5
9
9.1
9.2
9.3
10
10.1
10.2
10.3
10.4
2
11
11.1
11.2
12
12.1
)...................................................................................................... 121
.................................................... 121
................................... 124
......................................... 127
................................................................ 130
............................... 130
................................................................................ 135
....................................................................... 136
2
........................................................................................ 138
......................................................................... 139
.............................................................................. 142
............................................... 143
................................................ 150
.
................................................................................... 150
.................................... 154
157
..... 160
.... 161
...................................... 163
.
......................................................................................... 166
.
....................................................................................... 171
............................................................................. 175
.............. 175
............................................ 175
:......................................................................... 186
............................................................................... 187
) ................................................................................... 188
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12.2
12.3
13
13.1
13.2
14
14.1
14.2
15
15.1
15.2
16
16.1
16.2
17
17.1
17.2
18
18.1
18.2
19
19.1
19.2
20
(
) ................................................................................... 190
:............................................................................. 193
............................................................................. 194
............................................ 194
:……………………………………………………198
(
) .......................... 199
............................................ 199
:............................................................................. 206
,
,
........................................................................................................... 207
............................................ 207
:……………………………………………………210
(
).... 211
............................................ 211
:............................................................................. 218
................................... 219
............................................ 219
:............................................................................. 225
.................................. 226
............................................ 226
:............................................................................. 233
................... 234
............................................ 234
:............................................................................. 237
............................................................................................................ 238
20.1
........................................... 243
20.2
:………………………………………………........243
21
............... 244
21.1
............................................ 244
21.2
:............................................................................. 251
3
.................................................................................. 252
22
,
,
.......................................................... 252
22.1
.
................................................ 252
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
22.2
22.3
22.4
22.5
22.6
22.7
23
23.1
23.2
23.3
23.4
......................................................................... 252
................................... 255
..................................................................... 257
................................. 259
.................................................................................................. 261
....................................................................................... 262
........... 264
..................................................................... 264
................................................ 270
........................................ 272
.
............................................................................................................... 275
23.5
23.6
24
24.1
24.2
24.3
24.4
25
25.1
25.2
25.3
25.4
25.5
…………………………………………………………….……...277
....................................................................................... 279
................................................ 283
.......................................................................... 283
............................................................................. 286
.............................................................................................................. 289
....................................................................................... 292
...................................................................... 293
............................................................ 295
................... 301
.......................................................... 305
................. 308
....................................................................................... 310
.............................................................. 313
.................................................................................................. 316
................................................................................................... 317
.................................................................................................. 330
................................................................................................... 337
.................................................................................................. 341
.................................................................................................. 343
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
Управление качеством рассматривается совместно с менеджментом
качества, так как это тесно связанные и взаимодополняющие области
деятельности, образующие управление качеством в масштабе научной
деятельности.
Одним из важнейших положений теории управления качеством является
принятие решений на основе фактов. Совершенствование качества продукции
и процессов требует скрупулезной работы персонала предприятия по
выявлению причин дефектов и их устранению. Для этого необходимо
организовать
поиск
факторов,
характеризующих
несоответствия,
в
подавляющем большинстве которыми являются статистические данные,
разработать методы анализа и обработки данных, выявить коренные причины
дефектов и разработать мероприятия по их устранению с наименьшими
затратами.
Комплексная теория оценки качества, которая обусловлена проблемами
сбора, обработки и анализа результатов производственной деятельности,
включает в себя большое количество не только известных методов, но и
современных инструментов анализа и выявления дефектов. К таким методам
можно отнести корреляционный и регрессионный анализы, проверку
статистических гипотез, факторный анализ, анализ временных рядов, анализ
безотказности и т. д.
Таким образом, управление качеством и научное исследование это две
неотъемлемые состовляющие, т.к. одно дополняет другое.
В самом общем случае можно считать, что научное исследование
включает следующие четыре основных этапа.
1.
Подготовку
к
исследованию.
Сначала
определяется
цель
исследования, обосновывается предмет и объект исследования: осваиваются
накопленные знания по предмету исследования; проводится патентный поиск
и обосновывается необходимость выполнения данного исследования;
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
формулируются рабочая гипотеза и задачи исследования; разрабатываются
программа и общая методика исследования.
2. Экспериментальное исследование и обработку опытных данных. Этот
этап исследования предполагает: планирование опытов, подготовку к опытам
и их проведение, проверку данных и исключение резко отклоняющихся
значений, статистическую обработку опытных данных.
3. Анализ и синтез результатов экспериментального исследования. Это
путь от наблюдения к аналитическому обобщению, т.е. математическому
описанию состояния системы и раскрытию характера воздействия отдельных
факторов на процесс при помощи моделирования систем и математических
методов анализа.
4. Проверку результатов обобщения в практике и оценку экономической
эффективности результатов исследования. Теория или научно обобщенная
система
знаний
исследователем
должна
соответствовать
практике,
иначе
принятые
положения и построения
окажутся
гипотетическими,
предположительными. Изучаемые явления настолько многообразны и
спорны, что часто трудно, а порой и невозможно получить надежное
представление об эффективности предложенной теории или метода решения
задачи, основываясь только на однажды проведенном эксперименте.
В начале любого исследования необходимо определить цель, выбрать
предмет и обосновать объект исследования. Под целью исследования
понимается результат познавательного процесса, т. е. ради чего выполняется
исследование. Цель исследования должна быть сформулирована четко и
допускать количественную оценку. Целью большинства исследований
является: повышение производительности труда, снижение затрат на ремонт
отдельных
деталей
и
изделий,
повышение
эффективности
ремонта,
улучшение качества ремонта и т. п.
Под предметом исследования понимается содержательная ее часть,
зафиксированная в наименовании темы и связанная с познанием некоторых
сторон, свойств и связей исследуемых объектом необходимых и достаточных
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
для достижения цели исследования. Согласно сделанному определению
предмет исследования, с одной стороны, обусловливается целью, а с другой –
объектом исследования. В качестве объекта исследования следует выбирать
типичный, распространенный представитель, характерный для изучения
сущности данного явления или раскрытия закономерности.
Изучение накопленных знаний по теме исследования целесообразно
начинать с патентного поиска, знакомства с результатами выполненных
научных
исследований
по
данной
проблеме
в
других
научно-исследовательских организациях, с публикациями в периодической
печати и специальной литературе. Изучение проводится с целью: раскрытия
физической сущности развития явлений и связей отдельных элементов
исследуемой системы; применения технических средств измерения факторов,
воспроизводства развития явления, методов анализа процессов исследуемой
системы, критериев оптимизации и выявления влияющих на процесс развития
факторов; ранжирования факторов на основе априорной информации;
обоснования
необходимости
проведения
данного
исследования
и
возможности использования полученных ранее результатов для решения
задач выполняемого исследования.
По результатам изучения накопленной информации о предмете
исследования формулируются рабочая гипотеза и задачи исследования.
Гипотеза – это научное предположение о возможных механизмах, причинах и
факторах обусловливающих развитие изучаемых явлений, которые еще не
доказаны, но в той или иной степени вероятны. Гипотеза всегда выходит за
пределы известного круга явлений, содержит предположительное объяснение
и является звеном, связующим знание и незнание. Одно из главных
требований, которым должна удовлетворять гипотеза – это возможность
последующей экспериментальной ее проверки. Рабочая гипотеза - важный
элемент исследования, так как она синтезирует априорное представление о
предмете исследования и определяет круг решаемых задач для достижения
поставленной цели.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часть 1 Теоретическая часть
1 Рациональное планирование
1.1 Основные понятия и определения теории планирования
эксперимента
Эксперимент – система операций, воздействий и (или) наблюдений,
направленных на получение информации об объекте при исследовательских
испытаниях.
Опыт – воспроизведение исследуемого явления в определенных
условиях проведения эксперимента при возможности регистрации его
результатов.
План эксперимента – совокупность данных, определяющих число,
условия и порядок реализации опытов.
Планирование
эксперимента
–
выбор
плана
эксперимента,
удовлетворяющего заданным требованиям.
Фактор (Параметр) – переменная величина, по предположению
влияющая на результаты эксперимента.
Уровень фактора – фиксированное значение фактора относительно
начала отсчета.
Основной уровень
фактора
–
натуральное значение фактора,
соответствующее нулю в безразмерной шкале.
Нормализация факторов – преобразование натуральных значений
факторов в безразмерные значения.
Априорное ранжирование факторов – метод выбора наиболее важных
факторов, основанный на экспертной оценке.
Размах варьирования фактора – разность между максимальным н
минимальным натуральными значениями фактора в данном плане.
Интервал варьирования фактора – половина размаха варьирования
фактора.
Эффект взаимодействия факторов – показатель зависимости
изменения эффекта одного фактора от уровней других факторов.
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторное пространство – пространство, координатные оси которого
соответствуют значениям факторов.
Область экспериментирования (область планирования) – область
факторного пространства, где могут размещаться точки, отвечающие
условиям проведения опытов.
Активный эксперимент – эксперимент, в котором уровни факторов в
каждом опыте задаются исследователем.
Пассивный эксперимент– эксперимент, при котором уровни факторов
в каждом опыте регистрируются исследователем, но не задаются.
Последовательный
эксперимент
(Шаговый
эксперимент)
–
эксперимент, реализуемый в виде серий, в котором условия проведения
каждой последующей серии определяются результатами предыдущих.
Отклик (Реакция на Параметр) – наблюдаемая случайная переменная,
по предположению, зависящая от факторов.
Функция отклика – зависимость математического ожидания отклика от
факторов.
Оценка функции отклика – зависимость, получаемая при подстановке
в функцию отклика оценок значений ее параметров.
Дисперсия
оценки
функции
отклика
–
дисперсия
оценки
математического ожидания отклика в некоторой данной точке факторного
пространства.
Поверхность отклика (Поверхность регрессии) – геометрическое
представление функции отклика.
Поверхность уровня функции отклика – геометрическое место точек в
факторном пространстве, которому соответствует некоторое фиксированное
значение функции отклика.
Область оптимума – область факторного пространства в окрестности
точки, в которой функция отклика достигает экстремального значения.
Рандомизация плана – один из приемов планирования эксперимента,
имеющий целью свести эффект некоторого неслучайного фактора к
случайной ошибке.
Параллельные опыты – рандомизированные во времени опыты, в
которых уровни всех факторов сохраняются неизменными.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Временный дрейф – случайное или неслучайное изменение функции
отклика во времени.
Исследователь на этапе планирования эксперимента должен:
•
помнить, к какому классу относится моделируемая система
(статическая или динамическая, детерминированная или стохастическая и т.д.);
•
определить, какой режим работы его интересует, стационарный
(установившийся) или нестационарный;
•
знать, в течение какого промежутка времени следует наблюдать за
поведением (функционированием) системы;
• знать, какой объём испытаний (то есть повторных экспериментов)
сможет обеспечить требуемую точность оценок (в статистическом смысле)
исследуемых характеристик системы.
Таким образом, планирование модельных экспериментов преследует
две основные цели:
1)
сокращение
общего
объёма
испытаний
при
соблюдении
требований к достоверности и точности их результатов;
2)
повышение информативности каждого из экспериментов в
отдельности. Поиск плана эксперимента проводится в
факторном
пространстве.
Факторное пространство (ФП) – это множество внешних и
внутренних параметров модели, значения которых исследователь может
контролировать в ходе подготовки и проведения эксперимента.
Значения факторов обычно называются уровнями.
Если при проведении эксперимента исследователь может изменять
уровни факторов, эксперимент называется активным, в противном случае пассивным.
Введём ещё несколько терминов, используемых в теории планирования
эксперимента.
Каждый из факторов имеет верхний и нижний уровни, расположенные
симметрично относительно некоторого нулевого уровня. Точка в ФП,
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
соответствующая нулевым уровням всех факторов, называется центром
плана.
Интервалом варьирования фактора называется некоторое число J,
прибавление которого к нулевому уровню даёт верхний уровень, а вычитание
- нижний.
Как правило, план эксперимента строится относительно одного
(основного) выходного скалярного параметра Y, который называется
наблюдаемой переменной.
Если моделирование используется как инструмент принятия решения,
то в роли наблюдаемой переменной выступает показатель эффективности.
При
этом
предполагается,
что
значение
наблюдаемой
переменной,
полученное в ходе эксперимента, складывается из двух составляющих:
Y = f(x) + е(x),
где f(x) - функция отклика (неслучайная функция факторов), е(x) - ошибка
эксперимента (случайная величина).
Дисперсия DY наблюдаемой переменной, которая характеризует
точность измерений, равна дисперсии ошибки опыта, т.е.
DY =De.
DY называют дисперсией воспроизводимости эксперимента. Она
характеризует качество эксперимента. Эксперимент называется идеальным
при DY = 0.
Существует два основных варианта постановки задачи планирования
имитационного эксперимента:
• Из всех допустимых требуется выбрать такой план, который
позволил бы получить наиболее достоверное значение функции отклика
f(х) при фиксированном числе опытов.
• Из всех допустимых требуется выбрать такой план, при котором
статистическая оценка функции отклика может быть получена с
заданной точностью при минимальном объёме испытаний.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Решение задачи планирования в первой постановке называется
стратегическим
планированием,
во
второй
–
тактическим
планированием.
При проведении опытных исследований различают пассивный и
активный эксперимент.
Методология
проведение
большой
пассивного
серии
экспериментирования
опытных
исследований
предполагает
с
поочередным
варьированием значений входных переменных x и анализом результатов
измерений выходной переменной y (лабораторный эксперимент или
эксперимент на пилотной установке).
К пассивному эксперименту принято относить также и сбор опытных
данных
в
режиме
эксплуатации
промышленной
установки
-
т.н.
промышленный эксперимент.
Обработка результатов, и выбор вида эмпирической модели (уравнения
регрессии), т.е. решение задачи структурной идентификации является
достаточно сложной задачей.
Это связано с тем, что вид уравнения регрессии необходимо определять
по характеру изменения переменных на графике эмпирической линии
регрессии, полученной по выборке экспериментальных данных.
Для решения этой задачи для одной входной переменной x предложены
эффективные методы, в которых предусматривается преобразование системы
координат как для входной (x), так и для выходной переменной (y). При
большем числе входных переменных (x1,...xm) надёжных методов определения
вида уравнения регрессии (вида эмпирической модели) в настоящее время не
существует.
Активный эксперимент проводится по заранее составленному плану, в
соответствии с которым ставится задача не только определения оптимальных
условий проведения эксперимента, но и оптимизации процесса (оптимальное
планирование эксперимента).
При определении оптимальных условий проведения процесса с
использованием эмпирических моделей (например, методом Бокса-Вильсона)
выходная переменная y является критерием оптимальности или целевой
функцией.
14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В теории активного экспериментирования выходную (зависимую)
переменную принято называть функцией отклика, а входные (независимые)
переменные - факторами. Соответственно – координатное пространство с
координатами (x1, x2, ...xm) - факторным пространством, а геометрическое
изображение функции отклика в факторном пространстве - поверхностью
отклика.
Активный эксперимент планируется таким образом, чтобы упростить
обработку его результатов методами регрессионного и корреляционного
анализа.
К достоинствам активного экспериментирования относятся:
•
возможность предсказания количества опытов, которые следуют
провести;
•
определение
точек
факторного
пространства,
где
следует
проводить опыты;
•
отсутствие проблем, связанных с выбором вида уравнения
регрессии;
•
возможность определения оптимальных параметров процесса
экспериментально-статистическим методом;
•
сокращение объёма опытных исследований.
Для правильного определения параметра оптимизации и выбора схемы
планирования эксперимента, необходимо предварительное изучения объекта
исследования (носитель некоторых неизвестных и подлежащих изучению
свойств и качеств) с целью сбора априорной информации о нем. Априорная
информация предполагает изучение литературных источников, анализ
результатов ранее проведенных экспериментов и т.д. При планировании
эксперимента объект должен отвечать двум основным требованиям:
1. Результаты исследования должны быть воспроизводимыми. Объект
исследования
удовлетворяет
требованию
воспроизводимости,
если
многократно повторенные опыты дают результаты, разброс значений которых
не превышает некоторые заданные величины.
2. Объект должен быть управляемым. Практически нет ни одного
абсолютно управляемого объекта. На реальный объект воздействуют как
управляемые,
так
и
неуправляемые
15
факторы,
которые
влияют
на
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
воспроизводимость. Если требование воспроизводимости выполняются, то
возможно активное вмешательство в процесс исследования и выбор для
каждого эксперимента управляемых факторов на тех уровнях, которые
представляют интерес для исследователя. Объект, на котором возможен
активный эксперимент, называют управляемым.
Математическая модель представляет собой совокупность различных
соотношений (это формулы, уравнения, неравенства и т.д.) определяющих
состояние объекта в зависимости от параметров объекта.
Фактор – независимая переменная, соответствующая одному из
возможных способов воздействия на исследуемый объект. Фактор считается
заданным, если указана его название и область определения. Число
выбранных факторов определяет размерность изучаемого факторного
пространства. Факторы определяют сам объект исследования и его состояние.
1.2 Основные принципы планирования эксперимента
Принципы, положенные в основу теории планирования эксперимента,
направлены на повышение эффективности экспериментирования, т. е. на
получение максимума информации при минимуме опытов:
-
отказ от полного перебора возможных входных состояний (в теории
планирования эксперимента сознательно отказываются от полного перебора
входных состояний или от эксперимента, близкого к нему по своей
конструкции. Выбор числа уровней варьирования по каждому фактору
непосредственно связывается с выбором вида функции отклика или с видом ее
аппроксимации);
-
принцип
постепенного
усложнения
математической
модели
(постановка небольшого числа опытов для получения простейшей модели,
проверка ее пригодности; если модель удовлетворяет исследователя,
эксперимент заканчивается. Если модель непригодна, необходим следующий
этап
экспериментирования:
постановка
новых
получить более сложную модель, ее проверка и т. д.);
16
опытов,
позволяющих
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
-
принцип сопоставления с шумом (полученная математическая модель
должна быть подвергнута проверке на адекватность);
-
принцип рандомизации (принцип приведения к случайности)
(данный принцип предусматривает чисто случайный выбор элементов для
последующего анализа, из общей совокупности, подлежащей изучению случайный порядок реализации опытов, строк матрицы плана);
-
принцип
оптимальности
планирования
эксперимента
(план
эксперимента должен обладать некоторыми оптимальными свойствами с
точки зрения определенного, заранее выбранного критерия оптимальности
плана или совокупности подобных критериев «меньше опытов - больше
информации, выше качество результатов).
1.3 Метод больших комбинационных квадратов
1.3.1 Сущность метода больших комбинационных квадратов
Для нахождения эмпирической зависимости некоторой величины у от m
независимых переменных или факторов, каждый из которых принимает по
nзначений, необходимо провести n m различных опытов. Чтобы выявить
влияние каждого фактора на величину у, нужно задать ему не менее
четырех-пяти значений ( n ³ 4 - 5 ). Для получения устойчивых средних
значений результатов опытов каждый из опытов необходимо повторить не
менее трех раз. Например, для полного исследования влияния на величину у
четырех факторов (m=4), каждый из которых может принимать по пять
различных значений (n=5), следует провести, не считая параллельных,
5 4 = 625 опытов. Необходимо заметить, что понятия уровня фактора и
значения фактора являются равноценными, а под параллельными понимают
повторенные несколько раз одни и те же опыты.
Графическое изображение плана полного эксперимента для четырех
факторов a,b,c,d, каждый из которых принимает по пять значений,
представлено на рисунке 1.1. Такое изображение плана полного эксперимента
называют большим комбинационным квадратом. Он состоит из 25 средних
17
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
квадратов. Каждый из средних квадратов разбит на 25 малых квадратов.
Таким образом, имеется 625 клеток, соответствующих общему числу
возможных сочетаний значений факторов в эксперименте.
А
b
c
1
2
3
4
5
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
d
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
Рисунок 1.1 – План полного эксперимента для четырех факторов и пяти
уровней
Полный эксперимент часто трудно осуществить из-за большого числа
опытов, поэтому исследователи в таких случаях вынуждены ограничиваться
лишь частью их. Рациональное планирование, при котором каждое сочетание
уровней влияющих факторов встречается в плане только один раз, позволяет
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сократить количество опытов в n
m-2
раз. Метод рационального планирования
при установлении влияния данного фактора на изучаемую величину
обеспечивает гарантированное усреднение влияния всех остальных факторов.
Графически это соответствует тому, что в каждом столбце и в каждой строке
большого
квадрата
встречается
по
одной
заштрихованной
клетке,
соответствующей принятой для опыта комбинации уровней влияющих
факторов. На рисунке 1.2 изображен такой план эксперимента.
При таком планировании для каждого значения одного фактора
значения других факторов встречаются одинаково часто. Например:
еслиа=2
то
если с=5
то
b=5,1,2,4,3
a= 1,2,3,4,5
c=1,2,3,4,5
b=1,3,2,4,5
d=4,5,1,3,2
d=4,2,3,1,5
Поэтому при определении зависимости исследуемой величины,
например, от фактора «а» влияние трех других факторов усредняется.
Для случая n=5и m=4 число опытов при использовании рационального
планирования сокращается в 25 раз и вместо 625 становится равным 25.
1.3.2 Построение комбинационных квадратов
Существует
целый
ряд
способов
построения
комбинационных
квадратов. Наиболее простой способ построения состоит в том, что
диагональные клеткиотдельного среднего квадрата размещаются в строках
большого комбинационногоквадрата. Схема построения комбинационного
квадрата этим способом показана на рисунке 1.3.
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А
b
c
1
2
3
4
5
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
d
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
Рисунок 1.2 – Рациональный план для четырех факторов и пяти уровней
Строится отдельный
средний квадрат, на сторонах которого
достраиваются еще четыре квадрата (рисунок 1.3 (а)). Клетки отдельного
среднего квадрата нумеруются от 1 до 25. Затем строится большой
комбинационный квадрат. Диагональные клетки 1, 7, 13, 19, 25 среднего
квадрата располагаются в третьем столбце большого комбинационного
квадрата, как показано на рисунке 1.3 (б). Диагональные клетки 21, 17, 13, 9, 5
располагаются в третьей строке большого комбинационного квадрата. Клетки
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14, 20, 21, 2, 8 располагаются в первом; 10, 11, 17, 23, 4 – во втором; 22, 3, 9, 15,
16 – в четвертом; 18, 24, 5, 6, 12 – в пятом столбце большого комбинационного
квадрата.
а)
18
22
10
14
20
24
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
2
6
12
16
4
6
б)
1
1
2
3
2
4
5
1
2
3
3
4
5
1
2
3
4
4
5
1
2
3
5
4
5
1
2
3
4
5
X4
X3
X2
X1
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
10
14
18
22
3
7
11
20
24
5
9
13
17
21
2
6
15
19
23
4
8
12
16
26
Рисунок 1.3– Схема построения большого комбинационного квадрата
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Аналогичный результат можно получить, если клетки 14, 10, 1, 22, 18
расположить в первой строке большого комбинационного квадрата; 20, 11, 7,
3, 24 – во второй, 2, 23, 19, 15, 6 – в четвертой; 8, 4, 25, 16, 12 – в пятой.
1.3.3 Способ М. М. Протодъяконова и Р. И. Тедера
Для обработки результатов опытов, спланированных по представленной
методике, используют способ М. М. Протодъяконова и Р. И. Тедера. Сущность
способа заключается в следующем:
- производится группировка результатов опытов по значениям каждого
фактора;
- для каждого значения каждого фактора вычисляется среднее значение
исследуемой величины;
- строят графики зависимостей исследуемой величины от каждого
фактора.
Для этого по оси абсцисс откладывают значения какого-либо фактора, а
по оси ординат – соответствующие им средние значения исследуемой
величины. По нанесенным точкам строят график зависимости исследуемой
величины от данного фактора. Аналогично получают графики зависимостей
исследуемой величины от остальных факторов. Эти зависимости являются
частными;
- если все графики частных зависимостей аппроксимируются с
достаточной точностью прямыми линиями и плавными кривыми, то искомую
зависимость исследуемой величины от всех факторов можно представить
суммой частных зависимостей;
- если не все графики частных зависимостей аппроксимируются с
достаточной точностью прямыми линиями и плавными кривыми, то для
нахождения искомой зависимости применяют метод последовательного
исключения факторов. Этот метод заключается в следующем:
а)
выделяют
графики
частных
зависимостей,
которые
могут
аппроксимироваться прямыми линиями и плавными кривыми;
б) по этим графикам устанавливают зависимость исследуемойвеличины
от фактора, оказывающего на эту величину наибольшее влияние;
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) по результатам опытов определяют параметры уравненияпрямой
линии или плавной кривой, описывающей влияние сильнодействующего
фактора на исследуемую величину;
г) используя полученную формулу и результаты опытов, находят путем
пересчета значения исследуемой величины в зависимости от всех факторов за
исключением сильнодействующего;
д) производят группировку пересчитанных результатов опытовпо
значениям
каждого
из
оставшихся
факторов;
ввиду
нейтрализации
сильнодействующего фактора зависимость исследуемой величины от второго
по силе влияния фактора выступает более ясно;
е) находят уравнение, выражающее зависимость исследуемойвеличины
от второго по силе влияния фактора;
ж) путем пересчета результатов второй группировки с использованием
полученной формулы исключают влияние второго фактора на исследуемую
величину;
з) изложенные выше приемы повторяют для следующего посиле
влияния фактора;
и) после нахождения по описанной методике всех частныхзависимостей
они объединяются в одну общую.
1.4 Метод латинских взаимно – ортогональных квадратов
При большом числе факторов для получения плана эксперимента более
рационально является применение цифровых матриц: число строк в матрице
равно числу опытов, а число столбцов равно числу влияющих факторов.
Комбинация цифр в каждой строке представляет собой сочетание уровней
факторов в соответствующем опыте. Такие планы строят на основе латинских
квадратов.
Латинский квадрат – это квадратная таблица, которая содержит n
элементов (эти элементы могут быть числа и буквы), в которой любой из
элементов встречается в каждой строке и в каждом столбце только один раз.
Например:
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ABCD
ВCDА
CDAB
DABС
Число латинских квадратов зависит от количества элементов, однако,
для получения оптимального плана пригодны не все латинские квадраты, а
только ортогональные друг другу.
Два латинских квадрата называются ортогональными, если при
наложении одного квадрата на другой каждая пара элементов встречается в
таблице только один раз. Например:
1
2
3
4
1
2
3
4
1
1
2
2
3
3
4
4
2
1
4
3
3
4
1
2
2
3
1
4
4
1
3
2
3
4
1
2
4
3
2
1
3
4
4
3
1
2
2
1
4
3
2
1
2
1
4
3
4
2
3
1
2
4
1
3
Число взаимно-ортогональных квадратов равно n+1, два из которых
квадрата упорядочены, остальные латинские.
Упорядоченным квадратом называют квадратную таблицу, строки, и
столбцы которой состоят из одинаковых элементов.
Пример упорядоченного квадрата по строкам представлен на рисунке
1.4
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
Рисунок 1.4 – Упорядоченный квадрат по строкам
Пример упорядоченного квадрата по строкам представлен на рисунке 1.5
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
Рисунок 1.5 – Упорядоченный квадрат по столбцам
Рассмотрим методику построения взаимно ортогональных квадратов.
1. Возьмем упорядоченный квадрат по строкам (5x5).
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
Рисунок 1.6 - «Упорядоченный»
Для того чтобы от упорядоченного квадрата перейти к латинскому
необходимо одинаковые цифры заменить различными.
2. Первый столбец оставляем без изменения, а остальные размещаем по
круговой перестановке.
В результате таких действий получаем латинский квадрат, который
является ортогональный упорядоченному (рисунок 1.7).
3. Полученный латинский квадрат можно преобразовать в квадрат ему
ортогональный, заменяя одинаковые цифры различными, в порядке их
круговой перестановке. Например, на рисунке 1.6 - все 2 содержащиеся в
столбцах 22222 заменяем соответственно цифрами 23451. после этого
последующие цифры каждого столбца записывают по кругу. Этот квадрат
также будет ортогональным упорядоченному.
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
2
3
4
5
2
3
4
5
1
3
4
5
1
2
4
5
1
2
3
5
1
2
3
4
Рисунок 1.7 - «Латинский»
4. Заменяя цифры 33333 в таблице 5 на 34512, записываем последующие
цифры по кругу.
1
3
5
2
4
2
4
1
3
5
3
5
2
4
1
4
1
3
5
2
5
2
4
1
3
Рисунок 1.8 – Квадрат ортоганальный «Латинскому»
1
4
2
5
3
2
5
3
1
4
3
1
4
2
5
4
2
5
3
1
5
3
1
4
2
Рисунок 1.9 – Взаимно ортогональный квадрат
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
5
4
3
2
2
1
5
4
3
3
2
1
5
4
4
3
2
1
5
5
4
3
2
1
Рисунок 1.10 – Взаимно ортогональный квадрат
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
Рисунок 1.11 – Взаимно ортогональный квадрат
Каждая система взаимно ортогональных латинских квадратов может
быть преобразована путем перестановки строк и столбцов, что позволяет
выбрать оптимальный план эксперимента по диапазонам изменения факторов
или же избежать неблагоприятного сочетания уровней. Каждый квадрат из
системы взаимно ортогональных квадратов может быть использован для
определения последовательности чередования уровней одного из факторов
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2 Экстремальное планирование
2.1 Планирование экстремальных экспериментов. Планы первого
порядка
Все многообразие проводимых исследований можно условно разбить на
две большие группы:
1)
метод однофакторного эксперимента (классический),
2)
метод многофакторного эксперимента.
Однофакторный
классический
эксперимент
предусматривает
фиксирование на определенных уровнях всех переменных факторов кроме
одного, который принимает дискретное значение в некоторой области своего
существования.
При проведении однофакторного эксперимента, варьируя один фактор и
стабилизировав остальные факторы на определенных выбранных уровнях,
находят зависимость исследуемой величины от одного фактора. Проведя
большое количество однофакторных экспериментов, получают зависимости
представленные множеством графиков, которое носит иллюстративный
характер.
Для того чтобы всесторонне изучить процесс при исследовании
однофакторного эксперимента необходимо провести достаточно большое
количество опытов. Следовательно, исследования проводятся длительное
время (изменение условий). По этой причине оказываются несовместимыми
большое количество опытов. Однофакторный эксперимент малопригоден для
проведения большихопытов, проводится вдали от оптимума.
2.2 Корреляционный анализ
Связи
между
различными
явлениями
в
природе
сложны
и
многообразны. Однако их можно определенным способом классифицировать.
В технике и естествознании часто речь идет о функциональной зависимости
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
между переменными X и Y, когда каждому значению X поставлено в
однозначное соответствие определенного значения Y.
В реальном мире многие явления природы происходят в обстановке
действия многочисленных факторов, влияние каждого из которых ничтожно, а
число этих факторов велико. В этих случаях связь теряет свою строгую
функциональность, и изучаемая физическая система переходит не в
определенное состояние, а в одно из возможных. Здесь речь идет о
стохастической связи. Частный случай стохастической связи – статистическая
связь. Об этой связи имеет смысл говорить, когда условное математическое
ожидание одной случайной переменной является функцией значения,
принимаемого другой случайной переменной.
Значения
статистической
зависимости
между
случайными
переменными имеет большое практическое значение. С ее помощью можно
прогнозировать зависимость случайной переменной, в предположении, что
независимая
принимает
определенное
значение.
Чтобы
изучить
статистическую зависимость необходимо знать условное математическое
ожидание случайной переменной. Для его оценки необходимо знать
аналитический вид двухмерного распределения (X;Y).
Корреляционная зависимость – это зависимость между одной случайной
переменной и условным средним значением другой переменной.
Примерами корреляционной связи являются зависимости: между
пределами прочности и текучести стали определенной марки, между
погрешностью размера и погрешностью формы поверхности детали,
обработанной определенным методом, межу температурой испытания и
ударной вязкостью стали, между усилием прижима ролика и шероховатостью
накатанной детали. В первых двух примерах имеет место корреляционная
связь между двумя откликами, а в третьем и четвертом – между фактором,
который является случайной величиной в связи с погрешностью измерения, и
откликом.
Двумерная корреляция изучает пары случайных чисел. Эти числа можно
изобразить графически в виде точки с координатами (X;Y). Таким образом,
можно изобразить весь набор пар случайных чисел, т.е. всю выборку
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(примеры различных видов корреляции представлены на рисунке 2.2). Эта
задача упрощается, если выборку упорядочить. Для этого значения X и Y
разбивают
на
интервалы.
По
одной
оси
откладывают
интервалы,
соответствующие переменной Y, а по другой – соответствующие X. Каждую
пару чисел изображают в виде точки в соответствующей клетке.
Такое изображение корреляционной зависимости называется полем
корреляции (рисунок 2.1). По расположению точек можно в первом
приближении предположить о форме и тесноте корреляционной связи.
Полная информация о вероятностной связи двух случайных величин
представляется совместной плотностью распределения f(x;y) или условными
плотностями распределения f(x/y), f(y/x), то есть плотностями распределения
случайных величин X и Y при задании конкретных значений y и x
соответственно.
Для
независимых
случайных
величин
совместная
плотность
распределения f(x, y) равна произведению плотностей распределения
случайных величин X и Y:
f(x,y) = fx(x) fy(y).
(2.1)
16Y
14
12
10
8
6
4
2
0
X
0
0,5
1
1,5
2
Рисунок 2.1 – Поле корреляции
30
2,5
3
3,5
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а)
б)
в)
г)
а) – идеальная линейная корреляция; б) – линейная корреляция с умеренным
рассеянием; в) – нелинейная корреляция; г) – отсутствие корреляции
(r – коэффициент корреляции)
Рисунок 2.2 – Примеры различных видов корреляции:
Основными характеристиками вероятностных зависимостей являются
корреляционный момент и коэффициент корреляции.
Корреляционный момент (или момент связи) двух случайных величин X
и Y-это математическое ожидание произведения центрированных случайных
величин:
k
K xy =
где
å n i ( x i - X )( y i - Y )
i=1
n -1
,
X и Y – математические ожидания случайных величин X и Y.
31
(2.2)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Корреляционный момент одновременно характеризует связь между
случайными величинами и их рассеивание. По своей размерности он
соответствует дисперсии для независимой случайной величины.
Если случайные величины независимы, то корреляционный момент
равен нулю, так как его можно представить как произведение центральных
моментов случайных величин, которые равны нулю.
Если хотя бы одна из случайных величин имеет малое рассеяние, то
корреляционный момент мал даже при явной зависимости между случайными
величинами. Поэтому для выделения характеристики тесноты связи между
случайными величинами переходят к коэффициенту корреляции rxy:
rxy =
где
K xy
SxS y
,
(2.3)
Sxи Sy- средние квадратические отклонения случайных величин Х и Y.
Коэффициент корреляции можно вычислить, не прибегая к расчету
средних квадратических отклонений, что упрощает вычислительную работу,
по следующей аналогичной формуле:
n
å ( X i - X ) ´ (Yi - Y )
rXY = i = 1
2
2
å ( X i - X ) å (Yi - Y )
(2.4)
или по формуле:
n
å X i å Yi
å X iYi n
rXY = i = 1
Dx D y
где Dx,Dy – суммы квадратов отклонений
32
(2.5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(å X i ) 2
2
,
DX = å X i n
(2.6)
(å Yi ) 2
2
DY = å Yi ,
n
(2.7)
Коэффициент корреляции, характеризует степень тесноты связи
случайных величин и может изменяться в пределах от -1 до +1. Чем ближе
значение его абсолютной величины к единице, тем сильнее линейная связь
между случайными величинами; чем ближе к нулю, тем эта связь слабее. При
rxy = 1 или rxy = - 1 статистическая линейная связь становится функциональной.
При значениях близких к нулю линейная корреляционная связь отсутствует.
Для независимых случайных величин также rxy= 0.
При более подробном анализе вероятностной связи определяют
условные
математические
ожидания
случайных
величин,
то
есть
математические ожидания случайных величин Y и X при заданных
конкретных значениях x и y соответственно.
Коэффициент корреляции служит для измерения только линейной связи
Пирсоном показатель, который называют корреляционным отношением.
Данный показатель является универсальным – он позволяет характеризовать
любую форму корреляционной связи (линейную и нелинейную).
Коэффициент детерминации вычисляется по формуле:
s2
гр
h2 =
,
s2
y
(2.8)
2
где s гр
- межгрупповая дисперсия; s 2y - общая дисперсия
33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
l
2
å (Yi - Y ) ´ ni
2 = i =1
s гр
n
(2.9)
n 2
å Yi
2
s 2y = i = 1
- (Y )
n
(2.10)
Корреляционное отношение вычисляется по формуле:
h=
2
s гр
s 2y
,
(2.11)
2.3 Однофакторный (классический) эксперимент
Однофакторный
классический
эксперимент
предусматривает
фиксирование на определенных уровнях всех переменных факторов кроме
одного, который принимает дискретное значение в некоторой области своего
существования т.е. сводится к способу наименьших квадратов.
2.3.1 Линейная регрессия (способ наименьших квадратов)
С помощью корреляционного анализа можно установить, насколько
тесна связь между двумя или более случайными величинами. Однако в
дополнение к этому желательно располагать моделью зависимости, которая
позволяла бы предсказывать значение некоторой величины по заданным
значениям других величин.
Определить форму связи – значит выявить механизм получения
зависимой
случайной
переменной.
34
При
изучении
статистических
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
зависимостей, форму связи можно охарактеризовать функцией регрессии,
которая может быть линейной, квадратной, показательной и т.д.
Условное математическое ожидание M(y) случайной переменной Y,
рассматриваемой как функция X, т.е. M(y)=f(x), называется функцией
регрессии случайной переменной Y относительно X. ФункцияM(y)=f(x)
показывает, каково будет среднее значение Y, если переменная X примет
вполне определенное значение.
Для характеристики формы связи при изучении корреляционной
зависимости пользуются понятием кривая регрессии.
Кривой регрессии Y по X называется условное среднее значение
случайной переменной Y, рассматриваемой как функция от X, т.е. Yср(x)= f(x).
Возникает вопрос: почему для
определения
кривой регрессии
пользуются именно условным средним значением Yср(x). Данное значение
обладает одним замечательным свойством: оно дает наименьшую среднюю
погрешность оценки прогноза.
Если вычислить среднее значение Y в каждом интервале изменения X,
нанести эти точки на поле корреляции и соединить эти точки между собой, то
мы получим ломаную линию. По виду данной ломаной линии можно
говорить, как в среднем меняется Y в зависимости от изменения X. Такая
линия называется эмпирической линией регрессии. По ее виду можно сделать
предположение о форме связи. Аппроксимированную линию называют
теоретической линией регрессии.
Линейная регрессия занимает особое место в теории корреляции. При
такой форме связи y| ( x) есть линейная функция от x , т.е.
y| ( x) = a0 + a1x
где a 0 и a1- коэффициенты регрессии; x - независимая случайная переменная
Линейная регрессия обуславливается двумерным нормальным законом
распределения пары случайных переменных (x;y).
Параметры в уравнении регрессии, т.е. коэффициенты регрессии,
определяются по способу наименьших квадратов.
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В начале XIX века Лежандр и Гаусс независимо друг от друга нашли
метод определения неизвестных по результатам опыта, с помощью которого
можно эффективно использовать избыточную информацию.
Условие Лежандра:
n
Q = å xi - E 2 = Qmin
i =1
(
)
где xi - измеренное или опытное значение переменной величины;
E - истинное или теоретическое значение случайной величины
Требование Лежандра заключается в том, чтобы сумма квадратов
отклонений
измеренных
величин
от
истинного
значения
была
бы
минимальной.
В случае линейной регрессии принимают: xi = yi , E = y | ( x) .
Получается:
Q = å ( yi - y | ( x)) 2 = Qmin
где yi - измеренное значение y
Минимум функции можно найти, приравняв к нулю ее первую
производную.
(
)
Q = å y - a 0 - a1 x 2 = Q min
Находим частные производные функции Q по a0 и a1и приравниваем к 0
ì
ï dQ
y - a0 - a1x = 0
ï da = -2å
ï 0
.
í
ï dQ
ï
= -2å y - a0 - a1x x = 0
ïî da1
(
)
(
)
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сокращаем на 2 и производим почленное суммирование:
ìå y - å a0 - å a1 x = 0
ï
.
í
2
ïîå yx - å a0 x - å a1x = 0
a 0 и a1 являются постоянными, поэтому их можно вынести за знак S , а
å a0
есть не что иное как na0 . Исходя из этого получается система
нормальных уравнений:
ìna0 + a1 å x = å y
ï
í
2
ïîa0 å x + a1 å x = å yx
Решая данную систему, находим a 0 и a1
2
å y å x - å x å yx
ao =
n å x 2 - (å x )2
a1 =
nå yx - å x å y
.
2
2
nå x - (å x )
2.3.2 Множественная линейная регрессия
Зависимость между несколькими переменными величинами принято
выражать уравнением множественной регрессии (может быть линейной и
нелинейной). В простейшем виде множественная линейная регрессия
выражается уравнением с двумя независимыми переменными величинами
(x;z):
y = a + bx + cz .
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для нахождения параметров этого уравнения (по способу наименьших
квадратов) применяют следующую систему уравнений:
ìan + b å x + c å z = å y
ïï
2
ía å x + b å x + c å xz = å xy .
ï
ïîa å z + b å xz + c å z 2 = å yz
2.3.3 Нелинейная регрессия
В качестве уравнения регрессии может быть использовано уравнение
прямой линии, многочлен k-ой степени или какая-то другая функция. В
первом случае связь называется линейной, в остальных – нелинейной.
Уравнение параболы второго порядка имеет вид:
y = a + bx + cx2 .
(2.12)
Для данного уравнения система нормальных уравнений имеет вид:
ìan + b å x + c å x 2 = å y
ï
ï
2
3
ía å x + bå x + c å x = å xy .
ï
2
3
4
2
ïa å x + b å x + c å x = å yx
î
Уравнение гиперболы первого порядка имеет вид:
b
y =a+ .
x
38
(2.13)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для данного уравнения система нормальных уравнений имеет вид:
1
ì
an
b
+
=åy
å
ïï
x
.
í 1
1
y
ïa å + b å
=å
2
x
x
ïî
x
(2.14)
Совместное решение этой системы относительно параметров a и b
приводит к следующим формулам:
1æ
1
y 1ö
ç å yå
å
å ÷÷;
2
D çè
x
xø
x
1æ
1ö
y
b = ç n å - å y å ÷,
x
xø
Dè
a=
(2.15)
1 æ 1 ö2
где D = n å
- ç å ÷ - определитель системы; x - значение независимой
x2 è x ø
переменной величины; y - значение зависимой переменной величины;
n - число членов ряда регрессии.
По изложенной выше методике регрессионный анализ применяют для
обработки результатов пассивного эксперимента, т.е. эксперимента, в котором
невозможно назначать и поддерживать на выбранном уровне значения
неслучайной величины. Более эффективным является активный эксперимент,
позволяющий применять математическое планирование эксперимента и тем
самым уменьшать время и число опытов.
39
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.4 Дисперсионный анализ
Возможен случай, когда на автоматической линии несколько станков
параллельно
выполняют
некоторую
операцию.
Для
правильного
планирования последующей обработки важно знать, насколько однотипными
являются средние размеры деталей, получаемых на параллельно работающих
станках. Здесь имеет место лишь один фактор, влияющий на размер деталей –
станки.
Исследователя интересует, существенно ли влияние этого фактора на
размеры деталей. Ответ на этот вопрос можно получить, сравнивая средние по
каждому станку размеры деталей между собой и оценки существенности
разницы этих средних.
Запишем матрицу наблюдений в виде таблицы 2.1.
Таблица 2.1 – Матрица наблюдений
Станки
Детали
1
2
…
1
X11
X12
X1j
X1n1
2
X21
X22
X2j
X2n2
…
…
…
i
Xi1
Xi2
…
…
…
m
Xm1
Xm2
…
J
…
…
…
xij
…
…
xmj
N
…
xini
…
…
xmnm
Запишем выражение:
Q = Q1 + Q2
(2.16)
где Q - полная сумма квадратов отклонений отдельных наблюдений от общей
средней;
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Q1 -
сумма
квадратов
разностей
между
средними
отдельных
совокупностей и общей средней всей совокупности наблюдений сумма
квадратов отклонений между группами;
Q2 - сумма квадратов разностей между отдельными наблюдениями и
средней соответствующей совокупности (сумма квадратов отклонений внутри
группы).
Найдем дисперсии:
Q
1 m æ |
| 2
D1 =
å ç X i - X ö÷ = 1
ø
m -1
m - 1 i = 1è
2
m n
Q2
1
|
D2 =
å å æç X ij - X i ö÷ =
ø
m(n - 1) i = 1 j = 1è
m(n - 1)
2
m n
1
|
æ
ö
D=
å å çX - X ÷ .
ø
mn - 1 i = 1 j = 1è ij
Произведем оценку различия между дисперсиями D1 и D2 по критерию
F (Фишера):
Q1
F=
Q2
K1
K2
где K1 - число степеней свободы ( K1 = m - 1);
K 2 - число степеней свободы ( K 2 = m(n - 1) ).
Выбирая уровень значимости a , по таблице (приложение) находим
табличное значение F - критерия.
41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнивая между собой межгрупповую и внутригрупповую дисперсии,
по величине их отклонения судят, насколько сильно проявляется влияние
факторов.
Рассмотрим задачу оценки действия двух одновременно действующих
факторов.
Предположим, что имеется несколько однотипных станков и несколько
видов сырья. Требуется выяснить, значимо ли влияние различных станков и
качество сырья в партиях на качество обрабатываемых деталей.
Пусть фактор «А» - влияние станков, фактор «В» - влияние качества
сырья в партиях. Размер обрабатываемых деталей обозначим Xij. Запишем
матрицу наблюдений (таблица 2.2).
Таблица 2.2 – Матрица наблюдений
Станки
Сырье
…
Вv
Xi|
…
…
X1v
X1*|
…
…
X2v
X2*|
В1
В2
…
А1
X11
X12
А2
X21
X22
Вj
Аi
Xij
Аr
Xr1
Xr2
…
…
Xrv
Xr*|
Xj|
X*1|
X*2|
…
…
X*v|
X|
Пусть имеется r - станков ( r -строк) и v - партий сырья ( v - столбцов).
По каждому столбцу и строке вычислим среднее значение, а также общее
среднее по формулам.
X |i * =
1 V
å X
V j = 1 ij
42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
X |* j =
X| =
1 r
å X
r i = 1 ij
1 r V
å å X .
rV i = 1 j = 1 ij
Запишем основное тождество (формула):
2
2
r
r V
r V
|
|
|
|
|
|
|
|
|
|
æ
ö
æ
ö
æ
ö
Q = å å ç Xij - X ÷ = å å ç Xij - X i * - X * j + X + X i * - X + X * j - X ÷ = V å ç X i * - X ÷ +
ø i = 1 j = 1è
ø
ø
i = 1è
i = 1 j =1è
2 r V
2
V
|
|
|
|
|
æ
ö
æ
ö
+ r å ç X * j - X ÷ + å å ç Xij - X i * - X * J + X ÷ = Q1 + Q2 + Q3
ø i = 1 j = 1è
ø
j = 1è
где Q1 - изменение признака по фактору «А»;
Q2 - изменение признака по фактору «В»;
Q3 - влияние неучтенных факторов;
Q - полная сумма квадратов отклонений отдельных наблюдений от общей
средней.
Оценим дисперсии:
2
r v
Q
1
|
æ
ö
D=
å å ç X ij - X ÷ =
ø
rv - 1 i = 1 j = 1è
rv - 1
2 Q
r
1
|
|
ö
æ
D1 =
v å ç X i* - X ÷ = 1
ø
r - 1 i = 1è
r -1
2 Q
v
1
|
|
D2 =
r å æç X * j - X ö÷ = 2
ø
v - 1 j = 1è
v -1
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
r v
Q3
1
| - X| + X|ö =
æ
.
D3 =
X
X
å å ç
÷
*j
i*
ø
(r - 1)(v - 1) i = 1 j = 1è ij
(r - 1)(v - 1)
Для выяснения значимости влияния факторов «А» и «В» на исследуемый
признак, сравнивают дисперсии по факторам с остаточной дисперсией.
Если случайная величина распределена нормально, то отношение
выборочных дисперсий имеет F-распределение:
D
F = 1
A D
3
D
F = 2.
B D
3
При выбранном уровне значимости a , F A и FB сравнивают с
табличным значением (приложение В). Если FA < Fa и FB < Fa , то факторы
«А» и «Б» не влияют на исследуемый признак.
2.5 Основы планирования многофакторного эксперимента
В общем случае объект исследования можно представить в виде
структурной схемы, показанной на рисунке 2.3.
Представление объекта в виде такой схемы основано на принципе
«черного ящика». Получаем следующие группы параметров:
1)
управляющие (входные)xi которые называются факторами;
2)
выходные
параметрыyi,
которые
состояния;
3)
wi, zi–возмущающие воздействия.
44
называются
параметрами
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Предполагается, что возмущающие воздействия не поддаются контролю
и либо являются случайными, либо меняются во времени.
Каждый фактор хi имеет область определения, которая должна быть
установлена до проведения эксперимента.
r
W
W1
W2
W3
...
Wn
...
X
X1
X2
.
.
.
.
.
ОБЪЕКТ
.
.
.
.
Y1
Y2
.
.
.
r
Y
Yn
Xn
...
Z1
Z2
Z3
Z
...
Zn
r
Рисунок 2.3 – Структурная схема объекта исследования
Комбинацию факторов можно представить как точку в многомерном
пространстве, характеризующую состояние системы.
На
практике
целью
многофакторного
эксперимента
является
установление зависимости
y = f ( x1 , x2 ...xk )
(2.17)
описывающей поведение объекта. Чаще всего функция (2.17) строится в виде
полинома
45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y = а0 + а1 х1 + а2 х2
(2.18)
или
y = а0 + а1 х1 + а2 х2 + а11х12 + а22 х22 + а12 х1х2 .
(2.19)
Целью эксперимента может быть, например, построение зависимости
(2.17) при минимальном количестве измерений значений управляющих
параметров хi.
На первом этапе планирования эксперимента необходимо выбрать
область определения факторов хi.Выбор этой области производится исходя
из априорной информации. Значения хi называютсяуровнями управляющего
параметра.
Если
выбрана
линейная
модель
(2.18),
то
для
построения
аппроксимирующей функции достаточно выбрать основной уровень и
интервал варьирования управляющего параметра хi.
Для линейной модели интервал варьирования можно определить как
I=
xmax - xmin
,
2
а основной (нулевой) уровень – как среднее значение
x0 =
xmax - xmin
.
2
Для упрощения планирования эксперимента принято вместо реальных
натуральных) уровней хi использовать кодированные значения факторов. Для
факторов с непрерывной областью определения это можно сделать при
помощи следующего преобразования (нормирования факторов)
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
xj =
~
x j - x j0
Ij
,
где ~
x j - натуральное значение фактора;
I j - интервал варьирования;
x j 0 - основной уровень;
x j - кодированное значение.
В результате x j принимает значения на границах x j = ±1 на основном
уровне x j = 0 . Основная проблема состоит в выборе области варьирования,
поскольку эта задача является неформализованной.
Рассмотрим полный факторный эксперимент на примере линейной
модели (2.18). Если число факторов k, то для проведения полного факторного
эксперимента нужно N = 2k опытов, где 2 – число уровней, которого
достаточно для построения линейной модели.
Условие проведения этого эксперимента можно зафиксировать в
матрице планирования (таблица 2.3).
Таблица 2.3 – Матрица планирования для двух факторов
Номер опыта
х1
х2
y
1
–1
–1
y1
2
+1
–1
y2
3
–1
+1
y3
4
+1
+1
y4
Таким образом, для двух факторов построение матрицы планирования
элементарно. Для большего числа факторов необходимо разработать правила
построения таких матриц. Например, при появлении фактора x3 в таблице
2.4произойдут следующие изменения (таблица 2.4): при появлении нового
столбца каждая комбинация уровней исходной таблицы проявится дважды.
47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 2.4 – Матрица планирования для трёх факторов
Номер опыта
x1
x2
x3
y
1
–1
–1
+1
y1
2
+1
–1
+1
y2
3
–1
+1
+1
y3
4
+1
+1
+1
y4
5
–1
–1
–1
y5
6
+1
–1
–1
y6
7
–1
+1
–1
y7
8
+1
+1
–1
y8
Это не единственный способ расширения матрицы планирования.
Используют также перемножение столбцов, правило чередования знаков.
Очень важны общие свойства матрицы планирования:
•
симметричность
матрицы
относительно
центра
=
xi 0 . Тогда
эксперимента:
N
å x ji = 0 .
i =1
•
N
å xij2 = N
условие нормировки, то есть сумма квадратов
i =1
элементов каждого столбца равна числу опытов. Первые два свойства
относятся к построению отдельных столбцов матрицы.
•
N
å xij × xin = 0 - совокупность столбцов имеет следующее свойство,
i =1
где j≠n.
•
Ротатабельность – это означает, что точки (значения факторов)
в матрице планирования подбираются так, что точность предсказания
выходного параметра должна быть одинакова на равных расстояниях от
центра эксперимента (нулевого уровня) и не зависеть от направления.
48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.6 Планирование эксперимента первого порядка для двух
переменных
План эксперимента первого порядка для двух переменных показан на
рисунок 2.3. То есть искомая функция y = f ( x1 , x2 ) описывается модельно в
виде плоскости
y = а0 + а1 х1 + а2 х2
(2.20)
или гиперболоида
y = а0 + а1х1 + а2 х2 + а3 х1 х2
(2.21)
Расположение этой модели в пространстве показано на рисунке2.4
поверхностью, проходящей через точки 1 – 2 – 3 – 4.
Рисунок 2.4 – Расположение модели первого порядка для двух
переменных в пространстве
Необходимые
уровни
для
полного
факторного
эксперимента
расположены в плоскости ( x1, x2 ) . Для модели в виде гиперболоида этот план
49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
является предельно экономным. Для построения гиперболоида необходимо
определить четыре коэффициента в модели (2.21). Это можно сделать, решая
систему из четырех уравнений. Следовательно, необходимы все четыре опыта.
В теории планирования эксперимента используется термин насыщенности.
Если рассматривать модель (2.20) в виде плоскости, то план
эксперимента является ненасыщенным (избыточным), так как необходимо
определить только три коэффициента a0, a1,и a2. В случае модели (2.21)
(насыщенный эксперимент) решение системы единственно, и поверхность
гиперболоида пройдет через все четыре экспериментальных значения yi.
Следствием этого является то, что насыщенный эксперимент не позволяет
усреднить случайные погрешности и не дает сведения об их размере.
Для ненасыщенного плана (2.20) избыточное число опытов позволяет
произвести усреднение и оценить размеры погрешности. Проведя плоскость
через точки 1, 2 и 3, можно оценить погрешность, определив, на каком
расстоянии от плоскости находится точка 4. Погрешность в других точках
может быть оценена проведениемплоскостей 1 – 3 – 4, 1 – 2 – 4 и 2 – 3 – 4. С
другой стороны коэффициент а1наклона поверхности к осиx1 может быть
найден как из наклона прямой 1 – 2, так и из наклона прямой 3 – 4. Аналогично
коэффициент a2 приx2можно определить из наклона прямых 1 – 3 и 2 – 4.
Поскольку полученные таким образом значенияa1 иa2 могут отличаться,
ненасыщенный эксперимент позволяет провести их усреднение и оценить
погрешность.
Если уравнение плоскости представить в виде
y = а0 + а1 ( х1 - х1 ) + а2 ( х2 - х2 ) ,
где х1 =
(2.22)
х1 min + x1 max
х
+ x2 max
; х2 = 2 min
, то мы переносим начало координат
2
2
в точку с координатами ( x1, x2 ) . Тогда коэффициент a0 находится усреднением всех четырех значений yi как высота центра плоскости 1 – 2 – 3 – 4.
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Процесс переноса начало координат в центр пространства факторов с
координатами ( x1, x2 ,..., xk ) очень важен при обработке данных любых
экспериментов, описываемых моделью в виде гиперплоскости, так как
позволяет получить более устойчивое усредненное значение дляа0.
Важнейшим фактором является то, что в результате такого усреднения
построенная плоскость удовлетворяет всем четырем значениям yi лишь в
среднем. В любой точке может быть найдена погрешность отклонения
экспериментальных данных относительно модели, и по этим четырем
отклонениям можно вычислить СКО.
Таким образом, один из четырех опытов является избыточным и может
быть исключен. Но тогда план эксперимента становится неротатабельным, то
есть неравноточным по всем направлениям. Если исключена точка 4 на
рисунке 2.4, то в направлении 3 – 2 в плоскости факторов будет обеспечена
большая точность, чем в направлении 1 – 0. В этом случае для восстановления
ротатабельности точки 1, 2 и 3 в плоскости факторов должны быть
равноудалены как друг от друга, так и от центра, то есть располагаться в
вершинах равностороннего треугольника с центром в точке 0. В общем случае
для линейной модели (2.20), эксперимент содержащий конечное число опытов
позволяет получить только оценки для коэффициентов a0 ,a1 иa2.
Подставив в уравнение модели (2.20) известные значения факторов хij и
результаты опытов yi получим систему линейных алгебраических уравнений
для определения аi. Если количество этих уравнений больше трех, то значения
оценока0 ,а1 иа2могут быть получены при помощи МНК:
æN
ö
а j = çç å xij yi ÷÷ N ,
è i =1
ø
где N– количество опытов.
Здесь учтено, что хij принимают значения – 1,+1.
51
(2.23)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для вычисления коэффициентов линейной модели по формуле (2.23)
получим:
а1 =
[(- 1)y1 + (+ 1)y2 + (- 1) y3 + (+ 1)y4 ]
4
,
- 1) y1 + (- 1) y 2 + (+ 1) y3 + (+ 1) y 4 ]
[
(
a2 =
4
(2.24)
Таким образом, для вычисленияa1 и a2 можно использовать (2.24). Для
определенияа0
1 n
в формуле (2.20) найдем среднее значение y = å yi ,
n i= 1
равное y = а0 + а1 х1 + а2 + х2 , где x1 =
В
случае
симметричности
1 n
1 n
x
x
=
,
å 1i 2 n å x2i .
n i =1
i =1
планирования x1= x2 = 0 ,
матрицы
откуда y= а0 . Чтобы коэффициент модели вычислялся по единой формуле
(2.23) в матрице планирования вводят фиктивную переменнуюх0, которая
принимает значение 1 во всехопытах и соответствует коэффициентуа0.
Коэффициент при независимых переменных xi указывает на силу влияния
факторов: чем больше значение имеет коэффициент ai, тем большее влияние
оказывает соответствующий фактор. В этом смысле результаты планирования
эксперимента
аналогичны
факторному
экспериментов
факторный
анализ может
анализу.
Для
использоваться
пассивных
в
качестве
априорных данных при планировании.
Планируя эксперимент, стремятся получить линейную модель, однако в
выбранных интервалах варьирования априори не известно, что линейная
модель адекватно описывает поведение системы.
Нелинейность связана со смешанным взаимодействием. Формула (2.21)
всегда может быть оценена по полному факторному эксперименту. Для
полного факторного эксперимента N = 22 матрица планирования с учетом
эффекта взаимодействия приведена в таблице 2.5.
52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 2.5 – Матрица планирования с учетом эффекта взаимодействия
Номер
x0
x1
x2
x1 x2
y
1
+1
–1
–1
+1
y1
2
+1
+1
–1
–1
y2
3
+1
–1
+1
–1
у3
4
+1
+1
+1
+1
y4
опыта
В этом случае коэффициент a12 также может быть вычислен по формуле (2.24)
а12 =
Столбцы
[(+ 1)y1 + (- 1) y2 + (- 1) y3 + (+ 1) y4 ]
х1,х2
4
задают
планирование
.
(2.24)
эксперимента
–
по
ним
определяютрезультаты опыта; столбцы х0,х1х2 служат только для расчета.
С ростом числа факторов число возможных взаимодействий возрастает.
Например, для факторного эксперимента N = 23 кроме х0, х1,х2,х3 в
матрицепланирования появляются столбцы х1х2,х1х3, х2х3, х1х2х3. Всего в
матрице
планирования
оказывается
восемь
столбцов,
следовательно,
необходимо определять восемь коэффициентов. Все восемь коэффициентов
необходимо
определять
в
том
случае,
если
учитывать
смешанное
взаимодействие. Если же модель задается в виде гиперплоскости (линейная
модель), то достаточно определить четыре коэффициента: х0,х1,х2, х3. Полный
факторный эксперимент оказывается избыточным и у экспериментатора
возникает выбор:
1.
Построить
гиперплоскость
по
четырем
экспериментам,
а
остальные четыре опыта использовать для оценки погрешности.
2.
Провести эксперимент, состоящий из 4-х опытов, то есть
реализовать экономный план эксперимента.
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, в отличие от модели гиперболоида, которая требует
определение 2k неизвестных коэффициентов, модель гиперплоскости,
содержит k +1 коэффициент и требует соответствующего числа опытов, то
есть полный факторный план (ПФП) для модели гиперплоскости сильно
избыточен.
Для
построения
гиперплоскости,
следовательно,
достаточно
использовать лишь некоторую часть из ПФП. Эту часть в теории
планирования эксперимента называют дробной репликой или дробным
факторным
планом
последовательным
(ДФП).
делением
называютрегулярной.
Число
Если
числа
p
дробление
опытов
ПФП
на
последовательного
производится
2,
то
деления
реплику
называют
дробностью реплики.
Число опытов регулярного ДФП равняется n = 2k-р. При р = 1 ДФП
называют полурепликой (или 1/2 реплика), при р = 2 – 1/4 реплика и т.д.
Соответствующее число опытов и параметров планирования приведены
в таблице 2.6.
Таблица 2.6 – Число опытов и параметров планирования
Число
факторов,
k
Число
коэфф.
модели,
k +1
Число
опытов
Число
Вид плана
ПФП
опытов
Избыточность
плана
2
3
4
ПФП
4
1
3
4
8
Полуреплика
4
0
4
5
16
Полуреплика
8
3
5
6
32
Четвертьреплика
8
2
6
7
64
1/8 реплика
8
1
7
8
128
1/16 реплика
8
0
6
9
256
1/16 реплика
16
7
54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для составления планов-таблиц регулярных дробных реплик часто
используют так называемое правило двоичного кода. Оно гласит, что для
модели в виде гиперболоида знаки "+" и "–" в столбцах плана должны
чередоваться по правилу чередования двоичных чисел в разряде двоичного
кода, то есть в столбце x1– через 1, в столбце x2– через 2, в столбце x3– через 4,
в столбце xk– через 2k – 1.
55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3 Построение эмпирических моделей по данным активного
эксперимента
При проведении опытных исследований различают пассивный и
активный эксперимент.
Методология
проведение
большой
пассивного
серии
экспериментирования
опытных
исследований
предполагает
с
поочередным
варьированием значений входных переменных x и анализом результатов
измерений выходной переменной y (лабораторный эксперимент).
К пассивному эксперименту принято относить также и сбор опытных
данных в режиме эксплуатации промышленной установки – промышленный
эксперимент.
Обработка результатов пассивного эксперимента проводится методами
регрессионного и корреляционного анализа, и выбор вида эмпирической
модели
(уравнения
регрессии),
т.е.
решение
задачи
структурной
идентификации является достаточно сложной задачей.
Это связано с тем, что вид уравнения регрессии необходимо определять
по характеру изменения переменных на графике эмпирической линии
регрессии, полученной по выборке экспериментальных данных.
Для решения этой задачи для одной входной переменной x предложены
эффективные методы, в которых предусматривается преобразование системы
координат как для входной (x), так и для выходной переменной (y). При
большем числе входных переменных (x1,...,xm) надёжных методов определения
вида уравнения регрессии (вида эмпирической модели) в настоящее время не
существует.
Активный эксперимент проводится по заранее составленному плану, в
соответствии с которым ставится задача не только определения оптимальных
условий проведения эксперимента, но и оптимизации процесса (оптимальное
планирование эксперимента).
56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При этом уравнения регрессии (эмпирические модели) описывают
данные активного эксперимента, в основном, в двух ограниченных областях и
имеют следующий вид:
- вдали от экстремального значения выходной переменной y :
ÙI
m -1 m
m
y = а0 + å а j x j + åå а ju x j xu
j =1 =
=
j 1u 2
u>j
- вблизи экстремального значения выходной переменной y («в почти
стационарной области»):
Ù II
m
m -1 m
m
j =1
j 1 u= 2
j= 1
y = а0 + å а j x j + åå а ju x j xu + å а j x 2j .
=
u> j
Приведённые
уравнения
являются
линейными
относительно
коэффициентов регрессии а и имеют достаточно простой вид.
Они включают слагаемые с двойным взаимодействием входных
переменных
æ m -1 m
ö
ç å å а ju x j xu ÷
÷
ç
è j= 1u= 2
ø
u>j
и не учитывают взаимодействия более высоких порядков (тройные, четверные
и т.д.), вероятность которых существенно меньше. Последнее уравнение
включает слагаемые с квадратами входных переменных
57
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
æm
ö
ç å а j x 2j ÷
ç
÷
è j =1
ø
и его коэффициенты получаются при обработке результатов активных
Ù
Ù II
экспериментов II-го порядка (верхний индекс II при y : y ) - например, ОЦКП
- ортогонального центрального композиционного плана эксперимента.
Предпоследнее уравнение не включает слагаемые с квадратами входных
переменных и его коэффициенты получаются при обработке результатов
Ù
ÙI
активных экспериментов I-го порядка – верхний индекс I при y : y например, ПФЭ - полный факторный эксперимент.
При определении оптимальных условий проведения процесса с
использованием эмпирических моделей (например, методом Бокса-Вильсона)
выходная переменная y является критерием оптимальности или целевой
функцией.
В теории активного экспериментирования выходную (зависимую)
переменную принято называть функцией отклика, а входные (независимые)
переменные – факторами. Соответственно – координатное пространство с
координатами (x1, x2,...,xm) – факторным пространством, а геометрическое
изображение функции отклика в факторном пространстве – поверхностью
отклика.
Активный эксперимент планируется таким образом, чтобы упростить
обработку его результатов методами регрессионного и корреляционного
анализа.
Ортогональные планы экспериментов, используемые при активном
экспериментировании, обеспечивают диагональный вид корреляционной
матрицы C при регрессионном анализе и, соответственно, статистическую
независимость коэффициентов регрессии.
К другим достоинствам активного экспериментирования относятся:
•
возможность предсказания количества опытов, которые следуют
провести;
58
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
•
определение
точек
факторного
пространства,
где
следует
проводить опыты;
•
отсутствие проблем, связанных с выбором вида уравнения
регрессии;
•
возможность определения оптимальных параметров процесса
экспериментально-статистическим методом;
•
сокращение объёма опытных исследований.
3.1 Полный факторный эксперимент и обработка его результатов
Полный факторный эксперимент (ПФЭ) относится к экспериментам
ÙI
I-го порядка, т.к. описывающее его уравнение
y не включает факторы в
квадрате.
Для двух факторов (x1 и x2) и без учёта взаимодействия факторов
соответствующая эмпирическая модель может быть записана:
ÙI
y = а0 + а1 x1 + а2 x2
В соответствии с теорией ПФЭ при проведении опытных исследований
каждый из факторов варьируется только на двух уровнях – минимальном
(кодированное значение - 1) и максимальном (кодированное значение +1).
При этом реализуются возможные комбинации минимальных и
максимальных значений факторов, в результате чего общее число опытов (n) в
ПФЭ равно 2m и полный факторный эксперимент обычно называется ПФЭ
типа 2m . Для определения числа опытов применяется формула:
n = 2m
В последнее уравнение включаются кодированные значения факторов zj
вместо xj, значения которых получаются по следующей схеме кодирования:
59
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
zi =
х j + x (j0)
Dx j
где
, j=1,…m
(
x (j0) = 0,5 x min
+ x max
j
j
Dx j =
x max
- x min
j
j
2
)
,j=1,…n
В результате план проведения эксперимента с учётом вышесказанного и
кодирования факторов имеет вид:
(число факторов равно 2 – m = 2, число опытов n = 2m = 22 = 4)
Таблица 3.1 – План проведения эксперимента
p
n
z0
z1
z2
уэ
1
+1
-1
-1
у1э
2
+1
+1
-1
у2 Э
3
+1
-1
+1
у3Э
4
+1
+1
+1
у4Э
При этом уравнение регрессии, описывающее эти опытные данные,
записывается с использованием кодированных факторов zj (j=0, 1, 2) и
соответственно кодированных коэффициентов регрессии а~ , а~ , а~ :
0
1
2
Ù
y = а%0 + а%1 z1 + а%2 z2 .
В кодированном факторном пространстве в соответствии с указанным
планом проведения эксперимента, проведённые опыты представляются
точками вершин квадрата (рисунок 3.1):
60
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 3.1 – Кодированное факторное пространство
Для
параметрической
идентификации
кодированного
уравнения
регрессии используется метод регрессионного анализа, включающий три
этапа:
•
определение кодированных коэффициентов уравнения регрессии
a методом наименьших квадратов;
•
оценка значимости кодированных коэффициентов регрессии с
использованием t - критерия Стьюдента;
•
проверка адекватности кодированного уравнения регрессии с
использованием F - критерия Фишера.
Реализация двух последних этапов возможна при выполнении свойства
однородности дисперсий (одно из требований регрессионного анализа) и
проведении параллельных опытов, например, в точке с координатами z1 = 0 и
z2 = 0 (центр плана, на рисунке - тёмная точка).
При проведенииk параллельных опытов в центре плана ( y0эs , s = 1,...k )
среднеезначение y0эs определяется как среднее арифметическое результатов
измерений во всех параллельных опытах:
k
y0эs =
å y0эs
S =1
k
61
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.2 Определение кодированных коэффициентов регрессии (ПФЭ)
В этом случае используется применяемая при линейном регрессионном
анализе матричная формула метода наименьших квадратов (МНК), которая с
учётом кодирования факторов имеет вид:
-1
æ ~ Т ~ ö
~ Т э
а~ = çç F
y ,
F ÷÷
F
(m +1)´1 è (m +1)´ n n´ (m +1) ø (m +1)´ n n´1
где кодированная матрица, зависящая от независимых переменных для двух
факторов включает только +1 и -1 и имеет вид:
é z10
êz
~
F = z = ê 20
4´3
ê z30
ê
ë z 40
z12 ù é+ 1
z 22 ú ê+ 1
ú=ê
z32 ú ê+ 1
ú ê
z 42 û ë+ 1
z11
z 21
z31
z 41
-1
+1
-1
+1
- 1ù
- 1ú
ú
+ 1ú
ú
+ 1û
Матрица z при активном экспериментировании называется матрицей
планирования и обладает тремя оптимальными свойствами:
•
симметричности: сумма элементов всех столбцов матрицы,
кроме первого (точнее, нулевого) равна нулю
n
å zij = 0, j = 1,...m
i =1
•
ортогональности: скалярное произведение двух любых столбцов
матрицы равно нулю
n
z Tj zu = å zij ziu = 0
i =1
62
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
j, u = 0, 1,…m u ≠ j;
•
нормировки: скалярное произведение двух одинаковых столбцов
матрицы равноп (п = 2m в ПФЭ)
z Tj z j
n
= å zij2 = n
i =1
j = 0,1,…m.
Благодаря
перечисленным
оптимальным
свойствам
матрицы
планирования z информационная матрица в ПФЭ при m=2 равна
~
~
I = F
(3´3)
T
~
F = z
(3´ 4) ( 4´ 3)
(3´ 4)
T
én 0 0ù
z = ê0 n 0ú ,
ú
( 4´3) ê
êë0 0 núû
т.е. она является диагональной с одинаковыми элементами на главной
диагонали, равными n=22=4.
Соответственно, корреляционная матрица С также будет диагональной
и с одинаковыми элементами главной диагонали:
~ æ ~T ~ ö
С = çç F F ÷÷
(3´3) è
ø
-1
æ T ö
= ç z z÷
è
ø
-1
én -1 0
0 ù
ú
ê
= ê 0 n -1 0 ú
ê 0
0 n -1 úû
ë
Результатом подстановки последних соотношений в матричную
формулу для определения кодированных коэффициентов регрессии будет
простая формула:
63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
å zij yiэ
a~ j = i =1
, j = 0, 1,…m
n
При учёте взаимодействия двух факторов z1 и z2 кодированное
уравнение регрессии принимает вид:
Ù
y = а%0 + а%1 z1 + а%2 z2 + а%12 z1 z2
и в матрицу планирования z включается ещё один дополнительный последний
столбец, каждый элемент которого равен произведению элементов столбцов,
соответствующих взаимодействующим факторам:
é z10
êz
~
F = z = ê 20
( 4´ 4)
ê z30
ê
ë z 40
z12 ( z11z12 ) ù é+ 1
z 22 ( z 21z 22 )ú ê+ 1
ú=ê
z32 ( z31z32 )ú ê+ 1
ú ê
z 42 ( z 41z 42 )û ë+ 1
z11
z 21
z31
z 41
-1
+1
-1
+1
- 1+ 1ù
- 1 - 1ú
ú
+ 1- 1ú
ú
+ 1+ 1û
При этом матрица планирования сохраняет все три оптимальных
свойства
-
кодированный
симметричности,
коэффициент
ортогональности
уравнения
и
регрессии
нормировки,
при
а
члене,
характеризующем взаимодействие факторов, определяется по формуле:
n
å (zij ziu )yiэ
a~ ju = i =1
n
, j, u= 0, 1,…mu>j
В теории ПФЭ доказывается, что при увеличении числа факторов (m>2)
матрица планирования
z
(n ´ p )
строится с использованием рассмотренной
64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
методики, в том числе и с учётом взаимодействия факторов (не только
двойного, но и тройного, четверного и т.д.).
В этом случае число столбцов матрицы p зависит от числа учёта
взаимодействий факторов n = 2m и матрица планирования сохраняет
перечисленные оптимальные свойства.
Поэтому для определения кодированных коэффициентов регрессии
используются приведённые выше формулы.
Для расчёта натуральных значений коэффициентов в кодированное
уравнение регрессии вместо кодированных факторов zj (j = 1, ... m) следует
подставить выражения для последних через натуральные значения факторов хj
(j = 1, ... m) в соответствии с приведённой выше схемой кодирования.
3.3
Определение
значимости
кодированных
коэффициентов
регрессии (ПФЭ)
Незначимость кодированных коэффициентов регрессии определяется с
использованием квантиля t– распределения Стьюдента t bтабл
( f е ) при помощи
неравенства:
a~ j
S a~ j
£ t bтабл
( fе ) ,
где β - доверительная вероятность (в инженерных расчётах равная 0,95);
fe - число степеней свободы дисперсии воспроизводимости (при
одной серии параллельных опытов равная k-1).
Выборочное значение квадратного корня дисперсии кодированного
коэффициента регрессии определяется по формуле:
65
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
~
Sa~ j = С jj Se ,
где Se - квадратный корень из дисперсии воспроизводимости,
определяемой по k параллельным опытам в центре плана эксперимента:
å (y
k
Se2 =
j =1
э
0S
- yсэ
)
2
=
k -1
SSe
,
fe
где SSe – сумма квадратов дисперсии воспроизводимости;
fe - число степеней свободы дисперсии воспроизводимости.
Как было показано выше, диагональные элементы корреляционной
матрицы в ПФЭ при кодировании факторов одинаковы и равны 1/n,
вследствие чего
S a~ j =
Se
.
n
В результате условие не значимости кодированных коэффициентов
регрессии принимает вид:
a~ j
S a~ j
n £ t bтабл
( fе ) .
~
Так как корреляционная матрица С в этом случае является
диагональной, то кодированные коэффициенты регрессии статистически
независимы и при одновременной не значимости нескольких кодированных
коэффициентов регрессии они (в отличие от процедуры обработки пассивного
эксперимента) могут быть сразу, все вместе, исключены из кодированного
уравнения регрессии.
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.4 Проверка адекватности уравнения регрессии (ПФЭ)
Проводится так же, как и при проведении пассивного эксперимента, с
использованием табличного значения критерия Фишера, выбранного при
доверительной вероятности β (чаще всего равной 0,95) и числе степеней
свободы остаточной дисперсии fR и дисперсии воспроизводимости fe .
Условие адекватности проверяется с использованием неравенства:
S R2
Se2
где
остаточная
дисперсия,
£ Fbтабл
( f R , fe ) ,
характеризующая
точность
уравнения,
определяется по формуле:
å (yiI - yiэ )
n
S R2 =
2
i =1
n- p
=
SS R
.
fR
При этом fR = n - p , где n - число экспериментов при различных
значениях факторов; p - число значимых коэффициентов регрессии.
К недостаткам ПФЭ относится резкое увеличение числа опытов при
возрастании количества факторов больше, чем 5 (при m = 5 n = 25 = 32 ).
Для проведения регрессионного анализа при пренебрежении целым
рядом несущественных взаимодействий факторов достаточно проводить
меньшее число опытов. В этом случае можно реализовать часть ПФЭ –
дробный факторный эксперимент (ДФЭ).
67
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.5 Ортогональный центральный композиционный эксперимент и
обработка его результатов
Ортогональный центральный композиционный эксперимент (ОЦКП)
относитсяк экспериментам II –го порядка, так как описывающее его уравнение
Ù II
y включает факторы в квадрате и поэтому может описывать поверхности
функций отклика в окрестности их экстремальных значений.
Для двух факторов (x1 и x2) с учётом только двойного взаимодействия
факторов соответствующая эмпирическая модель может быть записана:
Ù II
2
y = a0 + a1 x1 + a2 x2 + a12 x1 x2 + a11x12 + a22
.
В соответствии с методикой ОЦКП здесь, также как и для ПФЭ,
осуществляется кодирование факторов по приведённой выше схеме, и для
обеспечения ортогонального свойства матрицы планирования эксперимента в
Ù II
уравнение регрессии y включается некоторая постоянная S.
В результате уравнение регрессии при m = 2 принимает вид:
Ù II
2
y = a%0 + a%1 z1 + a%2 z2 + a%12 z1 z2 + a%11 ( z12 - S ) + a%22
( z22 - S ) .
Для определения большего числа кодированных коэффициентов, чем
при обработке ПФЭ, и описания поверхности функции отклика вблизи её
экстремума («почти стационарной области»), количество опытов в этом
случае увеличивается.
При этом опыты, проводимые при ПФЭ n = 2m , дополняются опытами в
«звёздных» точках факторного пространства nα = 2m и опытами в центре плана
с координатами z1 = 0 и z2 = 0 (nc ).
68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
«Звёздные» точки в факторном пространстве располагаются на
осях координат на расстоянии + α и - α от центра плана эксперимента;
причём величина а называется «звёздным» плечом и её значения, так же как
величина
S,
определяются
из
условия
ортогональности
матрицы
планирования z для ОЦКП.
Общее число опытов N в ортогональном центральном композиционном
эксперименте определяется по формуле:
N = n + na + nc,
или с учётом приведённых выше равенств:
N = 2m + 2m + nc.
Для случая двух факторов (m = 2):
N = 8 + nc .
Расположение опытных точек в факторном пространстве для случая
двух факторов в приведённой ранее кодированной системе координат может
быть представлено, как показано на рисунке 3.2:
Рисунок 3.2 – Кодированное факторное пространство
План проведения экспериментов в этом случае может быть представлен:
69
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 3.2 – План проведения экспериментов
N
2
m
2m
nc
p
z0
z1
z2
z1z2
z12- S
z22- S
yэ
1
+1
-1
-1
+1
1-S
1- S
yэ1
2
+1
+1
-1
-1
1-S
1- S
yэ2
3
+1
-1
+1
-1
1- S
1- S
yэ3
4
+1
+1
+1
+1
1- S
1- S
уэ4
5
+1
-α
0
0
α 2-S
-S
уэ5
6
+1
+α
0
0
α 2-S
-S
уэ6
7
+1
0
-α
0
-S
α 2- S
уэ7
8
+1
0
+α
0
-S
α 2- S
уэ8
9
+1
0
0
0
-S
-S
уэ9
.
.
.
N
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
+1
0
0
0
- S
-S
yэN
Матрица планирования z представляет собой часть плана проведения
эксперимента без горизонтальных и вертикальных заголовков таблицы и
вектора наблюдения y э (правого столбца).
3.6 Определение величины «звёздного плеча» α и S из условия
ортогональности матрицы планирования
Матрица планирования
z
(N ´6)
z
была бы ортогональной, если бы
выполнялись следующие равенства:
70
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(
)
ìï z0T z j - S = 0
í
ïî j = 1,2
(z
2
1
-S
) (z
T
2
2
)
- S = 0.
Раскрывая первое равенство, можно получить:
(
)
N
N
i =1
i =1
z 0 z12 - S = å zi 0 zij2 - å zi 0 S = n + 2a 2 - NS = 0
.
j = 1,2
Откуда:
S=
n + 2a 2
( A).
N
Раскрывая второе равенство, получаем:
(z
2
1
-S
(
) (z
T
- S n + 2a
2
2
2
) ( )
- S = z12
) + NS
2
T
( ) S -S
z 22 - z12
T
T
(
)
z 22 + S T S = n - n + 2a 2 S -
= n - 2 NS 2 + NS 2 = n - NS 2 = 0
Откуда:
S=
n
(В).
N
Последнее выражение используется для определения S.
Приравнивая правые части двух выражений для S, можно найти
формулу для определения α:
71
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n + 2a 2
n
=
N
N
a2 =
1
2
(
ö
næ N
Nn - n = çç
- 1÷÷.
2è n
ø
)
В результате звёздное плечо α можно определить по формуле:
a=
ö
næ N
çç
- 1÷÷.
2è n
ø
3.7 Определение кодированных коэффициентов регрессии (ОЦКП)
В соответствии с методом наименьших квадратов эти коэффициенты
определяются по матричной формуле:
~ T э
a~ = C z y ,
где
-1
T
~
C = æç z z ö÷ .
è
ø
Из-за свойства ортогональности матрицы планирования z необходимо
определить только диагональные элементы информационной матрицы:
~ T
I = z z,
а затем диагональные элементы корреляционной матрицы:
~ ~ -1
C=I .
72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.8 Определение диагональных элементов информационной и
корреляционной матриц
Обобщая уравнение регрессии на случай m факторов и учитывая только
все двойные взаимодействия факторов, число которых определяется по
формуле:
Сm2 =
m(m - 1)
,
2!
общее число коэффициентов уравнения регрессии для m факторов равно:
p =1 + m +
m(m - 1)
+ m,
2!
~
диагональные элементы информационной матрицы I определяются: i00 = N -
число таких элементов равно 1;
ijj=n+2α2 (j=1, … m);
ijj= n ( u >j ) - число таких элементов равно:
m(m - 1)
.
2!
Для определения при квадратах факторов ijj можно записать:
(
i jj = n(1 - S )2 + 2 a 2 - S
)
2
+ ( N - n - 2 )S 2 =
= n - 2nS + nS 2 + 2a 4 - 4a 2 S + +2 S 2 + NS 2 - nS 2 - 2 S 2 =
(
)
= 2a 4 + n - 2 S n + 2a 2 S + NS 2 = 2a 4 + n - NS 2 = 2a 2
Из равенства (А)=NS
Из
Количество таких диагональных элементов - m.
73
В)=0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
~
Диагональная матрица I имеет размер:
p =1+ m +
m(m - 1)
(m + 1)(m + 2) ,
+m=
2
2
что соответствует числу определяемых параметров p.
~ ~ -1
В результате диагональная корреляционная матрица C = I размером
р×р для m факторов и с учётом их двойных взаимодействий имеет вид:
é(N )-1
ê
ê
ê
ê
ê
ê
C =ê
( p´ p ) ê
ê
ê
ê
ê
ê
ê
ë
(n + 2a )-1
...
(n + 2a )
n -1
...
n -1
(2a )
4 -1
...
1
ù
ú
ú
ú
m
ú
ú
ú
ú m(m - 1)
ú
2
ú
ú
ú
ú
m
ú
1
ú
2a 4 û
( )
Элементы корреляционной матрицы определяются по матричной
формуле МНК:
~ T э
a~ = C z y .
Кодированные коэффициенты регрессии определяются:
74
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
N
å
N
å zij yiэ
yiэ
a~0 = i =1 ; a~ j = i =1
N
n + 2a 2
( j = 1,...m);
N
å (zij ziu )yiэ
a~ ju = i =1
m(m - 1) ö
æ
u > jç число коэффициентов
÷.
2
è
ø
n
å (zij2 - S )yiэ
n
a~ jj = i =1
2a 4
Для пересчёта этих коэффициентов регрессии в натуральные значения
необходимо вместо кодированных факторовz подставить их натуральные
величиныxj в соответствии с приведённой схемой кодирования.
3.9
Определение
значимости
кодированных
коэффициентов
регрессии (ОЦКП)
В отличие от ПФЭ значимость коэффициентов регрессии определяется
по разным формулам для различных коэффициентов, так как диагональные
~
элементы корреляционной матрицы С отличаются друг от друга.
С
учётом
общей
формулы
для
определения
не
значимости
коэффициентов регрессии
a~ j
£ t bтабл
( Sе )
~
С jj Se
не значимость каждого вида коэффициентов регрессии определяется:
a~ j
Se
N £ t bтабл
(S е )
75
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
a~ j
Se
a~ ju
Se
n + 2a 2 £ t bтабл
( S е ) ( j = 1,...m )
m(m - 1) ö
æ
n £ t bтабл
÷
( S е ) ç число коэффициентов
2
è
ø
a~ jj
2a 2 £ t bтабл
( S е ) ( j = 1,...m )
Se
3.10 Проверка адекватности уравнения регрессии (ОЦКП)
Осуществляется с использованием критерия Фишера – так же, как и в случае с
ПФЭ.
3.11 Определение экстремума функции отклика
Уравнение регрессии с m факторами вида:
Ù II
m
m-1 m
m
j =1
j 1 u =2
j =1
y = a%0 + å a%1 z1 + åå a% ju z j zu + å a% jj ( z12 - S )
=
u> j
может применяться для определения экстремума функции отклика с
использованием
необходимого
условия
переменных:
Ù II
¶y
¶z1
………
76
экстремума
функции
многих
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ù II
¶y
¶zm
Полученная система линейных уравнений (СЛАУ) позволяет расчётным
путём определить z opt
j (j=1,…m)и после подстановки их величин в исходное
Ù II
уравнение y получить максимальное или минимальное значение функции
отклика.
77
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4 Планы дробного факторного эксперимента
При многофакторном эксперименте, особенно когда число факторов
больше шести (п > 6), число опытов планов ПФЭ 2n (N = 2n) становится
чрезмерным. Если не требуется определение всех коэффициентов неполного
квадратичного полинома, то переходят к дробному факторному эксперименту
(ДФЭ) – части полного факторного эксперимента. Так, например, если
требуется определить лишь коэффициенты при самих факторах
Y = b0 + b1х1 + b2 х2 + ... + bn хn ,
то план ПФЭ 2П дает избыточную информацию. Так при n= 6,требуется
определить n+1 = 7 коэффициентов, тогда как по плану ПФЭ необходимо
провести N = 26 =64 опыта.
Хотя эта избыточная информация не является бесполезной, она позволяет
более точно определить коэффициенты, но все же часто используют планы
ДФЭ 2n-k , где k– показатель дробности плана ПФЭ. При k = 1 число опытов в
плане ДФЭ в два раза меньше, чем в плане ПФЭ, поэтому такие планы
называют полуреплика плана ПФЭ. Так при k=1 для плана ДФЭ 26-1 N =26-1 =
32, при k=2 для плана ДФЭ 26-2 N =26-2 = 16 и такой план называют четверть
репликой, при k=3 для плана ДФЭ 26-3 N =26-3 = 8.
При выборе дробности планаk необходимо учитывать, что число опытов
должно быть больше числа членов уравнения. В рассматриваемом случае
величинаk должна быть такой, что бы удовлетворялось условиеn + 1 ≤2n-k.
План ДФЭ строится, как и для плана ПФЭ, но с меньшим числом
факторов. Оставшиеся факторы варьируются не произвольно, а так чтобы
сохранялась ортогональность плана. Это обеспечивается, если оставшиеся
факторы варьируются по выбранному генерирующему соотношению,
например как произведение каких-либо факторов из первой группы. Но это
приводит к тому, что в матрице Х будут существовать одинаковые столбцы.
Следовательно, мы не сможем найти в чистом виде все коэффициенты
78
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
неполного квадратичного полинома, а лишь определим совместную величину
коэффициентов для одинаковых столбцов.
Рассмотрим построение плана ДФЭ 23-1 . Здесь n = 3,k =1, N=23-1 =4.
Первые два фактора варьируем как и ранее для плана ПФЭ 22 , а для третьего
фактора выбираем генерирующее соотношение в виде x = x1·x2. Для неполного
квадратичного полинома
Y = b0 + b1 х1 + b2 х2 + b3 х3 + b12 x1x2 + b13 + x1 x3 + b23 x2 x3 + b123 + x1x2 x3
количество столбцов плана составляет восемь.
Таблица 4.1 – План дробного факторного эксперимента
i
0
1
2
3
4
5
6
7
и
х0
х1
х2
х3
х1х2
х1х3
х2х3
х1х2 х3
1
+1
-1
-1
+1
+1
-1
-1
+1
2
+1
+1
-1
-1
-1
-1
+1
+1
3
+1
-1
+1
-1
-1
+1
-1
+1
4
+1
+1
+1
+1
+1
+1
+1
+1
План является ортогональным, но в нем оказались четыре пары
одинаковых
столбцов.
Поэтому
можно
определить
только
четыре
коэффициента, отражающие совместные влияния двух одинаковых столбцов
N
å x0U YU
b0 + b123 = U =1
Суммарные
значения
N
.
коэффициентов
b0 + b23
;
b2 + b13
,
b3 + b12 определяютсяаналогично. Это следствие того, что мы пытаемся
определить полное количество коэффициентов - 8 по недостаточному числу
79
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
опытов - 4. Однако, если заранее известно, что некоторые из членов уравнения
равны нулю (пренебрежимо малы) или имеется априорная информация о
величинах некоторых коэффициентов, то полученные коэффициенты могут
быть вычленены. Так если b123 = 0 , то
N
å x0U YU
b0 = U =1
N
Если можно допустить, что коэффициенты из их смешанной оценки
сопоставимы, то для рассмотренного плана
N
å x0U YU
1 U =1
b0 + b123 =
2
N
Графическое изображение планов ПФЭ 23 и ДФЭ 23-1в факторном
пространстве (для трех факторов – трехмерное пространство) представлено на
рисунке 3.3. План ПФЭ 23 представлен кубом с восемью узлами (точками
плана), а возможные планы ДФЭ 23-1 – проекциями этого куба на три
плоскости. То есть из восьми узлов выбираются четыре (рисунок 3.3, а). Из
куба можно также выбрать четыре точки из восьми, не лежащиев одной
плоскости, и сформировать планДФЭ 23-1 (рисунок 3.3, б).
4.1 Насыщенные планы первого порядка
Насыщенным планом первого порядка - называется план, содержащий
n+1 точку (опыт). Например, при n = 4, N=n + 1= 5.
То есть полином формируется в виде
Y = b0 + b1х1 + b2 х2 + ... + bn хn
80
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, насыщенный план – это предельно минимальный случай
плана
ДФЭ.
Такие
планы
называются
симплекс-планами.
Для
симплекс-плана при n = 1 N = 2 его геометрическое изображение представлено
на рисунке 3.1, а; при n=2, N=3 - на рисунке 3.1, б; при n=3, N=4 - на рисунке
3.1, в. Симплекс-планы обычно используются на стадии предварительного
исследования.
Рисунок 4.1 – Симплекс-план для n=1, N=2 (а); n=2, N=3 (б); n=3, N=4 (в)
Симплекс-план не всегда является ортогональным. Симплекс-план
называется правильным, если расстояние между двумя любыми точками
плана одинаковое.
Симплекс-план называется центрированным, если
x +1
å xiU = 0 ,
U =1
для i=1, 2, ..., n .
4.2 Применимость планов ПФЭ и пути повышения точности
полиномов
По каким же признакам можно судить о допустимости использования
неполного квадратичного полинома, построенного на основе планов ПФЭ 2n?
81
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Такие полиномы дают поверхность отклика, которая проходит точно
через
все
экспериментальные
точки,
по
которым
определяются
коэффициенты. Так как точки планов ПФЭ располагаются на границах
диапазонов варьирования факторов, то это означает, что поверхность отклика
проходит через граничные точки. В любом сечении поверхности отклика,
полученной по такому полиному, плоскостью при фиксированных всех
факторах кроме одного и параллельной оси Y получается след в виде прямой
линии.
Возможны случаи, когда реальная поверхность отклика определяется
полиномами второго и выше порядков. В этом случае поверхность плана
ПФЭ, совпадая с реальной поверхностью в граничных точках, может
отличаться в других точках факторного
пространства,
например
в
Ù
центральной точке плана, т.е. Y0 ¹ Y 0 Поэтому одним из признаков
неудовлетворительной аппроксимации полиномами по плану ПФЭ является
расхождение результатов функции отклика с реальной функцией в
центральной точке плана.
Однако при многофакторном эксперименте возможны случаи, когда в
реальности функция отклика зависит, в том числе, от квадратов факторов, у
которых коэффициенты имеют разные знаки, например, для "седловидной"
поверхности. При этом, несмотря на то, что эта поверхность явно нелинейная,
результат опыта в центральной точке может оказаться достаточно близким к
полученному результату по неполному квадратичному полиному плана ПФЭ.
Однако расхождения будут возникать во всех других точках плана
эксперимента. Поэтому нецелесообразность использования плана ПФЭ
определяется нелинейностью каких-либо сечений поверхности отклика.
Ù
Косвенным признаком может служить расхождение Y0 и Y 0 в центральной
точке плана.
Если же не удается получить полином по плану ПФЭ, хорошо
аппроксимирующей реальную поверхность, то какие пути можно предложить
для повышения точности полиномов?
82
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
•
Уменьшение диапазона варьирования факторов или его разбиение
на поддиапазоны, для каждого из которых строится свой план ПФЭ и
определяется свой полином. Путь достаточно трудоемок, но погрешность
семейства планов ПФЭ снижается.
•
Выделение фактора, порождающий нелинейность, и построение
для оставшихся n-1 факторов k планов ПФЭ, в каждом из которых
выделенный фактор зафиксирован при некотором значении. На основе
полученных k полиномов можно попытаться сформировать общий полином,
коэффициенты которого являются функциями выделенного фактора. Этот
путь также достаточно трудоемок.
•
Переход к плану ПФЭ с большим числом уровней варьирования
факторов, например к планам с варьированием факторов на трех уровнях планам ПФЭ 3n (рисунок 4.2). В этом случае происходит резкое увеличение
количества точек по сравнению с планом ПФЭ 2n . Так при n = 2 для ПФЭ
2nN=4, для ПФЭ 3nN=9; при n = 3 для ПФЭ 2nN=8, для ПФЭ 3nN=27; при n = 4
для ПФЭ 2nN=16, для ПФЭ 3nN=81 и т.д.
Рисунок 4.2 – Планы ПФЭ 32 (а) и ПФЭ 33 (б)
•
Достраивание планов ПФЭ 2n до планов более высокого порядка
(чаще всего второго) и построение полных квадратичных полиномов (с
наличием квадратов факторов).
•
Преобразование метрики матричного пространства, то есть
переход к новым факторам функционально связанным с прежними
факторами, но не порождающими нелинейности.
83
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 4.3 – Графическое изображение планов ПФЭ 23 и ДФЭ 23-1в
факторном пространстве
Планы ДФЭ, как и планы ПФЭ, являются рототабельными. Планы ДФЭ
могут быть какнасыщенными так и ненасыщенными.
Достоинство планов ДФЭ заключается и в том, что если построенный на
его основе неполный полином не удовлетворяет требованиям по точности, то
план ДФЭ легко достраиваются до плана ПФЭ, без потери информации
прежних опытах, с формированием более точного полинома.
Пример
построения
плана
дробного
представлен в приложении Б, пример Б.1.
84
факторного
эксперимента
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.3 Дробный факторный эксперимент
При большом числе факторов (k>3) проведение полного факторного
эксперимента связано с большим числом, экспериментов, значительно
превосходящим число коэффициентов линейной модели. Если при получении
модели можно ограничиться, линейным приближением, т.е. получить
адекватную модель в виде полинома y=b0 + b1x1 + b2x2 +...+bkxk, то число
экспериментов можно резко сократить в результате использования дробного
факторного эксперимента. Так, например, в полном факторном эксперименте
типа 22 при линейном приближении коэффициент регрессии b12 можно
принять равным нулю, а столбец x1x2 матрицы (таблица 4.2) использовать для
третьего фактора x3.
Таблица 4.2 – Матрица планирования
Номер
x0
x1
x2
x3 (x1x2)
y
1
+
+
+
+
y1
2
+
-
+
-
y2
3
+
+
-
-
y3
4
+
-
-
+
y4
эксперимента
В этом случае линейная модель будет определяться уравнением
y=b0 + b1x1 + b2x2 + b3x3. Для определения коэффициентов этого уравнения
достаточно провести четыре эксперимента вместо восьми в полном
факторном эксперименте типа 23. План эксперимента, предусматривающий
реализацию половины экспериментов полного факторного эксперимента,
называют полурепликой. При увеличении числа факторов (k>3) возможно
применение реплик большей дробности.
Дробной репликой называют план эксперимента, являющийся
частью плана полного факторного эксперимента. Дробные реплики
85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
обозначают зависимостью 2k-p, где p – число линейных эффектов,
приравненных к эффектам взаимодействия. При p = 1 получают полуреплику;
при p = 2 получают 1/4 - реплику; при p = 3 получают 1/8 - реплику и т. д. по
степеням двойки. Так, например, если в полном факторном эксперименте 2
(таблица 4.3) один из эффектов взаимодействия (x1x2, x1x3, x2x3, x1x2x3) заменим
четвертым фактором x4, то получим полуреплику 24-1 от полного факторного
эксперимента 24. Если два эффекта взаимодействия заменить факторамиx4 и
x5, то получим 1/4-реплику 25-2 от полного факторного эксперимента 25.
Таблица 4.3 –Матрица полного факторного эксперимента типа 23
Номер
x0
x1
x2
x3
x1x2
x1x3
x2x3
x1x2x3
y
1
+
-
-
+
+
-
-
+
y1
2
+
+
-
+
-
+
-
-
y2
3
+
-
+
+
-
-
+
-
y3
4
+
+
+
+
+
+
+
+
y4
5
+
-
-
-
+
+
+
-
y5
6
+
+
-
-
-
-
+
+
y6
7
+
-
+
-
-
+
-
+
y7
8
+
+
+
-
+
-
-
-
y8
эксперимента
Можно получать 1/8 – реплику от полного факторного эксперимента 26,
заменив три эффекта взаимодействия факторами x4, x5 и x6. Если заменить
четыре эффекта взаимодействия факторами x4, x5, x6 и x7, то получим, 1/16 –
реплику 27-4 от полного факторного эксперимента 27.
Реплики, которые используют для сокращения числа экспериментов в
2mраз, где m=1, 2, 3..., называют регулярными.
В связи с тем, что в дробных репликах часть взаимодействий заменена
новыми факторами, найденные коэффициенты уравнения регрессии будут
являться
совместными
оценками
линейных
86
эффектов
и
эффектов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
взаимодействия. Так, например, если в матрице (таблица 4.2) вычислим
элементы столбцов для произведений x1x3 и x2x3, то увидим, что элементы
столбца x1x2 совпадают с элементами столбца x2, а элементы столбца x2x3 - с
элементами столбца x1. Следовательно, коэффициенты b1,b2, b3 будут
оценками совместных эффектов, а именно: b1→β1 + β23; b2→β
2
+ β13;
b3 →β3 + β12
Коэффициент b1 является оценкой влияния фактора x1 и парного
взаимодействия x2x3 на функцию отклика. Влияние фактора x1 в этом случае
характеризуется величиной β1, а влияние взаимодействия - величиной β23.
Оценки, в которых невозможно разделить линейный эффект и эффект
взаимодействия, называют смешанными. Линейные эффекты рекомендуется
смешивать, прежде всего, с теми взаимодействиями, которые согласно
априорной информации незначимы.
Число несмешанных линейных эффектов в дробной реплике называют
ее разрешающей способностью.
Часто приходится решать задачи, в которых заранее можно полагать, что
эффекты взаимодействия, хотя и малы по сравнению с линейными, но все же
не равны нулю. В таких случаях необходимо заранее определить, какие
коэффициенты являются смешанными оценками. Тогда в зависимости от
условий поставленной задачи, подбирается такая дробная реплика, с помощью
которой можно извлечь максимальную информацию из эксперимента.
Прямая оценка разрешающей способности дробной реплики затруднена.
Поэтому дробные реплики задают с помощью генерирующих соотношений.
Генерирующим называют соотношение, которое показывает, какое из
взаимодействий принято незначимым и заменено новым фактором.
План типа 23-1 может быть представлен двумя полурепликами (таблица
4.4), которые задаются одним из следующих генерирующих соотношений:
х3 = х1 х2 ; х3 = - х1х2
87
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Генерирующие
соотношения
умножим
на
новую
независимую
переменную х3:
х32 = х1 х2 х3 ; х32 = - х1х2 х3
Таблица 4.4– Две полуреплики плана типа 23-1
х3 = х1 х2
Номер
х3 = - х1х2
Номер
эксперимента
x1
x2
x3
эксперимента
x1
x2
x3
1
-
+
-
1
-
+
+
2
+
+
+
2
+
+
-
з
-
-
+
з
-
-
-
4
+
-
-
4
+
-
+
Поскольку всегда хi2 = 1, получим следующие соотношения:
1 =х1х2х3; 1 = -х1х2х3.
(4.1)
В результате умножения генерирующего соотношения на новую
переменную получают так называемый определяющий контраст. Для
указанных
выше
полуреплик
определяющими
контрастами
будут
зависимости (4.1). Зная определяющий контраст, можно найти соотношения,
задающие совместные оценки. Для этого необходимо умножить независимые
переменные х1, х2 их3 на определяющий контраст. Умножая определяющие
контрасты (4.1) нах1, получим соотношения
x1 × 1 = х12 х2 х3 ; x1 × 1 = - х12 х2 х3 ,
так как хi2 = 1, то
х1 = х2 х3 ; х1 = - х2 х3 .
88
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Умножая определяющие контрасты на x2 и x3 получаем следующие
соотношения:
х2 = х1 х3 ; х2 = - х1 х3 ;
х3 = х1 х2 ; х3 = - х1х2 .
Это означает, что коэффициенты регрессии будут оценками
b1 ® b1 + b 23 ; b1 ® b1 - b 23 ;
b2 ® b 2 + b13 ; b2 ® b 2 - b13 ;
b3 ® b3 + b12 ; b3 ® b3 - b12 .
Полуреплика 24-1 может быть задана генерирующим соотношением
x4= x1x2x3. Матрица планирования этой полуреплики представлена таблице 4.4.
Определяющим контрастом полуреплики является соотношение
1 = x1x2x3x4.
Совместные оценки будут определяться следующим образом:
х1 = х2 х3 х4 b1 ® b1 + b 234 ;
х2 = х1х3 х4 b2 ® b 2 + b134 ;
х3 = х1х2 х4 b3 ® b 3 + b124 ;
х4 = х1х2 х3 b4 ® b 4 + b123 ;
х1x2 = х2 х4 b12 ® b12 + b 34 ;
х1x3 = х3 х4 b13 ® b13 + b 24 ;
х1x4 = х2 х3 b14 ® b14 + b 23 .
Полуреплика
соотношением
x4=
24-1
x1x2.
может
быть
Матрица
представлена в таблице 4.5.
89
также
задана
планирования
этой
генерирующим
полуреплики
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 4.5 – Полуреплика 24-1 с определяющим контрастом 1 = x1x2x3x4
Номер
x0
x1
x2
x3
x4
y
1
+
-
-
+
+
y1
2
+
+
-
+
-
y2
3
+
-
+
+
-
y3
4
+
+
+
+
+
y4
5
+
-
-
-
-
y5
6
+
+
-
-
+
y6
7
+
-
+
-
+
y7
8
+
+
+
-
-
y8
эксперимента
Таблица 4.6 – Полуреплика 24-1 с определяющим контрастом 1 = x1x2x4
Номер
x0
x1
x2
x3
x4
y
1
+
-
-
+
+
y1
2
+
+
-
+
-
y2
3
+
-
+
+
-
y3
4
+
+
+
+
+
y4
5
+
-
-
-
+
y5
6
+
+
-
-
-
y6
7
+
-
+
-
-
y7
8
+
+
+
-
+
y8
эксперимента
Определяющим контрастом полуреплики является соотношение
1= x1x2x4.
90
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместные оценки в этом случае будут определяться следующим
образом:
х1 = х2 х4 b1 ® b1 + b 24 ;
х2 = х1 х4 b2 ® b 2 + b14 ;
х3 = х1х2 х3 х4 b3 ® b 3 + b1234 ;
х4 = х1 х2 b4 ® b 4 + b12 ;
х1x3 = х2 х3 х4 b12 ® b13 + b 234 ;
х2 x3 = х1х3 х4 b23 ® b 23 + b134 ;
х3 x4 = х1х2 х3 b34 ® b 34 + b123.
В
практических
задачах
тройные
и
более
высокого
порядка
взаимодействия значительно чаще, чем двойные, бывают равны нулю и ими
обычно можно пренебречь. Полуреплика 24-1, заданная генерирующим
соотношением x4=x1x2x3, позволяет получить раздельные оценки четырех
линейных эффектов и три совместные оценки парных взаимодействий. В этом
случае раздельными оценками будут b1, b2, b3 и b4, так как тройными
взаимодействиями β234, β 134, β 124 и β 123 вследствиеих незначимости можно
пренебречь. В полуреплике, заданной генерирующим соотношением x4=x1x2,
три линейных эффекта, а именно b1, b2, b4 - оказались смешанными с парными
взаимодействиями. Разрешающая способность полуреплики, заданной генерирующим соотношением x4=x1x2x3, получилась значительно выше, чем у
полуреплики, заданной генерирующим соотношением x4=x1x2. Следовательно,
разрешающая
способность
полуреплики
зависит
от
генерирующего
соотношения, которым она задана.
Для оценки разрешающей способности реплик (большой дробности 1/4,
1/8 и т. д.) используют обобщающие определяющие контрасты. 1/4-реплика
25-2 может быть задана следующими генерирующими соотношениями:
x4=x1x2x3, x5=x2x3. Матрица планирования этой реплики представлена таблица
4.7.
91
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 4.7 – Матрица планирования 25-2
Номер
x0
x1
x2
x3
x4
x5
y
1
+
+
+
-
-
-
y1
2
+
-
+
-
+
-
y2
3
+
-
-
-
+
+
y3
4
+
+
-
-
-
+
y4
5
+
-
+
+
+
+
y5
6
+
+
+
+
-
+
y6
7
+
+
-
+
-
-
y7
8
+
-
-
+
+
-
y8
эксперимента
Таблица 4.8 – Матрица планирования 27-4
Номер
x0
x1
x2
x3
x4
x5
x6
x7
y
1
+
+
-
+
-
-
+
-
y1
2
+
-
-
+
+
+
-
-
y2
3
+
-
+
+
+
+
+
+
y3
4
+
+
+
+
-
-
-
+
y4
5
+
-
-
-
+
-
-
+
y5
6
+
+
-
-
-
+
+
+
y6
7
+
+
+
-
-
+
-
-
y7
8
+
-
+
-
+
-
+
-
y8
эксперимента
Определяющими контрастами реплики являются соотношения
1 = x1x2x3x4; 1 = x2x4x5.
Перемножив определяющие контрасты, получим третье соотношение
1= x1x4x5.
92
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Полная характеристика разрешающей способности рассматриваемой
реплики будет определяться обобщающим определяющим контрастом,
имеющим вид
1 = x1x2x3x4 = x2x4x5 = x1x4x5.
Схему смешивания оценок находим последовательным умножением
обобщающего определяющего контраста на x1, x2, x3 и т.д.
х1 = х2 х3 х4 = х2 х3 х4 х5 = х4 х5 b1 ® b1 + b 234 + b1235 + b 45 ;
х2 = х1 х3 х4 = х3 х5 = х1 х2 х4 х5 b2 ® b 2 + b134 + b35 + b1245 ;
х3 = х1х2 х4 = х2 х5 = х1х3 х4 х5 b3 ® b 3 + b124 + b 25 + b1345 ;
х4 = х1 х2 х3 = х2 х3 х4 х5 = х1х5 b4 ® b 4 + b123 + b 2345 + b15 ;
х5 = х1x2 x3 x4 x5 = х2 х3 = х1х4 b5 ® b 5 + b12345 + b 23 + b14 ;
х1x2 = х3 х4 = х1х3 х5 = х2 х4 х5 b12 ® b12 + b34 + b135 + b 245 ;
х1x3 = х2 х4 = х1х2 х5 = х3 х4 х5 b13 ® b13 + b 24 + b125 + b 345 .
Для 1/16 реплики генерирующими соотношениями
х4 = x1х2 х3 ; х5 = х1 х2 ; х6 = х1 x3 ; х7 = х2 х3
матрица
планирования
представлена
таблица
4.7.
Определяющими
контрастами этой реплики будут соотношения
1) 1 = х1х2х3х4; 2) 1 = х1х2х5; 3) 1 = х1х3х6; 4) 1 = х2х3х7.
Если попарно перемножить определяющие контрасты 1×2; 1×3; 1×4;
2×3; 2×4; 3×4, то получим
1 = x3x4x5; 1 = x2x4x6; 1 = x1x4x7; 1 = x1x2x3x5x6;
1 = x1x3x5x7; 1 = x1x2x6x7
93
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Произведения определяющих контрастов по три: 1×2×3; 1×2×4; 2×3×4;
1×3×4 – будут равны
1 = x1x4x5x6; 1 = x2x4x5x7;
1 = x5x6x7; 1 = x3x4x6x7
Умножая определяющие контрасты по четыре, получим
1 = x1x2x3x4x5x6x7.
Чтобы полностью характеризовать разрешающую способность данной
реплики, запишем обобщающий определяющий контраст
1 = x1x2x3x4 = x1x2x5 = x1x3x6 = x2x3x7 = x3x4x5 = x2x4x6 = x1x4x7 = x2x3x5x6 = x1x3x5x7 =
= x1x2x6x7 = x1x4x5x6 = x2x4x5x7 = x5x6x7 = x3x4x6x7 = x1x2x3x4x5x6x7
Если
эффектами
взаимодействия,
начиная
с
тройных,
можно
пренебречь, то коэффициенты будут оценками:
b1 ® b1 + b 25 + b 36 + b 47 ; b2 ® b 2 + b15 + b37 + b 46 ; b3 ® b3 + b16 + b 27 + b 45 ;
b4 ® b 4 + b35 + b 26 + b17 ; b5 ® b5 + b12 + b34 + b67 ; b6 ® b13 + b 24 + b 57 ;
b7 ® b 7 + b 23 + b14 + b 56 .
Таким образом, получаем весьма сложную систему смешивания. Все
линейные эффекты оказались смешанными с несколькими парными
взаимодействиями, поэтому разрешающая способность этой дробной реплики
очень низкая. Пользоваться такой репликой можно лишь в том случае, если
все парные взаимодействия близки к нулю.
Выбор дробной реплики зависит от конкретной задачи. Для получения
линейной модели рекомендуют выбирать дробные реплики с возможно
большей разрешающей способностью, т.е. реплики, у которых линейные
эффекты смешаны с эффектами взаимодействия близкими к нулю. При
94
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборе дробной реплики важно учитывать насыщенность плана, т. е.
соотношение между числом опытов и числом коэффициентов, определяемых
по результатам этих экспериментов. Дробная реплика, полученная заменой
всех
эффектов
взаимодействия
новыми
факторами,
называется
насыщенной. Применение насыщенных планов требует минимального числа
экспериментов. Число экспериментов в матрице насыщенной дробной реплики равно числу коэффициентов линейной модели. Гипотезу адекватности
модели в этом случае проверить невозможно, так как число степеней свободы
равно нулю.
Например, 1/16-реплика от полного факторного эксперимента 2
(таблица 4.7) является насыщенной, так как линейная модель не содержит
коэффициентов, которые необходимо определить по результатам восьми
экспериментов. При этом не остается степеней свободы для проверки
адекватности модели.
Дробные реплики широко применяют при получении линейных
моделей. Эффективность применения дробных реплик зависит от удачного
выбора
системы
смешивания
линейных
эффектов
с
эффектами
взаимодействия. При построении дробных реплик используют следующее
правило: новый фактор, введенный в планирование, нужно поместить в
столбец матрицы, принадлежащий взаимодействию, которым можно
пренебречь.
95
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5 Проведение эксперимента и обработка его результатов
5.1 Априорное ранжирование факторов
5.1.1 Сущность экспертных оценок
В последнее время все более широко применяют при решении
различных научных, технико-экономических и производственных задач, а
также задач прогнозирования методы коллективной экспертной оценки –
метод «мозгового штурма» и метод Делфи. Суть экспертных оценок состоит в
том, что группе специалистов-экспертов ставится ряд вопросов, касающихся
развития данного технического направления или предполагаемого объекта
техники. Суждение о прогнозе возникает после соответствующей обработки
ответов экспертов.
Метод мозговой атаки или мозгового штурма относится к так
называемому зависимому интеллектуальному эксперименту, в котором
участвует экспертная группа из 15 – 20 чел., причем последующее
предложение любого члена группы вносится с учетом высказывания
предшественников и запрещается критика. Эффективность дискуссии
оценивается не по критическим замечаниям, а по числу новых идей,
выявленных в процессе обсуждения проблемы.
В отличие от метода мозгового штурма, метод Делфи может быть назван
независимым интеллектуальным экспериментом, поскольку каждый эксперт
высказывает свое мнение независимо от мнения своих коллег. При этом
поощряется изолированность экспертов, соблюдается профессиональная
тайна письменного диалога между прогнозистом и каждым экспертом, что
способствует исключению влияния авторитетов и «давления» на эксперта.
Различают четыре основные разновидности метода Делфи: простой
ранжировки
(метод
предпочтения),
задания
весовых
коэффициентов,
последовательных сравнений, парных сравнении. Рассмотрим суть каждого
из перечисленных методов и методику обработки результатов экспертизы.
96
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.1.2 Метод простой ранжировки (метод предпочтения)
Ранжировка предполагает определенное отсеивание факторов по
ожидаемой степени их влияния на параметр оптимизации. При этом каждому
фактору
присваивается
присваивают
самому
определенное
сильно
место
влияющему
(ранги).
фактору,
Первое
место
последнее
–
слабовлияющему. Остальные факторы получают ранги от 2 до k-1, где
k – число влияющих факторов. Исходя из этого, число рангов N должно быть
равно числу влияющих факторов k. Отобрать факторы можно на основе
опроса ряда специалистов (экспертов). Используя статистическое усреднение,
выбирают самые сильно влияющие и отбрасывают слабовлияющие факторы.
Бывает так, что эксперт не в состоянии увидеть, какой из двух факторов
больше влияет на «у», поэтому он присваивает разным факторам один и тот
же ранг, тогда N≠k. Для того, чтобы использовать результаты такой
ранжировки, необходимо приписать каждому фактору стандартизированные
ранги.
Для этого общее число стандартизированных рангов принимают
равным «k», а факторам, имеющим одинаковые ранги, присваивают
стандартизированный ранг, значение которого представляет среднее значение
суммы мест, поделенных между собой факторами с одинаковыми рангами.
Например, пяти факторам присвоены следующие ранги (таблица 5.1).
Таблица 5.1 – Результаты экспертного опроса
Хi
Х1
Х2
Х3
Х4
Х5
аij
1
1
3
3
2
Факторы Х1 и Х2 поделили между собой 1 и 2 место, которым
присваивается стандартизированный ранг, определяемый как средняя сумма
мест:
C=
1+ 2
= 1,5
2
97
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторы Х3 и Х4 поделили 4 и 5 место, следовательно:
C=
4+5
= 4,5
2
В результате получаем следующую нормальную ранжировку (таблица
5.2):
Таблица 5.2 – Стандартизированная матрица
Хi
Х1
Х2
Х3
Х4
Х5
аij
1,5
1,5
4,5
4,5
3
Правильность ранжировки проверяется равенством5.1:
k ( k + 1) k
= å aij ,
2
i =1
(5.1)
где aij– ранг i-го фактора в j-ом ряду.
Для ранжировки факторов рекомендуется привлекать как можно больше
специалистов, это позволяет снизить субъективизм ранговых оценок (обычно
берут 7-10 человек). После ранжирования часть факторов отсеивают и не
включают в первую серию экспериментов. Если после этого цель
оптимизации достигнута, то исследование заканчивается.
В общем виде метод простой ранжировки (предпочтения) включает в
себя:
- составление списка влияющих факторов;
- разработка анкеты, которая содержит: параметр оптимизации,
факторы, уровни их варьирования;
- определение специалистов, которые работают в сфере проведения
эксперимента;
98
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- специалистам предлагается расположить все факторы в порядке
убывания степени их влияния на «у»;
- результаты опроса экспертов записывают в виде матрицы рангов;
- вычисляют коэффициент конкордации «W»;
- построение диаграммы рангов;
- принятие решения о возможности отсеивания факторов.
При отборе экспертов исходят, прежде всего, из компетентности того
или иного специалиста в области исследуемой проблемы. В специальной
литературе предлагаются различные методы отбора специалистов.
Заполняя анкету, эксперт определяет место фактора в ранжированном
ряду. Для удобства последующих вычислений результаты ранжирования
представляются в виде матриц (таблица 5.3).
Таблица 5.3 – Матрица экспертного опроса
Факторы k
Эксперты
m
1
2
…
i
k
1
a 11
a 12
…
a 1i
a1k
2
a 21
a 22
…
a2i
a2k
…
…
…
…
…
…
j2
…
a
am2
…
ami
j
a
m
a m1
a
j1
ji
a
jk
a mk
Суммируя по столбцам матрицы (таблица 5.3), определяют сумму
m
рангов по факторам
åа
j= 1
ij
, а затем рассчитывают среднюю сумму рангов по
формуле 5.2.
k
m
å å аij
Т=
i =1 j =1
k
,
(5.2)
где m – число экспертов
Разность между суммой рангов i-го фактора и средней суммой рангов
(формула 5.3).
99
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
k m
m
åå а ij
j=1
k
D i = å а ij -
i =1 j =1
m
= å a ij - Т ,
(5.3)
j =1
Далее рассчитывают сумму квадратов разностей по формуле 5.4.
k
S = å (Di ) ,
2
(5.4)
i =1
Полученные данные позволяют выявить согласованность мнений
экспертов относительно степени влияния факторов на параметр оптимизации.
Согласованность
мнений
экспертов
оценивается
коэффициентом
конкордации «W», т. е. коэффициентом ранговой корреляции для группы,
состоящей
из
mэкспертов.
Для
расчета
коэффициента
конкордации
используют одну из следующих формул 5.5, 5.6:
W=
W=
12S
,
m k3 - k
2
(
(5.5)
)
12S
(
)
m
m k - k - må T j
2
3
,
(5.6)
j =1
(
)
где Т j = å t 3j - t j , t j - число одинаковых рангов в j-м ряду.
Формула используется тогда, когда какой-либо эксперт не может
установить ранговое различие между несколькими факторами и присваивает
им одинаковые ранги. Коэффициент конкордации изменяется от 0 до 1.
Равенство единице означает, что все эксперты дали одинаковые оценки
факторам, а равенство 0 означает, что связи между оценками, полученными от
разных экспертов, не существует.
Использовать коэффициент конкордации можно после оценки его
значимости. Для оценки значимости коэффициента конкордации можно
100
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
воспользоваться распределением c 2 при
f = k - 1 степенях свободы.
Значение c 2 в зависимости от выражения для расчета W будет определяться
по одной из двух формул 5.7, 5.8:
c2 =
c2 =
12S
,
mk (k + 1)
12 S
1 m
mk (k + 1) åT j
k - 1 j =1
(5.7)
,
(5.8)
Гипотеза о наличии согласия экспертов может быть принята, если при
заданном числе степеней свободы f = k - 1 и уровне значимости α=0,05
2
табличное значение ca , будет меньше расчетного (приложение Б). Если
мнение экспертов оказывается согласованным, то можно строить диаграмму
рангов.
На диаграмме рангов по оси абсцисс откладываются факторы в
последовательности по степени их влияния на параметр оптимизации, а по оси
ординат – суммы рангов. Чем меньше сумма рангов у фактора, тем выше его
место на диаграмме. По распределению факторов на диаграмме оценивается
значимость того или иного фактора и решается вопрос о целесообразности его
включения в эксперимент. Можно не учитывать часть факторов и относить их
влияние к шумовому полю в случае, если они распределяются по закону
неравномерного экспоненциального убывания. Если распределение факторов
равномерное, то в эксперимент необходимо включать все факторы.
5.1.3 Метод задания весовых коэффициентов
Заключается
в
присвоении
каждому
из
факторов
весовых
коэффициентов, которые могут быть представлены двумя способами:
- всем факторам назначают весовые коэффициенты так, чтобы сумма
коэффициентов была равна какому-либо фиксированному числу (например,
единице, десяти, ста и т. д.);
101
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- наиболее важному из всех факторов придают весовой коэффициент,
равный какому-то фиксированному числу, а всем остальным – коэффициенты,
равные долям этого числа.
Обобщенное мнение экспертов получают также с помощью среднего
статистического значения j-го признака, где под a ji понимают весовой
коэффициент, присвоенный i-м экспертам j-му признаку. При этом, чем
больше a j , тем важнее признак. Однако сказать что-либо о согласованности
мнений экспертов невозможно, поскольку неизвестно, каким должно быть
распределение в идеальном случае. Фактически метод задания весовых
коэффициентов является методом так называемой сложной ранжировки.
5.1.4 Метод последовательных, сравнений
Эксперт упорядочивает все факторы в порядке уменьшения их
значимости: А1 > А2 > .... Аn ; присваивает первому фактору значение, равное
единице, остальным назначает коэффициенты в долях единицы; сравнивает
значение первого фактора с суммой всех остальных, при этом возможны три
варианта:
A1 > A2 + A3 + K + An
A1 = A2 + A3 + K + An
A1 < A2 + A3 + K + An
Эксперт выбирает наиболее соответствующий, по его мнению вариант и
приводит в соответствие с ним оценку первого фактора; сравнивает значение
первого фактора с суммой всех последующих за вычетом последнего фактора
и т. д.; повторяет процедуру до сравнения А1 с А2 + А3 .
102
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
После того как эксперт уточняет оценку первого фактора в соответствии
с выбранным им неравенством из трех возможных A1 > A2 + A3 ; A1 = A2 + A3
A1 < A2 + A3 он переходит к уточнению оценки фактора А2 по той же схеме.
Преимущество метода последовательных сравнений перед другими
состоит в том, что эксперт в процессе оценки важности фактора сам
анализирует свои оценки; недостаток – в сложности и громоздкости
проводимой работы.
5.1.5 Метод парных сравнений
Данный метод применяют при наличии большого числа альтернатив.
Согласно этому методу все факторы попарно сравнивают между собой и на
основании оценок парных сравнений путем дальнейшей обработки находят
оценки каждого фактора.
Для облегчения процедуры попарного сравнения признаков обычно
составляют таблицу матрицы парных сравнений (таблица 5.4).
Таблица 5.4 – Форма матрицы парных сравнений
Фактор
A
B
C
K
N
А
1
А:В
А:С
K
А:N
В
B:А
1
В:С
K
B:N
С
С:А
С:В
1
K
C:N
M
K
K
K
1
K
N
N:А
N:В
N:С
K
1
Каждый эксперт, заполняющий такую матрицу, должен проставить на
пересечении сравниваемых факторов их отношение: в первой клетке первой
строки (сравнение фактора самого с собой) эксперт пишет единицу, во второй
– результат сравнения первого фактора со вторым, в третьей – результат
сравнения первого фактора с третьим и т.д. Во второй строке эксперт
записывает в первой клетке результат сравнения второго фактора с первым, во
второй – единицу, в третьей – сравнение второго фактора с третьим и т. д. При
103
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
этом оценки не должны быть больше единицы – наиболее важный признак
(или показатель) из двух сравниваемых приравнивается единице, второй
оценивается в долях единицы. Как видно, половина таблицы, расположенная
выше диагонали, является отражением нижней половины. Поэтому обычно
заполняют только одну половину таблицы, а затем ответы экспертов
представляют в следующем виде:
i11 i12 i13 … i1n
i22 i23 … i2n
,
i33 … i3n
где i1n=А/N.
В случаях, когда каждую пару факторов сравнивают однократно, число
сравнений I=n(n-1)/2, где n - общее число факторов.
Так, если имеются три альтернативы, то каждый эксперт должен
произвести I3 =3 (3-1)/2=3 сравнения. Это значит, что он должен сравнить
альтернативу I с альтернативами II и III, затем альтернативу II с альтернативой III.
Если
процедура
парных
сравнений
выполняется
несколькими
экспертами, то в результате сложения одноименных элементов частных
матриц составляют суммарную матрицу, отражающую предпочтения всех
экспертов:
i11
i12
i22
i13
L i1n
i 23 L i2 n
.
i33 L i3n
L
,
В этой матрице i11 =
m
( j)
å i11
,…., i nn =
m
å inn( j )
где m – число экспертов;
j= 1
j= 1
(1) (2 )
i11
, i11 оценки соответственно 1, 2,…, j,…, m-го экспертов; i11 , i12 ,…, inn -
суммарные оценки матрицы, данные всеми экспертами.
После этого определяют средний ранг фактора, полученного от каждого
эксперта и от всех экспертов, и, сравнивая значения полученных рангов,
делают заключение о степени важности каждого из рассматриваемых
факторов.
104
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Определяя
дисперсию суммарной
матрицы и сравнивая
ее
с
максимально возможной с таким же числом элементов, определяют
согласованность мнений экспертов, при этом, чем ближе дисперсия
суммарной матрицы к максимально возможной дисперсии, тем выше
согласованность мнений. Метод парных сравнений позволяет провести
статистически обоснованный анализ согласованности мнений экспертов,
выявить, случайны ли полученные оценки [1].
5.2 Обработка результатов эксперимента
После выбора плана эксперимента, основных уровней и интервалов
варьирования факторов переходят к эксперименту. Каждая строка матрицы это условия эксперимента. Для исключения систематических ошибок
рекомендуется эксперименты, предусмотренные матрицей, проводить в
случайной последовательности. Порядок проведения следует выбирать по
таблице случайных чисел (таблица А.1 приложение А). Например, если
требуется провести восемь экспериментов, то из случайного места таблицы
последовательно выписывают числа, лежащие в интервале от 1 до 8, при этом
не учитываются уже выписанные и числа больше восьми. Так, например,
начиная с числа 87 (1-я строка таблица А.1 приложение А), получаем
следующую последовательность реализации экспериментов:
Номер опыта в матрице
1
2
3
4
5
6
7
8
Порядок реализации экспериментов
7
2
8
3
1
4
5
6
Для
компенсации
влияния
случайных
погрешностей
каждый
эксперимент рекомендуется повторить п раз. Эксперименты, повторенные
несколько раз при одних и тех же значениях факторов, называют
параллельными. Под дублированием понимают постановку параллельных
экспериментов. Обычно число n параллельных экспериментов принимают
равным 2-3, иногда – 4-5. При проведении исследований приходится иметь
дело с тремя вариантами дублирования экспериментов:
105
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1)
с равномерным дублированием экспериментов;
2)
с неравномерным дублированием экспериментов;
3)
без дублирования экспериментов.
При равномерном дублировании все строки матрицы планирования
имеют
одинаковые
неравномерного
числа
параллельных
дублирования
числа
экспериментов.
параллельных
В
случае
экспериментов
неодинаковы. При отсутствии дублирования параллельные эксперименты не
проводятся. Наиболее предпочтительным из трех вариантов дублирования
является первый. При этом варианте эксперимент отличается повышенной
точностью, а математическая обработка экспериментальных данных –
простотой. Характер дублирования влияет на содержание математической
обработки результатов наблюдений. Рассмотрим методику обработки
результатов эксперимента для каждого из трех вариантов дублирования.
5.2.1
Обработка
результатов
эксперимента
при
равномерном
дублировании
Для
каждой
строки
матрицы
планирования
по
результатам
nпараллельных экспериментов находят y j среднее арифметическое значение
параметра оптимизации:
1 n
y j = å y ju
n u =1
где u – номер параллельного эксперимента; yju - значение параметра
оптимизации в u-м параллельном эксперименте j-й строки матрицы.
С целью оценки отклонений параметра оптимизации от его среднего
значения для каждой строки матрицы планирования вычисляют дисперсию
s 2j эксперимента по данным n параллельных экспериментов. Статистической
дисперсией называют среднее значение квадрата отклонений случайной
величины от ее среднего значения:
106
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
s 2j
1 n
=
å y ju - y j
n - 1 u =1
(
)2
(5.9)
Ошибка sj эксперимента определяется как корень квадратный из
дисперсии
1 n
sj = +
å y ju - y j
n - 1 u= 1
(
)2
В этом случае ошибка при большом рассеянии будет значительной.
Рассеяние результатов эксперимента определяется влиянием неуправляемых
факторов, погрешностями измерений и другими причинами. Большое
рассеяние
изучаемой
величины
может
произойти
из-за
наличия
в
эксперименте сомнительных результатов. Для проверки сомнительных, т.е.
резко выделяющихся результатов, используют специальные критерии; одним
из таких критериев является отношение U (ГОСТ 11.002-73). Чтобы оценить
принадлежность резко выделяющихся результатов yjmax или yjmin к данной
нормальной совокупности и принять решение об исключении или оставлении
их в составе выборки, находят отношение
U max =
y j max - y j
sj
или U min =
y j min - y j
sj
где y j max - наибольшее значение параметра оптимизации среди его
значений, полученных в n параллельных экспериментах j-й строки матрицы
планирования;
y j min - наименьшее значение параметра оптимизации среди его
значений, полученных в n параллельных экспериментах j-й строки матрицы
планирования.
107
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Результат сравнивают с величиной β, взятой из ГОСТ 11.002-73 (таблица
В.3 приложения В) для числа n параллельных экспериментов и принятого
уровня значимости α. Число n параллельных экспериментов и объем выборки
n в рассматриваемом случае понятия равноценные. Если U max ³ b , то
сомнительный результат может быть исключен, в противном случае его
считают нормальным и не исключают.
Аналогично производится оценка результата y j min : если U min ³ b , то
сомнительный
результат
признают
анормальным;
при
U min £ b
подозреваемый в анормальности результат считают нормальным. Чтобы
числа параллельных экспериментов были одинаковы во всех строках
матрицы, необходимо повторить те, результаты которых были признаны
анормальными.
В математической
статистике для проверки гипотез
пользуются критериями согласия. Для того чтобы принять или забраковать
гипотезу при помощи этих критериев, устанавливают уровни значимости их.
Уровень значимости представляет собой достаточно малое значение
вероятности,
отвечающее
событиям,
которые
в
данной
обстановке
исследования можно считать практически невозможными.
Обычно принимают 5 %-, 2 %- или 1 %-ный уровень значимости. В
технике чаще всего принимают 5 %-ный уровень. Уровень значимости α
называют также уровнем риска или доверительным уровнем вероятности,
который соответственно может быть принят равным 0,05, 0,02 или 0,01. Так,
например, при уровне значимости (риска) α = 0,05 вероятность Р верного
ответа при проверке нашей гипотезы Р = 1 - α = 1 - 0,05 = 0,95, или 95 %. Это
значит, что в среднем только в 5% случаев возможна ошибка при проверке
гипотезы. После вычисления по формуле (5.9) дисперсий проверяют гипотезу
их однородности. Проверка однородности двух дисперсий производится с
помощью F-критерия Фишера, который представляет собой отношение
большей дисперсии к меньшей:
F=
s12
s22
108
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где s12 > s22 .
Если наблюдаемое значение Fp-критерия меньше табличного Fт
(таблица В.3 приложения В) для соответствующих чисел степеней свободы и
принятого уровня значимости, то дисперсии однородны. Однородность ряда
дисперсий проверяют по критерию Кохрена или по критерию Бартлета.
При
равномерном
дублировании
экспериментов
однородность
ряда
дисперсий проверяют с помощью G-критерия Кохрена, представляющего
собой отношение максимальной дисперсии к сумме всех дисперсий:
Gp =
2
smax
s12 + s22 + ... + s N2
Дисперсии однородны, если расчетное значение Gр-критерия не
превышает табличного значения Gт-критерия. В таблице В.6 приложения
В - N показывает число сравниваемых дисперсий, а n - число параллельных
опытов. Если Gр>Gт, то дисперсии неоднородны, а это указывает на то, что
исследуемая величина y не подчиняется нормальному закону. В этом случае
нужно попытаться заменить y случайной величиной q = f(y), достаточно
близко следующей нормальному закону. Если дисперсии s 2j экспериментов
однородны, то дисперсию s 2y воспроизводимости вычисляют по зависимости
s 2y =
1 N 2
ås j
N u =1
(5.10)
где N - число экспериментов или число строк матрицы планирования.
По результатам эксперимента вычисляют коэффициенты модели.
Свободный член b0 определяют по формуле
1 N
b0 = å y j
N j =1
109
(5.11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коэффициенты регрессии,
характеризующие линейные эффекты,
вычисляют по зависимости
1 N
bi = å xij y j
N j =1
(5.12)
Коэффициенты регрессии, характеризующие эффекты взаимодействия,
определяют по формуле
1
bil =
N
N
å xij xlj y j
(5.13)
j =1
где i, l - номера факторов; xij , xlj - кодированные значения факторов i и l в j-м
эксперименте. Формулы (5.11), (5.12), (5.13) получены в результате
использования метода наименьших квадратов.
Коэффициенты
b0,
bi ,
bij
–
это
оценки
теоретических
коэффициентов β0, βi, βil регрессии. Оценки, найденные с помощью метода
наименьших квадратов, являются наилучшими в том смысле, что они
распределены нормально со средними значениями, равными теоретическим
коэффициентам, и с наименьшими возможными дисперсиями. Вычислив
коэффициенты модели, проверяют их значимость. Проверку значимости
коэффициентов можно производить двумя способами:
1)
сравнением
абсолютной
величины
коэффициента
с
доверительным интервалом;
2)
с помощью t-критерия Стьюдента.
При проверке значимости коэффициентов первым способом для
определения доверительного интервала вычисляют дисперсии коэффициентов
регрессии. Дисперсию s 2 {bi } i-го коэффициента определяют по зависимости
s 2 {bi } =
1 2
sy .
nN
110
(5.14)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Доверительный интервал Dbi – находят по формуле
Dbi = ±tt s 2 {bi },
(5.15)
где tτ - табличное значение критерия при принятом уровне значимости и числе
степеней свободы f, с которым определялась дисперсия s 2y .
При равномерном дублировании экспериментов число степеней
свободы находится по зависимости:
f = (n - 1) N,
где N - число экспериментов в матрице планирования, а n-число
параллельных экспериментов
s 2 {bi } – ошибка в определении i-го коэффициента регрессии,
вычисляемая по формуле s 2 {bi } = + s 2 {bi } .
Значения t приведены в таблице В.7 приложения В.
Коэффициент
значим,
если
его
абсолютная
величина
больше
доверительного интервала.
При проверке значимости коэффициентов вторым способом вычисляют
tр, - критерий по зависимости
tр =
bi
s{bi }
и сравнивают его с табличным tт. Коэффициент значим, если tp>tт для
принятого уровня значимости и числа степеней свободы, с которым
определялась дисперсия s 2y .
111
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критерий Стьюдента t вычисляют для каждого коэффициента
регрессии. Статистически незначимые коэффициенты могут быть исключены
из уравнения.
После расчета коэффициентов модели и проверки их значимости
определяютдисперсию
2
sад
адекватности.
Остаточная
дисперсия,
или
дисперсия адекватности, характеризует рассеяние эмпирических значений y
)
относительно расчетных y , определенных по найденному уравнению
регрессии. Дисперсию адекватности определяют по формуле
N
2
=
sад
nå
j =1
(
)
yj - yj
)
nå y j - y j
N
)
2
=
f
j =1
(
N - (k + 1)
)2
,
(5.16)
где y j - среднее арифметическое значение параметра оптимизации в j-м
эксперименте;
)
y j - значение параметра оптимизации, вычисленное по модели для
условийj-го опыта;
f - число степеней свободы, равное N - (k + 1);
k – число факторов.
Проверку гипотезы адекватности найденной модели производят по Fкритерию Фишера:
Fр =
Если
значение
Fp<Fт
2
sад
(5.17)
s 2y
для
принятого
уровня
значимости
и
соответствующих чисел степеней свободы, то модель считают адекватной.
При Fp>Fт гипотеза адекватности отвергается.
112
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, обработка результатов эксперимента при равномерном
дублировании экспериментов может быть представлена следующей схемой:
1)
для каждой строки матрицы планирования по формуле
1 n
y j = å y ju
n u =1
вычисляют среднее арифметическое значение y j параметра оптимизации;
2)
по формуле (5.9) определяют дисперсию s 2j каждого опыта
матрицы планирования;
3)
используя критерий Кохрена, проверяют гипотезу однородности
дисперсий s 2j опытов;
4)
если дисперсии опытов однородны, то по формуле (5.11)
вычисляют дисперсию s 2y воспроизводимости эксперимента;
5)
по формулам (5.11), (5.12), (5.13) определяют коэффициенты
уравнения регрессии;
6)
по зависимости (5.14) находят дисперсии s 2 {bi } коэффициентов
регрессии;
7)
по формуле (5.15) устанавливают величину доверительного
интервала Dbi ;
8)
проверяют статистическую значимость коэффициентов регрессии;
9)
2
по зависимости (5.16) определяют дисперсию sад адекватности;
10)
с помощью F-критерия проверяют гипотезу адекватности модели.
В заключение необходимо отметить, что использование критериев
Кохрена, Стьюдента и Фишера предполагает нормальное распределение
результатов эксперимента.
113
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.2.2
Обработка
результатов
эксперимента
при
неравномерном
дублировании
Результаты отдельных экспериментов иногда получаются ошибочными,
и их приходится исключать. Вследствие этого числа параллельных
экспериментов оказываются неодинаковыми. Бывают и другие случаи, когда
по тем или иным причинам не удается провести одинаковое число
параллельных
неодинаковых
опытов
в
числах
каждом
из
основных
параллельных
экспериментов.
экспериментов
При
нарушается
ортогональность матрицы планирования и, как следствие, изменяются
формулы для определения коэффициентов регрессии и их ошибок. Расчет
коэффициентов регрессии
и
их ошибок
при неодинаковых
числах
параллельных опытов усложняется.
Обработка результатов эксперимента при неравномерном дублировании
производится по следующей схеме:
- для каждой строки матрицы планирования находят y j - среднее
арифметическое значение параметра оптимизации
1
yf =
nf
nj
å y ju
u =1
где nj - число параллельных экспериментов в j-й строке матрицы.
- для каждой строки матрицы вычисляют дисперсию s 2j эксперимента;
s 2j
1 nj
=
å y ju - y f
n j - 1 u =1
(
)2
- проверяют с помощью критерия Бартлета гипотезу однородности
дисперсий.
114
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для
этого
подсчитывают
s 2y
дисперсию
воспроизводимости
эксперимента по формуле:
s y2
1
=
N
å
j =1
æ N 2 ö
çåsj f j ÷
ç
÷
ø
f j è j =1
где f j - число степеней свободы, с которым определялась дисперсия
s 2j i-го эксперимента.
После этого определяют величину
N
æ
ö
2
Q = c f lg s y - å fi lgs 2j ÷
÷
ç
j =1
è
ø
-1 ç
где
é
1 æç n 1 1 ö÷ù
c = ê1 +
å f - f ÷ú ;
ç
(
)
N
3
1
êë
øúû
è j =1 j
Бартлет
показал,
что
величина
Q
N
f =å fj .
j =1
приближенно
подчиняется
χ2 - распределению с (N -1) степенями свободы, где N - число сравниваемых
дисперсий.
Если Q меньше χ2 (таблица В.8 приложения В) для данного числа (N - 1)
степеней свободы и принятого уравнения значимости, то дисперсии
однородны, и наоборот. Критерий Бартлета основан на нормальном
распределении. Если распределение случайной величины не подчиняется
нормальному закону, то проверка однородности дисперсий может привести к
ошибочным результатам.
Пример применения критерия Бартлета для проверки однородности
дисперсий представлен в приложении Б, пример Б.2.
115
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- вычисляют коэффициенты b1 уравнения регрессии, дисперсии s 2 {bi }
коэффициентов регрессии и ошибки s{bi } в определении коэффициентов;
- для каждого коэффициента регрессии находят расчетное значение
t- критерия:
tр =
{bi }
s{bi }
Сравнивают расчетное значение tp с табличным значением tт критерия.
Табличное значение критерия находят для принятого уровня значимости и
числа степеней свободы f, которое в рассматриваемом случае определяют по
зависимости:
f =
N
åfj =
j =1
N
å (n j - 1)
j =1
Коэффициент значим при tp>tт и незначим при tp<tт. Статистически
незначимые коэффициенты могут быть исключены из уравнения регрессии.
При исключении статистически незначимых коэффициентов из уравнения
оставшиеся
коэффициенты
пересчитывают
с
использованием
метода
наименьших квадратов;
- определяют дисперсию адекватности:
)
ån j y j - y j
N
2
sад
=
j =1
(
N
)
=
f
)
å n j (y j - y j )2
2
j =1
N - (k + 1)
где n - число параллельных экспериментов в j-й строке матрицы.
Проверяют гипотезу адекватности полученной модели с помощью
F-критерия, используя для этого формулу (5.9). Если Fр<Fт для принятого
116
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
уровня значимости и соответствующих чисел степеней свободы, то модель
считают адекватной. При Fp>Fт гипотеза адекватности отвергается.
5.2.3
Обработка
результатов
эксперимента
при
отсутствии
дублирования
Обработку результатов эксперимента в этом случае производят по
следующей схеме:
- для вычисления дисперсии s 2y воспроизводимости эксперимента
выполняют несколько параллельных опытов в нулевой точке (в центре плана).
При постановке опытов в нулевой точке все факторы находятся на нулевых
уровнях. По результатам исследований в центре плана вычисляют дисперсию
s 2y воспроизводимости эксперимента:
s 2y
n
1 é 0
2ù
=
y
y
(
)
êå u
ú,
n0 - 1 êëu =1
úû
где n0 - число параллельных экспериментов в нулевой точке;
yu - значение параметра оптимизации в u-м опыте; y - среднее
арифметическое значение параметра оптимизации в n0 параллельных
экспериментах;
- закончив эксперимент, вычисляют коэффициенты модели. Свободный
член b0 определяют по формуле:
1 N
b0 = å y j
N j =1
117
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коэффициенты
регрессии,
характеризующие
линейные эффекты,
вычисляют по зависимости:
1 N
bi = å xij y j
N j =1
где i, l - номера факторов;
j - номер строки или опыта в матрице планирования;
yj - значение параметра оптимизации в j-м опыте; xij, xljкодированные значения (±1)факторов i и l в j-м опыте.
- проверяют статистическую значимость коэффициентов уравнения
регрессии. Проверку значимости коэффициентов можно производить двумя
способами:
сравнением
абсолютной
величины
коэффициента
с
доверительным интервалом; с помощью t-критерия.
При проверке значимости коэффициентов первым способом для
определения доверительного интервала вычисляют дисперсии коэффициентов
регрессии по зависимости:
s 2 {bi } =
1 2
sy
N
(5.18)
где s 2 {bi } - дисперсия i-го коэффициента регрессии; N - число строк
или опытов в матрице планирования.
Из формулы (5.18) следует, что дисперсии всех коэффициентов равны.
Доверительный интервал Δb0 определяют по формуле (5.16). Значение
t-критерия, входящего в эту формулу, находят по таблице для принятого
уровня значимости и числа степеней свободы f которое определяют по
зависимости f = n0 – 1. Коэффициент регрессии значим, если его абсолютная
величина больше доверительного интервала. При проверке значимости
коэффициентов вторым способом вычисляют критерий tp:
118
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
tр =
{bi }
s{bi }
и сравнивают его с табличным tт. Коэффициент значим, если tp>tт для
принятого уровня значимости и числа степеней свободы, определенного по
формуле f = n0 - 1. Критерий Стьюдента t вычисляют для каждого
коэффициента
регрессии.
Статистически
незначимые
коэффициенты
регрессии могут быть исключены из уравнения;
- определяют дисперсию sa2 , адекватности по формуле
)
ånj yj - yj
N
2
=
sад
j =1
(
) å n j (y j - y) j )2
N
2
=
f
j =1
N - (k + 1)
где yj - значение параметра оптимизации в j-м эксперименте;
)
y j - значение параметра оптимизации, вычисленное по модели для
условий j-го эксперимента;
f – число степеней свободы, которое для линейной модели
определяется по зависимости f = N - (k + 1), где k - число факторов;
- проверяют гипотезу адекватности модели но F-критерию, используя
для определения Fр- критерия формулу (5.9).
Если Fp<Fт для принятого уровня значимости и соответствующих чисел
степеней свободы, то модель считают адекватной. При Fp>Fт гипотеза
адекватности отвергается. В этом случае для получения адекватной модели
принимают одно из следующих решений:
·
переходят к планированию второго или более высокого порядка;
·
уменьшают интервалы варьирования и ставят новый эксперимент,
повторяя эти действия до получения адекватной линейной модели;
- если линейная модель адекватна, то переходят к методу крутого
восхождения. Необходимо заметить, что крутое восхождение эффективно
тогда, когда все коэффициенты при факторах значимы. Незначимость
некоторых коэффициентов может получиться вследствие:
119
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- неудачно выбранных интервалов варьирования;
- включения факторов, не влияющих на параметр оптимизации;
- большой ошибки эксперимента.
Принятие решения в данной ситуации зависит от того, какая из трех
указанных причин имеет место. Если имеет место первая причина, то
изменяют интервалы варьирования по незначимым факторам и ставят новую
серию экспериментов. Если принята вторая, то не влияющие факторы
стабилизируют и исключают из экспериментов. Если принята третья причина,
то увеличивают число параллельных экспериментов. Увеличение их числа
приводит
к
уменьшению
дисперсии
коэффициентов
и
величины
доверительного интервала, в результате все или часть коэффициентов могут
оказаться значимыми. Возможен случай, когда все коэффициенты, кроме
b0,незначимы, а модель адекватна. Такая ситуация чаще всего возникает из-за
слишком узких интервалов варьирования или вследствие большой ошибки
эксперимента. В этой ситуации возможны два решения:
1) расширение интервалов варьирования;
2) повышение точности эксперимента путем улучшения методики
проведения и увеличения числа параллельных экспериментов.
120
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6
Базовые
понятия
и
операции
обработки
экспериментальных данных
6.1 Эмпирическая функция распределения
Методы обработки ЭД опираются на базовые понятия теории
вероятностей и математической статистики. К их числу относятся понятия
генеральной
совокупности,
выборки,
эмпирической
функции
распределения.
Под генеральной совокупностью понимают все возможные значения
параметра, которые могут быть зарегистрированы в ходе неограниченного по
времени наблюдения за объектом.
Такая совокупность состоит из бесконечного множества элементов. В
результате наблюдения за объектом формируется ограниченная по объему
совокупность значений параметра х1, х2, ..., хn. С формальной точки зрения
такие данные представляют собой выборку из генеральной совокупности.
Будем считать, что выборка содержит полные наработки до системных
событий.
Наблюдаемые значенияхi называют вариантами, а их количество –
объемом выборки п. Для того чтобы по результатам наблюдения можно было
делать какие-либо выводы, выборка должна быть репрезентативной
(представительной), т.е. правильно представлять пропорции генеральной
совокупности. Это требование выполняется, если объем выборки достаточно
велик, а каждый элемент генеральной совокупности имеет одинаковую
вероятность попасть в выборку.
Пусть в полученной выборке значениеxi параметра наблюдалось n1 раз,
значение х2 - n2 раз, значение хк - nk раз, n1 + n2 + ... + nk=n. Совокупность
значений, записанных в порядке их возрастания, называют вариационным
рядом, величины n - частотами, а их отношения к объему выборки ωi = ni/n относительными
частотами
(частостями).
относительных частот равна единице.
121
Очевидно,
что
сумма
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Под
распределением
понимают
соответствие
между
наблюдаемыми вариантами и их частотами или частостями. Пусть
nx - количество наблюдений, при которых случайные значения параметра Х
меньше x. Частость события X<x равна njn. Это отношение является функцией
от x и от объема выборки: Fn(x)= nx/п. Величина Fn(x) обладает всеми
свойствами функции распределения:
Fn(x) неубывающая функция, ее значения принадлежат отрезку [0 - 1];
если x1 - наименьшее значение параметра, аxk - наибольшее, то Fn(x)=0, когда
x<x1, и Fn(xk)=1, когда x >xk.
Функция Fn(x) определяется по экспериментальным данным, поэтому ее
называют
эмпирической
функцией
распределения.
В
отличие
от
эмпирической функции Fn(x) функцию распределения F(x) генеральной
совокупности называют теоретической функцией распределения,
она
характеризует не частость, а вероятность события X<x. Из теоремы Бернулли
вытекает,
что
частость
Fn(x)
стремится
по
вероятности
к
вероятности F(x) при неограниченном увеличении n. Следовательно, при
большом объеме наблюдений теоретическую функцию распределения F(x)
можно заменить эмпирической функцией Fn(x).
График эмпирической функции Fn(x) представляет собой ломаную
линию. В промежутках между соседними членами вариационного ряда Fn(x)
сохраняет постоянное значение. При переходе через точки оси x, равные
членам выборки, Fn(x) претерпевает разрыв, скачком возрастая на величину
1/n, а при совпадении l наблюдений - на l/n.
Пример построения вариационного ряда и графика эмпирической
функции распределения представлен в приложении Б пример Б.3.
При большом объеме выборки (понятие «большой объем» зависит от
целей и методов обработки, в данном случае будем считатьп большим, если
п>40) в целях удобства обработки и хранения сведений прибегают к
группированию ЭД в интервалы. Количество интервалов следует выбрать так,
чтобы в необходимой мере отразилось разнообразие значений параметра в
совокупности и в то же время закономерность распределения не искажалась
случайными колебаниями частот по отдельным разрядам. Существуют
122
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
нестрогие рекомендации по выбору количества у и размера h таких
интервалов, в частности:
- в каждом интервале должно находиться не менее 5 - 7 элементов. В
крайних разрядах допустимо всего два элемента;
- количество интервалов не должно быть очень большим или очень
маленьким.
Минимальное значение интервалов должно быть не менее 6 - 7. При
объеме выборки, не превышающем несколько сотен элементов, количество
интервалов задают в пределах от 10 до 20. Для очень большого объема
выборки (n>1000) количество интервалов может превышать указанные
значения.
Некоторые
соотношением
исследователи
y=1,441ln(п)+1;
при
рекомендуют
относительно
пользоваться
небольшой
неравномерности длины интервалов удобно выбирать одинаковыми и
равными величине:
h= (xmax -xmin)/у,
где xmax– максимальное и xmin– минимальное значение параметра.
При существенной неравномерности закона распределения длины
интервалов можно задавать меньшего размера в области быстрого изменения
плотности распределения; при значительной неравномерности лучше в
каждый разряд назначать примерно одинаковое количество элементов
выборки. Тогда длина конкретного интервала будет определяться крайними
значениями элементов выборки, сгруппированными в этот интервал, т.е. будет
различна для разных интервалов (в этом случае при построении гистограммы
нормировка по длине интервала обязательна – в противном случае высота
каждого элемента гистограммы будет одинакова).
Группирование
результатов
наблюдений
по
интервалам
предусматривает: определение размаха изменений параметра х; выбор
количества интервалов и их величины; подсчет для каждого i-го интервала
[xi - xi+1] частоты п или относительной частоты (частости n) попадания
123
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
варианта в интервал. В результате формируется представление ЭД в виде
интервального или статистического ряда.
Графически статистический ряд отображают в виде гистограммы,
полигона и ступенчатой линии. Часто гистограмму представляют как фигуру,
состоящую из прямоугольников, основаниями которых служат интервалы
длиною h, а высоты равны соответствующей частости. Однако такой подход
неточен. Высоту i-го прямоугольника Zi следует выбрать равной ni/(nh). Такую
гистограмму можно интерпретировать как графическое представление
эмпирической функции плотности распределения fn(x), в ней суммарная
площадь всех прямоугольников составит единицу. Гистограмма помогает
подобрать вид теоретической функции распределения для аппроксимации ЭД.
Полигоном называют ломаную линию, отрезки которой соединяют
точки с координатами по оси абсцисс, равными серединам интервалов, а по
оси ординат – соответствующим частостям. Эмпирическая функция
распределения отображается ступенчатой ломаной линией: над каждым
интервалом
проводится
отрезок
горизонтальной
линии
на
высоте,
пропорциональной накопленной частости в текущем интервале. Накопленная
частость равна сумме всех частостей, начиная с первого и до данного
интервала включительно.
Пример построения статистического ряда представлен в приложении Б,
пример Б.4.
Рассмотренные
представления
ЭД
являются
исходными
для
последующей обработки и вычисления различных параметров.
6.2 Оценки параметров распределения и их свойства
Значение параметра, вычисленное по ограниченному объему ЭД,
является случайной величиной, т. е. значение такой величины от выборки к
выборке может меняться заранее не предвиденным образом. Следовательно, в
результате обработки ЭД определяется не значение параметра θ, а только
~
лишь его приближенное значение q – статистическая оценка параметра.
124
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Получить статистическую оценку параметра теоретического распределения
означает найти функцию от имеющихся результатов наблюдения, которая и
даст приближенное значение искомого параметра. Различают два вида оценок
– точечные и интервальные.
Точечными называют такие оценки, которые характеризуются одним
числом. При малых объемах выборки точечные оценки могут значительно
отличаться от истинных значений параметров, поэтому их применяют при
большом объеме выборки.
Интервальные оценки задаются двумя числами, определяющими
вероятный
диапазон
возможного
значения
параметра.
Эти
оценки
применяются для малых и для больших выборок. Рассмотрим вначале
точечные оценки.
Применительно
к
каждому
оцениваемому
параметру
закона
распределения генеральной совокупности существует множество функций,
позволяющих
вычислить
искомые
значения.
Например,
оценку
математического ожидания можно вычислить, взяв среднее арифметическое
выборочных значений, половину суммы крайних членов вариационного ряда,
средний член выборки и т.д. Указанные функции отличаются качеством
оценок и трудоемкостью реализации.
Качество
оценок
характеризуется
такими
свойствами,
как
состоятельность, несмещенность, эффективность и достаточность.
Состоятельность характеризует сходимость по вероятности оценки
~
q к истинному значению параметра θ при неограниченном увеличении
объема выборки n:
•
Смещение оценки должно стремиться к нулю при объёме
~
выборки, стремящейся к бесконечности, т.е. M q i - q i = j ® 0 ;
( )
( )
~
D q i ® 0 при n ® ¥ .
Оценка является состоятельной, если она удовлетворяет закону
больших чисел, т.е. с увеличением объёма выборки значение оценки
стремится к значению параметра генеральной совокупности по вероятности:
125
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(
)
~
P q i-q i < 0 ® 1 при n ® ¥ .
•
Для определения состоятельности оценки достаточно выполнения
двух условий
Свойство
состоятельности
проявляется
при
неограниченном
увеличениип, а при небольших объемах ЭД наличие этого свойства еще
недостаточно для применения оценки.
Несмещенность
характеризует
отсутствие
систематических
(в
среднем) отклонений оценки от параметра при любом конечном, в том числе и
~
малом, объеме выборки, т. е. M q = q .
()
Использование статистической оценки, математическое ожидание
которой не равно оцениваемому параметру, приводит к систематическим
ошибкам. Не всегда наличие смещения плохо. Оно может быть существенно
меньше
погрешности
регистрации
значений
параметра
или
давать
дополнительную гарантию выполнения требований к значению параметра
~
(если даже при положительном смещении оценка q меньше предельно
допустимого значения, то несмещенное значение тем более будет отвечать
этому условию). В таких ситуациях допустимо применение смещенных
оценок, если они вычисляются проще, чем несмещенные. Но даже
несмещенная оценка может быть удалена от истинного значения.
Эффективность характеризует разброс случайных значений оценки
около истинного значения параметра. Среди всех оценок следует выбрать ту,
значения которой теснее сконцентрированы около оцениваемого параметра.
Для
многих
применяемых
способов
оценивания
выборочные
распределения параметров асимптотически нормальны, поэтому часто мерой
эффективности служит дисперсия оценки.
~
Оценка q является эффективной для параметра θ, если она имеет
наименьшую из возможных дисперсию при заданном объёме выборки п.
Достаточность характеризует полноту использования информации,
~
содержащейся в выборке. Другими словами, оценка q будет достаточной,
если все другие независимые оценки на основе данной выборки не дают
126
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
дополнительной информации об оцениваемом параметре. Эффективная
оценка обязательно является и достаточной.
Рассмотренные
свойства
применимы
также
к
ЭД,
которые
характеризуются многомерными распределениями вероятностей.
Подходы к формированию оценок разработаны в теории несмещенных
оценок, предложенной А. Н. Колмогоровым и С. Рао. В данной теории
предполагается известным с точностью до параметра T вид функции
плотности распределения наблюдаемой величины f(x, Т). Вид распределения
устанавливается исходя из априорных соображений, например, на основе
общепринятых суждений о характере безотказной работы технических
средств. Тогда задача сводится к нахождению такой функции от результатов
наблюдений, которая дает несмещенную и эффективную оценку.
6.3 Оценки моментов и квантилей распределения
Для характеристики эмпирического распределения можно использовать
оценки центральных и начальных моментов. Применение находят моменты до
четвертого порядка включительно, так как точность выборочных моментов
резко падает с увеличением их порядка, в частности, дисперсия начальных
моментов порядка р зависит от моментов порядка 2р. Она становится
значительной для моментов высокого порядка даже при больших объемах
выборки. Выборочные значения моментов определяют непосредственно по
выборке или по сгруппированным данным.
Пусть Х - изучаемый количественный признак, x1, x2,...xk имеющаяся
выборкаобъёма п =n1 + п2 +.... +nk.
Для произвольного действительного числа х обозначимпх - количество
вариант выборки, меньших числа х.
Относительная частота появления события (Х<х) равна
127
nx
.
n
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
*
Функция F ( x ) =
nx
, определяющая для каждого x Î nx относительную
n
частотусобытия (Х<х), называетсяэмпирической функцией распределения
или выборочной функцией распределения.
Функция распределения F(x) генеральной совокупности называется
теоретической функцией распределения.
Теоретическая функция распределения характеризует вероятность
события (Х<х), а эмпирическая функция характеризует относительную
частоту данного события. Эмпирическая функция распределения обладает
всеми свойствами теоретической функции распределения.
Рассмотрим выборочные числовые характеристики.
Выборочным средним называется число
k
xв = å xi
i =1
ni
n
Выборочной дисперсией называется число
k
Dв = å (xi - xв )2
i =1
ni
.
n
Начальный выборочный моментр i-го порядка - это число
k
mkВ = å ( xi ) p
i =1
ni
.
n
Центральный выборочный момент р-го порядка - это число
В
mkС
k
= å ( xi - xв ) p
i =1
128
ni
.
n
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Важно заметить, что для интервального вариационного ряда в
приведённых выше формулах вместо значений вариант хi берётся середина
x , а числоn в этом случае есть количество
соответствующего интервала ~
i
i
наблюдённых значений, попавших в i-ый интервал.
Главное назначение средних величин (оценок начальных моментов и в
первую очередь первого момента распределения) состоит в их обобщающей
функции. Это обобщение позволяет заменить множество различных
индивидуальных значений показателя средней величиной, характеризующей
всю однородную совокупность. Иначе говоря, средняя величина является
типической характеристикой варианты в конкретной выборке. Иногда средняя
величина обобщает и неоднородные совокупности данных. Например, может
применяться такой показатель как среднее количество обработанных запросов
на сервере в течение суток, хотя очевидно, что дневная загрузка сервера
сильно отличается от загрузки в ночное время. Указанный показатель имеет
смысл для оценки ресурса накопителей на жестких дисках.
Каждый
элемент
ЭД
формируется
под
влиянием
как
общих
закономерностей, так и особых условий и случайных событий. Следовательно,
в обработке ЭД большой интерес представляют вопросы оценки величин,
характеризующих вариацию значений параметра у разных объектов или у
одного и того же объекта в разные моменты времени.
Вариацией
какого-либо
параметра
(показателя)
в
совокупности
наблюдений называется различие его значений у разных элементов этой
совокупности.
Вариация
является
характерным
свойством
большинства
информационных параметров АСОИУ. Именно это свойство является
объектом
исследования
большинства
методов
обработки
ЭД.
Для
характеристики вариации нет единого показателя, в этих целях применяются
моменты распределения выше первого, производные от них величины, размах
выборки, квантили и др.
129
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7 Проверка статистических гипотез
7.1 Сущность задачи проверки статистических гипотез
Статистическая
гипотеза
представляет
собой
некоторое
предположение о законе распределения случайной величины или о
параметрах этого закона, формулируемое на основе выборки.
Примерами
статистических
гипотез
являются
предположения:
генеральная совокупность распределена по экспоненциальному закону;
математические
ожидания
двух
экспоненциально
распределенных
выборок равны друг другу. В первой из них высказано предположение о виде
закона распределения, а во второй – о параметрах двух распределений.
Гипотезы, в основе которых нет никаких допущений о конкретном виде
закона распределения, называют непараметрическими, в противном случае –
параметрическими.
Гипотезу, утверждающую, что различие между сравниваемыми
характеристиками отсутствует, а наблюдаемые отклонения объясняются
лишь случайными колебаниями в выборках, на основании которых
производится сравнение, называют нулевой (основной) гипотезой и
обозначают Н0.
Наряду с основной гипотезой рассматривают и альтернативную
(конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза
будет отвергнута, то будет иметь место альтернативная гипотеза.
Различают простые и сложные гипотезы.
Гипотезу называют простой, если она однозначно характеризует
параметр распределения случайной величины.
Например,
если
l
является
параметром
экспоненциального
распределения, то гипотеза Н0 о равенстве 1=10 – простая гипотеза.
Сложной называют гипотезу, которая состоит из конечного или
бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве
1>10 состоит из бесконечного множества простых гипотез Н0 о равенстве 1>bi,
130
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где bi– любое число, большее 10. Гипотеза Н0 о том, что математическое
ожидание
нормального
распределения
равно
двум
при
неизвестной
дисперсии, тоже является сложной. Сложной гипотезой будет предположение
о распределении случайной величины Х по нормальному закону, если не
фиксируются конкретные значения математического ожидания и дисперсии.
Проверка гипотезы основывается на вычислении некоторой случайной
величины – критерия, точное или приближенное распределение которого
известно. Обозначим эту величину через z, ее значение является функцией от
элементов выборки z=z (x1, x2, ..., xn).
Процедура проверки гипотезы предписывает каждому значению
критерия одно из двух решений – принять или отвергнуть гипотезу. Тем
самым все выборочное пространство и соответственно множество значений
критерия делятся на два непересекающихся подмножества S0 и S1. Если
значение критерия z попадает в область S0, то гипотеза принимается, а если в
область S1, то гипотеза отклоняется.
Множество S0 называется областью принятия гипотезы или областью
допустимых значений, а множество S1 – областью отклонения гипотезы или
критической областью. Выбор одной области однозначно определяет и
другую область.
Принятие или отклонение гипотезы Н0 по случайной выборке
соответствует истине с некоторой вероятностью и, соответственно, возможны
два рода ошибок.
Ошибка первого рода возникает с вероятностьюα тогда, когда
отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1.
Ошибка второго рода возникает с вероятностью β в том случае, когда
принимается
неверная
гипотеза
Н0,
в
то
время
как
справедлива
конкурирующая гипотеза Н1.
Доверительная вероятность - это вероятность не совершить ошибку
первого рода и принять верную гипотезу Н0.
Вероятность отвергнуть ложную гипотезу Н0 называется мощностью
критерия. Следовательно, при проверке гипотезы возможны четыре варианта
исходов (таблица7.1).
131
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 7.1 – Варианты исходов
Гипотеза Н0
Верна
Неверна
Решение
Вероятность
Примечание
Принимается
1–α
Доверительная вероятность
Отвергается
α
Принимается
β
Отвергается
1–β
Вероятность ошибки первого
рода
Вероятность ошибки второго
рода
Мощность критерия
Например, рассмотрим случай, когда некоторая несмещенная оценка
параметра θ вычислена по выборке объема n, и эта оценка имеет плотность
распределения f (θ), рисунок 7.1.
Рисунок 7.1 – Области принятия и отклонения гипотезы
Предположим, что истинное значение оцениваемого параметра равно Т.
Если рассматривать гипотезу Н0 о равенстве θ =Т, то насколько велико должно
быть различие между θ и Т, чтобы эту гипотезу отвергнуть. Ответить на
данный вопрос можно в статистическом смысле, рассматривая вероятность
достижения некоторой заданной разности между θ и Т на основе выборочного
распределения параметра θ.
132
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Целесообразно полагать одинаковыми значения вероятности выхода
параметра θ за нижний и верхний пределы интервала. Такое допущение во
многих случаях позволяет минимизировать доверительный интервал, т.е.
повысить мощность критерия проверки. Суммарная вероятность выхода
параметра θ за пределы интервала с границами θ1-a/2 и θa/2, составляет величину
α. Эту величину следует выбирать такой, чтобы выход за пределы интервала
был маловероятен. Если оценка параметра попала в заданный интервал, то нет
основания подвергать сомнению проверяемую гипотезу. Гипотезу равенства
θ=Т можно принять. Но если после получения выборки окажется, что оценка
выходит за установленные пределы, то в этом случае есть серьезные
основания отвергнуть гипотезу Н0. Отсюда следует, что вероятность
допустить ошибку первого рода равна α (равна уровню значимости критерия).
Если предположить, например, что истинное значение параметра в
действительности равно Т+d , то согласно гипотезе Н0 о равенстве θ = Т –
вероятность того, что оценка параметра θ попадет в область принятия
гипотезы, составит β, рисунок 7.1.
При заданном объеме выборки вероятность совершения ошибки первого
рода можно уменьшить, снижая уровень значимости α. Однако при этом
увеличивается вероятность ошибки второго рода β (снижается мощность
критерия). Аналогичныерассуждения можно провести для случая, когда
истинное значение параметра равно Т - d.
Единственный способ уменьшить обе вероятности состоит в увеличении
объема выборки (плотность распределения оценки параметра при этом
становится более "узкой").
При выборе критической области руководствуются правилом Неймана Пирсона: следует так выбирать критическую область, чтобы вероятностьα
была мала, если гипотеза верна, и велика в противном случае. Однако выбор
конкретного значенияα относительно произволен. Употребительные значения
лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов
составлены таблицы интервалов с границами в θ1-a/2 и θa/2 для типовых
значений a и различных способов построения критерия.
133
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При выборе уровня значимости необходимо учитывать мощность
критерия при альтернативной гипотезе. Иногда большая мощность критерия
оказывается существеннее малого уровня значимости, и его значение
выбирают относительно большим, например 0,2. Такой выбор оправдан, если
последствия ошибок второго рода более существенны, чем ошибок первого
рода. Например, если отвергнуто правильное решение "продолжить работу
пользователей с текущими паролями", то ошибка первого рода приведет к
некоторой задержке в нормальном функционировании системы, связанной со
сменой паролей. Если же принято решения не менять пароли, несмотря на
опасность несанкционированного доступа посторонних лиц к информации, то
эта ошибка повлечет более серьезные последствия.
В зависимости от сущности проверяемой гипотезы и используемых мер
расхождения оценки характеристики от ее теоретического значения
применяют различные критерии. К числу наиболее часто применяемых
критериев для проверки гипотез о законах распределения относят критерии
хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях
параметров – критерии Фишера, Стьюдента.
134
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8 Типовые распределения
При проверке гипотез широкое применение находит ряд теоретических
законов распределения. Наиболее важным из них является нормальное
распределение. С ним связаны распределения хи-квадрат, Стьюдента,
Фишера, а также интеграл вероятностей. Для указанных законов функции
распределения
аналитически
не
представимы.
Значения
функций
определяются по таблицам или с использованием стандартных процедур
пакетов прикладных программ. Указанные таблицы обычно построены в
целях удобства проверки статистических гипотез в ущерб теории распределений – они содержат не значения функций распределения, а
критические значения аргумента z(α).
Для односторонней критической области z(α)=z1-a, т.е. критическое
значение аргумента z(α) соответствует квантили z1-a уровня 1-α, рисунок 8.1,
так как
¥
z (a )
z
-¥
ò f (z )dz = a = 1 - ò f (z )dz .
Рисунок 8.1 – Односторонняя критическая область
Для двусторонней критической области, с уровнем значимостиα, размер
левой области α2, правойα1 (α1+α2=α), рисунок 8.2. Значения z(α2) и z(α1)
связаны с квантилями распределения соотношениями:
135
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
z (a1 ) = z1-a 1 , z (a 2 ) = za 2 ,
так как
z (a 1 )
ò f (z )dz = 1 - a1
-¥
z (a 2 )
ò f (z )dz = 1 - a 2
-¥
Для симметричной функции плотности распределения f(z) критическую
область выбирают из условия α1= α2 = α/2) (обеспечивается наибольшая
мощность критерия). В таком случае левая и правая границы будут равны
|z(α/2)|.
Рисунок 8.2 – Двусторонняя критическая область
8.1 Нормальное распределение
Этот вид распределения является наиболее важным в связи с
центральной предельной теоремой теории вероятностей: распределение
суммы независимых случайных величин стремится к нормальному с
увеличением их количества при произвольном законе распределения
отдельных слагаемых, если слагаемые обладают конечной дисперсией.
136
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Кроме того, А.М. Ляпунов доказал, что распределение параметра
стремится к нормальному, если на параметр оказывает влияние большое
количество факторов и ни один из них не является превалирующим. Функция
плотности нормального распределения
é (x - m1 )2 ù
1
f (x ) =
expêú
2m2 úû
2pm2
êë
- унимодальная, симметричная, аргумент х может принимать любые
действительные значения, рисунок 8.3.
Рисунок 8.3 – Плотность нормального распределения
Функция плотности нормального распределения стандартизованной
величины u имеет вид:
é u2 ù
1
f (u ) =
expê- ú
2p
ë 2û
Вычисление
значений
функции
распределения
Ф(u)
для
стандартизованного неотрицательного аргумента u (u≥0) можно произвести с
помощью полинома наилучшего приближения
Ф(u) = 1– 0,5(1 + 0,196854u + 0,115194u2 + 0,000344u3 + 0,019527u4) – 4
137
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Такая аппроксимация обеспечивает абсолютную ошибку не более
0,00025.
Для
вычисления Ф(u)
в
области
отрицательных значений
стандартизованного аргумента u (u<0) следует воспользоваться свойством
симметрии нормального распределения
Ф(u) = 1 – Ф(- u).
Интеграл вероятностей связан с функцией нормального распределения
стандартизованной величины u соотношением
Ф(u) = 0,5 + F(u).
8.2 Распределение χ2
Распределению хи-квадрат (χ 2– распределению) с k степенями свободы
соответствует распределение суммы
n
c 2 = å ui2
i =1
квадратов n стандартизованных случайных величин ui, каждая из которых
распределена по нормальному закону, причем k из них независимы, n ≥ k .
Функция плотности распределения хи-квадрат с k степенями свободы
é k æ k öù
f (x ) = ê2 2 Gç ÷ú
è 2 øúû
êë
ækö
где Gç ÷ - гамма-функция.
è2ø
138
-1
( x)
k
k
-1 2
,x≥0,
2 e
(8.1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Функция плотности при k, равном одному или двум, – монотонная, а при
k>2 – унимодальная, несимметричная, рисунок 8.4.
Рисунок 8.4 – Плотность распределения хи-квадрат
Математическое
ожидание
и
дисперсия
величины
χ2
равны
соответственно k и 2k .Распределение хи-квадрат является частным случаем
более общего гамма - распределения, а величина, равная корню квадратному
из хи-квадрат с двумя степенями свободы, подчиняется распределению Рэлея.
С
увеличением
числа степеней свободы
(k>30) распределение
хи-квадрат приближается к нормальному распределению с математическим
ожиданием k и дисперсией 2k.
8.3 Распределение Стьюдента
Распределение Стьюдента (t – распределение, предложено в 1908 г.
английским статистиком В. Госсетом, публиковавшим научные труды под
псевдонимом Student) характеризует распределение случайной величины
t=
(u
2
1
u0
)
+ u22 + ...uk2 k
139
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где u0, u1,uk взаимно независимые нормально распределенные случайные
величины с нулевым средним и конечной дисперсией. Аргумент t не зависит
от дисперсии слагаемых. Функция плотности распределения Стьюдента
æ (k + 1) ö
(k +1)
Gç
֎
2 ù- 2
t
2 ø
f (t ) = è
ê1 + ú
kû
æk ö
pkGç ÷ ë
è2ø
(8.2)
Величина k характеризует количество степеней свободы. Плотность
распределения – унимодальная и симметричная функция, похожая на
нормальное распределение, рисунок 8.5
Рисунок 8.5 – Плотность распределения Стьюдента
Область изменения аргумента t от минус до плюс бесконечности.
Математическое ожидание и дисперсия равны 0 и k/(k-2) соответственно, при
к>2. По сравнению с нормальным распределение Стьюдента более пологое,
оно имеет меньшую дисперсию. Это отличие заметно при небольших
значениях k, что следует учитывать при проверке статистических гипотез
(критические значения аргумента распределения Стьюдента превышают
аналогичные
распределения
показатели
содержат
нормального
значения
для
интегрирования от r(k; a) до бесконечности)
140
распределения).
Таблицы
односторонней
(пределы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
¥
ò f (t )dt = a
r (k , a )
или двусторонней (пределы интегрирования от –r(k; a) до r(k; a)
r (k , a )
ò f (t )dt = a
- r (k , a )
критической области.
Распределение Стьюдента применяется для описания ошибок выборки
при k<30. При k, превышающем 100, данное распределение практически
соответствует нормальному, для значений k из диапазона от 30 до 100
различия между распределением Стьюдента и нормальным распределением
составляют несколько процентов.
Поэтому относительно оценки ошибок малыми считаются выборки
объемом не более 30 единиц, большими – объемом более 100 единиц. При
аппроксимации распределения Стьюдента нормальным распределением для
односторонней критической области вероятностьα
æ
k ö
P{t > t (k ;a )} = u1-a ç 0,
÷,
(
)
k
2
è
ø
k ö
æ
где u1-a ç 0,
÷ - квантиль нормального распределения. Аналогичное
k
2
(
)
è
ø
соотношение можно составить и для двусторонней критической области.
141
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8.4 Распределение Фишера
Распределению Р.А. Фишера (F-распределению Фишера – Снедекора)
подчиняется случайная величина
X =
y1 k1
,
y2 k 2
равная отношению двух случайных величин у1 и у2, имеющих хи-квадрат
распределение с k1 и k2 степенями свободы. Область изменения аргумента х от
0 до бесконечности. Плотность распределения
k1
ù2
ék
f (x) = ê 1 ú
ë k2 û
æ (k + k ) ö
Gç 1 2 ÷ (k1 - 2 )
2
ø × x 2 × é1 + k1
× è
ê k
æ k1 ö æ k2 ö
ë
2
Gç ÷Gç ÷
è2ø è 2ø
(k + k )
- 1 2
2
ù
xú
û
(8.3)
В этом выражении k1 обозначает число степеней свободы величины y1 с
большей дисперсией, k2 – число степеней свободы величины y2 с меньшей
дисперсией. Плотность распределения – унимодальная, несимметричная,
рисунок 8.6.
Рисунок 8.6 – Плотность распределения Фишера
142
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Математическое ожидание случайной величины х
m1 = k2 / (k2– 2) при k2>2,
дисперсия
m2 =
2k 22 (k1 + k 2 - 2)
k1 (k 2 - 2)2 (k 2 - 4)
при k2> 4.
При k1>30 и k2>30 величина х распределена приближенно нормально:
с центром распределения (k1-k2) / (2k1k2) и дисперсией (k1+k2) / (2k1k2).
8.5 Проверка гипотез о законе распределения
Обычно сущность проверки гипотезы о законе распределения ЭД
заключается в следующем.
Имеется выборка фиксированного объема, выбран или известен вид
закона распределения генеральной совокупности. Необходимо оценить по
этой выборке параметры закона, определить степень согласованности
экспериментальных данных и выбранного закона распределения, в котором
параметры заменены их оценками. Пока не будем касаться способов
нахождения оценок параметров распределения, а рассмотрим только вопрос
проверки
согласованности
распределений
с
использованием
наиболее
употребительных критериев.
8.5.1 Критерий хи-квадрат К. Пирсона
Использование этого критерия основано на применении такой меры
(статистики) расхождения между теоретическим F(x) и эмпирическим
143
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
распределением
Fn(x),
которая
приближенно
подчиняется
закону
распределения χ2. Гипотеза Н0 о согласованности распределений проверяется
путем анализа распределения этой статистики. Применение критерия требует
построения статистического ряда.
Итак, пусть выборка представлена статистическим рядом с количеством
разрядов у. Наблюдаемая частота попаданий в i-й разряд ni соответствии с
теоретическим законом распределения ожидаемая частота попаданий в i-й
разряд составляет Fi. Разность между наблюдаемой и ожидаемой частотой
составит величину (ni–Fi). Для нахождения общей степени расхождения
между F(x) и Fп(x) необходимо подсчитать взвешенную сумму квадратов
разностей по всем разрядам статистического ряда
y
(ni - Fi )
i =1
Fi
c =å
2
(8.4)
Величина χ2 при неограниченном увеличении n имеет распределение
хи-квадрат (асимптотически распределена как хи-квадрат). Это распределение
зависит от числа степеней свободы k, т.е. количества независимых значений
слагаемых в выражении (8.4). Число степеней свободы равно числу y минус
число линейных связей, наложенных на выборку. Одна связь существует в
силу того, что любая частота может быть вычислена по совокупности частот в
оставшихся y-1 разрядах. Кроме того, если параметры распределения
неизвестны заранее, то имеется еще одно ограничение, обусловленное
подгонкой распределения к выборке. Если по выборке определяются f
параметров распределения, то число степеней свободы составит k = y-f-1.
Очевидно, что чем меньше расхождение между теоретическими и
эмпирическими частотами, тем меньше величина критерия. Область принятия
гипотезы Н0 определяется условием c 2 < c 2 (k, a ) , где c 2 (k, a ) - критическая
точка распределения хи- квадрат с уровнем значимости a .
144
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибки первого рода равна a, вероятность ошибки
второго рода четко определить нельзя, потому что существует бесконечно
большое множество различных способов несовпадения распределений.
Мощность критерия зависит от количества разрядов и объема выборки.
Критерий рекомендуется применять при n>200, допускается применение при
n>40, именно при таких условиях критерий состоятелен (как правило,
отвергает неверную нулевую гипотезу).
Теоретическое значение вероятности Fi попадания случайной величины
в i-й интервал определяется по формуле
æ (x - m1 )2 ö
ò expçç - 2s 2 ÷÷dx
x i -1
è
ø
xi
1
Fi =
s 2p
(8.5)
Для нормального закона возможные значения случайной величины
лежат в диапазоне отминус до плюс бесконечности, поэтому при расчетах
оценок вероятностей крайний левый и крайний правый интервалы
расширяются до минус и плюс бесконечности соответственно. Вычислить
значения функции нормального распределения можно, воспользовавшись
стандартными
функциями
табличного
процессора
или
полиномом
наилучшего приближения.
8.5.2 Критерий А.Н. Колмогорова
Для применения критерия А.Н. Колмогорова ЭД требуется представить
в виде вариационного ряда (ЭД недопустимо объединять в разряды). В
качестве меры расхождения между теоретической F(x) и эмпирической Fn(x)
функциями распределения непрерывной случайной величины Х используется
модуль максимальной разности
145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
d n = max F ( x ) - Fn ( x ) .
А.Н.
Колмогоров доказал,
что какова бы
(8.6)
ни была
функция
распределения F(x) величины Х при неограниченном увеличении количества
наблюденийп
функцияраспределения
случайной
величины
dn n
асимптотически приближается к функциираспределения
) å (- 1)k exp(- 2k 2l2 ).
(
K (l ) = P d n n < l =
¥
(8.7)
k = -¥
Иначе говоря, критерий А.Н. Колмогорова характеризует вероятность
того, что величина d n n не будет превосходить параметр 1 для любой
теоретической функции распределения. Уровень значимостиα выбирается из
условия
(
)
P d n n > l = a = 1 - K (l ) ,
(8.8)
в силу предположения, что почти невозможно получить это равенство, когда
существует соответствие между функциями F(x) и Fn(x). Критерий
А.Н. Колмогорова позволяет проверить согласованность распределений по
малым выборкам, он проще критерия хи-квадрат, поэтому его часто
применяют на практике. Но требуется учитывать два обстоятельства:
- в соответствии с условиями его применения необходимо пользоваться
следующим соотношением:
(
)
d n = max d n+ , d n- ,
где
j
j -1
- F ( x ) d n- = max F ( x ) .
1£ j £ n n
1£ j £ n
n
d n+ = max
146
(8.9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- условия применения критерия предусматривают, что теоретическая
функция распределения известна полностью – известны вид функции и
значения ее параметров. На практике параметры обычно неизвестны и
оцениваются по ЭД. Но критерий не учитывает уменьшение числа степеней
свободы при оценке параметров распределения по исходной выборке. Это
приводит к завышению значения вероятности соблюдения нулевой гипотезы,
т.е. повышается риск принять в качестве правдоподобной гипотезу, которая
плохо согласуется с ЭД (повышается вероятность совершить ошибку второго
рода).
В качестве меры противодействия такому выводу следует увеличить
уровень значимости α, приняв его равным 0,1 – 0,2, что приведет к
уменьшению зоны допустимых отклонений.
Пример применения критерия А.Н. Колмогорова представлен в
приложении Б, пример Б.5.
8.5.3 Критерий Р. Мизеса
В качестве меры различия теоретической функции распределения F(х) и
эмпирической Fn(x) по критерию Мизеса (критерию - ω2) выступает средний
квадрат отклонений по всем значениям аргумента х
wn2
=
+¥
ò [Fn (x ) - F (x)]
2
dF ( x )
(8.10)
-¥
Статистика критерия
nw n2
n
1
i - 0.5 ù
é
=
+ å ê F ( xi ) 12n i =1 ë
n úû
147
2
(8.11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При
неограниченном
увеличении
n
существует
предельное
распределение статистики nwn2 . Задав значение вероятностиα можно
определить критические значения nw n2 (a ) . Проверка гипотезы о законе
распределения
осуществляется обычным
образом: если
фактическое
значение nwn2 окажется больше критического или равно ему, то согласно
критерию Мизеса с уровнем значимости а гипотеза Н0 о том, что закон
распределения генеральной совокупности соответствует F(x), должна быть
отвергнута.
Пример проверки гипотезы с помощью критерия Мизеса представлен в
приложении Б, пример Б.6
Достоинством критерия Мизеса является быстрая сходимость к
предельному закону, для этого достаточно не менее 40 наблюдений в области
часто используемых на практике больших значений nw n2 (а не несколько сот,
как для критерия хи- квадрат).
Сопоставляя возможности различных критериев, необходимо отметить
следующие особенности:
•
Критерий Пирсона устойчив к отдельным случайным ошибкам в
ЭД. Однако его применение требует группирования данных по интервалам,
выбор которых относительно произволен и подвержен противоречивым
рекомендациям.
•
Критерий Колмогорова слабо чувствителен к виду закона
распределения и подвержен влиянию помех в исходной выборке, но прост в
применении.
•
Критерий Мизеса имеет ряд общих свойств с критерием
Колмогорова: оба основаны непосредственно на результатах наблюдения и не
требуют построения статистического ряда, что повышает объективность
выводов; оба не учитывают уменьшение числа степеней свободы при
определении параметров распределения по выборке, а это ведет к риску
148
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
принятия ошибочной гипотезы. Их предпочтительно применять в тех случаях,
когда параметры закона распределения известны априори, например, при
проверке датчиков случайных чисел.
При проверке гипотез о законе распределения следует помнить, что
слишком хорошее совпадение с выбранным законом распределения может
быть обусловлено некачественным экспериментом («подчистка» ЭД) или
предвзятой предварительной обработкой результатов (некоторые результаты
отбрасываются или округляются).
Выбор критерия проверки гипотезы относительно произволен. Разные
критерии могут давать различные выводы о справедливости гипотезы,
окончательное
заключение
в таком
случае
принимается
на
основе
неформальных соображений. Точно также нет однозначных рекомендаций по
выбору уровня значимости.
Рассмотренный подход к проверке гипотез, основанный на применении
специальных таблиц критических точек распределения, сложился в эпоху
"ручной" обработки ЭД, когда наличие таких таблиц существенно снижало
трудоемкость вычислений. В настоящее время математические пакеты
включают процедуры вычисления стандартных функций распределений, что
позволяет отказаться от использования таблиц, но может потребовать
изменения правил проверки.
149
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
9 Методы оценки параметров распределения
9.1 Точечная оценка параметров распределения.Сущность задачи
точечного оценивания параметров
Точечная оценка предполагает нахождение единственной числовой
величины, которая и принимается за значение параметра. Такую оценку
целесообразно определять в тех случаях, когда объем ЭД достаточно велик.
Причем не существует единого понятия о достаточном объеме ЭД, его
значение зависит от вида оцениваемого параметра (к этому вопросу вернёмся
при изучении методов интервальной оценки параметров, а предварительно
будем считать достаточной выборку, содержащую не менее чем 10 значений).
При малом объеме ЭД точечные оценки могут значительно отличаться от
истинных
значений
параметров,
что
делает
их
непригодными
для
использования.
Задача точечной оценки параметров в типовом варианте постановки
состоит в следующем:
Имеется выборка наблюдений (x1, x2, ..., xn) за случайной величиной Х.
Выборка должна быть представительной. Объем выборкип фиксирован.
Известен вид закона распределения величины Х, например, в форме плотности
распределения f(T, x), где T – неизвестный (в общем случае векторный)
параметр распределения. Параметр является неслучайной величиной.
Требуется найти оценку θ параметра T закона распределения.
Существует несколько методов решения задачи точечной оценки
параметров, самыми распространёнными из которых являются методы
максимального (наибольшего) правдоподобия, моментов и квантилей.
150
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
9.1.1 Метод максимального правдоподобия
Метод был предложен Р. Фишером в 1912 г. Метод основан на
исследовании вероятности получения выборки наблюдений (x1, x2, .... xn) за
некоторым количественным признаком Х. Значения выборки случайные,
поэтому будем рассматривать их как независимые случайные величины
X1, X2, ... Xn, имеющие одинаковые распределения. Если количественный
признак Х непрерывный, то случайные величины X1, X2, ... Xn имеют
одинаковые плотности распределения вероятностей, зависящихот х и от
вектора параметров распределения q = (q1 ,q 2 ,...q n ) , т.е. плотности f (x, q ) .
Суть метода максимального правдоподобия заключается в свойстве
случайной величины реализовывать в эксперименте в основном те свои
значения x1, x2, .... xn, вероятность которых максимальна. В этом случае
совместная плотность распределения вероятностей f(x1, x2, ... xn,q ) случайных
величин X1, X2, ... Xn должна быть максимальной для непрерывного признака
или совместное распределение вероятностей P(X1=x1, X2=x2, ... Xn=xn)
случайных величин X1, X2, ... Xn должно быть максимальным для дискретного
признака.
Ввиду независимости случайных величин X1, X2, ... Xn их совместная
плотность
распределения
будет
равна
произведению
плотностей
распределения, т.е.
f (x1 , x 2 ,...x n ,q ) = f (x1 ,q ) × f (x 2 ,q ) × ... × f (x n ,q ),
а совместная вероятность равна произведению вероятностей событий
P ( X 1 = x1 , X 2 = x 2 ,... X n , q ) = p x1 (q ) × ... × p x n (q ) .
151
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Функцией правдоподобия L(x1, x2, ... xn,q ) называется функция, которая
в случае непрерывного количественного признака определяется по формулам:
для непрерывного признака -
L (x1 , x 2 ,...xn ,q ) = f (x1 ,q ) × f (x2 ,q ) × ... × f (xn ,q ) ,
для дискретного признака -
P (x1 , = x2 ,...x n , q ) = p x1 (q ) × ... × p x n (q ).
В качестве оценки q1...q n неизвестных параметров распределения
q1...q n берут те значения, при которых функция правдоподобия достигает
максимума.
Технически
задача
поиска
максимального
значения
функции
правдоподобия облегчается, если рассмотреть не саму функцию, а
натуральный логарифм от неё, т.е. функцию ln L(x1 , x2 ,...xn ,q ) . За оценки
неизвестного
вектора
параметровв
берётсярешение q1...q n уравнения
правдоподобия
¶ ln L(x1 , x2 ,...xn ,q )
= 0 k= 1, n .
¶q k
Для проверки того, что точка оптимума соответствует максимуму
функции правдоподобия, необходимо найти вторую производную от этой
функции. И если вторая производная в точке оптимума отрицательна, то
найденные значения параметров максимизируют функцию.
Таким образом, нахождение оценок максимального правдоподобия
включает следующие этапы: построение функции правдоподобия (ее
натурального
логарифма); дифференцирование
функции
по искомым
параметрам и составление системы уравнений; решение системы уравнений
152
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
для нахождения оценок; определение второй производной функции, проверку
ее знака в точке оптимума первой производной и формирование выводов.
Пример применения метода максимального правдоподобия приведён в
приложении Б, пример Б.7.
Метод
максимального
правдоподобия
позволяет
получить
состоятельные, эффективные (если таковые существуют, то полученное
решение даст эффективные оценки), достаточные, асимптотически нормально
распределенные оценки. Этот метод может давать как смещенные, так и
несмещенные оценки. Смещение удается устранить введением поправок.
Метод особенно полезен при малых выборках. Если функция максимального
правдоподобия имеет несколько максимумов, то из них выбирают
глобальный.
9.1.2 Метод моментов
Метод предложен К. Пирсоном в 1894 г.
Будем
считать,
что
вид
функции
распределения
изучаемого
количественного признака известен, но параметры этого распределения
неизвестны. Нужно оценить эти параметры по выборке. Сущность метода
моментов заключается в том, что по конкретной выборке x1, x2, ...., xп
генеральной совокупности Х, распределение которой известно с точностью
до
параметров q1...q m выбирается
столько
эмпирическихмоментов,
сколько требуется оценить неизвестных параметров распределения.
Желательно применять моменты младших порядков, так как
погрешности вычисления оценок резко возрастают с увеличением порядка
момента. Вычисленные по ЭД оценки моментов приравниваются к
теоретическим моментам; параметры распределения определяются через
моменты, и составляются уравнения, выражающие зависимость параметров от
моментов, в результате получается система уравнений. Решение этой системы
дает оценки параметров распределения генеральной совокупности.
Пример метода моментов представлен в приложении Б, пример Б.8.
153
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
9.2 Интервальная оценка параметров распределения
9.2.1 Сущность задачи интервального оценивания параметров
Интервальный метод оценивания параметров распределения случайных
величин заключается в определении интервала (а не единичного значения), в
котором с заданной степенью достоверности будет заключено значение
оцениваемого параметра. Интервальная оценка характеризуется двумя
числами – концами интервала, внутри которого предположительно находится
истинное значение параметра. Иначе говоря, вместо отдельной точки для
оцениваемого параметра можно установить интервал значений, одна из точек
которого является своего рода "лучшей" оценкой. Интервальные оценки
являются более полными и надежными по сравнению с точечными, они
применяются как для больших, так и для малых выборок. Совокупность
методов определения промежутка, в котором лежит значение параметра Т,
получила название методов интервального оценивания. К их числу
принадлежит метод Неймана.
Постановка задачи интервальной оценки параметров заключается в
следующем: Имеется выборка наблюдений x1, x2, .... xn за случайной величиной
Х.
Объем
выборкип фиксирован. Предположим, что статистическая
~
характеристика q , рассчитанная по данным выборки, является выборочной
оценкой неизвестного параметра q генеральной совокупности, причём q - это
~
постоянное число. Оценка q характеризует параметр q тем точнее, чем
~
меньше абсолютная величина разности q - q .
~
~
Если q - q < d , где d > 0 , то число d называется точностью оценки q .
~
утверждать, что оценка q абсолютно удовлетворяет
~
неравенству q - q < d . Однако можно задать вероятность γ, с которой это
Нельзя
неравенство осуществляется.
154
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
~
Надёжность или доверительная вероятность оценки q - это вероятность
~
γ, с которой осуществляется неравенство q - q < d .
Принято надёжность оценки задавать перед процессом оценивания
параметра генеральной совокупности. В качестве вероятности γ берут число,
близкое к 1 (от 0,95 до 0,999).
~
~
Пусть P q - q < d = g . Если неравенство q - q < d заменить равносильным
(
)
ему двойным неравенством:
~
~
~
- d < q - q < d , или q - d < q < q + d ,
(
)
~
~
то получим: P q - d < q + d = g .
Вероятностный смысл данного отношения таков: вероятность того, что
~
~
~
интервал q - d ;q + d покрывает неизвестный параметр q , равна γ.
~
~
Интервал q - d ;q + d , который покрывает оцениваемый неизвестный
~
параметр q , с заданной вероятностьюγ называется доверительным интервалом.
~
~
Границы q - d и q + d называются доверительными границами
(
(
)
)
интервала. Они определяются на основе выборочных данных и являются
функциями от случайных величин X1, X2, ... Xn, и, следовательно, сами
являются случайными величинами.
9.2.2 Общий метод построения доверительных интервалов.
Доверительный интервал для оценки математического ожидания
нормального
распределения
при
известном
среднем
квадратичном
отклонении
Будем
считать,
что
количественный
признак
Х
генеральной
совокупности подчиняется нормальному закону распределения с параметрами
α и σ. Среднее квадратичное данного распределения σ считается известным.
Нужно оценить неизвестное математическое ожидание α генеральной
155
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
совокупности по выборочной средней x , т.е. необходимо определить
доверительный интервал, который покрывает параметр α с заданной
надёжностью γ.
Имеет место следующее утверждение: если случайная величина Х
подчиняется нормальному закону распределения, то выборочная средняя X ,
найденная по независимым наблюдениям, также подчиняется нормальному
закону распределения с параметрами:
M (X ) = a ; s (X ) =
s
.
n
Для того, чтобы определить доверительный интервал, необходимо,
(
)
чтобы выполнялось равенство P X - a < d = g .
Для нормально распределённой случайной величины Х имеет место
равенство:
æ d ö
P X - a < d = 2Ф ç
÷.
è s (X ) ø
(
)
X имеет нормальное распределение s ( X ) =
s
. Поэтому
n
æd n ö
d n
÷÷ = 2Ф(t ) , t =
P X - a < d = 2Фçç
.
s
è s ø
(
Из равенства t =
)
d n
s
выразим d = t
и получим:
s
n
s ö
æ
Pç X - a < t
÷ = 2Ф (t ) .
nø
è
156
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Так как вероятность Р задана и равна γ, окончательно получаем:
s
s ö
æ
Pç x - t
<a < x + t
÷ = 2Ф(t ) = g
n
nø
è
Таким образом, с доверительной вероятностьюγ можно утверждать, что
s
s ö
æ
<a < x + t
доверительный интервал ç x - t
÷ покрывает неизвестный
n
nø
è
параметр α сточностью d = t
s
.
n
x - находим по данным выборки, п – это объём выборки, σ – величина,
известная заранее.
g
. По таблице
2
функции Лапласа (приложение Г) определяется для заданной доверительной
Число tнаходится из равенства 2Ф(t ) = g , или 2Ф(t ) =
вероятности γ величина t и затем находится величина δ.
9.3 Методика Вальда проверки гипотезы о свойствах случайной
величины
Рассматривается следующая задача: имеются экспериментальные
данные о некоторой случайной величине ξ; известно аналитическое
выражение для плотности распределения этой случайной величины –
некоторое выражение f (x,q ) , где х - аргумент, а q - некоторый параметр,
принимающий одно из двух возможных значений - q = q1 или q = q 2 ,
причем q1 < q 2 . Какое именно из этих двух значений принимаетпараметр
в, - неизвестно. Именно это и надо определить по значениям случайной
величины ξ, которые можно разыгрывать неограниченно много.
Примером такой плотности может служить плотность нормального
распределения:
157
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
f ( x ,q ) =
1
e
s 2p
-
( x -q ) 2
2s 2
,
где, кроме параметра q , участвует так же еще один параметр - σ. Опишем
методику Вальда решения поставленной задачи. Фиксируем достаточно
малые числа a и b , например a , b Î (0,1) ; фиксируем, далее, числа
A=
1- b
b
, B=
a
1-a
при достаточно малых a , b между числами A, B имеет место неравенство:
B<A – именно для этого неравенства должны быть достаточно малы числа
a, b.
Пусть, далее, ξ1, ξ2, …,ξk,… - значения случайной величины ξ,
получаемыеэкспериментально. Построим суммы:
t
L t = å ln
i =1
f (x i ,q 2 )
.
f (x i ,q1 )
Основная теорема Вальда: если L t > ln A , то q = q 2 с вероятностью
ошибки b ; если же L t < ln B , то q = q1 с вероятностью ошибки a .
Принято рассматривать в описанной ситуации две величины – п и Δgt,
определяемые так:
минимальное значение t, при котором выполняется одно из неравенств -
L t > ln A или L t < ln B - является случайной величиной, зависящей от той или
инойреализации случайной величины ξ1, ξ2, …,ξk,…; именно это минимальное
значение t и является случайной величинойп ;
учитывая смысл только что введенного обозначенияп , введем величину
158
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
f (x i , q 2 )
1 t
Dg t = å ln
;
n i =1 f (x i , q1 )
очевидно, и эта величина – также случайная. На практике часто имеют смысл
математические ожидания последних двух случайных величин; их находят
как обычные средние арифметические значения реализаций этих величин,
конструируемых по различным реализациям ξ1, ξ2, …,ξk,…
159
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10 Интервальные оценки при экспоненциальном законе
распределения
В качестве примера рассмотрим определение интервальных оценок для
показателей надёжности. Вероятность безотказной работы определяется
формулой
1
T = mt .
T
P (t ) = e - lt l =
Доверительный интервал для средней наработки до отказа Т при равных
вероятностях
a
выхода за правую и левую границы
2
2Tå r
ca2 2
где ca2 2 , c12-a
2
<T <
2Tå r
c12- a
,
2
находятся по таблице при числе степеней свободы k = 2r, где r
число зарегистрированных отказов, для соответствующих вероятностей.
Когда вычисляется только нижняя граница,
T>
2Tå r
ca2
.
Если k > 100, то доверительный интервал вычисляется по формулам для
нормального усечённого распределения.
Для вероятности безотказной работы двухсторонний доверительный
интервал вычисляется по формуле:
160
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
é c12- a 2 ti ù
é c a2 2 ti ù
exp ê ú.
ú < P (ti ) < exp ê
êë 2Tå r úû
êë 2Tå r úû
В случае односторонней границы -
é c a2 ti ù
P(ti ) > exp ê ú.
2
T
å r ûú
ëê
10.1 Планирование испытаний и обработка экспериментальных
данных
В соответствии с требованиями ГОСТ 27.002-83 планирование
испытаний предусматривает ряд предварительных условий, обеспечивающих
эффективность испытаний. Вводятся условные обозначения различных
планов в виде совокупности трех символов, первый из которых указывает
число испытываемых объектов (устройств) N, второй – наличие (R) или
отсутствие (U) замены (восстановления) объектов, отказавших во время
испытаний, третий - длительность испытаний (r или Т). Таким образом, для
испытаний N объектов без замены отказавших элементов, имеем следующие
три плана:
- (N, U, r) – испытания до r-го отказа, r<N;
- (N, U, T) – испытания длительностью Т;
- [N,U,(r, T)] – испытание длительностью, равнойmin (tr или T), где
tr - момент r-го отказа, а Т - заведомо заданный ресурс (время, или величина
пробега, или число циклов и т.д.)
Аналогично
вводятся
обозначения
для
планов
с
заменой
(восстановлением) отказавших устройств: (N, R,r); (N, R,T); [N, R, (r,T)]. В
плане (N, R, r) в отличие от (N, U, r) число r может быть больше, чем N (где, в
частности, допустимо N = 1). Здесь, приведено 6 наиболее распространенных
типов испытаний. ГОСТ 27.001-83 предусматривает 16 планов испытаний, где
161
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
учтены кроме названных условий и такие как M – восстановление объектов
при испытаниях в случае их отказов; S – решение об окончании испытаний (о
приемке или браковке) восстанавливаемых объектов (основывается на
суммарном времени испытаний) (таблица 10.1).
Таблица 10.1 – Выбор плана испытаний
План испытаний
Суммарная наработка Tå r , ч
(NUr)
Tå r = å t j + ( N - r ) × t r
r
j =1
r
Tå r = å t j + ( N - r ) × T
(NUT)
j =1
r
при tr<T, Tå r = å t j + ( N - r ) × t r ;
j =1
NU(rT)
r
при tr≥ T, Tå r = å t j + ( N - r ) × T
j =1
(NRr)
Tå r = Nt r
(NRT)
Tå r = NT
при tr< T, Tå r = Nt r ;
NR(rT)
при tr> T, Tå r = NT
Результаты статистической обработки испытаний существенно зависят
от
вероятностных
моделей,
то
есть
от
априорных
(теоретических)
распределений интервалов безотказной работы и восстановлений. Эти
результаты могут приводить к заведомо ошибочным выводам, если модель не
отражает
реальные
процессы
возникновения
отказов
и
механизмы
восстановления. Поэтому до решения основных задач апостериорного (на
основе опыта) анализа надежности целесообразно сначала проверить, с
помощью статистического критерия согласия, на соответствие выбранного
162
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
априорного распределения эмпирическому распределению, построенному на
основании данных проведенных испытаний.
Исходными данными (случайными величинами), которые подвергаются
обработке, являются время наработки на отказ, время наработки на
восстановление и число отказов однотипных элементов. После того, как такой
материал собран, его обработка позволяет установить законы распределения
показателей надежности: вероятность безотказной работы, интенсивность
отказов, среднее время наработки на отказ и др.
Знание законов распределения дает возможность определить все
остальные количественные показатели надежности. Таким образом, основная
задача статистической обработки состоит в определении одного из законов
распределения исходных экспериментальных величин. В ряде случаев вид
закона распределения известен заранее, до опыта. Например, как уже
отмечалось выше, для электронной аппаратуры средств автоматики и
релейной защиты справедлив экспоненциальный закон распределения
показателей надежности. Это подтверждается многочисленными опытными
данными, полученными в условиях эксплуатации.
При
определении
или
подтверждении
закона
распределения
целесообразен следующий порядок: подготовка опытных данных; построение
гистограмм
оцениваемого
аппроксимация
гистограмм
количественного
теоретическим
показателя
законом
надежности;
распределения
и
определение его параметров; проверка допустимости предполагаемого закона
распределения на основе использования критериев согласия. Наиболее часто
используется критерий χ2 или критерий Колмогорова. Для получения
достаточно точных результатов число наблюдений случайной величины
(отказов) должно быть не менее 40 – 50.
10.2 Интервальная оценка показателей надежности
Количество
полученных
в
статистических
процессе
данных
эксплуатации,
163
для
оценки
надежности,
принципиально
ограничено.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Полученные по ограниченному объему информации точечные оценки могут
оказаться весьма приблизительными. Причем отклонения этих оценок от
истинного
значения
оцениваемого
параметра
являются
величинами
случайными. Очевидно, что с увеличением числа наблюдений (отказов)
случайная ошибка оценки показателей уменьшается. На основе опытных
данных используется специальная методика оценки показателей надежности в
определенном интервале возможных их значений. Предположим, что
истинное значение средней наработки до отказа составляет Т0, а средняя
наработка до отказа определена по полученным отказам:
1 n
T = å ti ,
n i =1
Ù
гдеп– количество отказов за время испытаний, ti - наработка до i-го отказа. Чем
Ù
меньше п тем больше расхождение между T0 и T , то есть существует интервал
расхождения. Найти точные границы, в пределах которых находится истинное
значение искомой величины, не представляется возможным. Однако можно
определить интервал ее возможных значений с некоторой доверительной
вероятностью β. При этом, чем больше доверительная вероятность β, тем шире
границы интервала и наоборот. В общем виде, эта зависимость имеет запись
b = P (Tн £ T0 £ Tв ) ,
(10.1)
где Тн и Тв - соответственно нижняя и верхняя границы средней
Ù
наработки до отказа, где лежат T и Т0.
Вероятность того, что значение Т0 выйдет за заданный интервал
называется уровнем значимости:
a = P (Tн £ T0 £ Tв ) = 1 - b .
164
(10.2)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Значения доверительных вероятностей β обычно принимают равными
0,9; 0,95; 0,99. Соответствующие им уровни значимости составят 0,1; 0,05;
0,01. Доверительная вероятность β, определяемая выражением (10.1),
характеризует степень достоверности результатов двусторонней (то есть с
определением верхней и нижней границ) оценки.
Доверительный интервал для средней наработки до отказа при равных
a
выхода заправую (верхнюю) и левую (нижнюю) границы для
2
экспоненциального распределения определяется по выражению
вероятностях
2T r Ù
2T r
å
Tн = 2 < T < 2 å = Tв ,
ca
c a
2
где c a2
2
,2 r
иc2 a
1- , 2r
2
(10.3)
1- ,2 r
2
,2 r
- значения χ2 (хи-квадрат) при параметрах
a
a
и 1 - ; 2r = k–
2
2
a
a
и P = 1 - соответственно.
2
2
Когда вычисляется только нижняя граница, то
числостепеней свободы, для вероятностей P =
2T r
T > 2å
ca ,2 r в
Ù
(10.4)
В выражениях (10.3) и (10.4) Tå r – суммарная наработка до отказа по
отказам, зафиксированным во время эксперимента. Значения c a2
2
определяются
по
таблице
квантилей
распределения
χ2
,2 r
иc2 a
1- , 2r
2
(хи-квадрат)
(приложение Д).
Таким образом, для заданных уровней значимостиα и числа степеней
свободы k по таблице находят соответствующие значения χ2, подставляют в
выражение (10.3) и находят Тн и Тв. Величина a задается в зависимости от
требований, предъявляемых к анализируемой системе.
165
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10.3 Статистические оценки генеральной совокупности. Задача об
оценке качества по выборке
Пусть X - случайная величина и ξ1,…,ξn – ее значения, совокупность
которых принято называть генеральной совокупностью. Напомним две основные
статистические оценки генеральной совокупности: математическое ожидание число M x =
1 n
1 n
=
x
,
и
дисперсия
–
число
(x i - M x )2 .
D
å
å
i
x
n i =1
n i =1
Часто вместо символов Mξ, Dξ пишут M(ξ), D(ξ); кроме того, во многих
случаях применяетсяобозначение σ(ξ) для числа
Dx .
Если наряду со случайной величиной ξ имеется вторая случайная
величина η и набор ее значений того же объема – η1, …, ηn, то рассматривают
корреляционный момент пары случайныхвеличин ξ, η – число
kxh
1 n
= å (x i - M (x ))(h i - M (h )) ,
n i =1
а также коэффициент корреляции:
rxh =
kxh
s (x )s (h )
.
Если о паре случайных величин ξ,η известно, что между ними
существует некоторая зависимость η = η(ξ), то имеется методика
приближенного
отыскания
этой
зависимости,
основаннаяна
методе
наименьших квадратов. Если требуется среди многочленов степени, не
превосходящей некоторого m, найти тот, который имитирует эту зависимость
лучше всего, то достаточно решить несложную систему линейных
алгебраических уравнений и при m<п получить определенныймногочлен
Q(X) = q0 + q1x + ... + qmxm; доказывается, что при наличии зависимости
η = η(ξ) дисперсия D(η) не превосходит числа
166
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
1
= å (h i - Q (x ))2 ,
n - m i =1
которое принято называть оценкой дисперсии по методу наименьших
квадратов.
Рассмотрим классическую задачу о статистической оценке качества.
Имеется партия некоторого товара (например, партия автомобилей).
Требуется оценить качество этой партии, сделав некоторую выборку из нее
(например, отобрав несколько автомобилей, оценить их и по этим оценкам
сделать выводы обо всей партии). В такой постановке речь идет об оценке
качества генеральной совокупности по выборке. Излагаемая ниже методика
решения этой задачи предложена А. Вальдом.
Введем какой-либо числовой параметр, характеризующий качество
партии. Например, если речь идет о партии автомобилей, то таким параметром
может быть доля (процент) автомобилей бракованных. Если этот параметр
меньше некоторого числа, то партия будет считаться хорошей, а если этот
параметр больше некоторого другого числа, то партия будет считаться
плохой.
Пусть α - вероятность забраковать хорошую партию (т.е. вероятность
того, что анализ выборки покажет, что партия плохая в то время, как на самом
деле, партия хорошая). Пусть N– вероятность принять плохую партию
(т.е. вероятность того, что анализ выборки покажет, что партия хорошая в то
время, как в действительности - партия плохая).
Пусть N - объем партии и п0 - объем выборки. Пусть, далее,
ν - приемочное число, а т – количество дефектных изделий в выборке, т.е. если
в выборке m≤ν, то партия принимается (или партия - хорошая), а если в
выборке т>ν, то вся партия не принимается (или партия – плохая). Наконец,
обозначим через L количество дефектных изделий во всей партии и пусть l0,l1,
l0<l1– границы контролируемого параметра L, т.е. если L≤l0, то партия –
хорошая, а если L≥l1, то партия – плохая.
167
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В этих условиях вероятности α, β можно вычислить явно с помощью
комбинаторных формул. Напишем лишь окончательный результат, используя
стандартное обозначение P(α) для вероятности наступления событияα:
a = P (M > n L = l0 ) = 1 -
b = P (M > n L = l1 ) = 1 -
Если n0 £
a @1-
где p 0 =
n
å
Clm0 C Nn0--l m
0
C Nn 0
m=0
n
C lm1 C Nn 0--l m
m=0
C Nn 0
å
1
,
.
N
, то α, β приближенно равны:
10
n
å
C nm0
m=0
p 0m
(1 - p0 )
n0 - m
, b @1-
n
å C nm p1m (1 - p1 )n
m=0
0
0
-m
,
l0
l
, p1 = 1 . Если p0, p1<0.1, то возможны дальнейшие упрощения
N
N
формул.
Числа α, β называют, соответственно, риском поставщика и риском
потребителя. При составлении плана контроля партии по выборке стремятся
так выбрать границы l0<l1, чтобы эти риски были, по возможности,
одинаковыми.
Практическое вычисление выражений типа
a =1-
n
C lm0 C Nn 0--l m
m=0
C Nn 0
å
0
, b = 1-
168
n
Clm1 C Nn 0--l m
m=0
C Nn0
å
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
требует предварительного преобразования их к виду, удобному для
реализации
вычислений
непосредственное
на
компьютере;
вычисление
без
факториалов
такой
подготовки
создает
ситуацию
«переполнения» памяти. Вот основное в этой связи наблюдение.
Выражение C nk представляет собой следующее произведение
n n -1 n - 2
n - k +1
×
×
× ... ×
.
k k -1 k - 2
1
Здесь ровно k сомножителей. Теперь рассмотрим выражение
Clm0 C Nn 0--l m
0
C Nn0
распишем его в соответствии с указанным только что правилом:
l0 l0 - 1
l - m + 1 N - l0 N - l0 - 1
N - l0 - n0 + m + 1
×
× ... × 0
×
×
× ... ×
1
1
m m -1
n0 - m n0 - m - 1
N - n0 + 1
N N -1
× ... ×
×
n0 n0 - 1
1
В знаменателе этого выражения указано n0 дробей; в числителе
количество дробей есть m + (n0 – m), то есть – их столько же, сколько в
знаменателе.
В практических задачах, связанных со статистической оценкой
генеральной совокупности, потребуется следующая справочная информация.
1 Случайная величина с равномерным распределением в интервале (a,b)
имеет плотность
169
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ì0, x < a,
ïï 1
f (x ) = í
, a £ x £ b,
b
a
ï
ïî0, x > b.
Ее математическое ожидание M =
a+b
(b - a )2 .
и ее дисперсия D =
2
12
Для имитации на компьютере случайной величины, равномерно
распределенной в интервале (0,1), в каждом языке программирования
предусмотрена специальная команда; будем условно обозначать ее RND (то
есть
символ
RND
обозначает
число
из
совокупности
равномерно
распределенных чисел в интервале (0,1)). Таким образом, для имитации чисел,
равномерно распределенных в интервале (a,b), нужно применять команду
(b – a) RND.
2 Случайная величина с экспоненциальным распределением имеет
плотность
ì0, x < 0,
f ( x ) = í - lx
île , x ³ 0.
Ее математическое ожидание M =
доказать,
что
имитация
1
1
, дисперсия D = 2 . Можно
l
l
экспоненциально
распределенной
случайной
1
величины осуществляется по схеме x = - ln (1 - RND ) .
l
3 Случайная величина с нормальным распределением имеет плотность
f (x ) =
æ ( x - a )2 ö
1
÷.
expç ç
÷
b
2
2pb
è
ø
170
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ее математическое ожидание M = a, дисперсия D =b . Можно доказать,
что
имитация
нормально
распределенной
случайной
величины
æ 12
ö
осуществляется по схеме x = b çç å RND - 6 ÷÷ + a .
è 1
ø
4 Случайная величина с логнормальным распределением имеет
плотность
æ (ln ( x ) - a )2 ö
1
÷.
f (x ) =
expç ç
÷
b
2
x 2pb
è
ø
Ее математическое ожидание M = expæç 1 b + a ö÷ , дисперсия
è2
ø
D = (exp(b + 2a ))(exp(b ) + 1) .
Для имитации логнормально-распределенной случайной величины с
параметрами a,b, указанными в вышеприведенной формуле для плотности,
следует имитировать нормально распределенную случайную величину с
математическим
ожиданием
a
и
дисперсией
b,
а
затем
взять
экспоненциальную функцию от каждого из этих чисел.
10.4 Случайные процессы как модели порождения данных.
Линейные модели случайных процессов
Существует много задач, данные для которых возникают случайно.
Например, задача о прогнозировании землетрясений опирается на данные,
собираемые специальными датчиками и рассматриваемые современной
наукой как случайные числа. При исследовании случайных данных всегда
возникает необходимость в их имитации на уровне уже распознанных
закономерностей – тогда исследования можно проводить без дальнейшего
сбора информации на уровне датчиков. В этой связи к настоящему времени
171
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сложилось несколько моделей порождения данных. Одной из таких моделей
является случайный процесс.
Случайным процессом называется функция вещественной переменной,
значениями которой являются случайные величины. Если z(t) – случайный
процесс, то аргумент t удобно рассматривать как время. Мы будем
предполагать, что для всех рассматриваемых ниже случайных процессов z(t)
при t<0 обязательно z(t) =0.
Поскольку для каждого t величина z(t) – случайная, постольку для
каждого t имеется функция (или плотность) распределения этой случайной
величины. В теории случайных процессов принято особым образом выделять
такой случайный процесс z(t), для которого каждая случайная величина z(t)
является нормально распределенной с математическим ожиданием 0 и
дисперсией 1 (для всех t>0); этот случайный процесс называется белым шумом
и всюду ниже будет обозначаться символом a(t). По традиции, аргумент
случайного процесса записывают в виде индекса, т.е. вместо z(t) пишут zt,
вместо a(t) пишут at и т.д.
Условимся, что всюду в дальнейшем время будет меняться дискретно,
только по целымчислам, т.е. t = 0,±1,±2, …
Среди случайных процессов особое место занимают процессы
линейные, которые определяются так:
случайный процессzt называется линейным, если имеет место равенство:
zt = at +π1at-1 +π2at-2 +...+ πsat-s +..., где π 1, π 2, ..., π s,...– числовая
последовательность, асуммирование в правой части последнего равенства
происходит фактически на конечном числе слагаемых, так как, напомним, для
всех рассматриваемых случайных процессов z(t) при t<0 обязательно z(t)=0.
При описании линейных случайных процессов удобно использовать
технику формальных степенных рядов по следующей схеме.
Будем обозначать символом B так называемый оператор сдвига, т.е.
символ, позволяющий формально сделать запись: zt-1=Bz.
172
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Такая запись означает, что zt -2=Bzt-1 а вместе эти две записи означают,
что zt-2 _ Bzt-1= B2zt. Продолжая этот формализм, получаем: Bzt-k=B2zt.
Поэтому выражение zt=at +π1at-1 +π2at-2 +…+ πsat-s +...переписываетсятак:
zt =at +π1Bat +π2B2at +...+πkBkat +....; последнее выражение можно переписать в
виде zt =π(B)at, где π(B) = 1 +π1B +π2B2 + ... +πkBk + ...– формальный степенной
ряд. Учитывая, что у этого формального степенного ряда свободный член
отличен от нуля, можно найти обратный к нему - такой ряд ψ(B), что ψ(B)
π(B) = 1; при этом ψ(B) будет иметь следующий вид: ψ(B) = 1 +ψ1B +ψ2B2 +..+
ψkBk + ..., где ψ1,ψ2,...,ψk,...– числовая последовательность. С помощью
последнего формального степенного ряда линейный случайный процесс
переписывается в следующем виде: zt =at–ψ1zt-1–ψ2zt-2–…–ψkzt-k–...
Таким образом, всякий линейный случайный процесс возникает по
указанному выше правилу из белого шума и может задаваться через самого
себя рекуррентно.
Остановимся
на
вопросе
компьютерной
имитации
линейного
случайного процесса. Начнем с имитации белого шума. Из математики
известно, что если взять двенадцать случайных чисел, распределенных
равномерно в интервале (0,1) –s1, ...,s12– и с их помощью построить число
æ 12 ö
s = çç å si ÷÷ - 6 , то числаσ, многократно повторенные с помощью такой
è i= 1 ø
процедуры,будут нормально распределены с математическим ожиданием 0 и
дисперсией 1.
Отсюда ясно, как осуществить имитацию белого шума: если требуется
воспроизвести значения a0,a1,...,an, то нужно построить с помощью датчика
случайных чисел, равномерно распределенных в интервале (0,1), наборы
si,1,si,2,..., si,12, i = 0,1,..., n, а затем положить
æ 12
ö
ai = çç å si , k ÷÷ - 6 , i = 0,1,..., n .
è k =1 ø
173
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Заметим,
что
если
бы
требовалось
имитировать
нормально
распределенные случайные числа, но не с нулевым математическим
ожиданием
и
единичной
дисперсией,
а
с
произвольно
заданными
математическим ожиданием m и дисперсией D, то несложное обобщение
вышеупомянутой математической теоремы привело бы нас к следующей
формуле:
ai =
æ æ 12
ö ö
D çç çç å si, k ÷÷ - 6 ÷÷ + m , i = 0,1,..., n
èè k = 1 ø ø
В случае же произвольного линейного случайного процесса zt =at +π1at-1
+π2at-2 +... + πsat-s +... последовательность действий для его имитации такова:
1) фиксируется число n, для которого будут имитироваться числа
z0, z1,..., zn;
2) формируется имитация белого шума a0,a1,...,an в соответствии
сописанным выше правилом;
3) формируются числа
z0 = a0;
z1 = a1 + π1a0;
z2 = a2 + π1a1 + π2a0;
……………………..
z2 = a2 + π1an-1 + π2a n-2 + … +πna0.
174
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часть 2 Практическая часть
11 Обработка результатов наблюдений над случайной
величиной
Цель занятия: получить навыки и умения определения числовых
характеристик
случайной
величины
с целью идентификации
закона
распределения.
Задачи:
- используя пример выполнения практической работы обработать
результаты наблюдений с целью идентификации закона распределения
(задания для выполнения практической работы представлены в таблице 11.1,
все данные необходимо изменить на величину своего варианта по списку
преподавателя);
- ответить на контрольные вопросы.
11.1 Пример выполнения практической работы
1 Формируем первичную статистическую совокупность (таблица 11.1)
Таблица 11.1 – Первичная статистическая совокупность
опыт
1
2
3
4
5
6
7
8
9
10
хi
173
180
175
178
170
181
179
175
183
182
опыт
11
12
13
14
15
16
17
18
19
20
хi
177
170
177
181
175
178
181
178
179
185
опыт
21
22
23
24
25
26
27
28
29
30
хi
180
178
181
180
171
182
183
174
180
179
опыт
31
32
33
34
35
36
37
38
39
40
хi
180
172
176
181
179
180
179
178
184
185
опыт
41
42
43
44
45
46
47
48
49
50
хi
189
187
184
186
179
188
192
179
186
190
2 Формируем упорядоченную статистическую совокупность (таблица
11.2)
175
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 11.2 – Упорядоченная статистическая совокупность
опыт
1
2
3
4
5
6
7
8
9
10
хi
170
170
171
172
173
174
175
175
175
176
опыт
11
12
13
14
15
16
17
18
19
20
хi
177
177
178
178
178
178
178
179
179
179
опыт
21
22
23
24
25
26
27
28
29
30
хi
179
179
179
179
180
180
180
180
180
180
опыт
31
32
33
34
35
36
37
38
39
40
хi
181
181
181
181
181
182
182
183
183
184
опыт
41
42
43
44
45
46
47
48
49
50
3 Находим наибольшее и наименьшее значение исходных данных
xmin=170; xmax=192
4 Определяем размах варьирования выборки
R=x
max
-x
min
= 192 - 170 = 22
5 Определяем количество интервалов группирования
K = 1 + 3,3 lg n = 1 + 3,3 lg 50 = 1 + 3,3 ´ 1,69 = 6 ,5
Принимаем К=6
6 Определяем величину интервала группирования
H=
R 22
=
= 3,6
K
6
принимаем H=4
7 Находим центр распределения выборки
176
хi
184
185
185
186
186
187
188
189
190
192
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
D=
X max + X min
2
=
170 + 192
= 181
2
8 Расчет частот, частостей, накопленных частот, накопленных
частостей, плотности распределения частот и частостей (результаты заносим в
сводную таблицу 11.3)
Таблица 11.3 – Сводная таблица
Середины
интервалов
x/
1
170-174
172
6
0,12
2
174-178
176
11
3
178-182
180
4
182-186
5
6
интервал
Границы
интервалов
Частоты Частости
Pi = ni n
ni
Накопленные
частоты – Hi
Накопленные Плотность
частости
частот
Плотность
частостей
PH = H i n
F = ni h
Fn = Pi h
6
0,12
1,5
0,03
0,22
17
0,34
2,75
0,05
20
0,4
37
0,74
5
0,1
184
8
0,16
45
0,9
2
0,04
186-190
188
4
0,08
49
0,98
1
0,02
190-194
192
1
0,02
50
1
0,25
0,005
å = 50 å = 1
Рисунок 11.1 – Гистограмма
10 Построение ломанойкумуляты (рисунок 11.2)
177
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 11.2 – Ломаная кумулята
11 Построение полигона (рисунок 11.3)
Рисунок 11.3 – Полигон
Накопленные частоты Hi
12 Построение ступенчатойкумуляты (рисунок 11.4)
60
50
40
30
20
10
0
170
172
176
180
Рисунок 11.4 – Ступенчатаякумулята
178
184
188
192
194
Середины интервалов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
13 Определение числовых характеристик эмпирического распределения
Определение математического ожидания:
_ 1 n
X = å xi = 180
n i =1
_
где X - математическое ожидание;
n - объем выборки;
xi - случайная величина.
14 Определение дисперсии – D
2
_
ö
æ
n
1
D=
å ç xi - X ÷ = 24,26
÷
n - 1 i = 1ç
ø
è
15 Определение среднего квадратического отклонения (СКО)
s = D = 4,92
16 Определение коэффициента вариации
V =
s
´ 100% = 2, 7%
Х
где s – среднее квадратическое отклонение;
_
X - математическое ожидание.
17 Определение медианы (аналитическое и графическое)
Аналитическое определение медианы:
Находим интервал, содержащий медиану, путем использования
накопленных частот H i . Медианному интервалу соответствует первая из
накопленных частот, превышающая половину всего объема совокупности.
179
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
æ 50
ö
n
4ç - 17 ÷
h( - H i (Me - 1) )
2
ø = 179,6
Me = X Me(min) + 2
= 178 + è
niMe
20
где X Me(min) - нижняя граница медианного интервала;
h - ширина интервала;
ni (Mt ) - частота медианного интервала;
H i ( Me-1)
-
накопленная
частота
интервала,
предшествующего
медианному;
n - объем выборки.
Графическое определение медианы:
Последнюю ординату кумуляты, делим пополам. Из полученной точки
восстанавливаем перпендикуляр до пересечения с кумулятой. Абсцисса точки
пересечения и дает значение медианы.
Проверка аналитического и графического метода определения медианы
Me(аналитическая ) » Me( графическая )
18 Определение моды
Находим модальный интервал, т.е. интервал, содержащий моду, по
наибольшей частоте:
Mo = X Mo(min) +
= 178 +
h(niMo - ni (Mo - 1) )
(niMo - ni
(Mo - 1)
4(20 - 11)
= 179,7
(20 -11) + (20 - 8)
180
) + (niMo - ni(Mo + 1) )
=
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где X Mo (min) - нижняя граница модального интервала;
niMo - частота модального интервала;
ni ( Mo-1) - частота интервала, предшествующего модальному;
ni ( Mo+1) - частота интервала, последующего за модальным.
19 Определение асимметрии и эксцесса
Вычисления осуществляем по способу «условного нуля», используя
вспомогательные коэффициенты ( X 0 =180 – середина интервала с максимальной
частотой). Полученные результаты заносим в таблицу 11.4.
интервал
Таблица 11.4 – Определение асимметрии и эксцесса
Границы
интервалов
1
1
2
3
4
5
6
2
170-174
174-178
178-182
182-186
186-190
190-194
Середина
Частоинтервата
ла
ni
Xi
3
6
11
20
8
4
1
50
å
4
172
176
180
184
188
192
xi| =
xi - x0
h
5
-2
-1
0
1
2
3
ni × xi|
ni × xi|2
6
-12
-11
0
8
8
3
-4
7
24
11
0
8
16
9
68
ni × x
|3
i
8
-48
-11
0
8
32
27
8
ni × x i|
4
9
96
11
0
8
64
81
260
xi| + 1
ni × ( xi| + 1) 4
10
-1
0
1
2
3
4
20 Рассчитаем вспомогательные коэффициенты:
g1 =
å (6 ) - 4
=
= -0 ,08 ;
å (3) 50
g4 =
g2 =
å (7 ) 68
=
= 1,36 ;
å (3 ) 50
å (9 ) 260
=
= 5 ,2 ;
å (3 ) 50
g3 =
å (8 ) 8
=
= 0 ,16
å (3 ) 50
å (11) 734
=
= 14 ,68
g 4/ =
50
å (3 )
Проверка:
g 4/ = 4g 1 + 6g 2 + 4g 3 + g 4 + 1 = 4 × (- 0,08 ) + 6 × 1,36 + 4 × 0,16 + 5,2 + 1 = 14,68
181
11
6
0
20
128
324
256
734
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Найдем: g12 = (- 0,08)2 = 0,0064 ; g13 = (- 0,08)3 = -0,000512 ;
g14 = (- 0,08)4 = 0,00004096
m1 = g 2 - g12 = 1,36 - 0,0064 = 1,3536 ;
m 2 = g 3 - 3g 1g 2 + 2g 13 = 0,16 - 3 × (- 0,08) × 1,36 + 2 × (- 0,000512) = 0,485376 ;
m 3 = g 4 - 4g 1g 3 + 6g 12g 2 - 3g 14 = 5,2 - 4 × (- 0,08 ) × 0,16 + 6 × 0,0064 × 1,36 - 3 × 0,00004096 = 5,25722112
Проверка:
g 4 = m3 + 4g 1m 2 + 6g 12 m1 + g 14 = 5,25722112 + 4 × (- 0,08) × 0,485376 +
+ 6 × 0,0064 × 1,3536 + 0,00004096 = 5,16
X = x0 + hg 1 = 180 + 4 × (- 0,08 ) = 179,68
S = h m1 = 4 × 1,3536 = 4,652
As =
m2
m13
=
0,4854
= 0,308
3
1,3536
m
5,257
- 3 = -0,130
Ex = 3 - 3 =
2
2
1,3536
m1
182
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Так как результат для
AS
положительный, то, следовательно,
асимметрия правосторонняя (математическое ожидание расположено правее
моды).
Так
как
эксцесс
отрицательный,
то,
следовательно,
вершина
эмпирической кривой распределения лежит выше вершины теоретической
кривой.
21 Выбор теоретического закона распределения (выбор осуществляем
по коэффициенту вариации, а также по виду полигона и гистограммы). В
нашем случае коэффициент вариации равен 2,7 %, по таблице 11.5, выбираем
нормальный закон распределения.
Таблица 11.5 – Соотношение коэффициента вариации и закона
распределения
v
Вид закона распределения
0,08-0,4
Нормальный закон
0,4-0,85
Закон Вейбулла
0,35-0,8
Логарифмический закон
0,6-1,3
Экспоненциальныйзакон
22 Расчет теоретической кривой нормального закона распределения
(таблица 11.6). Значения функции f (t ) представлены в статистических
таблицах.
183
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 11.6 – Расчет теоретической кривой нормального закона
распределения
интервал
Теоретические
Середины
интервало
в
Границы
интервало
в
|
1
частоты
Нормированно f (t ) =
×
hn
2p
е отклонение
n
=
f (t )
t
|
2
S
t
x -x
t=
×e 2
S
Вычис Округ
Частот
X| - X
ы
(X )
л.
1
1
2
3
4
5
6
2
170-174
174-178
178-182
182-186
186-190
190-194
3
172
176
180
184
188
192
4
6
11
20
8
4
1
5
-8
-4
0
4
8
12
6
-1,63
-0,82
0
0,82
1,63
2,45
7
0,1057
0,2850
0,3989
0,2850
0,1057
0,0198
.
8
4,29
11,57
16,19
11,57
4,29
0,80
9
5
11
16
12
5
1
Таблица 11.7 – Расчет теоретической кривой нормального закона
распределения
интервал
Частоты
Теоретические
Границы
интервалов
1
2
3
4
5
170-174
174-178
178-182
182-186
186-190
172
176
180
184
188
5
11
16
12
5
0,1
0,22
0,32
0,24
0,1
5
16
32
44
49
0,1
0,32
0,64
0,88
0,98
6
190-194
190
1
0,02
50
1
Середины
интервалов
(X )
|
nТ
Частости
теоретические
Накопленные
частоты
теоретические
Накопленные
частости
теоретические
23 Проверка гипотезы о соответствии эмпирического распределения
нормальному закону с использованием критерия согласия Пирсона ( c 2 ).
Вычисляем критерий Пирсона ( c 2 ):
(
K n -n
2
c = å i Ti
i = 1 nTi
где ni - эмпирические частоты;
nТi - теоретические частоты;
K – количество интервалов
Определяем число степеней свободы:
184
)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
r = K - q -1 = 6 - 2 -1 = 3
где q - число используемых параметров (для нормального закона q = 2 , так как
в нормальном законе используются два параметра – математическое ожидание
и среднее квадратическое отклонение).
Задаемся уровнем значимости a = 0,01 , и, для удобства вычислений,
расчеты приводим в таблицу 11.8.
интевал
Таблица 11.8 – Расчет критерия согласия Пирсона
Границы
интервалов
Частоты
эмпирические
ni
Частоты
теоретические
nTi
(ni - nTi )2
1
2
3
4
5
6
170-174
174-178
178-182
182-186
186-190
190-194
6
11
20
8
4
1
5
11
16
12
5
1
1
0
16
16
1
0
c2 =
Сравниваем
фактическое
значение
c2
с
(ni - nTi )2
nTi
0,2
0
1
1,3
0,2
0
2,7
табличным
c T2= 11,345 (приложение Д).
Так как 11,345 > 2,7 , то можно утверждать, что гипотеза о
принадлежности опытных данных нормальному закону распределения
принимается.
Исходя из этого, функция плотности распределения вероятностей для
нормального закона распределения будет иметь вид:
- (x - 180)2
1
f ( x) =
e 48,4
2p
185
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
11.2 Контрольные вопросы:
1. Перечислите
порядок
обработки
результатов
наблюдений
над
называют
2-х
случайной величиной.
2. Как рассчитать размах выборки?
3. Перечислите моменты первого порядка.
4. Перечислите моменты второго порядка.
5. Для чего рассчитывают коэффициент вариации?
6. Почему
нормальный
закон
распределения
параметрическим законом?
7. Перечислите параметры, характеризующие положение случайной
величины.
8. Перечислите параметры, характеризующие рассеивание случайной
величины.
9. Что такое дисперсия, СКО?
10.Чем выборка отличается от генеральной совокупности?
11.Какая выборка называется репрезентативной?
12.Как построить гистограмму?
13.Что такое частота, частость?
14.Какая бывает асимметрия?
15.Как эксцесс влияет на форму кривой распределения?
16.Перечислите наиболее распространенные законы распределения.
17.Что такое статистическая гипотеза?
18.Перечислите критерии для проверки статистических гипотез.
19.Что такое уровень значимости, критерий значимости?
186
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12 Дисперсионный анализ
Цель
работы:
получить
навыки
и
умения
применения
дисперсионногоанализа при построении однофакторного и двухфакторного
комплекса.
Задачи:
- используя пример выполнения работы, выявить влияние одного
фактора на исследуемый признак (все данные в матрице (таблица 12.1)
наблюдений изменить на величину своего варианта по списку из журнала
преподавателя);
- используя пример выполнения работы, выявить влияние
двух
факторов «А» и «В» на исследуемый признак (все данные в матрице (таблица
12.3) наблюдений изменить на величину своего варианта по списку из
журнала преподавателя);
- ответить на контрольные вопросы;
- оформить в виде отчета по практической работе.
Дисперсионный анализ – это статистический метод анализа результатов
наблюдений, зависящих от различных одновременно действующих факторов,
выбор наиболее важных факторов и оценка их влияния.
Идея дисперсионного анализа заключается в разложении общей
дисперсии случайной величины на независимые случайные слагаемые,
каждое из которых характеризует влияние того или иного фактора или их
взаимодействия. Последующее сравнение этих дисперсий позволяет оценить
существенность влияния факторов на исследуемую величину
Если исследуется влияние одного фактора на исследуемую величину, то
речь идет об однофакторном комплексе. Если
факторов – двухфакторный комплекс.
187
изучается влияние двух
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12.1 Пример выполнения практической работы(однофакторный
дисперсионный анализ)
Пусть
имеется
четыре
партии
сырья
для
текстильной
промышленности. Из каждой партии отобрано по пять образцов и проведены
испытания на определение величины разрывной нагрузки. Требуется
выяснить, существенно ли влияние различных партий сырья на величину
разрывной нагрузки.
1 Запишем матрицу наблюдений (таблица 12.1)
Таблица 12.1 – Матрица наблюдений
Разрывная нагрузка (n)
Номер
партии (m)
1
2
3
4
5
1
200
140
170
145
165
2
190
150
210
150
150
3
230
190
200
190
200
4
150
170
150
170
180
2 Находим среднее арифметическое значение по каждой строке:
X i| =
1 n
å X
ni =1 i
|
|
|
( X i| = 164; X = 170; X = 202; X = 164 )
2
3
4
3 Среднее арифметическое всей совокупности наблюдений:
188
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ö
æ m n
ç å å X ÷
ij ÷
ç
i =1 j =1
|
ø
è
X =
mn
= 175
4 Вычисляем Q1 :
K1 = m - 1 = 3
2
m
|
|
ö
æ
Q1 = n å ç X i - X ÷ = 4980
ø
i = 1è
5 Вычисляем Q2 :
K 2 = mn - n = 16
2
m n
Q2 = å å æç X ij - X i| ö÷ = 7270
ø
i = 1 j = 1è
6 Вычисляем Q :
K = mn - 1 = 19
2
m n
Q = å å æç X ij - X | ö÷ = 12250
ø
i = 1 j = 1è
7 Результаты вычислений заносим в сводную таблицу 2.2.
189
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 12.2 – Результаты однофакторного дисперсионного анализа
Компоненты
Суммы
Число степеней
Средний
квадратов
свободы
квадрат
Межгрупповая
4980
3
1660
Внутригрупповая
7270
16
454,4
Полная
12250
19
644,7
дисперсии
8 Рассчитываем F - критерий ( F = 3,65 ).
9 По таблице, представленной в приложении В, находим F - критерий
(табличный) Fa = 5,29 (α=0,01).
Так как вычисленное значение F - критерия меньше табличного
значения, то можно утверждать, что различие между сырьем в партиях не
влияет на величину разрывной нагрузки.
12.2 Пример выполнения практической работы (двухфакторный
дисперсионный анализ)
1 Запишем матрицу наблюдений (таблица12.3).
Таблица 12.3 – Матрица наблюдений
A
B
В1
В2
В3
X | i*
А1
1
2
3
2
А2
5
6
10
7
X |* j
3
4
6,5
4,5
2 Найдем Q1 , Q2 , Q3 , Q по формулам:
190
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
r
Q1 = v å æç X |i * - X | ö÷ = 3é(2 - 4,5)2 + (7 - 4,5)2 ù = 37,5
êë
úû
ø
i = 1è
2
v
Q2 = r å æç X |* j - X | ö÷ = 2 é(3 - 4,5)2 + (4 - 4,5)2 + (6 - 4,5)2 ù = 13
úû
ëê
ø
j = 1è
2
r v
Q3 = å å æç Xij - X|i * - X|* j + X| ö÷ = (1- 2 - 3 + 4,5)2 + (2 - 2 - 4 + 4,5)2 + (3 - 2 - 6,5 + 4,5)2 +
ø
i =1 j =1è
+ (5 - 7 - 3 + 4,5)2 + (6 - 7 - 4 + 4,5)2 + (10- 7 - 6,5 + 4,5)2 = 3
Q = Q1 + Q2 + Q3 = 53,5
3 Найдем дисперсии:
Q
D1 = 1 = 37,5
r -1
Q
D2 = 2 = 6,5
v -1
Q3
D3 =
= 1,5
(r - 1)(v - 1)
4 Найдем расчетное значение F – критерия:
FA =
D1
= 25
D3
FB =
D2
= 4 ,3
D3
191
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5 Табличное значение F – критерия (приложение В):
= 18,5 ; Fa ( B) = 19 .
Fa
( A)
6 Сравним табличное значение F – критерия с расчетным:
F A > Fa ( A) (фактор «А» - влияет);
FB < Fa (B) (фактор «В» - не влияет).
192
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12.3 Контрольные вопросы:
1.
Что такое дисперсионный анализ?
2.
В чем идея дисперсионного анализа?
3.
Перечислите порядок однофакторного дисперсионного анализа.
4.
Перечислите порядок двухфакторного дисперсионного анализа.
5.
Как определить степень влияния того или иного фактора?
193
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
13 Корреляционный анализ
Цель работы: получить навыки и умения измерения тесноты связи с
помощью коэффициента корреляции и корреляционного отношения.
Задачи:
- изучить теоретические аспекты корреляционного анализа;
- используя пример выполнения практической работы рассчитать
коэффициент корреляции (таблица 13.1) и корреляционное отношение
(таблица 13.2) – все значения Y изменить на величину своего варианта;
- ответить на контрольные вопросы.
13.1 Пример выполнения практической работы
1 Группируем первичные данные в виде таблицы для расчета
коэффициента корреляции (таблица13.1):
Таблица 13.1 – Данные для расчета коэффициента корреляции
Xi
Yi
XiYi
X2i
Y2i
10,0
0,70
7,000
100,00
0,4900
10,8
0,73
7,884
116,64
0,5329
11,3
0,75
8,475
127,69
0,5625
10,0
0,70
7,000
100,00
0,4900
10,1
0,65
6,565
102,01
0,4225
11,1
0,65
7,215
123,21
0,4225
11,3
0,70
7,910
127,69
0,4900
10,2
0,61
6,222
104,04
0,3721
13,5
0,70
9,450
182,25
0,4900
194
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 13.1
Xi
Yi
XiYi
X2i
Y2i
12,3
0,63
7,749
151,29
0,3969
14,5
0,70
10,150
210,25
0,4900
11,0
0,65
7,150
121,00
0,4225
12,0
0,72
8,640
144,00
0,5184
11,8
0,69
8,142
139,24
0,4761
13,4
0,78
10,452
179,56
0,6084
11,4
0,70
7,980
129,96
0,4900
12,0
0,60
7,200
144,00
0,3600
15,6
0,85
13,260
243,36
0,7225
13,0
0,80
10,400
169,00
0,6400
12,1
0,75
9,075
146,41
0,5625
å = 237,4
14,06
167,919
2861,60
9,9598
2 Определяем суммы квадратов отклонений по формулам:
(å X i ) 2
237,42
2
= 2861,60 = 43,662
DX = å X i n
20
(å Yi ) 2
14,06 2
2
DY = å Yi = 9,9598 = 0,076
n
20
3 Используя формулу определяем коэффициент корреляции:
n
å X i å Yi
237,4 ×14,06
X
Y
å i i
167,919 n
20
= i =1
=
= +0,564
r
XY
D D
43,662 × 0,076
x y
Полученная величина указывает на наличие положительной средней
силы корреляционной связи между исследуемыми признаками.
195
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4 Группируем первичные данные в виде таблицы13.2для расчета
корреляционного отношения:
Таблица 13.2 – Данные для расчета корреляционного отношения
Группа
Интервал
Xi
Yi
1
2
3
4
2,0-3,5
3,5-5,0
5,0-6,5
6,5-8,0
196
2,0
1,8
3,0
3,8
3,3
3,4
3,3
3,3
3,4
2,9
3,5
4,1
3,9
5,4
3,9
6,4
4,0
4,2
4,1
5,0
4,5
4,6
4,8
5,2
4.9
5.3
5,1
5,8
5,4
8,5
5,6
4,6
5,9
7,0
5,9
9,0
6,3
8,0
6,4
7.9
6,6
11,2
6.7
7,0
7.2
8,6
7.5
9,4
8,0
10,4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5 Находим среднее значение в каждой группе (таблица13.3)
Таблица 13.3 – Расчет среднего значения в группе
Среднее значение в
Группа
Частота
группе
1
5
3.0
2
8
5,0
3
7
7,3
4
5
9,3
6 Находим общее среднее:
n
å Yi
1,8 + 3,8 + +10,4
= 6,112
Y = i =1 =
n
25
7 Рассчитаем общую дисперсию:
n 2
å Yi
2 1,82 + 3,82 + +10,4 2
2
i
=
1
sy =
- (Y ) =
- 6,112 2 = 5,954
n
25
8 Рассчитаем межгрупповую дисперсию:
l
2
å (Yi - Y ) ´ ni
(3,0 - 6,112) 2 ´ 5 + +(9,3 - 6,112)2 ´ 5
2
i
=
1
=
= 4,69
s гр =
n
25
9 Найдем коэффициент детерминации:
197
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
s гр
4,69
2
h =
=
= 0,788 .
2
5
,
954
sy
10 Найдем эмпирическое корреляционное отношение:
h=
Таким
образом,
2
s гр
s 2y
=
рассчитанное
4,69
= 0,888
5,954
эмпирическое
корреляционное
отношение свидетельствует о достаточно высокой статистической связи
между x и y.
13.2 Контрольные вопросы:
1.
Дайте понятие статистической связи.
2.
Что такое корреляционная зависимость?
3.
Приведите примеры корреляционной зависимости.
4.
Что такое поле корреляции?
5.
Что такое корреляционный момент?
6.
Что характеризует корреляционный момент?
7.
Для чего служит коэффициент корреляции?
8.
Какие может принимать значения коэффициент корреляции?
198
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14 Регрессионный анализ (способ наименьших квадратов)
Цель работы: получить знания, навыки и умения применения «способа
наименьших квадратов» для аппроксимации опытных данных.
Задачи:
- изучить теоретические аспекты регрессионного анализа и «способа
наименьших квадратов»;
- используя пример выполнения работы, провести аппроксимацию
опытных данных (связь между переменными: линейная, множественная,
параболическая, гиперболическая);
- построить эмпирическую и теоретическую линии регрессии (все
данные Y изменить на величину своего варианта);
- ответить на контрольные вопросы.
14.1 Пример выполнения практической работы
Связь между величинами – линейная y | ( x ) = a0 + a1 x (в таблице 14.1
представлены исходные данные для расчета).
1 Система нормальных уравнений имеет вид:
ìïna0 + a1 å x = å y
í
2
ïîa0 å x + a1 å x = å yx
Таблица 14.1 – Данные для расчета линейной регрессии
y
x
X2
yx
y| (x)
4
0,5
0,25
2
4,35
6
1,5
2,25
9
5,21
5,5
2,5
6,25
13,75
6,07
199
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 14.1
y
x
X2
yx
y| (x)
7
3,5
12,25
24,5
6,93
8
4,5
20,25
36
7,79
8,5
5,5
30,25
46,75
8,65
å y = 39
å x = 18
åx
2
= 71,5
å yx = 132
Подставляем полученные суммы в систему и решаем ее:
ì6a0 + 18a1 = 39
í
î18a0 + 71,5a1 = 132
Таким образом, мы получили линейное уравнение регрессии, которое
имеет следующий вид:
y | ( x) = 3,92 + 0,86x
Строим эмпирическую и теоретическую линии регрессии (рисунок
14.1):
Рисунок 14.1 – Эмпирическая и теоретическая линии регрессии
200
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Аналогичным способом выполняем другие виды аппроксимации.
2 Расчёт эмпирического уравнения для множественной линейной
регрессии
Найти эмпирическое уравнение регрессии между значениями у, z и x.
Данные о корреляционной зависимости между этими признаками приведены в
таблице 14.2.
Предполагая линейный характер связи между этими признаками и
учитывая их буквенные обозначения, возьмем за исходное уравнение
регрессии уравнение вида:
x = a + by + cz
которому отвечает выше приведенная система нормальных уравнений.
ì an + b å x + c å z = å y
ïï
2
í a å x + b å x + c å xz = å xy
ï
ïî a å z + b å xz + c å z 2 = å yz
Необходимые суммы представлены в таблице. Подставляем их в
уравнения системы:
ì10 a + 165b + 294c = 575
ï
í165a + 2891b + 5202c = 9908
ï294a + 5202b + 9456c = 17816
î
Чтобы решить эту систему относительно параметров а, b и с, разделим
каждое уравнение на коэффициент при а, что дает:
201
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
a + 16,5000b + 29,4000 c = 57,5000
a + 17,5212b + 31,5273c = 60,0485
a + 17,6939b + 32,1633c = 60,5986
Затем, вычитая первое уравнение из второго, а второе — из третьего,
получим:
1,0212b + 2,1273c = 2,5485
0,1727b + 0,6360b = 0,5501
Разделим каждое уравнение на коэффициент при bи найдем разность
между полученными уравнениями:
b + 2,0831c = 2,4956
b + 3,6827c = 3,1853
- 1,5996c = -0,6897
Отсюда c = - 0,6897 = 0,4312. Подставляя в одно из этих уравнений
- 1,5996
вместо с его значение, находим b + 2,0831(0,4312 ) = 2,4956 , откуда
b = 2,4956 - 0,8982 = 1,5974 .
В первое (исходное) уравнение вместо b и c подставляем их значения:
10a + 165(1,5974) + 294(0,4312) = 575.
Отсюда:
a=
575 - 390,3438 184,6562
=
= 18,466.
10
10
В итоге получим:
202
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x y = 18,466 + 1,597 y + 0,431z.
Подставляя в это уравнение задаваемые значения переменных y и z,
можно определить ожидаемую величину переменной x.
Найденное эмпирическое уравнение регрессии показывает, что при
изменении x на 1 число y при постоянном z изменится в среднем на 1,60, а
число z при постоянной величине y изменится в среднем на 0,43.
Таблица 14.2 – Данные для расчета множественной линейной регрессии
x
y
z
X2
Y2
Z2
xy
yz
xz
70
18
36
4900
324
1296
1260
648
2520
60
17
29
3600
289
1020
1020
493
1740
70
22
40
4900
484
1540
1540
880
2800
46
10
12
2116
100
460
460
120
552
58
16
31
3364
256
928
928
496
1798
69
18
32
4761
324
1242
1242
576
2208
32
9
13
1024
81
288
288
117
416
62
18
35
3844
324
1116
1116
630
2170
46
15
30
2116
225
690
690
450
1380
62
22
36
3844
484
1364
1364
792
2232
å y2 =
åz2 =
å xy =
å yz =
å xz =
= 2891
= 9456
= 9908
= 5202
= 17816
å x = 575 å y = 165 å z = 294 å x 2 =
= 34469
3 Расчёт эмпирического уравнения для параболы второго порядка.
Y изменяется по X следующим образом (таблица 14.3). Из таблицы 14.3
видно, что значения зависимой переменной Y сначала возрастают, а затем
начинают убывать. Это признак параболической зависимости между переменными Y и X. Найдем эмпирическое уравнение этой зависимости.
Предварительно рассчитаем вспомогательные величины
Расчет приведен в таблице 14.3.
Составим систему нормальных уравнений:
203
å y, å yx, å yx
2
и др.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ì9a + 45b + 285c = 203,3;
ï
í45a + 285b + 2025c = 1030,0;
ï285a + 2025b + 15333c = 6439,6
î
Решая эту систему относительно коэффициентов а, b и с, находим:
а= 13,466; b = 4,587 и с = -0,436. Отсюда эмпирическое уравнение параболы
второго порядка таково:
y = 13,466 + 4,587 x - 0,436x 2 .
Таблица14.3 – Данные для расчета параболы второго порядка
x
y
xy
X2
YX2
X3
X4
y | ( x)
1
18,2
18,2
1
18,2
1
1
17,6
2
20,1
40,2
4
80,4
8
16
20,9
3
23,4
70,2
9
210,6
27
81
23,3
4
24,6
98,4
16
393,6
64
256
24,8
5
25,6
128,0
25
640,0
125
625
25,5
6
25,9
155,4
36
932,4
216
1296
25,3
7
23,6
165,2
49
1156,4
343
2401
24,2
8
22,7
181,6
64
1452,8
512
4096
22,3
9
19,2
172,8
81
1555,2
729
6561
19,4
xy
å=
å x=2
å yx=2
å x=3
å x=4
x)
å y| (=
= 2025
= 15333
å=x
45
å=y
203,3
= 1030,0
= 285
= 6439,6
= 203,3
4 Расчёт эмпирического уравнения для гиперболы первого порядка
Зависимость величины у характеризуется следующими величинами
(таблица 14.4).
Если эти данные изобразить графически в системе прямоугольных
координат, можно убедиться в том, что они выглядят в виде гиперболической
зависимости между переменными Y и X. Необходимые суммы для вычисления
параметров a и b по уравнению y = a +
Подставляя эти данные в формулы:
204
b
содержатся в таблице 4.4.
x
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
a=
y 1ö
1æ
1
ç å y å 2 - å å ÷;
Dè
x xø
x
b=
y
1æ
1ö
ç nå - å y å ÷,
Dè
x
xø
æ 1ö
D = nå 2 - ç å ÷
è xø
x
1
2
Находим:
a=
b=
33,89 ×1,272 - 1381,8 × 2,91
8 × 1,272 - (2,91)2
8 ×1381,8 - 3389 × 2,91
8 × 1,272 - (2,91)2
= 169,7 » 170;
= 698,1 » 698.
Отсюда уравнение регрессии Y по X:
y = 170 + 698 / x
Таблица 14.4 – Данные для расчета гиперболы первого порядка
1
x
y
X2
y
x
1
x
x
1,4
673
1,96
480,7
0,714
0,5102
669
2,2
489
4,84
222,3
0,454
0,2066
487
2,3
451
5,29
196,1
0,435
0,1890
473
2,6
405
6,76
155,8
0,385
0,1479
438
3,6
485
12,96
134,7
0,278
0,0772
364
4,1
330
16,81
80,5
0,244
0,0595
340
4,4
288
19,36
65,5
0,227
0,0517
329
5,8
268
33,64
46,2
0,172
0,0297
290
å y = 3389
1
2
å y = 3389 å x = 2,909 å 12 = 1,2718
x
205
y | ( x)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14.2 Контрольные вопросы:
1.
Что значит определить форму связи?
2.
Что называется кривой регрессии?
3.
Чем эмпирическая линия регрессии отличается от теоретической?
4.
Какие ученые предложили «способ наименьших квадратов»?
5.
В чем сущность «способа наименьших квадратов»?
6.
Запишите условие Лежандра.
7.
Как выглядит уравнение множественной регрессии?
8.
Как выглядит уравнение параболы второго порядка?
206
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
15 Выбор объекта исследования, параметра оптимизации,
влияющих факторов
Цель работы: Закрепление знаний, умений и навыков по выбору объекта
исследования, влияющих факторов, параметра оптимизации.
Задачи:
- ознакомиться с представленным методическим материалом;
- используя пример выполнения практической работы:
1) выбрать объект исследования («чёрный ящик»), нарисовать его
схему, описать принцип работы выбранного объекта;
2) обосновать выбор параметра оптимизации (y-отклик);
3) перечислить все влияющие факторы «х» на параметр оптимизации
«у»;
4) зарисовать модель объекта исследования в виде «чёрного ящика»;
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
15.1 Пример выполнения практической работы
В качестве объекта исследования выбираем двигатель автомобиля
(ДВС).
Как и всякий механизм, двигатель внутреннего сгорания (рисунок 15.1)
имеет достаточно много недостатков. Одним из них являются вибрации и
шум. Вибрации и шум органически присущи всем механизмам. Для снижения
передаваемых вибраций применяются различные балансиры, например,
делаются упругими и т.д. По мере износов деталей, происходящих во время
эксплуатации, изменяются и параметры работы каждого цилиндра. Износ
поршня, поршневых колец, клапанов и их седел приводит к снижению
207
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
максимального давления сжатия (компрессии). Снижение компрессии сразу
снижает мощность двигателя. Двигатель начинает неравномерно работать,
повышаются его вибрации периодического действия. В поршневых машинах
во
время
работы
достаточно
большие
массы
металла
совершают
возвратно-поступательное движение. Они вызывают возмущающие силы,
которые передаются на транспортные средства через опоры.
Увеличение зазора в паре поршень – цилиндр приводит к стукам при
перекладке поршня в верхней и нижней мертвых точках. Увеличение зазоров
во вкладышах усиливает вибрации, т. к. происходят удары вкладышей по
коленчатому валу (в первую очередь в паре шатун – кривошип).
Вибрация двигателя является вредным явлением, оказывает заметное
воздействие на ресурс двигателя и вызывает ускорение утомляемости
водителей, обслуживающего персонала и пассажиров.
Рисунок 15.1 – Двигатель внутреннего сгорания в разрезе
Для
обоснования
соответствующих
нормативов
проводится
исследование. На первом этапе этого исследования выявляются основные
технологические факторы, влияющие на вибрацию двигателя.
208
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
После изучения априорных данных (литературных источников), ранее
проведенных исследований в этой области были выбраны следующие десять
факторов, оказывающих воздействие на вибрацию двигателя – «y»:
- дисбаланс коленчатого вала в сборе – х1;
- масса шатунно-поршневой группы – х2;
- зазор коренных подшипников – х3;
- несоосность опор коренных подшипниках – х4;
- дисбаланс шкива коленчатого вала – х5;
- жесткость закрепления двигателя – х6;
- диаметральный зазор в шатунных подшипниках – х7;
- диаметральный зазор между цилиндрами и поршнями – х8;
- качество сборки (укладка вала на блок) – х9;
-
дисбаланс
распределительного
вала
в
сборе
с
шестерней
распределения – х10.
Таким образом, на основании вышесказанного, мы можем представить
объект исследования – «двигатель внутреннего сгорания» в виде «черного
ящика» (рисунок 15.2).
Х1
Х2
Х3
Х4
Х5
Х6
«Двигатель
внутреннего
сгорания»
Х7
Х8
Х9
Х10
Рисунок15.2 – ДВС как модель - «черный ящик»
209
Y
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
15.2 Контрольные вопросы:
1.
Что такое научное исследование?
2.
Перечислите этапы научного исследования.
3.
Что понимают под предметом исследования?
4.
Что такое эксперимент?
5.
Что такое планирование эксперимента?
6.
Перечислите принципы планирования эксперимента.
7.
Что понимают под моделью?
8.
Какие бывают модели?
9.
Что такое параметр оптимизации?
10.
Что из себя представляет функция отклика?
11.
Что из себя представляет план эксперимента первого порядка?
12.
Как выглядит полином первой степени?
13.
Какие требования предъявляют к параметру оптимизации?
14.
Что такое фактор?
15.
Какие требования предъявляют к факторам?
210
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
16 Априорное ранжирование факторов (психологический
эксперимент)
Цель работы: Закрепление знаний, умений и навыков по отсеиванию
факторов на основе априорного ранжирования факторов.
Задачи:
- ознакомиться с представленным методическим материалом;
- используя пример выполнения практической работы провести
априорное ранжирование факторов для двух случаев:
1) эксперты дали разные ранги факторам;
2) при ранжировании факторов есть повторы (количество экспертов в
обоих случаях принять равным 8);
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
16.1 Пример выполнения практической работы
Эксперты присвоили различные ранги факторам
1 Результаты проведения экспертного опроса представлены в таблице
16.1:
Таблица 16.1 – Матрица экспертного опроса
Эксперты
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
1
1
2
3
7
4
6
8
5
10
9
Число
повторяющ
ихся в
строке
рангов
-
2
2
3
4
5
10
1
9
6
8
7
-
211
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 16.1
Число
повторяяЭксперты
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
ющихся в
строке
рангов
3
1
2
4
8
5
3
7
6
9
10
-
4
2
4
5
9
8
3
6
10
7
1
-
5
3
2
4
6
5
9
8
1
10
7
-
1
2
3
4
5
6
7
8
9
10
11
12
6
1
2
3
4
5
9
7
10
8
6
-
7
1
2
3
4
6
10
7
9
8
5
-
8
1
2
3
7
4
9
5
8
10
6
-
å aij
12
19
29
50
47
50
57
55
70
51
-
Di
-32
-25
-15
6
3
6
13
11
26
7
-
1024
625
225
36
9
36
169
121 676
49
-
m
=j 1
( Di )
2
2 Рассчитываем среднюю сумму рангов по формуле:
k m
å å а ij
Т=
i =1 j=1
=
k
440
= 44
10
3 Находим разность между суммой рангов i-го фактора и средней суммы
рангов D i по формуле:
k
m
D i = å а ij -
m
åå а
i =1 j=1
j=1
k
ij
m
= å a ij - Т
j =1
Результаты расчета вносим в таблицу 16.1.
4 Рассчитываем сумму квадратов разности по формуле:
212
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
k
S = å (D i )2 = 1024 + 625 + 225 + 36 + 9 + 36 + 169 + 121 + 676 + 49 = 2970
i =1
Полученные данные позволяют выявить согласованность мнений
экспертов относительно степени влияния факторов на параметр оптимизации.
5 Согласованность мнений экспертов оцениваем коэффициентом
конкордации (W) по формуле:
W=
Величина
12 S
2
(
3
m k -k
коэффициента
)
=
12 × 2970
8 2 × 990
конкордации
= 0,563
существенно
больше
0,
следовательно, можно считать, что мнения экспертов согласуются, однако
значение
коэффициента
W
существенно
отличается
и
от
1,
что
свидетельствует о неодинаковом ранжировании факторов экспертами.
6 Оцениваем значимость коэффициента с помощью критерия Пирсона
c 2 . Расчетное значение критерия Пирсона определяем по формуле:
c2 =
12 S
12 × 2970
= 40,5
=
mk (k + 1) 8 × 10 × (10 + 1)
Найдем табличное значение c . При f=10-1=9, α=0,05 табличное
2
значение (таблица В.8 приложенияВ).
c 2 т = 16,92 .
2
2
Таким образом, c табл
< c расч
; 16,92<40, то можно с вероятностью 95%
можно утверждать, что коэффициент конкордации значим, его отличие от 0
существенно, поэтому мнение экспертов относительно степени влияния
факторов на параметр оптимизации согласовывается в соответствии с
коэффициентом
конкордации
W=0,563.
213
Это
позволяет
использовать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
результаты проведенного исследования и построить диаграмму рангов
(рисунок 16.1).
Рисунок 16.1 – Диаграмма рангов
Из диаграммы видно, что распределение факторов соответствует
неравномерному
факторов
экспоненциальному
можно
исключить
из
убыванию,
следовательно,
часть
последующих
экспериментов,
были
исключены факторы 9,8,7. Их влияние учитывается на шумовом поле. По
результатам априорного ранжирования были отобраны три первых фактора.
Остальные факторы при дальнейших экспериментальных исследованиях
должны оставаться постоянными, а их влияние должно учитываться
на
шумовом поле.
При ранжировании факторов есть повторы
7 Результаты проведения экспертного опроса представлены в таблице
16.2:
Таблица 16.2 – Матрица экспертного опроса
Эксперт
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
1
1
2
2
4
3
3
5
6
7
8
214
Число
повторяющихся
в строке рангов
2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 16.2
Число
Эксперт
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
повторяющихся
в строке рангов
2
1
1
3
4
2
3
6
5
8
7
2
3
1
2
4
8
5
3
8
6
7
9
1
4
2
2
5
4
6
3
5
8
7
1
2
5
3
2
4
6
5
9
8
1
10
7
-
6
1
2
3
4
5
5
5
8
7
6
1
7
1
2
3
4
4
4
5
8
7
6
1
8
1
2
3
7
4
9
5
8
10
6
-
8 Определяем стандартизированные ранги по первому эксперту.
Фактор 1 – на первом месте; факторы 2 и 3 поделили 2 и 3 место – им
приписывается стандартизированный ранг, определяемый как средняя сумма
мест с =
2+3
= 2,5 ; факторы 5 и 6 поделили 4 и 5 место, их
2
стандартизированный ранг будет равен с =
4+5
= 4,5 ; фактор 4 – на шестом
2
месте; 7 на 7 месте; 8 на 8 месте; 9 на 9 месте; 10 на 10.
9 Проверяем правильность ранжирования по формуле:
10(10 + 1)
k (k + 1) k
= å aij =
= 1 + 2,5 + 2,5 + 4,5 + 4,5 + 6 + 7 + 8 + 9 + 10
2
2
i =1
10 Определяем стандартизированные ранги по второму эксперту и т. д.
Результаты ранжирования сводим в стандартизированную матрицу (таблица
16.3).
Таблица 16.3 – Стандартизированная матрица
Экспер
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
1
1
2,5
2,5
6
4,5
4,5
7
8
9
10
2
1,5
1,5
4,5
6
3
4,5
8
7
10
9
ты
215
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 16.3
Экспер
Х1
Х2
Х3
Х4
Х5
Х6
Х7
Х8
Х9
Х10
3
1
2
4
8,5
5
3
8,5
6
7
10
4
2,5
2,5
6,5
5
8
4
6,5
10
9
1
5
3
2
4
6
5
9
8
1
10
7
6
1
2
3
4
6
6
6
10
9
8
7
1
2
3
4
4
4
7
10
9
8
8
1
2
3
7
4
9
5
8
10
6
åa
12
16,5
30,5
46,5
39,5
44
56
60
73
59
Di
-31,7
-27,2
-13,2
2,8
-4,2
0,3
12,3
16,3
29,3
15,3
1004,89
739,84
174,24
7,84
17,64
0,09
151,29
265,69
858,49
234,09
ты
m
j =1
ij
( Di )
2
11 Рассчитываем среднюю сумму рангов по формуле:
k m
å å аij
437
i =1 j =1
=
= 43,7
Т=
k
10
12 Находим разность между суммой рангов i-го фактора и средней
суммы рангов D i по формуле:
k
m
D i = å а ij -
m
åå а
i =1 j=1
j =1
k
ij
m
= å a ij - Т
j =1
Результаты расчета представлены в таблице 16.3.
13 Рассчитываем сумму квадратов разности по формуле:
k
S = å D i 2 = 3454,1
i =1
( )
216
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Полученные данные позволяют выявить согласованность мнений
экспертов относительно степени влияния факторов на параметр оптимизации.
14 Согласованность мнений экспертов оцениваем коэффициентом
конкордации (W) по формуле:
W=
Величина
12 S
m
m 2 æç k 3 - k ö÷ - m å T j
è
ø
j =1
коэффициента
=
12 × 3454,1
= 0,655
2
3
æ
ö
8 ç10 - 10 ÷ - 8 × 18
è
ø
конкордации
существенно
больше
0,
следовательно, можно считать, что мнения экспертов согласуются, однако
значение
коэффициента
W
существенно
отличается
и
от
1,
что
свидетельствует о неодинаковом ранжировании факторов экспертами.
15 Оцениваем значимость коэффициента с помощью критерия Пирсона
c 2 . Расчетное значение критерия Пирсона определяем по формуле:
c2 =
12 S
1 m
mk (k + 1) å T
k -1 j = 1 j
=
12 × 3454,1
= 53,27
1
8 ×10(10 + 1) ×18
10 - 1
Найдем табличное значение (приложение Д) c . При f=10-1=9, α=0,05
2
табличное значение
c 2 т = 16,92 .
2
2
Таким образом, c табл
< c расч
; 16,92<53,27, то можно с вероятностью
95 % можно утверждать, что коэффициент конкордации значим, его отличие
от 0 существенно, поэтому мнение экспертов относительно степени влияния
факторов на параметр оптимизации согласовывается в соответствии с
коэффициентом
конкордации
W=0,655.
Это
позволяет
использовать
результаты проведенного исследования и построить диаграмму рангов.
Диаграмма рангов строится аналогично как в предыдущем примере.
217
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
16.2 Контрольные вопросы:
1.
В чем суть экспертных оценок?
2.
В чем отличие метода «Делфи» от метода «Мозговой атаки»?
3.
Перечислите этапы метода ранжировки.
4.
Какие значения может принимать коэффициент конкордации?
5.
Перечислите этапы метода задания весовых коэффициентов.
6.
В чем суть метода последовательных и парных сравнений?
7.
Как построить диаграмму рангов?
218
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
17 Планирование полного факторного эксперимента
Цель работы: закрепление знаний, умений и навыков по планированию
полного факторного эксперимента, а также по статистической оценке
результатов экспериментов.
Задачи:
- ознакомиться с представленным методическим материалом;
- используя пример выполнения практической работы провести
статистическую оценку результатов эксперимента (объект исследования
студент выбирает самостоятельно);
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
17.1 Пример выполнения практической работы
1
По
результатам
априорного
ранжирования
факторов
было
установлено, что на вибрацию двигателя доминирующее значение оказывают
три фактора:
- Х1 – дисбаланс коленчатого вала в сборе с маховиком и сцеплением;
- Х2 – масса комплекта шатунно-поршневой группы;
- Х3 – зазор коренных подшипников.
Значения нижнего, основного и верхнего, а также интервала
варьирования представлены в таблице 17.1.
219
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица17.1 – Значения верхнего, нижнего, основного уровня и
интервал варьирования фактора
Фактор
-1
0
+1
Δ
Х1
40
120
200
80
Х2
2390
2450
2510
60
Х3
0,06
0,12
0,18
0,06
1 Линейная модель имеет вид:
y = b0 + b1 x1 + b2 x2 + b3 x3
Учитывая, что число факторов небольшое и модель линейная,
воспользуемся матрицей ПФЭ, когда факторы варьируют на двух уровнях. По
формуле, представленной ниже, определяем количество опытов:
N = 2 k = 23 = 8
Принимаем число параллельных наблюдений в каждом опыте по 3,
тогда общее число наблюдений будет 24.
2 Для каждой строки матрицы планирования по результатам 3
параллельных экспериментов находим y j среднее арифметическое значение
параметра оптимизации по формуле. Матрица планирования и результаты
проведения ПФЭ представлены в таблице17.2.
Таблица 17.2 – Матрица планирования ПФЭ
№
№
опыта реализации
опыта
1
7
2
2
3
8
Х0
Х1
Х2
Х3
Рабочая
матрица
+
+
+
+
+
+
+
-
+
+
+
200 2510 0,18
40 2510 0,18
200 2390 0,18
220
yj
s 2j
81,02
73,6
72,3
2,97
2,09
2,71
Ù
y
81,01
74,47
72,33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 17.2
№
№
опыта реализации Х0 Х1 Х2
опыта
4
3
+
5
1
+ + +
6
4
+
+
7
5
+ +
8
6
+
-
Рабочая
матрица
Х3
+
-
40
200
40
200
40
2390
2510
2510
2390
2390
yj
0,18
0,06
0,06
0,06
0,06
Ù
s 2j
66,67
1,62
84,17
2,52
78,30
1,29
75,33
1,33
68,06
1,16
Сумма: 15,69
y
65,79
84,07
77,53
75,39
68,85
2
3 Для каждой строки матрицы планирования вычисляем дисперсию s j
эксперимента по данным 3 параллельных опытов:
n
s2j = 1 å( y ju - y j )2 ,
n -1 u =1
Расчетные
значения
оценок
дисперсии
для
каждого
опыта
представлены в таблице 17.2.
2
4 Проверим однородность дисперсий s j при помощи G-критерия
(принимаем α=0,05). Так как число повторных наблюдений во всех опытах
было одинаково и равнялось 3, то для f = n - 1 = 3 - 1 = 2 и N=8, будет
выполняться следующее неравенство (приложение В):
Gp =
2
smax
2 / N s 2 = 2,97 = 0,189 < G
= smax
å j
0,05(2,8) = 0,516 .
2
2
2
15
,
69
s1 + s2 + ... + s N
j =1
Следовательно, оценки дисперсии во всех опытах однородны.
5 Определяем дисперсию воспроизводимости
1 N 2 15,69
2
sy =
= 1,96
å s =
N j =1 j
8
221
s
2
y по формуле:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6
Определяем дисперсию, связанную с ошибками в определении
коэффициентов регрессии по формуле:
s 2{bi } =
1 2 1,96
s =
= 0,082
nN y 8 × 3
{}
откуда - S bi = 0,286
7 Найдем оценки коэффициентов уравнения регрессии по формулам:
1 N
81,02 + 73 ,6 + 72 ,3 + 66 ,67 + 84 ,17 + 78 ,3 + 75 ,33 + 68 ,06
b0 =
= 74 ,93
å yj =
N j =1
8
1 N
81,02 - 73,6 + 72,3 - 66,67 + 84,17 - 78,3 + 75,33 - 68,06
= 3,27 .
b1 =
å xij y j =
8
N j =1
Таким же образом оценим коэффициенты b2 и b3:
b2 = 4,34
b3 = -1,53
8
Определяем
доверительный
интервал
для
коэффициентов
регрессии по формуле:
Dbi = ±t фs{bi } = ±2,12 × 0,286 = 0,606
9 Оценим значимость полученных коэффициентов регрессии с
использованием критерия Стъюдента (t – критерия). Расчетные значения
t-критерия определим по формулам:
222
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
t p0 =
b0
74,93
=
= 261,9
s{bi } 0,286
t p1 =
b1
3,27
=
= 11,43
s{bi } 0,286
t p2 =
b2
4,34
=
= 15,17
s{bi } 0,286
t p3 =
b3
1,53
=
= 5,34
s{bi } 0,286
Табличное значение t-критерия определяем при α=0,05 и f=16 (t=2,13).
Сравнивая расчетное значение с табличным (приложение В), можно
сказать, что все коэффициенты уравнения регрессии значимы.
Таким образом, уравнение регрессии будет иметь вид:
)
y = 74,93 + 3, 27 x 1 +4,34x 2 - 1,53x 3
9 Найдем расчетные значения параметра оптимизации используя
уравнение, с учетом условий опытов (таблица 17.2):
)
y1 = 74,93 + 3, 27 × ( +1) + 4,34 × ( +1) -1,53 × ( +1)= 81,01
)
y2 = 74,93 + 3,27 × ( -1) + 4,34 × ( +1) -1,53 × ( +1)= 74,47
)
y3 = 74,93 + 3,27 × ( +1) + 4,34 × ( -1) -1,53 × ( +1) = 72,33
223
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
)
)
)
)
)
y4 = 65,79 ; y5 = 84,07 ; y6 = 77, 53 ; y7 = 75,39 ; y8 = 68,85
10 Рассчитаем дисперсию адекватности. Для удобства расчетов
промежуточные вычисления выполняем в таблице 17.3.
Таблица17.3 – Данные для расчета дисперсии адекватности
)
)
)
Факторы
№
( y j - y j )2
yj
yj
yj-yj
опыта X0
X1
X2
X3
1
+
+
+
+
81,02
81,01
0,01
0,0001
2
+
+
+
73,6
74,47
0,87
0,7569
3
+
+
+
72,3
72,33
0,03
0,0009
4
+
+
66,67
65,79
0,88
0,7744
5
+
+
+
84,17
84,07
0,1
0,0100
6
+
+
78,3
77,53
0,77
0,5929
7
+
+
75,33
75,39
0,06
0,0036
8
+
68,06
68,85
0,79
0,6231
Сумма:
2,768
N
N
) 2
)
n å ( y j - y j )2
n å (y j - y j )
3 × 2,768
j 1
j 1
=
2= =
sад
=
= 2,076
=
N - (k +1)
f
8 - ( 3 + 1)
11
Проверим полученное уравнение на адекватность. Для этого
найдем расчетное значение критерия Фишера (F- критерий) по формуле:
2
sад
2,076
=
= 1,06 < 3,01
Fp =
2
1
,
96
sy
При уровне значимости α=0,05; f=N-(k+1)=4; f = (n – 1) N=16 –
табличное значение F-критерия равно 3,01 (приложение В).
Вывод: таким образом, полученное уравнение регрессии можно считать
адекватным с доверительной вероятностью 95 %, и, следовательно, им можно
пользоваться для прогноза уровня вибрации двигателя в зависимости от
3 факторов.
224
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
17.2 Контрольные вопросы:
1.
Как выбрать область эксперимента?
2.
Что понимают под интервалом варьирования фактора?
3.
Как выбрать интервал варьирования фактора?
4.
Как кодируют уровни факторов?
5.
Что понимают под полным факторным экспериментом (ПФЭ)?
6.
Как выглядит матрица планирования ПФЭ для двух факторов?
7.
Что понимают под числом степеней свободы в статистике?
8.
Приведите пример матрицы планирования ПФЭ для трех
факторов с эффектами взаимодействия.
9.
Как строятся матрицы планирования при увеличении числа
факторов.
10.
Что такое рандомизация и для чего она необходима?
11.
Перечислите
этапы
статистической
обработки
результатов
эксперимента при равномерном дублировании число экспериментов.
12.
Как определить коэффициенты регрессии?
13.
Как оценить значимость коэффициентов регрессии?
14.
С помощью какой гипотезы проверяют значимость полученной
модели?
15.
Как интерпретировать результаты эксперимента?
225
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
18 Планирование дробного факторного эксперимента
Цель работы: закрепление знаний, умений и навыков по планированию
дробного факторного эксперимента (ДФЭ).
Задачи:
- ознакомиться с представленным методическим материалом;
- используя
пример
выполнения
практической
работы
найти
соотношения, задающие совместные оценки;
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
18.1 Пример выполнения практической работы
1 Полуреплика 24-1 может быть задана генерирующим соотношением
x4=x1x2x3. Матрица планирования этой полуреплики представлена в таблице
18.1.
Определяющим контрастом полуреплики является соотношение:
1= x1x2x3x4.
Совместные оценки будут определяться из соотношений:
x1= x2x3x4
b1 → β1 + β234;
x2= x1x3x4
b2 → β2 + β134;
x3= x1x2x4
b3 → β3 + β124;
226
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x4= x1x2x3 b4 → β4 + β123;
x1x2=x2x4
b12 → β12 + β34;
x1x3=x3x4
b13 → β13 + β24;
x1x4=x2x3
b14 → β14 + β23.
Таблица 18.1 – Полуреплика 24-1 с определяющим контрастом 1= x1x2x3x4
Номер
эксперимента
1
2
3
4
5
6
7
8
x0
x1
x2
x3
x4
y
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
-
+
+
+
+
-
y1
y2
y3
y4
y5
y6
y7
y8
2 Полуреплика 24-1 может быть задана генерирующим соотношением
x4=x1x2.
Матрица
планирования
этой
полуреплики
представлена
в
таблице18.2. Определяющим контрастом полуреплики является соотношение
1= x1x2x4.
Совместные оценки в этом случае будут определяться из соотношений:
x1= x2x4
b1 → β1 + β24;
x2= x1x4
b2 → β2 + β14;
x3= x1x2 x3x4
b3 → β3 + β1234;
227
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x4= x1x2
b4 → β4 + β12;
x1x3=x2x3x4
b13 → β13 + β234;
x2x3=x1x3x4
b23 → β23 + β134;
x3x4=x1x2x3
b34 → β34 + β123
Таблица 18.2 – Полуреплика 24-1 с определяющим контрастом 1= x1x2x4
Номер
эксперимента
1
2
3
4
5
6
7
8
В
x0
x1
x2
x3
x4
y
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
-
+
+
+
+
y1
y2
y3
y4
y5
y6
y7
y8
более
высокого
практических
задачах
тройные
и
порядка
взаимодействия значительно чаще, чем двойные, могут быть равными нулю, и
ими обычно можно пренебречь. Полуреплика 24-1, заданная генерирующим
соотношением x4=x1x2x3, позволяет получить раздельные оценки четырех
линейных эффектов и три совместные оценки парных взаимодействий. В этом
случае раздельными оценками будут b1, b2, b3 и b4, так как тройными
взаимодействиями β234, β134, β124 и β123 вследствие их незначимости можно
пренебречь. В полуреплике, заданной генерирующим соотношением x4=x1x2,
три линейных эффекта, а именно b1, b2, b4, оказались смешанными с парными
взаимодействиями.
Разрешающая
способность
полуреплики,
заданной
генерирующим соотношением x4=x1x2x3, получилась значительно выше, чем у
полуреплики,
заданной
генерирующим
228
соотношением
x4=x1x2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следовательно,
разрешающая
способность
полуреплики
зависит
от
генерирующего соотношения, которым она задана.
3 Для оценки разрешающей способности реплик (большой дробности
(¼, ⅛ и т. д.) используют обобщающие определяющие контрасты. ¼-реплика
25-2 может быть задана следующими генерирующими соотношениями:
x4=x1x2x3, x5=x2x3. Матрица планирования этой реплики представлена в
таблице 18.3.
Определяющими контрастами реплики являются соотношения:
1= x1x2x3x4; 1= x2x3x5
Перемножив определяющие контрасты, получим третье соотношение:
1= x1x4x5
Полная характеристика разрешающей способности рассматриваемой
реплики будет определяться обобщающим определяющим контрастом,
имеющим вид:
1= x1x2x3x4= x2x3x5= x1x4x5.
Таблица 18.3 – Матрица планирования 25-2
Номер
эксперимента
1
2
3
4
5
6
7
8
x0
x1
x2
x3
x4
x5
y
+
+
+
+
+
+
+
+
+
+
+
+
-
+
+
+
+
-
+
+
+
+
+
+
+
+
+
+
+
+
-
y1
y2
y3
y4
y5
y6
y7
y8
229
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Схему смешивания оценок находим последовательным умножением
обобщающего определяющего контраста на x1,x2, x3 и т. д.:
x1= x2x3x4= x1x2x3x5= x4x5
b1 → β1 + β234 + β1235 + β45;
X2= x1x3x4= x3x5=x1x2x4x5
b2 → β2 + β134 + β35 + β1245;
X3= x1x2x4= x2x5=x1x3x4x5
b3 → β3 + β124 + β25 + β1345;
X4= x1x2x3= x2x3x4x5= x1x5b4 → β4 + β123 + β2345 + β15;
x5= x1x2x3x4x5=x2x3= x1x4b5 → β5 + β12345 + β23 + β14;
X1x2= x3x4= x1x3x5=x2x4x5b12 → β12 + β34 + β135 + β245;
X1x3= x2x4= x1x2x5=x3x4x5b13 → β13 + β24 + β125 + β345.
4 Для 1/16 реплики генерирующими соотношениями являются
соотношения:
x4= x1x2x3; x5= x1x2; x6= x1x3; x7= x2x3
Матрица планирования этой реплики представлена в таблице 8.4
Определяющими контрастами реплики будут соотношения:
1= x1x2x3x4; 1= x1x2x5; 1= x1x3x6; 1= x2x3x7.
Если попарно перемножить определяющие контрасты 1х2; 1х3; 1х4;
2х3; 2х4; 3х4, то получим соотношения:
230
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1= x3x4x5; 1= x2x4x6; 1= x1x4x7;
1= x2x3x5x6; 1= x1x3x5x7; 1= x1x2x6x7
Произведения определяющих контрастов по три: 1x2x3; 1х2х4; 2х3х4;
1х3х4 – будут равны соотношениям:
1= x1x4x5x6; 1= x2x4x5x7; 1= x5x6x7; 1= x3x4x6x7
Умножая определяющие контрасты по четыре, получим 1= x1x2x3x4x5x6x7 .
Таблица 18.4 - Матрица планирования 27-4
Номер
эксперимента
1
2
3
4
5
6
7
8
x0
x1
x2
x3
x4
x5
x6
x7
y
+
+
+
+
+
+
+
+
+
+
+
+
-
+
+
+
+
+
+
+
+
-
+
+
+
+
+
+
+
+
-
+
+
+
+
+
+
+
+
-
y1
y2
y3
y4
y5
y6
y7
y8
Чтобы полностью характеризовать разрешающую способность данной
реплики, запишем обобщающий определяющий контраст
1=x1x2x3x4=x1x2x5=x1x3x6=x2x3x7=x3x4x5=x2x4x6=x1x4x7= x2x3x5x6=
x1x3x5x7=x1x2x6x7= x1x4x5x6= x2x4x5x7= x5x6x7=x3x4x6x7= x1x2x3x4x5x6x7.
Если
эффектами
взаимодействия,
начиная
пренебречь, то коэффициенты будут оценками:
231
с
тройных,
можно
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b1 → β1 + β25 + β36 + β47;
b2 → β2 + β15 + β37 + β46;
b3 → β3 + β16 + β27 + β45;
b4 → β4 + β35 + β26 + β17;
b5 → β5 + β12 + β34 + β67;
b6 → β6 + β13 + β24 + β57;
b7 → β7 + β23 + β14 + β56.
Таким образом, получаем весьма сложную систему смешивания. Все
линейные эффекты оказались смешанными с несколькими парными
взаимодействиями, поэтому разрешающая способность этой дробной реплики
очень низкая. Пользоваться такой репликой можно лишь в том случае, если
все парные взаимодействия близки к нулю.
Выбор дробной реплики зависит от конкретной задачи. Для получения
линейной модели рекомендуют выбирать дробные реплики с возможно
большей разрешающей способностью, т. е. реплики, у которых линейные
эффекты смешаны с эффектами взаимодействия близкими к нулю. При
выборе дробной реплики важно учитывать насыщенность плана, т. е.
соотношение между числом опытов и числом коэффициентов, определяемых
по результатам этих экспериментов. Дробная реплика, полученная заменой
всех эффектов взаимодействия новыми факторами, называется насыщенной.
Применение
насыщенных
планов
требует
минимального
числа
экспериментов. Число экспериментов в матрице насыщенной дробной
реплики
равно
числу
коэффициентов
линейной
модели.
Гипотезу
адекватности модели в этом случае проверить невозможно, так как число
степеней свободы равно нулю.
Например, 1/16-реплика от полного факторного эксперимента 27
является насыщенной, так как линейная модель не содержит коэффициентов,
которые необходимо определить по результатам восьми экспериментов. При
этом не остается степеней свободы для проверки адекватности модели.
232
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Дробные реплики широко применяют при получении линейных
моделей. Эффективность применения дробных реплик зависит от удачного
выбора
системы
смешивания
линейных
эффектов
с
эффектами
взаимодействия. При построении дробных реплик используют следующее
правило: новый фактор, введенный в планирование, нужно поместить в
столбец
матрицы,
принадлежащий
взаимодействию,
которым
можно
пренебречь.
18.2 Контрольные вопросы:
1.
Для чего используют дробный факторный эксперимент (ДФЭ)?
2.
Что такое полуреплика?
3.
Какой зависимостью обозначают дробную реплику?
4.
Как получают реплики большой дробности?
5.
Какие реплики называют регулярными?
6.
Что понимают под разрешающей способностью дробной реплики?
7.
Что понимают под генерирующим соотношением?
8.
Перечислите свойства матриц ДФЭ и ПФЭ.
233
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
19
Экспериментальное
определение
экстремальных
значений
Цель
работы:
закрепление
знаний,
умений
и
навыков
по
экспериментальному определению экстремальных значений.
Задачи:
- ознакомиться с представленным методическим материалом;
- используя пример выполнения практической работы, методом крутого
восхождения (спуска) по поверхности отклика, найти оптимальные значения
факторов;
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
19.1 Пример выполнения практической работы
Рассмотрим пример расчета наискорейшего спуска при оптимизации
уровня
вибрации
двигателя
автомобиля
в
зависимости
от
трех
технологических факторов:
- Х1 – дисбаланс коленчатого вала в сборе с маховиком и сцеплением,
гс × см ;
- Х2 – масса комплекта шатунно-поршневой группы, г ;
- Х3 – зазор коренных подшипников, мм .
Линейная модель:
)
y = 74,93 + 3, 27 x1 + 4,34 x2 - 1,53x3
хорошо согласуется с опытными данными. В таблице 9.1 приведены факторы,
уровни их варьирования, матрица планирования, результаты опытов и расчет
наискорейшего спуска.
1 Рассчитаем произведение b j Dx j для трех факторов:
234
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b1Dx1 = 261, 6 ; b2 Dx2 = 260, 4 ; b3 Dx=3 -0,09
Максимальное значение:
b1Dx1 = 261, 6
(следовательно, X1 – базовый фактор).
Если теперь вычесть составляющие градиента из основных уровней
факторов, то даже в девятом опыте факторы будут иметь нереальные
значения. В связи с этим можно сделать вывод, что шаг движения по
направлению наискорейшего спуска велик. Уменьшить шаг можно, так как
умножение составляющих градиента на любое положительное число дает
точки, также лежащие на градиенте.
2 Принимаем изменение дисбаланса коленчатого вала через интервал
20 гс × см , т. е. необходимо уменьшить составляющую градиента в 13,1 раз. В
такое же число раз уменьшаем составляющие градиента по второму и
третьему факторам – формула. Так для фактора
b2 Dx 2
4,34 × 60
D
=
D
×
20
=
×
= 19,88
- X2: 2
баз b
x
3
,
27
80
×
D
×
баз
баз
b3Dx3
(-1,53) × 0,06
= 20 ×
= -0,007
- X3: D 3 = D баз ×
bбаз × Dxбаз
3,27 × 80
Округляем полученные значения (таблица 19.1, операция 9).
3 Вычитаем последовательно составляющие градиента из основного
уровня факторов. В результате этой процедуры получаем серию «мысленных
опытов» наискорейшего спуска (5 операция по таблице 19.1). Ожидаемое
значение
параметра
оптимизации
в
мысленных
опытах
оцениваем
подстановкой соответствующих значений факторов в уравнение регрессии.
235
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Перед постановкой именованные значения факторов в опытах 9-14 (таблица
19.1) преобразуем в кодированные, используя формулу:
Xi =
X i - X i0
,
ei
где i– номер фактора;
xi– натуральное значение i-го фактора;
xi0 – натуральное значение основного уровня i-го фактора;
εi – интервал варьирования i-го фактора.
4 Подставляя кодированное значение факторов для каждого опыта в
уравнение регрессии рассчитываем параметр оптимизации. Расчетные
значения параметра оптимизации могут не совпадать с экспериментально
полученными значениями, так как величины факторов в этих опытах выходят
за область эксперимента.
Таблица 19.1 – Расчет наискорейшего спуска по поверхности отклика
Исследуемые факторы
Последовательность
№
операций
yj
операций
наискорейшего
X1
X2
X3
спуска
1
2
3
4
5
6
1
Основной уровень
120
2450
0,12
Интервал
2
80
60
0,06
варьирования DX i
3
Верхний уровень
200
2510
0,18
4
Нижний уровень
40
2390
0,06
Опыты:
+
+
+
1
81,02
2
+
+
73,6
3
+
+
72,3
5
4
+
66,67
5
+
+
84,17
6
+
78,3
7
+
75,33
8
68,06
b
3,27
4,34
-1,53
6
i
bi DX i
7
261,6
260,4
-0,09
Шаг при изменении
8
20,00
19,88
-0,0069
xi на 20 гс × см
236
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 19.1
1
2
9
Округление
Мысленные
опыты:
9
10
10
11
12
13
14
3
20,00
4
19,9
5
-0,007
6
-
100
2430
0,127
77,9
80
60
40
20
0
2410
2390
2370
2350
2330
0,134
0,141
0,148
0,155
0,162
75,8
73,7
71,6
69,5
67
Таким образом, на основании проведенных расчетов и выполненных
исследований можно утверждать, что оптимальная величина уровня вибрации
двигателя составляет 67 дБ, при этом дисбаланс коленчатого вала не должен
превышать 20 гс × см , масса комплекта шатунно-поршневой группы не должна
быть более 2350 г и зазор в подшипниках – не более 0,15 мм.
19.2 Контрольные вопросы:
1.
Перечислите методы одномерной оптимизации.
2.
Перечислите экспериментальные методы многомерного поиска.
3.
В чем заключается идея метода дихотомии?
4.
В чем сущность метода Фибоначчи?
5.
В чем сущность метода золотого сечения?
6.
В чем сущность метода Гаусса-Зайделя?
7.
В чем сущность методы крутого восхождения по поверхности
отклика?
8.
В чем сущность симплекс-метода?
237
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20 Планирование эксперимента с помощью большого
комбинационного квадрата
Цель работы: получить навыки и умения планирования эксперимента с
помощью большого комбинационного квадрата (БКК).
Задачи:
- ознакомиться с представленным методическим материалом;
-
используя
пример
выполнения
лабораторной
работы
найти
эмпирическую зависимость величины «y» от четырех влияющих факторов x1,
x2, x3, x4 (при выполнении данной лабораторной работы, значения всех
влияющих факторов (x1, x2, x3, x4) изменить на свой вариант (по журналу
преподавателя);
- ответить на контрольные вопросы;
- работу оформить в виде отчета по лабораторной работе.
20.1 Пример выполнения практической работы
1
Строим рациональный план эксперимента (четыре фактора, пять
уровней) – таблица 20.1.
Таблица 20.1 – Большой комбинационный квадрат
1
1
2
3
2
4
5
1
2
3
3
4
5
1
2
3
4
4
5
1
2
3
5
4
5
1
2
3
4
X4
X3
X2
X1
1
2
3
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
22
33
21
24
20
39
26
37
28
15
34
33
30
41
32
238
49
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
X4
X3
X2
Продолжение таблицы 20.1
4
5
1
2
3
4
5
1
2
3
4
5
50
37
36
23
56
43
42
29
50
2 Производим группировку результатов опыта по значениям каждого
фактора, а также для каждого значения каждого фактора вычисляем среднее
значение исследуемой величины (таблица 20.2, таблица 20.3).
Таблица 20.2 – Группировка результатов опыта
X1
X2
1
2
3
4
1
29
15
33
24
2
23
34
42
28
3
22
43
36
32
4
26
37
20
56
5
30
21
39
50
Среднее
26
30
34
38
Таблица 20.3 – Группировка результатов опыта
X3
X4
1
2
3
4
1
22
39
34
49
2
33
26
33
50
3
24
37
30
37
4
21
28
41
36
5
20
15
32
23
Среднее
24
29
34
39
5
49
33
37
41
50
42
5
56
43
42
29
50
44
Среднее
30
32
34
36
38
Среднее
40
37
34
31
28
3 Строим графики зависимостей исследуемой величины от каждого
фактора (рисунок 20.1)
239
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
зависимость у от х3
50
40
30
20
10
0
1
2
3
4
5
Рисунок 20.1 – Графики зависимостей исследуемой величины от
каждого фактора
Так как все графики частных зависимостей величины «y» от каждого из
факторов аппроксимируются с достаточной точностью прямыми, то
зависимость величины «у» от всех факторов может быть представлена суммой
частных зависимостей.
4 Способом наименьших квадратов (метод Лежандра и Гаусса) находим
аппроксимирующие прямые.
Зависимость величины «у» от факторов х1, х2, х3, х4 может быть
выражена уравнениями прямых линий:
у=kх1+в, у=kх2+в, у=kх3+в, у=kх4+в.
Для определения параметров уравнения по «n» экспериментальным
данным составляем систему нормальных уравнений (пример приведен для
фактора x1):
240
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
n
ì n 2
ïk å x1i + bå x1i = å x1i yi
ï i =1
i =1
i =1
í n
n
ïk x + nb = y
å i
ï å 1i
i =1
î i =1
После подстановки найденных значений сумм в нормальные уравнения,
они примут вид:
ì55k + 15b = 550
í
î15k + 5b = 170
5 Решая системы уравнений, находим уравнения аппроксимирующих
прямых, так для фактора
х1 - y = 4 x1 + 22
х2 - y = 2 x2 + 28
х3 - y = 5x3 + 19
х4 - y = -3x4 + 43
6 Так как все графики аппроксимируются прямыми, то искомая
зависимость исследуемой величины от всех факторов находим в виде сумм
частных зависимостей:
y = 4 x1 + 2 x2 + 5 x3 - 3 x4 + a
7 Определяем параметр «а».
241
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Подставляя в уравнение значения факторов первого опыта и величину
«у1», полученную в этом опыте, находим значение «а1». Аналогично находим
для последующих опытов величины «а2», «а3», и т. д. Искомый параметр «а»
определяем как среднее арифметическое из величин а1, а2, а3……..,аn, где
n – число проведенных опытов.
8 Зависимость «у» от всех факторов запишем в виде уравнения:
y = 4 x1 + 2 x2 + 5 x3 - 3 x4 + 10
9 Из уравнения следует, что величина «у» возрастает с ростом значений
факторов х1, х2, х3 и уменьшается с ростом значения фактора х4.
242
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20.2 Контрольные вопросы:
1.
В чем сущность рационального планирования?
2.
Какие опыты называются параллельными?
3.
Как выглядит большой комбинационный квадрат?
4.
Как построить большой комбинационный квадрат?
5.
В чем сущность способа М. М. Протодъяконова и Р. И. Тедера?
243
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
21 Планирование эксперимента с помощью латинских
квадратов
Цель работы: получить навыки и умения планирования эксперимента с
помощью латинских квадратов.
Задачи:
- ознакомиться с представленным методическим материалом;
- используя пример выполнения практической работы построить
латинские квадраты (задание дано ниже), а также найти эмпирическую
зависимость величины «y» от четырех влияющих факторов x1, x2, x3, x4,
каждый из которых может принимать одно из пяти целочисленных значений:
1, 2, 3, 4, 5 (при выполнении данной практической работы, значения всех
откликов – «y» изменить на свой вариант (по журналу преподавателя);
- ответить на контрольные вопросы;
- работу оформить в виде отчета по практической работе.
Задание: При выполнении данной практической работы, необходимо
взять упорядоченный по столбцам квадрат (буквенный и цифровой) и
построить ортогональные ему латинские квадраты (число элементов в
квадрате 7, 8, 9).
21.1 Пример выполнения практической работы
1 Строим рациональный план эксперимента.
Воспользуемся
приведенными
квадратами (таблица 21.1).
244
выше
взаимно-ортогональными
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 21.1 – Рациональный план эксперимента
Номер
Значения уровней факторов
у
упересч.
опыта
Х1
Х2
Х3
Х4
1
1
1
1
1
4
0,2
2
2
2
2
2
20
0,5
3
3
3
3
3
54
0,9
4
4
4
4
4
112
1,4
5
5
5
5
5
200
2
6
2
3
4
5
72
1,8
7
3
4
5
1
45
0,75
8
4
5
1
2
44
0,55
9
5
1
2
3
70
0,7
10
1
2
3
4
24
1,2
11
3
5
2
4
75
1,25
12
4
1
3
5
128
1,6
13
5
2
4
1
55
0,55
14
1
3
5
2
17
0,85
15
2
4
1
3
30
0,75
16
4
2
5
3
84
1,05
17
5
3
1
4
105
1,05
18
1
4
2
5
33
1,65
19
2
5
3
1
24
0,6
20
3
1
4
2
39
0,65
21
5
4
3
2
70
0,7
22
1
5
4
3
22
1,1
23
2
1
5
4
54
1,35
24
3
2
1
5
87
1,45
25
4
3
2
1
32
0,4
245
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для определения чередования уровней первого фактора используем
таблицу 1.4, вторго фактора – таблицу 1.5, третьего фактора – таблицу 1.6,
четвертого фактора – таблицу 1.7. В таблице 21.1 представлен рациональный
план эксперимента, определяющий условия проведения каждого опыта.
2
Группируем значения «у», полученные в опытах, по значениям
факторов x1, x2 (таблица 21.2), x3 и x4 (таблица 21.3). Для каждого значения
факторов вычисляем средние значения величины «у».
Таблица 21.2– Группировка результатов опытов
X2
1
2
3
4
5
Среднее
X1
1
4
24
17
33
22
20
2
54
20
72
30
24
40
3
39
87
54
45
75
60
4
128
84
32
112
44
80
5
70
55
105
70
200
100
Среднее
59
54
56
58
73
Таблица 21.3 – Группировка результатов опытов
X4
1
2
3
4
5
Среднее
1
4
44
30
105
87
54
2
32
20
70
75
33
46
X3
3
24
70
54
24
128
60
4
55
39
22
112
72
60
5
45
17
84
54
200
80
Среднее
32
38
52
74
104
3 В системе координат, отмечая средние значения величины «у»,
соответствующие значениям x1, x2, x3, x4, строим графики (рисунок 21.1):
246
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
зависимость у от х1
зависимость у от х2
100
150
100
50
50
0
0
1
2
3
4
1
5
2
3
4
5
4
5
зависимость у от х4
150
100
50
0
1
2
3
Рисунок 21.1– Графики зависимостейфакторов «х» от средних значений
величины «y»
Из графиков видно, что наиболее точно аппроксимируется прямой
линией зависимость величины «у» от фактора x1. Следовательно, искомая
формула может быть представлена произведением зависимости «у» от x1 на
сумму частных зависимостей «у» от x2, x3 и x4.
4 Способом наименьших квадратов, находим аппроксимирующую
прямую:
у= кх1+в.
n
n
ì n 2
ïk å x1i + bå x1i = å x1i yi
ï i= 1
i= 1
i= 1
í n
n
ïk x + nb =
å yi
ï å 1i
i= 1
î i= 1
После подстановки найденных значений сумм в нормальные уравнения, они
примут вид:
247
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ì55k + 15b = 1100
í
î15k + 5b = 300
Решая системы уравнений, находим уравнение аппроксимирующей прямой:
y = 20 x1 + 0
5
Пользуясь этим уравнением, исключаем влияние фактора x1 на
величину «у» путем деления значений «у», полученных в опытах на величину
20x1. В результате находим пересчитанные значения «у», освобожденные от
влияния фактора x1. Так, например, в первом опыте значение величины «у»
равно 4, а значение фактора x1 равно 1 (таблица 21.1). Пересчитанное
значение:
y
4
=
= 0.2
20 x1 20 ´ 1
во втором опыте
y
20
=
= 0 .5
20 x1 20 ´ 2
в третьем
y
54
=
= 0.9
20x1 20 ´ 3
y
группируем по значениям
20x1
факторов x2, x3 и x4 (таблицы 21.4 - 21.5).
6
Пересчитанные значения
Таблица 21.4 – Пересчитанные значения факторов
X2
X3
1
2
3
4
5
1
0,2
1,45
1,05
0,75
0,55
2
0,7
0,5
0,4
1,65
1,25
3
1,6
1,2
0,9
0,7
0,6
4
0,65
0,55
1,8
1,4
1,1
5
1,35
1,05
0,85
0,75
2
Среднее
0,9
0,95
1,0
1,05
1,1
248
Среднее
0,8
0,9
1
1,1
1,2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 21.5 – Пересчитанные значения факторов
X4
y
20x1
Среднее
7
1
0,2
0,75
0,55
0,6
0,4
0,5
2
0,5
0,55
0,85
0,65
0,7
0,65
3
0,9
0,7
0,75
1,05
1,1
0,9
4
1,4
1,2
1,25
1,05
1,35
1,25
5
2
1,8
1,6
1,65
1,45
1,7
Строим графики зависимостей средних значений величины
y
20x1
от факторов x2, x3 и x4. (рисунок 21.2)
Рисунок 21.2 – Графики зависимостей средних значений величины
y
20x1
от факторов x2, x3 и x4
8 Полученные графики дают основание заключать, что зависимость
величины
y
от факторов x2 и x3 могут быть выражены уравнениями
20x1
прямых:
249
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y
y
= k3 x3 + b3 .
= k 2 x2 + b2 ,
20x1
20 x1
Зависимость величины
y
от фактора x4 может быть представлена
20x1
уравнением параболы:
y
= dx42 + c
20 x1
Способом наименьших квадратов определяем параметры уравнений
частных зависимостей:
y
= 0,05 x2 + 0,85
20x1
y
= 0,1x3 + 0,7
20 x1
y
= 0,05x42 + 0,45
20 x1
9
Объединяя частные зависимости, находим искомую формулу:
(
)
y = 20 x1 ´ 0,05 x2 + 0,1x3 + 0,05 x 2 4 + a .
10
Подставляя в последнее уравнение значения величины «у»,
полученные в опытах, находим, что общий постоянный член «а» в искомой
формуле равен нулю.
Искомая зависимость исследуемой величины «у» от четырех факторов
(
)
x1, x2, x3, x4 получает вид: y = x1 ´ x2 + 2 x3 + x 2 4 .
250
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
21.2 Контрольные вопросы:
1.
Что называется латинским квадратом?
2.
Какие латинские квадраты называются ортогональными друг к
другу?
3.
Сколько можно построить взаимно-ортогональных квадратов?
4.
Какой квадрат называется упорядоченным?
5.
Приведите пример упорядоченного по строкам квадрата.
6.
Приведите пример упорядоченного по столбцам квадрата.
7.
Опишите порядок построения латинских квадратов.
8.
Для чего применяют латинские квадраты в рациональном
планировании эксперимента?
251
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часть 3 Курсовая работа
22 Построение гистограммы, расчет количественных
характеристик,
проверка
гипотезы
нормальности
распределения
22.1 Плотность распределения. Гистограмма
Одним
из
способов
графического
изображения
плотности
распределения является гистограмма (столбиковая диаграмма). Это такой вид
диаграммы, который при помощи столбиков, расставленных в ряд на мелких
размерных интервалах, отражает состояние качества проверенной партии
изделий и помогает разобраться в состоянии измерений или качества изделий
в генеральной совокупности, выявить в ней положение среднего значения и
характер рассеивания.
22.2 Построение гистограммы
Рассматривая таблицу 22.1, можно понять, что одним зрительным
восприятием этих данных невозможно получить достоверную информацию о
состоянии качества изделий в генеральной совокупности (например, в партии
изделий). Отсюда следует, что эти данные необходимо упорядочить. В такой
ситуации лучше всего составлять гистограмму.
Таблица 22.1 – Коэффициенты деформации деталей в процессе
термообработки
№ детали
№
опера
ции
1
1
1
2
3
4
5
6
7
8
9
0
2
3
4
5
6
7
8
9
10
11
1.5
0.9
1.1
1.0
0.9
1.1
1.1
1.2
1.0
0.9
252
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
Продолжение таблицы 22.1
2
3
4
5
6
7
8
9
10
11
2
0.6
0.1
0.7
0.8
0.7
0.3
0.5
0.8
1.2
0.6
3
0.5
0.8
0.3
0.4
0.5
1.0
1.1
0.6
1.2
0.4
4
0.6
0.7
0.5
0.2
0.5
0.3
0.5
0.4
1.0
0.8
5
0.7
0.8
0.3
0.4
0.6
0.7
1.1
0.7
1.2
0.8
6
0.8
1.0
0.6
1.0
0.7
0.6
0.3
1.2
1.4
1.0
7
1.0
0.9
1.0
1.2
1.3
0.9
1.3
1.2
1.4
1.0
8
1.4
1.4
0.9
1.1
0.9
1.4
0.9
1.8
0.9
1.4
9
1.1
1.4
1.4
1.4
0.9
1.1
1.4
1.1
1.3
1.1
0
1.5
1.6
1.6
1.5
1.6
1.5
1.6
1.7
1.8
1.5
При
составлении
гистограммы
(рисунок
22.1)
рекомендуется
придерживаться следующего порядка:
1)
среди измеренных значений находят максимальное Xmax и
минимальное Xmin значения и определяют широту распределения по формуле
R = Xma x - Xmin. В данном случае R =1,8 – 0,1 = 1,7;
2)
определяют количество интервалов (классов) к = n = 100 = 10 ,
где n - число наблюдений;
3)
делят широту распределения R на количество интервалов к,
полученный результат округляют и принимают за широту интервала
h = R/k = 1,7/10 = 0,17 » 0,2;
4)
размечают в бланке регистрации (таблица 22.2) интервалы
варьирования, устанавливая граничные значения с конца одной из сторон, а
также вписывают значения середины интервалов;
253
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 22.2 – Бланк регистрации
интерв Интервал Значения середины
Подсчет частот
Частот
Накопленны
ы f
е частоты
ал
ы
интервалов
1
0,1-0,3
0,2
II
2
2
2
0,3-0,5
0,4
IIII III
8
10
3
0,5-0,7
0,6
IIII IIII III
13
23
4
0,7-0,9
0,8
IIII IIIIIIII
15
38
5
0,9-1,1
1,0
IIII IIIIIIIIIIII
20
58
6
1,1-1,3
1,2
IIII IIII II
17
75
7
1,3-1,5
1,4
IIII IIII III
13
88
8
1,5-1,7
1,6
IIIIIIII
9
97
9
1,7-1,9
1,8
III
3
100
5)
просматривают таблицу 22.1 по порядку от первой до последней
строчки и при чтении каждого результата соответствующую метку (черточку)
заносят в тот класс, к которому относится данное наблюдение. Каждый знак
IIII cоответствует пяти наблюдениям, поэтому подсчет частот значительно
облегчается;
6)
по оси абсцисс наносят границы интервалов, а по оси ординат
шкалу для частот. Над интервалами вычерчивают прямоугольники, высота
которых пропорциональна частотам.
254
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 22.1 – Гистограмма
22.3 Количественные характеристики распределения
22.3.1 Среднее арифметическое
Предположим, что в результате измерений получены величины х1,х2, х3, . .
. , хn, число которых равно n. Тогда среднее арифметическое х определяют по
следующей формуле:
х=
х1 + х2 + х3 + ... + хn
n
или
n
х=
å xi
i =1
n
=
åx
n
255
(22.1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В тех случаях, когда измеряемые величины разделяют на интервалы, то,
обозначив значения середины каждого интервала через хj= х1, х2,х3,…, хк, а
частоту в этих интервалах соответственно через fj= f1, f2 , ….,fk, среднее
арифметическое х вычисляют по следующей формуле:
х=
х1 f1 + x2 f 2 + × × × + xk f k
n
В сокращенном виде формула будет иметь вид:
1 k
х = åxj f j
n j =1
(22.2)
22.3.2 Рассеивание значений
Для количественной оценки рассеивания значений часто используют
сумму
квадратов
отклонений,
дисперсию,
среднее
квадратическое
отклонение.
Сумма квадратов отклонений S
Отклонением называют разницу между каждым измеренным значением
величины и ее средним арифметическим (хi - х ). Если применить это ко всем
измеренным данным, то полученная сумма возведенных в квадрат отклонений
и будет представлять собой сумму квадратов (отклонений) S:
S = ( x1 - x) 2 + ( x2 - x)
2
+ × × × + ( xn - x) 2
æ n ö
çç å xi ÷÷
n
n
S = å ( xi - x) 2 = å xi2 - è i =1 ø
n
i =1
i =1
256
2
(22.3)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Дисперсия sе2
Если сумма квадратов отклонений S выражает рассеивание значений во
всем комплексе данных, то дисперсия sе2, полученная делением S на число n -1
данных, является мерой рассеивания на каждую отдельную единицу данных:
2
é
æ n ö ù
ê
çç å xi ÷÷ ú
n
n
ê
1
S
1
2
è i =1 ø ú =
( xi - x ) 2 =
x
s е2 =
=
å
å
i
ú
n - 1 n - 1 i =1
n - 1 ê i=1
n
ê
ú
ê
ú
ë
û
=
(22.4)
1 k
( x j - x) 2 f j
å
n - 1 j =1
Среднее квадратическое отклонение sе
Взятый с положительным знаком квадратный корень из дисперсии
называют средним квадратическим отклонением sе:
2
é
æ n ö ù
ê
çç å xi ÷÷ ú
n
ê
1
2 è i =1 ø ú
=
s е = s е2 = S / n - 1 =
x
å
i n - 1 ê i=1
n ú
ú
ê
ú
ê
û
ë
=
(22.5)
1 k
2
xj - x f j
å
n - 1 j =1
(
)
22.4 Нормальное распределение
При большом числе данных соответственное сужение интервалов в
распределении влечет за собой постепенное приближение гистограммы к
гладкой кривой. Если же число данных будет беспредельно большое, то
гистограмма превратится в безукоризненную кривую. В этом случае кривая
может рассматриваться в качестве распределения генеральной совокупности
(рисунок 22.2).
257
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если кривая распределения имеет тенденцию в центре обнаруживать
один пик, причем симметрично справа и слева от среднего арифметического
она принимает форму колокола, то такую кривую называют нормальным
распределением, или распределением Гаусса.
Закон, или функцию нормального распределения выражают следующей
формулой:
é 1 æ x - m ö2 ù
1
expê- ç
y = f ( x) =
÷ ú,
2
s
s 2p
è
ø ûú
êë
(22.6)
где m- среднее арифметическое распределения; s - среднее квадратическое
отклонение.
Величины m и sназывают параметрами распределения. Для удобства
вычисления функции распределения y = f (x) случайные величины нормируют
по формуле:
u=
x-m
.
s
Рисунок 22.2 – Нормальное
Рисунок 22.3 – Нормированное
распределение
нормальное распределение
258
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Нормальное распределение с параметрами m = 0 и s =1 называется
нормированным нормальным распределением (рисунок 22.3). Функция
нормального нормированного распределения примет вид:
y = f (u ) =
1
æ 1 ö
expç - u 2 ÷
2p
è 2 ø
(22.7)
При анализе качества продукции количество замеров не всегда бывает
достаточным для определения законов распределения. Но если заранее
известен закон распределения, то для определения важнейших числовых
характеристик распределения нужно небольшое количество замеров. В том
случае,
когда
закон
распределения
случайной
величины
близок
к
нормальному, для обработки результатов опытов необходимо определение
двух статистических оценок параметров распределения: х и sе. В связи с
этим, проверка нормальности распределения составляет основное содержание
предварительной обработки результатов эксперимента.
22.5 Проверка гипотезы нормальности распределения
Некоторое представление о близости эмпирического распределения к
нормальному дает анализ показателей асимметрии и эксцесса. Показатель
асимметрии определяют по формуле:
А=
m3
(22.8)
s e3
где – третий центральный момент
m3 =
(
)
1
å xj - x fj ,
n -1
259
(22.9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
среднее квадратическое отклонение
sе =
(
1
å xi - x
n -1
)2 .
(22.10)
Показатель эксцесса определяют по формуле:
Э=
m4
s e4
-3
(22.11)
где – четвертый центральный момент
m4 =
(
)
4
1
xj - x f j
å
n -1
(22.12)
.
Для симметричных распределений m3 = 0, m4/se4 = 3, следовательно, А = 0
и Э= 0.
Несмещенные оценки для показателей асимметрии и эксцесса находят по
формулам:
А* =
Э* =
n(n - 1)
×A
n-2
n -1
[(n + 1) × Э + 6]
(n - 2)(n - 3)
(22.13)
(22.14)
Для проверки гипотезы нормальности распределения следует также
вычислить среднеквадратические отклонения для показателей асимметрии и
эксцесса:
260
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6n(n - 1)
(n - 2)(n + 1)(n + 3)
(22.15)
24n(n - 1)2
sэ =
(n - 3)(n - 2)(n + 3)(n + 5)
(22.16)
sА =
Если выполняются условия
А * £ 3s А и Э * £ 5s Э , то гипотезу
нормальности исследуемого распределения принимают.
22.6 Пример выполнения проверки гипотезы нормальности
распределения
Используя
данные
таблицы
22.2
определить
количественные
характеристики распределения и проверить гипотезу о нормальности
распределения. По формулам (22.2), (22.4), (22.8), (22.11), (22.13), (22.14),
(22.15) и (22.16) находим следующие значения:
х=
s е2 =
1
× 101,8 = 1,02
100
1
× 14,69 = 0,1469, s е = 0,1469 = 0,38
99
А=
Э=
1 - 0,134
×
= -0,02
99 0,056
1 4,934
×
- 3 = -0,65
99 0,021
261
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
100 × 99
× (- 0,02) = -0,02
98
А* =
Э* =
99
[101 × (- 0,65) + 6] = -0,62
98 × 97
sА =
sЭ =
6 × 99
= 0,24
101 × 103
24 × 100 × 98 × 97
99 2 × 103 × 105
= 0,46
А * = 0,02 < 3s A = 0,72; Э * = - 0,62 < 5s Э = 2,3 ,
следовательно, данное распределение можно отнести к нормальному.
С целью упрощения необходимые для расчета данные сводим в таблицу
(таблица 22.3).
22.7 Вариант задания
Для определения варианта задания из таблицы 22.1 выписывают все
столбики и строки, за исключением тех столбиков и строк, порядковые номера
которых совпадают, соответственно с последней и предпоследней цифрами
номера зачетной книжки.
Таблица 22.3 – Вычисление количественных характеристик
Интерв
Середи
оп
алы
ны
ыт
варьир
интерва
ования
ла
1
0,1-0,3
0,2
2
0,4
-0,82
0,67
-0,55
0,45
1,34
-1,1
0,9
2
0,3-0,5
0,4
8
3,2
-0,62
0,384
-0,238
0,148
3,073
-1,904
1,184
Час
тота
fixi
2
3
4
х i - x ( х i - x ) 2 ( хi - x ) 3
( х i - x ) 4 f i ( х i - x ) f i ( хi - x ) f i ( хi - x )
fi
262
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 22.3
Интерв
Середи
№
алы
ны
п/п
варьир
интерва
ования
ла
3
0,5-0,7
0,6
4
0,7-0,9
5
Час
fixi
х i - x ( х i - x ) ( хi - x ) 3 ( х i - x ) 4 f i ( х i - x ) 2 f i ( х i - x ) 3 f i ( х i - x ) 4
13
7,8
-0,42
0,176
-0,074
0,031
2,288
-0,962
0,403
0,8
15
12,0
-0,22
0,048
-0,011
0,002
0,72
-0,165
0,03
0,9-1,1
1,0
20
20,0
-0,02
0,0004
0
0
0,008
0
0
6
1,1-1,3
1,2
17
20,4
0,18
0,032
0,006
0,001
0,544
0,102
0,017
7
1,3-1,5
1,4
13
18,2
0,38
0,144
0,055
0,021
1,872
0,710
0,273
8
1,5-1,7
1,6
9
14,4
0,58
0,336
0,195
0,113
3,024
1,755
1,017
9
1,7-1,9
1,8
3
5,4
0,78
0,608
0,475
0,370
1,824
1,425
1,11
100
101
14,692
-0,134
4,934
S
тота
fi
263
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
23
Статистическое
оценивание
и
проверка
количественных оценок
Выбор правильного решения из двух противоположных предположений
о генеральной совокупности называется статистической проверкой.
Предположительная количественная оценка параметра генеральной
совокупности называется статистическим оцениванием.
23.1 Проверка средних значений
23.1.1 Среднее арифметическое по совокупности m и дисперсия
генеральной совокупности s2 известны
В практической деятельности ситуация, когда m и s 2 генеральной
совокупности уже известны, встречаются редко. Однако, такую ситуацию
можно приближенно заменить ситуацией, при которой из многочисленных
данных статистически управляемого технологического процесса можно
определить среднее арифметическое и дисперсию. Ниже рассмотрим
ситуацию, когда проверяют, действительно лиn– ое количество данных,
которые считаются взятыми из генеральной совокупности, имеющей
нормальное распределение, взяты из этой генеральной совокупности.
Порядок проверки гипотез:
1 Строят нулевую гипотезу (ее обозначают H0).
H0:m1 = m2 (n-е количество данных взято из идентичной генеральной
совокупности, имеющей нормальное распределение).
2 Выдвигают альтернативную гипотезу:
Н1: m1 ¹m2 (n-е количество данных было взято не из идентичной
генеральной совокупности).
264
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3 Выбирают тип распределения, исходя из гипотезы 1 принимают
нормальное распределение N(m,s2).
4 Вычисляют статистическую оценку
U0 =
5
Принимают
решение
x-m
s/ n
о
(23.1)
проведении
двухсторонней
либо
односторонней проверки гипотез.
Разграничение области 5 %, 1 %-ного уровня значимости и т.д.
называют
областями
отклонения
гипотезы.
В
таблице
23.1
они
заштрихованы. Эти области отклонения иногда берут по обе стороны
распределения, а иногда по одну сторону. Например, в отличие от нулевой
гипотезы
m1 =m2, если предположить, что альтернативная гипотеза будет m1 ¹m2, то
область отклонения берут с двух сторон, если же предположить, что она m1 >m2
или m1 <m2, то берут только с одной стороны. Такие проверки гипотез
соответственно называют двухсторонней или односторонней проверкой.
6 Принимают решение отклонить или принять нулевую гипотезу.
После того, как в таблице В.1 приложения В будут найдены числовые
значения величин, соответствующие 5 % или 1 %-ному уровню значимости,
их сравнивают со статистическими оценками, полученными в результате
вычислений, и выносится решение.
Если
значение
расхождения
®
U0 < Ua
®
не являются
значимыми
Если
значение
нулевая
принимается
расхождения
®
U0,01 > U0 > U0.05
гипотеза
альтернативная
®
являются
значимыми
265
гипотеза
принимается
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если
значение
U0> U0.01
®
расхождения
альтернативная
имеют высокую®
гипотеза
степень значи-
принимается
мости
Пример 23.1
Выход годной продукции в технологическом процессе составлял: среднее
арифметическое m =85,5 %, среднее квадратическое отклонение s=4,5 %.
После внесения в технологический процесс усовершенствований, собранные в
течение четырех дней данные составили `х = 93,3 %.
Таблица 23.1 – Распределение и уровень значимости
Уровень значимости
5%
Тип
распределен
ия
Вид распределения
1%
Одност
Двухстор
Односто
Двухсторо
онняя
ронняя
нняя
проверка
проверка
проверка
a=0,05
a=0,10
a=0,01
a=0,02
a=0,05
a=0,10
a=0,01
a=0,02
a=0,025
a=0,05
a=0,005
a=0,01
оронняя
проверк
а
Нормальное
распределение
t-распределение
F-распределение
266
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Можно ли утверждать, что между первым и вторым случаем имеется
расхождение?
Решение:
1) Н0 :m1 = m2
2) Н1 :m1¹m2 (двухсторонняя оценка).
3) среднее
х
при n = 4 подчиняется нормальному распределению.
По формуле (2.1)
U0 =
93,3 - 85,5
= 3,42 .
4,5 / 4
4) при сравнении с 1%-ным уровнем значимости получится U0 =3,42
>U0.01= 2,58. Следовательно, расхождение имеет высокую степень значимости.
Значения Ua, берут из таблицы В.1 приложения В.
23.1.2
Известно
только
среднее
арифметическое
генеральной
совокупности m
Поскольку
дисперсия
генеральной
совокупности
s2
неизвестна,
необходимо пользоваться ее предположительной оценкой, исходя из
выборочных данных. А именно, осуществляют проверку надm, используя
s е2 и основываясь на t-распределении (Стьюдента):
1 Строят нулевую гипотезу:
Н0:m1 = m2.
2 Строят альтернативную гипотезу:
Н1:m1 ¹m2 (двухсторонняя проверка),
m1 >m2 или m1 <m2 (односторонняя проверка).
3 Выбирают распределение для проверки статистических оценок.
267
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Поскольку sнеизвестно, проводят проверку, используя sеи основываясь
на t-распределении.
4 Вычисляют статистические оценки
t0 =
x-m
se / n .
(2.2)
5 Сравнивая значение из таблицы t-распределения (для соответствующей
степени свободы Ф = n -1 и уровня значимости a) и значение t0, принимают
решение.
Если t0 > t(Ф; 0.05) , то различие имеет место, поскольку уровень значимости
5%-ный.
Если t0 >t(Ф;
0.01),
то имеет место существенное различие, поскольку
уровень значимости 1%-ный.
Пример 23.2
До сих пор выход годной продукции в технологическом процессе в
среднем составлял 85,5 %. После того, как технологический процесс был
усовершенствован, данные, собранные за 10-дневный срок, позволили
получить следующие цифровые значения:
Таблица 23.1 - Данные технологического процесса
Исходн
1
2
3
4
5
6
7
8
9
10
S
90,0
93,0
92,5
94,1
89,5
90,3
91,2
92,4
94,0
92,6
919,6
ые
данные
хi , %
xi 2
8100 8649 8556.2 8854.8 8010.2 8154.0 8317.4 8537.7 8836 8574.7 84590.3
Можно ли утверждать, что выход годной продукции увеличился?
Решение:
268
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
0: 1 =
2
1: 1
2
2
(
).
.
3
919,6
10
i
n
91,96
S
S
(23.3):
919,6 2
84590,36
10
33,944
:
33,944
9
4
t0
1,942
(2.2):
t0
91,96 85,5
10,52
1,942 / 10
5
t
,
.
:"
,
?".
t , = tg9;0.02 = 2,821.
.2
t0 = 10,52
,
t
,
.
269
= 2,821,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
23.2
,
,
(
)
(F
F0,
,
).
,
,
F
,
.
F
,
.
,
,
F
23.1).
:
1
:
2
1 =
0:
2
2
2 .
:
1:
2
1
2
1
2
2
2
2
(
),
2
1
2
2
(
).
2
1 ,
3
2
1 =
S1
2
2 =
1,
S2
270
2,
1=
2
2
n1 - 1,
2=
n2 - 1.
:
(23.3)
(23.4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4 Определяют соотношение несмещенных оценок дисперсии F0. В
данном случае большее из двух sе12, sе22 принимается за числитель. Если sе12
>sе22, то определяется величина:
F0 = sе12/sе22.
5 Если за уровень значимости принять a, то при двухсторонней проверке
из табл.3 Приложения определяют значение Fф1, ф2, a/2.
6 Выносят решение. Если: F0 < Fф1,
ф2,
a/2, то принимают Н0 и считают,
что в оценке дисперсии расхождений нет.
Если же F0 > Fф1,
ф2,
a/2, то принимают Н1 и считают, что в оценке
дисперсии имеется расхождение.
Пример 23.3
Измерив по шкале Роквелла значение твердости после закалки,
произведенной на высокочастотных закалочных устройствах А и В, получили
следующие данные для каждого из них:
Устройство А
53,5
54,0
53,8
54,5
54,8
Устройство В
54,8
53,0
52,8
54,0
53,5
54,5
Можно ли утверждать, что в оценке рассеивания значений имеется
расхождение?
1 Н0:sА2=sВ2
2 Н1:sА2¹sВ2.
3 По формуле (23.3) определяют сумму квадратов отклонений:
271
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
SA = å
X A2
(å X A )2
270,6
= 14645,98 = 1,11
SB = å
X B2
(å X B )2
322,6
= 17348,38 = 3,25
nA
5
nB
6
4 Определяют несмещенные оценки дисперсии:
sА2= SА/ФА= 1,11/4 = 0,2775
sВ2= SВ/ФВ= 3,25/5 = 0,650.
5 Определяют отношение дисперсий:
F0 = sB2/sA2 = 0,650/0,2775 = 2,34.
6 Сравнивают предельные значения из таблицы F-распределения
(таблица В.3 приложения В) с F0.
F5;4;0,025 = 9,36 >F0.
7Выносят решение. Принимается нулевая гипотеза Н0, поскольку
расхождения в оценках дисперсии от применения этих двух устройств не
существенны.
23.3 Проверка различия средних арифметических
Обычно при сравнении существующего технологического процесса с
усовершенствованным
технологическим
процессом,
при
сравнении
производственной методики по способу А и В, при сопоставлении результатов
работы группы А и группы В и т.д. среднее генеральной совокупности часто
272
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бывает неизвестно. Втакого рода ситуациях рекомендуется осуществлять
проверку, придерживаясь следующего порядка.
Прежде всего, определяют отношение дисперсий, полученных из
несмещенных оценок sе12, sе22 для двух групп выборок, и осуществляют
проверку по F-распределению, в результате чего убеждаются, что в дисперсии
не обнаруживается существенного различия. В том случае, когда между sе12 и
sе22 имеется существенное различие, то определить общую дисперсию s22
становится невозможным.
Если нет существенного различия между sе12 и sе22, то обозначая средние
арифметические измеренных значений двух групп выборок n1, n2 через х1 , х 2 , а
сумму квадратов через S1, S2, можно построить предположение, что дисперсия
генеральной
совокупности
s2
оценивается
общей
для
двух
групп
несмещенной оценкой s e2 :
s e2
s e21 (n1 - 1) + s e22 (n2 - 1)
S1 + S 2
=
=
(n1 - 1) + (n2 - 1)
(n1 - 1) + (n2 - 1)
(23.6)
При проверке существенного различия средних арифметических в двух
группах выборок целесообразно применить формулу:
t0 =
X1 - X 2
æ1
1 ö
çç + ÷÷ × s е2
è n1 n2 ø
(23.7)
и осуществлять проверку по t-распределению. При этом число степеней
свободы равно Ф = n1+n2 - 2.
Объединив вместе все процедуры проверки при данной ситуации,
получают:
1
Н0:s12 = s22, а также m1 = m2.
273
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
Определяют дисперсии sе12, sе22 и осуществляют проверку по
F-критерию. Если нет существенного различия переходят к следующему
процессу.
3
Н1:m1 ¹m2.
4
Определив sе2, вычисляют t0.
5
Сравнив t0 со значениями tф,a из таблицы t-распределения при
Ф = n1+n2 - 2, делают выводы.
Пример 23.4
Проверить, существенно ли различие в средних значениях твердости
после закалки, произведенной на устройствах А и В, пользуясь данными
примера 23.3.
Решение:
1
Н0:sА2= sВ2, mА = mВ.
2
В результате проверки по F-критерию, как уже было описано
выше, существенного различия не было установлено.
3
Н1:mА ¹mВ.
4
Определяют несмещенную оценку дисперсии по зависимости
(23.6):
s е2 =
5
1,11 + 3,25
= 0,48.
4+5
Вычисляют по выражению (2.7) t0:
t0 =
54,12 - 53,77
æ1 1ö
ç + ÷ × 0,48
è5 6ø
274
= 0,85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
270,6
= 54,12
5
322,6
= 53,77
XB =
6
XA =
6
Выносится решение: t9;0.01 = 3.25 >t0.
7
Существенного различия
между средними
значениями не
установлено.
23.4
Статистическое
оценивание
количественных
значений.
Интервальная оценка
23.4.1 Ситуация, когда дисперсия генеральной совокупности s2 уже
известна
Если определить среднее арифметическое в выборке объемом n, взятой
методом
случайного
отбора
образцов
из
нормальной
генеральной
совокупности со средним арифметическим m и дисперсией s2 и нормировать
его, то выражение (23.1) подчинится нормальному распределению со средним
значением m= 0 и дисперсией s2 = 1.
Приняв значение U, соответствующее уровню значимости a, за Ua ,
получают, что вероятность неравенства
- Ua <
x-m
<U a
s/ n
(23.8)
будет (1 - a). Видоизменив эту формулу, получают нижнюю границу
x - U a × s / n и верхнюю границу x + U a × s / n нахождения среднего
арифметического m. Это и есть доверительный интервал.
275
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 23.5
Известно, что среднее арифметическое отклонение массы изделий,
изготовленных неким технологическим процессом, составляет
s=3,5 г. Далее в результате измерения массы этих изделий в выборке объемом
n=4,
извлеченной
случайным
отбором,
было
получено
x= 85, 4 г.
Предлагается сделать интервальную оценку среднего арифметического для
массы в генеральной совокупности при доверительной вероятности 99 %.
Решение.
Поскольку 1 - a = 0,99, то a= 0,01. По таблице В.1 приложенияВнаходим
U0,01 = 2,576.
Нижняя граница x - U a × s / n = 65,4 - 2,576 × 5,5 4 = 58,3 г.
Верхняя граница x + U a × s / n = 65,4 + 2,576 × 5,5 4 = 72,5 г.
Таким образом, среднее арифметическое генеральной совокупности
находится в интервале 58,3 <m< 72,5 г.
23.4.2 Дисперсия генеральной совокупности s2 неизвестна
Если дисперсия генеральной совокупности s2 неизвестна и при этом
использовать выражение (23.10), то определенное при помощи выражения
(23.2) распределение статистической величины t принимает распределение
Стьюдента при числе степеней свободы Ф = n - 1. Доверительный интервал,
обусловленный вероятностью (1 - a), выражают:
- ta <
x-m
< ta
sе / n
причем доверительные границы
276
(2.9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x ± t ф.a
se
n
(2.10)
Пример 23.6
Для
того,
чтобы
узнать
величину
поводки,
полученную
при
термообработке штампованных деталей, была взята выборка n = 10 и
получены x = 0,085 мм, sе = 0,042 мм.
Необходимо определить границы 95%-ного доверительного интервала
для величины поводки этих деталей.
Решение.
t9;0,05 = 2,26
Доверительные границы
0,085 ± 2,26
0,042
= 0,085 ± 0,031.
10
Доверительный интервал 0,054 мм - 0,116 мм.
23.5
Статистическая
проверка
доли
дефектных
изделий
в
генеральной совокупности
Если подсчитать число дефектных изделий в произвольно отобранной
выборке объемом n, взятой методом случайного отбора, например, из
генеральной совокупности со средней долей дефектных изделий в
технологическом процессе равно р¢, то поскольку известно, что это число
277
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
подчиняется
биномиальному
распределению,
определяют
вероятность
превышения числом дефектных изделий значения r.
Вместе с тем при условии р¢£0,5 и nр¢³ 5 биномиальное распределение
может приблизиться к нормальному распределению. Другими словами, в
биномиальном распределении:
Среднее значение равно nр¢;
Среднее квадратическое отклонение равно
np ¢(1 - p ¢ ) .
Исходя из этого статистику U0определяют по формуле:
U0 =
r - np¢
np¢(1 - p¢)
(23.11)
Пример 23.7
Прежде средняя доля дефектных изделий в технологическом процессе
составляла
11,5
%.
После
внесения
в
технологический
процесс
усовершенствований была взята выборка объемом 70 шт., в которой число
дефектных изделий оказалось равным 4. Можно ли утверждать, что различие
имеет место?
Решение.
1)
Н0: р¢ = р¢1.
2)
Н1: р¢¹р¢1.
3)
убеждаются
в
возможности
приближения
к
нормальному
распределению n.p¢= 70×0,115 = 8,05 > 5, p¢= 0,115 < 0,5, следовательно можно
считать приближение к нормальному распределению возможным;
4)
Вычисляют по выражению (2.11) статические оценки:
278
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
U0 =
5)
4 - 8,05
8,05(1 - 0,115)
= 1,52
Принимают решение:
U 0,05 = 1,96 > U 0 = 1,52,
6)
поэтому
нельзя
считать,
что
усовершенствования
были
эффективными.
23.6 Вариант задания
Вариант задания определяется последней цифрой номера зачетной
книжки студента, которая определяет конкретные числовые значения
различных параметров, приведенных в пояснении к каждому заданию.
1 Выход годной продукции в технологическом процессе составлял:
среднее арифметическое
m
= 86,5 %, среднее квадратическое отклонение s =
4,5 %. После внесения в технологический процесс усовершенствований
собранное в течение пяти дней (n=5) данные составили 90,3 %. Можно ли
утверждать, что выход годного увеличился?
К числу дней n=5 необходимо прибавить последнюю цифру из номера
зачетной книжки.
2 Десять разных термопар откалиброваны по стандартной, которая
показывала 1000 0С. В таблице приведены показания термопар:
опыт
Таблица 23.2 – Показания термопар
0
С
0
1
2
3
4
5
6
7
8
9
986
1005
991
994
983
1002
996
998
1002
983
279
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Можно ли считать, что эти отклонения обусловлены нормальными
вариациями случайной величины - показаний в 0С, или на их характеристики
повлиял некоторый фактор (при изготовлении или транспортировке)?
Из десяти термопар исключаются показания той термопары, порядковый
номер которой совпадает с последней цифрой номера зачетной книжки.
3 На штамповочном автомате изготавливают поковки. Мастер участка
случайным образом отобрал десять поковок. При взвешивании получили
следующие результаты:
Таблица 23.3 – Результаты отбора
№
0
1
2
3
4
5
6
7
8
9
560
550
573
548
560
558
548
540
550
поковки
Масса, г 545
Можно ли с вероятностью 95 % считать, что масса заготовки
соответствует заданию – 550 г.?
Из десяти значений нужно исключить массу поковки, порядковый номер
которой совпадает с последней цифрой номера зачетной книжки.
4 Измерив твердость образцов, обработанных по режимам А и В,
получили следующие результаты:
А:
64,0
65,0
75,0
67,0
64,5
В:
69,0
69,0
61,5
67,5
64,0
74,0
75,0
Можно ли утверждать, что в дисперсии имеется расхождение?
К значениям твердости прибавить последнюю цифру номера зачетной
книжки.
5 На штамповочных автоматах А и В изготавливают одинаковые
поковки. Мастер участка случайным образом отобрал по десять поковок с
каждого автомата. При взвешивании получили следующие результаты:
280
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 23.4 – Результаты взвешивания
№
поковки
Масса, г
0
1
2
3
4
5
6
7
8
9
570
569
590
540
537
585
595
568
580
545
545
560
548
575
547
559
560
548
540
550
Можно ли с вероятностью 95 % утверждать, что точность поковок на
автомате В выше, чем на автомате А?
Из таблицы исключить столбик, номер которого совпадает с последней
цифрой номера зачетной книжки.
6 По данным предыдущего задания проверить, можно ли с вероятностью
95 % утверждать, что автоматы настроены одинаково?
7 Измерив твердость образцов, обработанных по режимам А и В, получили
следующие данные:
А:
64,0
65,0
75,0
67,0
64,5
В:
69,0
69,0
61,5
67,5
64,0
74,0
75,0
Проверить, существенно ли различие в средних значениях твердости
образцов, обработанных по режимам А и В.
К значениям твердости прибавить последнюю цифру номера зачетной
книжки.
8 В результате испытаний 16 образцов из алюминиевого сплава на разрыв
было определено среднее арифметическое значение предела прочности:
х = 600 МПа. При этом среднее квадратическое отклонение по генеральной
совокупности составляло s = 30 МПа. Найти границы 95 %-ного
доверительного интервала для величины предела прочности sв.
К числу испытаний n=16 прибавить число, равное последней цифре
номера зачетной книжки.
9 По результатам 50-ти измерений усилия прокатки были подсчитаны
среднее значение усилия х = 1500 кН и выборочная дисперсия sе =1,21.104
281
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(кН)2. Определить границы доверительного интервала при доверительной
вероятности 95 %.
К числу измерений n=50 прибавить последнюю цифру номера зачетной
книжки.
10 В условиях технологического процесса, когда средняя доля дефектных
изделий составляла 3 %, однажды произвели сплошную проверку 500
изготовленных изделий, среди которых было обнаружено 25 дефектных.
Возникли ли в технологическом процессе отклонения?
К числу дефектных изделий прибавить последнюю цифру номера
зачетной книжки.
282
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24 Корреляционный и регрессионный анализ
24.1 Корреляционный анализ
На
заводах
и
в
лабораториях
приходится
часто
проводить
экспериментальное изучение зависимостей между случайными величинами x
и y. Для этого производят некоторое количество n независимых опытов.
Результат i-го опыта дает пару значений (xi, yi), i=1, 2,…, n.
Когда непрерывным изменениям измеряемой величины x в некоторых
характеристиках сопутствуют непрерывные изменения другой величины y, то
утверждают, что между x и y имеется корреляция.
Метод,
несколькими
анализирующий
переменными
корреляционную
величинами,
зависимость
называют
между
корреляционным
анализом. В частности, когда переменных величин только две, анализ
называется простым корреляционным анализом, когда же одновременно
подвергают анализу более трех переменных величин, то анализ называют
сложным корреляционным анализом. В данном разделе рассмотрим простой
корреляционный анализ.
О наличии или отсутствии корреляции между двумя величинами можно
судить по виду поля корреляции, нанося точки (xi, yi) на координатную
плоскость. Такую фигуру называют корреляционной диаграммой (рисунок
24.1).
Рисунок 24.1 – Корреляционная диаграмма
283
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если провести прямые линии, параллельные оси абсцисс и оси ординат
через точки ( x, y ), то плоскость рисунка, на которой разбросаны точки,
окажется разделенной на четыре части.
Корреляционная диаграмма показывает, что точки, расположенные в I
секторе, будут превышать средние значения, а точки расположенные в III
секторе, окажутся меньше средних значений.
I.
( xi - x ) > 0 ( yi - y ) > 0
III.
( xi - x ) < 0 ( yi - y ) < 0
å ( xi - x )( yi - y ) > 0 .
В обоих секторах при увеличении x увеличивается и y, или при
увеличении y увеличивается x. В свою очередь сумма произведений
å ( xi - x )( yi - y ) в
отклонений, называемая корреляционным соотношением
первом и третьем секторах > 0, а во втором и четвертом секторах - <0.
По корреляционному соотношению можно приблизительно понять
степень
корреляции,
ибо,
если
эта
сумма
составит
значительную
положительную величину, то это будет положительной корреляцией, если же
она составит значительную отрицательную величину – отрицательной
корреляцией. Вместе с тем, если рассчитывать степень корреляции только по
сумме произведений, то нужно учесть, что она изменяется в зависимости от
рассеивания значений x и y. Поэтому в качестве критерия корреляции
принимают сумму произведений, деленную на произведение корней
квадратных из суммы квадратов каждого из отклонений x и y, что и называют
коэффициентом корреляции:
r0 =
=
å ( xi - x )( yi - y )
2
å (xi - x )2 å ( yi - y )
åx y
å хi yi - ni i
=
2
2
é
(
(
yi ) ù
xi ) ù é
2
å
å
2
ú ê å yi ú
êå xi n ú
n úê
êë
ûë
û
284
(24.1)
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обозначая сумму квадратов х, сумму квадратов y, а также сумму
произведений x и y соответственно через Sxx, Syy, Sxy, то r можно выразить
следующей формулой:
ro =
S xy
S xx S yy
(24.2)
Коэффициент корреляции занимает промежуточное значение между -1 и
+1. Причем, если вслед за увеличением x увеличивается и y, то коэффициент
корреляции становится положительным, а если вслед за увеличением x
уменьшается y, то он становится отрицательным. Поэтому при приближении r
к единице, корреляция вполне вероятна, тогда как при приближении r к нулю
она маловероятна. Поскольку r представляет собой статистическую величину,
вычисленную на основании опытных данных, то необходимо проверить
значимость коэффициента корреляции.
Оценку значимости коэффициента парной корреляции (проверку наличия
корреляции) выполняют по формуле:
to =
r n-2
1- r
(24.3)
2
Подставив в вышеупомянутую формулу значение tф,a, получают
предельное значение rф,a, с которым сравнивают r0. При условии êr0ê>= rф,a
принимается решение о наличии взаимосвязи. Поскольку для вычисления r
используют два расчетных значения x, y , то число степеней свободы Ф = n -2.
Пример. Проверить найденное в примере значение коэффициента
корреляции.
Для n=20, Ф = n –2 = 20 – 2 =18; a = 0,01
rф,a = 0,561
ro= 0,965,
т. к. r0 >rф,a, значитr обладает высокой степенью значимости.
285
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24.2 Регрессионный анализ
Для характеристики формы связи при изучении корреляционной
зависимости пользуются уравнением регрессии. Задача ставится таким
образом: по данной выборке объема n найти уравнение регрессии и оценить
допускаемую при этом ошибку. Для простоты и более легкого освоения
методики регрессионного анализа предположим (на первых порах), что при
проведении парного линейного регрессионного анализа имеем дело только с
уравнением прямой линии.
Уравнение прямой на плоскости в декартовых координатах:
)
y = b0 + b1 x
Для
определения
линии
регрессии
(24.4)
необходимо
непременно
статистически оценить коэффициент регрессии b1и постоянное число b0.
Для этого должны быть удовлетворены два следующих условия:
1.
Линия регрессии должна проходить через точку с координатами
( x; y ) средних значений x и y.
2.
Сумма квадратов отклонений от линии регрессии вдоль оси Oy
должна быть наименьшей:
) 2
U = å ( yi - yi ) = min
(наименьшее значение)
(24.5)
)
Если в эту формулу подставим значение y i , то получим:
U = å [ yi - (b0 + b1 x )] = min
2
(24.6)
Для решения этой задачи необходимо в каждом конкретном случае
вычислить значение коэффициентов b0 и b1, минимизирующих сумму
286
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отклонений U. Для этого, как известно из математического анализа,
необходимо вычислить частные производные функции U по коэффициентам
b0 и b1 и приравнять их к нулю:
ì ¶U
ï ¶b = 0,
ï 0
í
ï ¶U = 0;
ïî ¶b1
(24.7)
ì ¶U
ï ¶b = 2å ( yi - b0 - b1 xi )(- 1) = 0,
ï 1
í
ï ¶U = 2å ( y - b - b x )(- x ) = 0.
i
i
0
1 i
ïî ¶b1
(24.8)
Следовательно, прямая линия регрессии определяется формулами:
å yi = nb0 + b1 å xi ® y = b0 + b1 x ,
å xi yi = b0 å xi + b1 å xi2
(24.9)
(24.10)
Если выражение из формулы (24.9) b0 = y - b1 x подставить в формулу
(24.10), то получим:
å xi yi = ( y - b1 x )å xi + b1 å xi2 = = y å xi + b1 (å xi2 - x å xi ) (24.11)
Отсюда выразим b1:
287
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
å xi yi -
å xi å y i
å xi y i - y å xi =
n
2
å xi - x å xi å xi2 - å xi å xi
n
(å xi )(å yi )
å xi y i S xy
n
=
=
2
S xx
(
xi )
å
2
å xi - n
b1 =
=
b0 = y - b1 x
(24.12)
(24.13)
Для проверки значимости уравнения регрессии используют F-критерий.
Для этого определяют общую дисперсию sy2 и остаточную s2ост:
s y2
2
yi ) ù
(
1
1 é
å
2
2
=
å ( y i - y ) = n - 1 ê å yi - n ú
n -1
úû
êë
2
s ост
=
1
( yi - y)i )2
å
n-2
(24.14)
(24.15)
и определяют их отношение
2
F0 = s y2 / s ост
Если F0 > Fn-1,
n-2, a,
(24.16)
то уравнение статистически значимо описывает
результаты экспериментов.
288
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24.3
Пример
выполнения
парного
корреляционного
и
регрессионного анализа
По данным таблице 24.1 определить коэффициент корреляции между
твердостью y и степенью деформации x. При наличии взаимосвязи определить
уравнение регрессии и его адекватность экспериментальным результатам.
Таблица 24.1 – Парный корреляционный и регрессионный анализ
)
)
yi
yi - y i
опыт
x
y
x2
y2
xy
( y i - y) i )2
1
0,20
64
0,0400
4096
12,80
64,5
-0,5
0,25
2
0,19
65
0,0361
4225
12,35
63,9
1,1
1,21
3
0,28
69
0,0784
4761
19,32
69,1
-0,1
0,01
4
0,26
69
0,0676
4761
17,94
68,0
1,0
1,00
5
0,23
66
0,0529
4356
15,18
66,2
-0,2
0,04
6
0,21
65
0,0441
4225
13,65
65,1
-0,1
0,01
7
0,24
67
0,0576
4489
16,08
66,8
0,2
0,04
8
0,26
67
0,0676
4489
17,42
68,0
-1,0
1,00
9
0,28
70
0,0784
4900
19,60
69,1
0,9
0,81
10
0,25
68
0,0625
4624
17,00
67,4
0,6
0,36
11
0,25
67
0,0625
4489
16,75
67,4
-0,4
0,16
12
0,22
66
0,0484
4356
14,52
65,7
0,3
0,09
13
0,18
63
0,0324
3969
11,34
63,3
-0,3
0,09
14
0,26
68
0,0676
4624
17,68
68,0
0
0
15
0,17
62
0,0289
3844
10,54
62,7
-0,7
0,49
16
0,30
70
0,0900
4900
21,00
70,3
-0,3
0,09
17
0,19
64
0,0361
4096
12,16
63,9
0,1
0,01
18
0,25
68
0,0625
4624
17,00
67,4
0,6
0,36
19
0,29
69
0,0841
4761
20,01
69,7
-0,7
0,49
20
0,27
68
0,0729
4624
18,36
68,6
-0,6
0,36
289
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
№
S
Продолжение таблицы 24.1
x
y
x2
y2
4,78
1
1335
1,1706
)
yi
xy
89213
)
yi - y i
( y i - y) i )2
320,7
5,429
Определяют коэффициент корреляции:
S xx = å x
(å x )2
4,78 2
= 1,1706 = 0,0282
2
S yy = å y
n
2
S xy = å xy -
20
(å y )2
13352
= 89213 = 101,75
n
20
å x å y = 320,7 - 4,78 × 1335 = 1,6350
n
20
Тогда, коэффициент корреляции (24.2)
r0 =
2
1,635
= 0,965
0,0282 × 101,75
Проводят проверку коэффициента
корреляции.
Для
этого
выбирают уровень значимости a=0,01 и определяют число степеней свободы
Ф = n-2 = 20 – 2 = 18.
По таблице В.4 приложения В определяют rф,a= r18;0,01 = 0,561.
Поскольку r0 = 0,965 >rф,a, то r обладает высокой степенью значимости.
3
Определяют коэффициент уравнения регрессии. По выражению
(24.12)
290
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b1 =
1,635
= 58,11
0,0282
Для определения по формуле (24.13) b0, необходимо определить средние
x, y :
x=
å xi
y=
å yi
n
n
=
4,78
= 0, 239
20
=
1335
= 66,75
20
b0 = 66,75 - 58,11 × 0,239 = 52,87
Тогда уравнение регрессии будет:
)
y = 52,87 + 58,11xi
4
Определяют
адекватность
уравнения
экспериментальным
данным:
)
y=
= 64,49
1 52,87 + 58,11x=
1 52,87 + 58,11 × 0, 20
)
y20= 52,87 + 58,11x20= 52,87 + 58,11 × 0,27= 68,55
Исходя из зависимостей (24.14), (24.15) и (24.16)
291
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
101,8
= 5,36
19
5,429
2
s ост
=
= 0,3
18
5,36
= 17,85
F0 =
0,3
s y2 =
5
Вывод. Так как F0 = 17,85 >Fn-1; n-2; 0,05= 2,2, то следует признать,
что уравнение адекватно описывает экспериментальные результаты.
24.4 Вариант задания
По данным таблицы 24.2 определить коэффициент корреляции между
входной толщиной h0(x) и выходной толщиной h1(y) при прокатке. При
наличии взаимосвязи определить уравнение регрессии и его адекватность
экспериментальным результатам.
Таблица 24.2 – Варианты
№ вар.
x
y
№ вар.
x
y
1
0,71
0,46
11
0,90
0,55
2
0,78
0,50
12
0,85
0,53
3
0,84
0,52
13
0,81
0,50
4
0,92
0,56
14
0,80
0,48
5
0,87
0,54
15
0,78
0,50
6
0,85
0,52
16
0,84
0,53
7
0,86
0,51
17
0,82
0,52
8
0,91
0,54
18
0,85
0,54
9
0,93
0,57
19
0,82
0,53
10
0,93
0,59
20
0,90
0,54
Из таблицы 24.2 исключить опыт, порядковый номер которого
соответствует сумме двух последних цифр из номера зачетной книжки.
292
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
25 Планирование эксперимента
Важной задачей планирования эксперимента является определение
числа опытов, которые необходимы для выявления зависимости между
исследуемыми переменными величинами.
Те, переменные параметры, которые изменяются экспериментатором в
процессе испытаний, называются факторами, а те параметры, которые
изучаются или оптимизируются, называются выходами или откликами
системы, или параметрами оптимизации системы.
При математическом планировании эксперимента предполагается, что
существует некоторая аналитическая связь между факторами и откликом
процесса, и требуется выбрать минимальное число и условия проведения
опытов, позволяющих найти область оптимальных значений параметров.
Другими словами необходимо найти приближенную зависимость выходного
параметра от факторов, т.е. построить математическую модель процесса.
Математическая задача планирования эксперимента состоит в том, чтобы
найти уравнение поверхности отклика:
y = f (x1 , x2, ...x n )
(25.1)
где y – выход процесса, т.е. параметр оптимизации;
xi – факторы, которые варьируются при проведении эксперимента.
Таким образом, математическое планирование фактически связано с
изучением формы поверхности отклика и, следовательно, оптимальному
значению выхода будут соответствовать максимальные или минимальные
точки этой поверхности.
Для большинства реальных задач вид поверхности отклика заранее
неизвестен, поэтому при экспериментальном поиске оптимальных условий
функцию у представляют в виде системного ряда:
293
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
у = b 0 + å b i xi + å b ij xi x j + å b ijk xi x j xk + ...
(25.2)
Очевидно, точность подобной аппроксимации определяется порядком
системного ряда и диапазоном изменения переменных хi. Так как поверхность
отклика изучается обычно в сравнительно узком интервале варьирования
факторов, то без большой погрешности можно отбросить члены высших
порядков. Задача оптимизации решается в два этапа: сначала осуществляется
поиск области оптимума, для чего используется линейная модель поверхности
отклика; на втором этапе для описания почти стационарной (оптимальной)
области используется степенной ряд, содержащий члены второго, а иногда и
третьего порядка. Коэффициенты степенного ряда b можно оценить с
помощью выборочных коэффициентов регрессии b, которые определяются по
результатам конечного числа опытов. Тогда уравнение регрессии, получаемое
на основании результатов экспериментов, примет вид:
y = b0 + å bi xi + å bij xi x j + å bijk xi x j xk + ...
(25.3)
Таким образом, после вычисления коэффициентов регрессии появляется
возможность оценить влияние изучаемых факторов на функцию отклика и
определить направление движения к области оптимума.
В качестве выхода процесса рекомендуется выбирать параметр, который
имеет ясный физический смысл и количественное выражение, при этом
желательно, чтобы параметр оптимизации был единственным и не зависел от
времени.
Для каждого фактора выбираются условный нулевой или основной
уровень хi0, диапазон и шаг Dxi варьирования переменных. Диапазон
изменения факторов равен разности между верхним и нижним пределом
данного фактора.
294
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
25.1 Полный факторный эксперимент
Полным факторным экспериментом (ПФЭ) называется эксперимент,
реализующий все возможные неповторяющиеся комбинации опытов n
независимых управляемых факторов, каждый из которых варьируется на k
уровнях. Необходимое число опытов N при ПФЭ равно N = kn. Если число
уровней составляет 2, то N=2n.
Рассмотрим случай двухфакторного эксперимента, для которого
уравнение регрессии неполной квадратичной модели имеет вид:
y = b0 + b1 x1 + b2 x2 + b12 x1 x2
(25.4)
где х1 и х2- значения факторов;
b0 - свободный член, равный отклику при х1=х2 = 0;
b1, b2 - коэффициенты регрессии, показывающие степень влияния
соответствующих факторов на параметр оптимизации;
b12- коэффициент, указывающий на наличие эффекта взаимодействия двух
факторов (парного взаимодействия).
Если в качестве базовой модели выбран полином первой степени, то
каждый фактор варьируется на двух уровнях, например, х1=х1min и х1=х1max, а
интервал варьирования равен:
Dх1=(х1max-х1min)/2.
Если выбран полином второй степени, то каждый фактор необходимо
варьировать уже на трех уровнях:
х1=х1max;
х1=х10;
295
х1=х1min.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При планировании ПФЭ преобразуют размерные (натуральные)
значения факторов хiв безразмерные (кодовые) Хi по следующей зависимости:
Хi=xi-xi0/Dxi, i=1,2,3,…,n.
(25.5)
где xi0 - базовые значения i-го фактора (значение нулевого или основного
уровня).
Такое нормирование дает возможность легко построить ортогональную
матрицу планирования и значительно облегчить дальнейшие расчеты.
В этом случае верхние и нижние уровни варьирования Хiв и Хiн в
относительных единицах равны соответственно +1 и -1 независимо от
физической природы факторов, значений базовых уровней и интервалов
варьирования Dхi.
При увеличении числа факторов n>2 проводят последовательное
достраивание матриц ПФЭ (таблица25.1).
Таблица 25.1 - Планы двухфакторных экспериментов
План
22
23
№ опыта
Х1
Х2
Х3
Х4
1
+
+
+
+
2
-
+
+
+
3
+
-
+
+
4
-
-
+
+
5
+
+
-
+
6
-
+
-
+
7
+
-
-
+
8
-
-
-
+
296
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24
9
+
+
+
-
10
-
+
+
-
11
+
-
+
-
12
-
-
+
-
13
+
+
-
-
14
-
+
-
-
15
+
-
-
-
16
-
-
-
-
Отметим следующие два важных свойства рассмотренных планов:
1 Оси симметричны относительно центра эксперимента
N
å хij = 0;
i=1, 2, 3,…n;
j=1, 2, 3,…N.
j =1
Сумма значений любого столбца равна нулю.
2 Эти планы нормированы
N
å хij 2 = N ; i= 0, 1, 2, 3,…n;
j= 0, 1, 2, 3,…N.
j =1
Сумма квадратов элементов любого столбца равна числу опытов.
Основным преимуществом планов, обладающих указанным свойствами,
является возможность проведения родственной (независимой) оценки
коэффициентов регрессии.
После составления плана эксперимента приступают к его реализации.
На исследуемый процесс влияют не только выбранные факторы хi, но и еще
ряд факторов, которые могут быть вообще неизвестны исследователю. Для
того, чтобы внести элемент случайности влияния этих факторов на результат
эксперимента (а это необходимо для обоснованного использования аппарата
математической статистики), приходится проводить m параллельных опытов
297
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
и устанавливать случайный порядок проведения опытов во времени. Эта
процедура называется рандомизацией (перемешиванием) и выпприступают к
его реализации. На исследуемый процесс влияют не только выбранные
факторы хi, но и еще ряд факторов, которые могут быть вообще неизвестны
исследователю. Для того, чтобы внести элемент случайности влияния этих
факторов на результат эксперимента:
G0 =
s 2j max
N
ås 2j
£ G( 0,05;Ф1;Ф2 )
(25.6)
j =1
где sj2 - выборочная дисперсия выходной величины y по j строке матрицы
планирования, полученная из m параллельных опытов:
1 m
s =
å yij - y j
m - 1 i =1
2
j
(
)2
(25.7)
где yij - значение выходной величины по j строке матрицы планирования
(j изменяется от 1 до N) из i-го параллельного опыта (i изменяется от 1 до m);
`yj - среднее значение выходной переменной, полученное из параллельных
опытов по j строке матрицы планирования;
sj2max - наибольшая из дисперсий в строках плана;
G(0,05;Ф1;Ф2) - табличное значение критерия Кохрена при 5% уровне
значимости; Ф1 = m -1; Ф2 = N.
Если вычисленное значение G0 окажется меньше табличного, то
гипотеза об однородности дисперсий принимается. Делается вывод о
воспроизводимости экспериментов. В противном случае необходимо принять
меры по повышению воспроизводимости опытов.
298
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В случае воспроизводимости процесса рассчитывают коэффициенты
уравнения регрессии. Независимые оценки b0, bi, bikсоответствующих
коэффициентов b0, bi, bik, (b0®b0, bi®bi, bik®bik) находят по следующим
формулам:
b0 =
bi =
1
bik =
N
1
N
N
1
N
N
åyj
j =1
y1 + y2 + ... + y N
N
(25.8)
xi1 y1 + xi 2 y 2 + ... + xiN y N
N
(25.9)
или b0 =
j= 1
å xij y j
å xij xkj y j
j =1
N
или bi =
или bik =
xi1 xk1 y1 + xi 2 xk 2 y 2 + ... + xiN xkN y N
N
(25.10)
После определения оценок коэффициентов регрессии bik необходимо
проверить гипотезу об их значимости. Проверяют гипотезу с помощью
критерия Стьюдента. Если выполняется условие:
çbi÷³tФ;a s в2 ,
где
s в2
аs
то
данный
2
y
=
s у2
N ×m
s 2j
å
=
коэффициент
N
Ф = N(m -1)
–
(25.11)
дисперсия коэффициентов, (25.12)
– дисперсия воспроизводимости, (25.13)
является
статистически
значимым.
Все
коэффициенты, для которых это условие не выполняется, являются
незначимыми и они из уравнения регрессии исключаются вместе с
299
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
соответствующим фактором, при этом оставшиеся коэффициенты не
пересчитываются.
Проверяют гипотезу об адекватности полученной математической
модели результатом эксперимента с использованием критерия Фишера.
Модель адекватна, если выполняется неравенство:
F0 =
s y2
2
s ад
³ F(Ф1,Ф 2,a ) ,
s2ад <s2у
если
(25.14)
2
- дисперсия адекватности (остаточная дисперсия)
где s ад
2
=
s ад
1
N -d
)
N
å (y j - y j )2
j =1
(25.15)
где d – число значимых коэффициентов уравнения регрессии, включая и b0.
)
у j - рассчитанное по модели значение отклика (параметра оптимизации)
в j опыте.
Ф1= N(m -1); Ф2 = N - d.
2
Если же s ад
> s 2y , то рассчитывают критерий Фишера, исходя из
отношения:
2
s ад
F0 =
s y2
(25.16)
Гипотеза об адекватности может быть принята, если F0 £ F(Ф1;Ф 2;a ) , при
этом Ф1= N - d, Ф2 = N(m -1).
В том случае, когда гипотеза об адекватности модели отвергается,
необходимо переходить к более сложной форме математического описания,
либо, если это возможно, провести эксперимент с меньшим интервалом
варьирования.
После проверки на адекватность, выполняют переход от кодированных
значений факторов к натуральным по уже известной зависимости
300
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
xi - xi0
,
Xi =
Dxi
i=1, 2, …,n.
(25.17)
Для двухфакторного эксперимента:
æ x1 - x10 ö
æ x2 - x20 ö
ç
÷
ç
÷
y = b0 + b1 ç
÷ + b2 ç Dx ÷ +
1
x
D
2 ø
è
ø
è
(25.18)
æ x1 - x10 öæ x2 - x20 ö
֍
÷
+ b12 çç
÷ç Dx ÷
x
D
1 øè
2 ø
è
25.2 Пример планирования полного факторного эксперимента
Сопротивление деформации sS алюминиевого сплава 1915 в наибольшей
степени зависит от температуры q и скорости деформации x. Необходимо
получить математическую модель вида sS=sS (q, x) для последующей
оптимизации параметров процесса пластической обработки.
Экспериментальное
исследование
условий
горячего
прессования
алюминиевого сплава 1915 позволило установить технологически разумные
пределы, в которых могут изменяться факторы: температура от 370 0С до
430
0
С; скорость деформации от 8 до 12 с-1. Для решения задачи
моделирования принято решение провести ПФЭ 22.
Опыты проводятся путем растяжения образцов на пластометре. Условия
эксперимента приведены в таблице 25.2, а матрица плана и результаты
экспериментов в таблице 25.3. Проводилось по три параллельных опыта (m=3)
с рандомизацией.
301
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 25.2 – Условия эксперимента
q, 0С
x, с-1
Основной xi= 0
400
10
Интервал варьирования Dxi
30
2
Нижний xi= -1
370
8
Верхний xi = +1
430
12
Кодовые обозначения
X1
X2
Уровень фактора
Таблица 25.3 – План эксперимента
№
опы
X1
X2
та j
X1
X2
Параллельные
опыты sS, Мпа
Y1
Y2
Y3
уj
sj 2
)
yj
)
( y j - y j )2
1
+
+
+
106
108
105
106.3
2.33
106.3
0
2
-
+
-
156
154
158
156
4.01
156.0
0
3
+
-
-
99
100
96
98.3
4.34
98.0
0.09
4
-
-
+
139
141
141
140.3
1.34
140.3
0
S
5
12.02
0
0
0
122.5 124.5
123
S
123.3
1.085
13.10
1
0.09
125.22
3.69
3.78
Определяем y j и выборочные дисперсии sj2 для каждого опыта
по формуле (25.7). Результаты расчета сводим в таблицу.
2
Проводим проверку воспроизводимости опытов по критерию
Кохрена (4.6) sj2max = 4,34.
G0 = 4,34/12,02 = 0,36.
302
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Табличное значение критерия Кохрена для уровня значимости a = 0,05
и степеней свободы Ф1 = m –1= 3 -1=2, Ф2 = N =4 G(0,05, 2, 4 )= 0,7679 (таблица
В.5 приложения В).
Сравниваем G0 и G(a,Ф1, Ф2).
G0<G(0,05,2,4),
следовательно,
дисперсии
однородны,
опыты
воспроизводимы.
3
По формуле (25.13) находим дисперсию воспроизводимости:
s 2у = (2,33 + 4,01 + 4,34 + 1,34) / 4 = 3,01
Степень свободы дисперсии воспроизводимости равна
Ф = N(m -1) = 4(3-1) = 8.
4
Определяем коэффициенты уравнения регрессии, которое в
общем случае имеет вид:
)
y = b0 + b1 x1 + b2 x2 + b12 x1 x2
Для нахождения коэффициентов b0, b1, b2 и b12 используем
соответственно зависимости (25.8), (25.9) и (25.10):
b0 = (106,3+156+98,3+140,3)/4 =125,22
b1 = (106,3-156+98,3-140,3)/4 = -22,92
b2 = (106,3+156-98,3-140,3)/4 = 5,92
b12 = (106,3-156-98,3+140,3)/4 = -1,92.
303
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Уравнение регрессии примет вид:
)
у = 125,22 - 22,92 Х 1 + 5,92 Х 2 - 1,92 Х 1 Х 2
5
s в2=
По
формуле
(25.12)
находим
дисперсию
коэффициентов
3,01
= 0,25 и, исходя из зависимости (25.11) оцениваем значимость
4×3
коэффициентов
уравнения
регрессии.
Табличное
значение
критерия
Стьюдента для уровня значимости a =0,05 и степени свободы Ф= N(m -1) =
4(3-1) = 8 равно t0,05, 8=2,31 (таблица В.2 приложения В).
Произведение ta ,Ф × s в2 = 2,31 × 0,25 = 1,15
Все коэффициенты по абсолютной величине превышают это значение.
Следовательно мы должны признать их значимыми.
6
Проверяем
экспериментальным
адекватность
результатам.
В
полученного
нашем
случае
число
уравнения
значимых
коэффициентов уравнения регрессии равно числу опытов, т.е. степень
свободы дисперсии адекватности (25.15) равна нулю. Поэтому мы вынуждены
поставить дополнительный опыт на нулевом уровне. Результаты опыта
заносим в план эксперимента. При этом число опытов N становится равным
пяти, а дисперсия воспроизводимости (25.13)
sу2= (2,33+4,01+4,34+1,34+1,085)/5 = 2,6.
)
По уравнению регрессии рассчитываем значения у j и определяем
N
сумму квадратов отклонений
)
å (y j - y j )2 .
Результаты расчета заносим в
j= 1
таблицу плана эксперимента. Определяем дисперсию адекватности (25.15) для
N=5 и d=4.
304
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
sад2= 3,78/(5-4) = 3,78.
Тогда F-отношение (расчетное значение критерия Фишера) (25.16):
F0 = 3,78/2,60 = 1,45.
Табличное значение критерия Фишера для a=0,05,
Ф1=N-d=1, Ф2 = N(m -1) =10, F(0,05,1,10) =5,0 (таблица В.3 приложения В).
Получаем F0 <F(0,05;1,10) и, следовательно, уравнение регрессии адекватно
экспериментальным результатам.
7
Выполняем переход от кодированных значений факторов к
натуральным по уравнениям (25.17) и (25.18)
æ q - 400 ö
æ x - 10 ö
æ q - 400 öæ x - 10 ö
s s = 125,22 - 22,92ç
÷ + 5,92ç
÷ - 1,92ç
֍
÷=
è 30 ø
è 2 ø
è 30 øè 2 ø
= 273,2 - 0,444q + 15,78x - 0,032q × x
25.3 Дробный факторный эксперимент
ПФЭ требует большого числа опытов, причем часть из них несет мало
информации. Дробный факторный эксперимент (ДФЭ) позволяет сократить
число опытов и в то же время получить основной объем необходимой
информации.
Эксперимент, составляющий по объему только часть ПФЭ, называется
дробным факторным экспериментом или дробной репликой. Существует ½
реплики, ¼ реплики, 1/8 реплики и т.д. Условные обозначения дробных
реплик и количество опытов даны в таблице 25.4.
305
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 25.4 – Дробный факторный эксперимент
Кол-во
Условное
факторо
Дробная реплика
в
Кол-во опытов
обозначение
Для дробной
ДФЭ
реплики
Для ПФЭ
3
½ реплики от 23
23-1
4
8
4
½ реплики от 24
24-1
8
16
5
½ реплики от 25
25-1
16
32
5
¼ реплики от 25
25-2
8
32
6
½ реплики от 26
26-1
32
64
6
¼ реплики от 26
26-2
16
64
6
1/8 реплики от 26
26-3
8
64
7
½ реплики от 27
27-1
64
128
7
¼ реплики от 27
27-2
32
128
7
1/8 реплики от 27
27-3
16
128
7
1/16 реплики от 27
27-4
8
128
При образовании реплик необходимо помнить, что количество опытов
должно быть хотя бы на единицу больше, чем количество факторов в ДФЭ.
Эффективность применения дробных реплик зависит от удачного
выбора
системы
смешивания
линейных
эффектов
с
эффектами
взаимодействий. Реплики, у которых линейные эффекты смешаны с
взаимодействиями наивысшего порядка, являются наиболее эффективными,
они обладают наибольшей разрешающей способностью и называются
главными.
В реальных условиях разработчик может не иметь твердой уверенности
в отсутствии того или иного взаимодействия факторов. В этом случае надо
306
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
знать, когда и какие эффекты определяются совместно, определить
разрешающую
способность
дробных
реплик.
Для
этого
пользуются
понятиями «определяющие контрасты» и «генерирующее соотношения».
Рассмотрим эти понятия на примере полуреплики 23-1 . Соотношение
показывающее, с каким из эффектов смешан данный эффект, или какое
взаимодействие
факторов
заменено
данным
фактором,
называется
генерирующим соотношением:
Х3 = Х1Х2
(25.19)
Покажем эту полуреплику в качестве таблицы:
Таблица 25.5 – План ДФЭ 23-1
№ опыта Х3=Х1Х2
Х1
Х2
Х3
Х1Х2Х3
1
+
+
+
+
2
-
+
-
+
3
+
-
-
+
4
-
-
+
+
Для произведения трех столбцов матрицы в каждом опыте имеем:
+1= Х1Х2Х3
(25.20)
эти же уравнения можно получить из генерирующего соотношения,
умножением левой и правой его части на Х3.
Произведение столбцов матрицы равное +1 называется определяющим
контрастом. Контраст помогает найти смешанные эффекты. Для того, чтобы
определить какой эффект смешан сданным, нужно умножить обе части
определяющего контраста на фактор, соответствующий эффекту. Так для
полуреплики 23-1 с определяющим контрастом 1= Х1Х2Х3 имеем:
307
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Х1= Х1 2Х2Х3 = Х2Х3
(25.21)
Х2= Х1Х2 2Х3 = Х1Х3
(25.22)
Х3 = Х1Х2Х32 = Х1Х2
(25.23)
Это значит, что коэффициенты линейного уравнения будут оценками
линейных эффектов:
b1=b1+b23; b2=b2+b13; b3=b3+b12
(25.24)
Эффект смешивания в принципе снижает точность оценок. Однако,
поскольку мы считаем модель линейной и взаимодействия пренебрежимо
малыми, то точность оценок будет достаточной.
25.4 Пример планирования дробного факторного эксперимента
Необходимо спланировать эксперимент с целью выбора оптимальных
параметров устройства для получения максимального значения выходной
характеристики у. Исходные значения факторов и интервалы варьирования
заданы в таблице.
Таблица 25.6 – Условия эксперимента
Уровни факторов
Фактор
Интервал
-1
0
+1
варьирования
Х1
200
220
240
20
Х2
3
6
9
3
Х3
40
100
160
60
Х4
1
2
3
1
308
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для матрицы планирования выбираем полуреплику от ПФЭ 24,
заданную
генерирующим
соотношением
Х4=
Х1Х2Х3.
Определяющим
контрастом является 1= Х1Х2Х3Х4. Умножая определяющий контраст
последовательно на Х1,Х2,Х3 иХ4, найдем совместно оценки линейных
эффектов и взаимодействий:
b1=b1+b234
b12=b12+b34
b2=b2+b134
b23=b23+b14
b3=b3+b124
b13=b13+b24
b4=b4+b123
Составляем таблицу матрицы планирования в которую вносим
результаты эксперимента.
Таблица 25.7 – План эксперимента
№
Х0
Х1
Х2
Х3
опыта
Х4=
Х1Х2
Х1Х3
Х2Х3
Х1Х2Х3
=Х3Х4
=Х2Х4
=Х1Х4
уj
1
+
+
+
-
-
+
-
-
10
2
+
-
-
-
-
+
+
+
9
3
+
+
-
-
+
-
-
+
15
4
+
-
+
-
+
-
+
-
25
5
+
+
+
+
+
+
+
+
26
6
+
-
-
+
+
+
-
-
14
7
+
+
-
+
-
-
+
-
5
8
+
-
+
+
-
-
-
+
20
bi
15
-1,5
4,75
0,75
4,5
-0,75
0,75
2,0
309
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коэффициенты biрассчитываются по формулам, приведенным в п. 25.1.
b0 =
b1 =
å y j = (10 + 9 + 15 + 25 + 26 + 14 + 5 + 20) / 8 = 15
N
å xij y j = (10 - 9 + 15 - 25 + 26 - 14 + 5 - 20) / 8 = -1,5
N
и т.д.
Таким образом, аналитическое выражение для у принимает вид:
)
y = 15 - 1,5 X 1 + 4,75 X 2 + 0,75 X 3 + 4,5 X 4 - 0,75 X 1 X 2 +
+ 0,75 X 1 X 3 + 2 X 2 X 3
Дальнейший анализ подобных выражений, их изменение (переход от
кодированных факторов к натуральным), проведение новых экспериментов
ведется в соответствии с порядком, изложенным для ПФЭ.
25.5 Вариант задания
Для выполнения первого задания к целым значениям lр (таблица 25.8)
необходимо прибавить последнюю цифру из номера зачетной книжки.
Вариант второго задания определяется суммой двух последних цифр номера
зачетной книжки студента.
25.5.1 Планирование полного факторного эксперимента
По условию задачи (п. 25.2) и матрице планирования эксперимента
(таблица 25.8) построить математическую модель вида lр=lр(q,x).
310
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 25.8 - План эксперимента
№
Х1
Х1
Х1Х1
Параллельные опыты lp
уj
sj2
(y) j - y j )2
опыта
y1
y2
y3
1
+
+
4,59
4,48
4,72
2
-
+
3,54
3,50
3,67
3
+
-
5,10
5,03
5,20
4
-
-
3,90
4,00
3,97
25.5.2 Планирование дробного факторного эксперимента
В соответствии со своим вариантом (таблица 25.9) составить план
эксперимента для построения линейной математической модели. Построить
систему оценок коэффициентов регрессии.
Таблица 25.9 – Варианты заданий
№
ДФЭ
Определяющий контраст
1
25-2
1= Х1Х2Х4=Х1Х2Х3Х5
2
25-2
1= Х2Х3Х4=Х1Х3Х5
3
25-2
1= Х1Х3Х4=Х2Х3Х6
4
26-2
1= Х1Х2Х3Х5=Х1Х2Х3Х4Х6
5
26-2
1= Х1Х2Х4Х5=Х1Х2Х3Х6
6
26-2
1= Х1Х3Х4Х5=Х2Х3Х4Х6
7
26-3
1= Х1Х2Х4=Х2Х3Х5=Х1Х2Х3Х6
8
26-3
1= Х2Х3Х4=Х1Х3Х5=Х1Х2Х6
9
26-3
1= Х1Х3Х4=Х1Х2Х5=Х2Х3Х6
10
27-3
1= Х1Х2Х3Х5=Х1Х2Х4Х6=Х1Х2Х3Х4Х7
11
27-3
1= Х1Х2Х4Х5=Х1Х2Х3Х6=Х1Х3Х4Х7
12
27-3
1= Х1Х3Х4Х5=Х2Х3Х4Х6=Х1Х2Х4Х7
13
27-4
1= Х1Х2Х4=Х2Х3Х5=Х1Х3Х6=Х1Х2Х3Х7
варианта
311
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы 25.9
14
27-4
1= Х1Х3Х4=Х1Х2Х5=Х2Х3Х6=Х1Х2Х3Х7
15
27-4
1= Х2Х3Х4=Х1Х3Х5=Х1Х2Х6=Х1Х2Х3Х7
16
28-4
1= Х1Х2Х3Х5=Х1Х2Х4Х6=Х1Х3Х4Х7=Х1Х2Х3Х4Х8
17
28-4
1= Х2Х3Х4Х5=Х1Х2Х3Х6=Х1Х2Х4Х7=Х1Х2Х3Х4Х8
18
28-4
1= Х1Х2Х4Х5=Х1Х3Х4Х6=Х1Х2Х3Х7=Х1Х2Х3Х4Х8
19
29-5
1= Х1Х2Х3Х5= Х1Х2Х4Х6= Х1Х3Х4Х7= Х2Х3Х4Х8= Х1Х2Х3Х4Х9
20
29-5
1= Х2Х3Х4Х5= Х1Х3Х4Х6= Х1Х2Х4Х7= Х1Х2Х3Х8= Х1Х2Х3Х4Х9
21
29-5
1= Х1Х3Х4Х5= Х2Х3Х4Х6= Х1Х2Х3Х7= Х1Х2Х4Х8= Х1Х2Х3Х4Х9
312
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Список использованных источников
1 Адлер, Ю. П. Введение в планирование эксперимента. / Ю. П. Адлер –
М.: Изд-во. «Металлургия», 1968. – 155 с.
2 Адлер, Ю. П. Планирование эксперимента при поиске оптимальных
условий. / Ю. П. Адлер, Е. В. Маркова, Ю. В. Грановский. – М.: Наука,
1976. – 280 с.
3 Барабащук,
В.
И.
Планирование
эксперимента
в
технике
/
В. И. Барабащук, Б. П. Креденцер, В. И. Мирошниченко. – Киев:
Техника, 1984. – 200 с.
4 Быковский, В. В. Применение теории планирования эксперимента в
научных и инженерных расчетах: учебное пособие / В. В. Быковский,
Л. В. Быковская, Ю. А. Дормидонов. – Оренбург: ИПК ОГУ, 2002. –
66 с. ISBN 5-7410-0442-3
5 Гмурман, В. Е. Теория вероятностей и математическая статистика. /
В. Е Гмурман. – М.: Высш. школа, 2000. – 480 с.
6 ГОСТ
24026-80
«Исследовательские
испытания.
Планирование
эксперимента. Термины и определения. М.,1980.
7 Грачев, Ю. П. Математические методы планирования экспериментов.
/Ю. П. Грачев – М.: Пищевая промышленность, 1979. – 200с.
8 Довженко, Н. Н., Осипова С. И. Практикум по организации
эксперимента и обработке металлов давлением. учебн. пособие /
Н. Н. Довженко, С. И. Осипова. – Красноярск, 1988. – 104 с.
9 Дьяконов, В.П. MATLAB 6/6.1/6.5 + Simulink 4/5 в математике и
моделировании. Полное руководство пользователя. /В. П. Дьяконов. М.: СОЛОН - Пресс, 2003. - 576 с.
10 Исследования и изобретательство в машиностроении. Практикум/ под
общ. Ред. М.М. Кане. Мн.: УП «Технопринт», 2003. 237 с.
11 Ковшов, В. Н. Постановка инженерного эксперимента. /В. Н. Ковшов. –
Киев-Донецк: Вища школа, 1982. – 120 с.
313
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12 Кравцова,
Е.
Д.
Планирование
научных
и
промышленных
экспериментов в примерах и задачах: практикум / Е. Д. Кравцова,
Э. М. Никифорова. – Красноярск.: ГАЦМиЗ, 2002. – 124 с.
13 Красовский, Г. И. Планирование эксперимента. / Г. И. Красовский,
Г. Ф. Филаретов. – Минск: БГУ, 1982. – 302 с.
14 Лакин, Г. Ф. Биометрия: учеб. пособие для биол. спец. вузов /
Г. Ф. Лакин – 4-е изд., перераб. и доп. – М.: Высш. Шк., 1990. – 352 с .
ISBN 5-06-000471-6.
15 Математическая статистика: учебник для техникумов./ В. М. Иванова,
В. Н. Калинина, Л. А. Нешумова, И. О. Решетникова. – М.: «Высш.
школа», 1975. – 398 с.
16 Математическая
теория планирования
эксперимента./
Под
ред.
С.М. Ермакова.- М.: Наука. Главная редакция физико-математической
литературы, 1983. 392 с.
17 Моделирование процессов восстановления машин / В. П. Апсин,
Л. В. Дехтеринский, С. Б. Норкин, В. М. Приходько. – М.: Транспорт,
1996. – 311 с.
18 Монтгомери, Д. К. Планирование эксперимента и анализ данных. /
Д. К. Монтгомери – Л.: Судостроение, 1980. – 384 с.
19 Надёжность технических систем: Справочник/ Ю.К. Беляев, В.А. [и др.]
- М.: Радио и связь, 1985. 608 с.
20 Организация эксперимента: Метод. Указания к практическим занятиям
по курсу «организация эксперимента» для студентов специальности
110600 «Обработка металлов давлением» дневной и заочной форм
обучения / сост. С.В. Дранишников; КИЦМ. – Красноярск, 1990. – 48 с.
21 Планирование
эксперимента
в
исследовании
технологических
процессов / под ред. Э.К.Лецкого. - М.: Мир, 1977.
22 Практикум по теории статистики: учеб. пособие / под ред. проф.
Р. А. Шмойловой. – М.: Финансы и статистика, 2001. – 416 с. ISBN
5-279-01941-0.
23 Пугачев, В. С. Теория вероятностей и математическая статистика /
В. С. Пугачев. – М.: Наука, 1979. – 496 с.
314
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24 Рогов, В. А. Методика и практика технических экспериментов:
учеб.пособие для студ. высш. учеб. заведений / В. А. Рогов,
Г. Г. Позняк. – М.: Издательский центр «Академия», 2005. – 288 с. ISBN
5-7695-1951-7.
25 Спиридонов, А. А. Планирование эксперимента при исследовании
технологических
процессов.
/А.
А.
Спиридонов.
–
М.:
Машиностроение, 1981. – 184 с.
26 Спиридонов, А. А. Планирование эксперимента: учеб.пособие. /
А. А. Спиридонов, Н. Г. Васильев. – Свердловск: УПИ, 1975. – 152 с.
27 Теория статистики: учебник / под ред. проф. Р. А. Шмойловой. – 3-е
изд., перераб. – М.: Финансы и статистика, 2001. – 560 с. ISBN
5-279-01951-8.
28 Тюрин,
Ю.Н.
Анализ
данных
на
компьютере
/
Ю.Н.Тюрин,
А.А. Макаров. - М.: Финансы и статистика, 1995.
29 Сакато Сиро. Практическое руководство по управлению качеством. /
Сакато Сиро. – М,: Машиностроение, 1980. – 214 с.
30 Шкляр, В.Н. Планирование эксперимента и обработка результатов:
конспект
лекций
для
магистров
по
направлению
220200
«автоматизация и управление в технических (мехатронных) системах» /
В.Н. Шкляр. – Томск: Издательство Томского политехнического
университета, 2010. – 90с.
31 Щурин, К.В. Методика и практика планирования и организации
эксперимента: практикум / К.В. Щурин, Д.А. Косых;Оренбургский гос.
ун-т. – Оренбург: ОГУ, 2012 – 185 с.
32 Щурин, К.В. Надежность мобильных машин / К. В. Щурин; М-во
образования и науки Рос. Федерации, Федер. агентство по образованию,
Гос. образоват. учреждение высш. проф. образования "Оренбург.гос.
ун-т". - Оренбург : ОГУ, 2010. – 586 с.
33 Ящерицын, П. И. Планирование эксперимента в машиностроении. /
П. И. Ящерицын, Е. И. Махаринский. – Минск.: Высш. школа, 1985. – 286 с.
34 Щурик К.В. Управление качеством в историко-философском аспекте:
учебное пособие / К.В. Щурин, А.Л. Воробьев, Д.А. Косых. – Оренбург:
ОГУ, 2013 – 230 с.
315
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение А
(справочное)
Случайные числа
Таблица А.1 – Фрагмент таблицы случайных чисел
87 63
88
23
62
51
07
69
59
02
89
49
14
98
53
41
92 36
07 76
85
37
84
37
47
32
25
21
15
08
82
34
57
57
35 22
03 33
48
84
37
37
29
38
37
89
76
25
09
69
44
61
88 23
13 01
59
47
64
04
99
59
96
20
30
87
31
33
69
45
58 48
00 83
48
94
44
08
67
79
41
61
41
15
60
11
88
83
24 82
24 07
78
61
89
42
58
88
22
16
13
24
40
09
00
65
46 38
61 12
90
62
41
11
59
85
18
42
61
29
88
76
04
21
80 78
27 84
05
99
85
75
67
80
05
57
05
71
70
21
31
99
99 06
96 53
99
25
13
63
316
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПриложениеБ
(обязательное)
Примеры теоретических расчётов
Б.1 Пример построения плана ДФЭ
Построить план ДФЭ 24-1 и определить полином
Y = b0 + b1 х1 + b2 х2 + b3 х3 + b4 x4 + b12 x1 x2 + b13 x1 x3 + b14 x1 x4 + b23 x2 x3 +
+ b24 x2 x4 + b34 x3 x4
.
Число факторов – 4. Нужно найти 8 коэффициентов полинома.
Выбираем 8 из 16 опытов плана ПФЭ 24 таким образом, чтобы были
определены независимые коэффициенты при самих факторах, смешанные
коэффициенты при парных сочетанияхфакторов и в пренебрежении тройными
и четверным сочетаниями факторов и при этом сохранялась ортогональность
плана.
Таблица Б.1 – Матрица планирования для ПФЭ 24
U
x1
x2
x3
x4
1
-1
-1
-1
-1
2
-
+1
-1
-1
-1
3
-
+1
-1
-1
4
4
+1
+1
-1
-1
5
-
-1
-1
+1
-1
6
6
+1
-1
+1
-1
7
7
-1
+1
+1
-1
8
-
+1
+1
+1
-1
ПФЭ 24
ДФЭ 24-1
1
317
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы Б.1
U
x1
x2
x3
x4
ПФЭ 24
ДФЭ 24-1
11
3
-1
+1
-1
+1
12
-
+1
+1
-1
+1
13
5
-1
-1
+1
+1
14
-
+1
-1
+1
+1
15
-
-1
+1
+1
+1
16
8
+1
+1
+1
+1
Такой выбор позволяет сформировать план ДФЭ 24-1 как и план ПФЭ 23 ,
но с х4=х1х2х3 . План ДФЭ 24-1 представляется в виде
Таблица Б.2 – Матрица планирования для ДФЭ 24-1
Ù
U
х0
x1
х2
х3
х4 х1 х2 x1х3 x1 х4 x2х3 x2х4 x3х4
Y
Y
1
+1
-1
-1
-1
-1
+1
+1
+1
+1
+1
+1
10
10
2
+1
+1
-1
-1
+1
-1
-1
+1
+1
-1
-1
8
8
3
+1
-1
+1
-1
+1
-1
+1
-1
-1
+1
-1
8
8
4
+1
+1 +1
-1
-1
+1
-1
-1
-1
-1
+1
7
6,8
5
+1
-1
-1
+1
+1
+1
-1
-1
-1
-1
+1
9
9,2
6
+1
+1
-1
+1
-1
-1
+1
-1
-1
+1
-1
8
8
7
+1
-1
+1
+1
-1
-1
-1
+1
+1
-1
-1
8
8
8
+1
+1 +1
+1
+1
+1
+1
+1
+1
+1
+1
6,5
6,68
Значения коэффициентов полинома составляют:
b123 = b124 = b134 = b234 = b1234 = 0 .
318
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10 + 8 + 8 + 7 + 9 + 8 + 8 + 6,5
= 8,06 ;
8
b0 =
b1 =
- 10 + 8 - 8 + 7 - 9 + 8 - 8 + 6,5
= -0,69 ;
8
b2 = -0,69 ; b3 = -0,19 ; b4 = -0,19 ;
(b12 + b34 ) = 10 - 8 - 8 + 7 + 9 - 8 - 8 + 6,5 = 0,06 ;
8
b13 + b24 = 0,06 ; b14 + b23 = 0,06 .
Если принять, что
b12 » b34 =
1
(b12 + b34 ) = 0,03 ,
2
b13 » b24 =
1
(b13 + b24 ) = 0,03 ,
2
b14 » b23 =
1
(b14 + b23 ) = 0,03 ,
2
то полином имеет вид
Y = 8,06 - 0,69 х1 - 0,69 х2 - 0,19 х3 - 0,19 x4 + 0,03x1 x2 + 0,03x1 x3 + 0,03x1 x4 +
+ 0,03x2 x3 + 0,03x2 x4 + 0,03x3 x4
.
Значения полинома в точках плана приведены в последнем столбце
плана ДФЭ24-1. В нашем случае точность его достаточно высокая.
319
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Б.2 Пример проверки однородности дисперсий с помощью
критерия Бартлета
Рассмотрим применение критерия Бартлета для проверки однородности
дисперсий. Матрица планирования предусматривала выполнение четырех
экспериментов. Первый был повторен пять раз, второй - шесть, третий и
четвертый - по четыре раза. При этом дисперсия первого эксперимента равна
3,5; второго – 4,22; третьего – 5,88; четвертого – 11,36. Необходимо проверить,
верна ли гипотеза об однородности дисперсий.
Дисперсия
s 2y =
s 2y
параметра оптимизации
1 æç n 2 ö÷ 3.5 × 4 + 4.22 × 5 + 5.88 × 3 + 11.36 × 3
s j fj =
= 5.79
N
çå
÷
15
å fj è j =1 ø
j =1
Вычисляем величинус:
é
1 æ 1 1 1 1 1 öù
c = 0.4343ê1 +
ç + + + - ÷ú = 0.485
ë 3(4 - 1) è 4 5 3 3 15 øû
Определяем Q:
N
ö
1 æç
1
2
Q=
f lg s y - å f j lg s 2y ÷ =
[15 lg 5.79 - 4 lg 3.5 - 5 lg 5.88 - 3 lg11.36] = 1.37
÷ 0.485
c çè
j =1
ø
Табличное значение c т2 для трех степеней свободы (N – 1 = 3) и 5 %
уровнязначимости равно 7,82. Так как Q < c т2 , то гипотеза однородности
дисперсий принимается.
320
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Б.3
Пример
построения
вариационного
ряда
и
графика
эмпирической функции распределения
Построить вариационный ряд и график эмпирической функции
распределения по результатам наблюдений, таблица Б.3.
Таблица Б.3 – Результаты наблюдений
i
1
2
3
4
5
6
xi
51
43
56
60
64
56
Решение. Построим вариационный ряд, упорядочив по возрастанию
значения вариантов, таблица Б.4
Таблица Б.4 – Значения вариантов
i
1
2
3
4
5
6
xi
43
51
56
56
60
64
Искомая эмпирическая функция представле на рисунке Б.1:
ì0, при x < 43
ï0.16, при 43 £ x < 51
ï
ï0.33, при 51 £ x < 56
FЭ (x ) = í
ï0.67, при 56 £ x < 60
ï0.84, при 60 £ x < 64
ï
î1, при x ³ 64
321
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок Б.1 – Эмпирическая функция распределения
Б.4 Пример построения статистического ряда
Имеются результаты регистрации значений затухания сигналаxi на
частоте 1000 Гц коммутируемого канала телефонной сети. Эти значения,
измеренные в дБ, в виде вариационного ряда представлены в таблицеБ.5.
Необходимо построить статистический ряд.
Таблица Б.5 – Вариационный ряд значений сигнала
i
1
2
3
4
5
6
7
8
9
10
11
xi 25,79 25,98 25,98 26,12 26,13 26,49 26,52 26,60 26,66 26,69 26,74
i
12
13
14
15
16
17
18
19
20
21
22
x i 26,85 26,90 26,91 26,96 27,02 27,11 27,19 27,21 27,28 27,30 27,38
i
23
24
25
26
27
28
29
30
31
32
33
xi 27,40 27,49 27,64 27,66 27,71 27,78 27,89 27,89 28,01 28,10 28,11
i
34
35
36
37
38
39
40
41
42
43
44
xi 28,37 28,38 28,50 28,63 28,67 28,90 28,99 28,99 29,03 29,12 29,28
Решение. Количество разрядов статистического ряда следует выбрать
минимальным, чтобы обеспечить достаточное количество попаданий в
каждый из них, возьмем y = 6. Определим размер разряда
322
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
h = (xmax–xmin)/у =(29,28 - 25,79)/6 = 0,58.
Сгруппируем наблюдения по разрядам, таблица Б.6.
Таблица Б.6 – Сгруппированные наблюдения
i
1
2
3
4
5
6
xi
25,79
26,37
26,95
27,5 3
28,12
28,70
ni
5
9
10
9
5
6
Fi =ni/n
0,114
0,205
0,227
0,205
0,114
0,136
fi = ni/h
0,196
0,353
0,392
0,353
0,196
0,235
На основе статистического ряда построим гистограмму, рисунокБ.2, и
график эмпирической функции распределения, рисунокБ.3.
Рисунок Б.2 – Гистограмма распределения
323
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок Б.3 – Эмпирическая функция распределения
График эмпирической функции распределения, рисунок Б.3, отличается
от графика, представленного на рисункеБ.1 равенством шага изменения
варианты и величиной шагаприращения функции (при построении по
вариационному ряду шаг приращения кратен 1/n , а по статистическому ряду –
зависит от частости в конкретном разряде)
Пример Б.5 Пример проверки гипотезы с помощью критерия
А.Н. Колмогорова
Проверить с помощью критерия А.Н. Колмогорова гипотезу о том, что
ЭД, представленные в таблицеБ.7, подчиняются нормальному распределению
при уровне значимости α=0,1.
Решение. Исходные данные и результаты вычислений сведены в
таблицу Б.7. Необходимые вычисления можно провести с использованием
табличного процессора: значение эмпирической функциираспределения
Fn(xi); i= 1, 44 ; значения теоретической функции Fn(xi) – это значение
функциинормального распределения в точке х.
324
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица Б.7 – Исходные данные
i
xi
1
2
з
4
5
6
7
8
9
10
11
25,79 25,98 25,98 26,12 26,13 26,49
26,52 26,60 26,66 26,69 26,74
Fn(xi) 0,023 0,046 0,068 0,091 0,114 0,1з6
0,159 0,182 0,204 0,227 0,250
F(xi) 0,036 0,055 0,055 0,073 0,075 0,144
0,151 0,170 0,188 0,196 0,211
d n+
0,014 0,009 0,01з 0,018 0,038 0,008
0,008 0,012 0,016 0,032 0,039
d n-
0,036 0,032 0,010 0,005 0,016 0,031
0,014 0,011 0,006 0,009 0,016
i
xi
12
1з
14
15
16
17
18
19
20
21
22
26,85 26,90 26,91 26,96 27,02 27,11
27,19 27,21 27,28 27,30 27,38
Fn(xi) 0,273 0,296 0,318 0,341 0,364 0,386
0,409 0,432 0,455 0,477 0,500
F(xi) 0,246 0,263 0,267 0,284 0,з05 0,зз7
0,371 0,378 0,406 0,412 0,447
d n+
0,027 0,032 0,051 0,057 0,059 0,050
0,038 0,054 0,049 0,065 0,053
d n-
0,004 0,010 0,028 0,0з4 0,036 0,027
0,015 0,0з1 0,026 0,042 0,031
i
xi
23
24
25
26
27
28
29
30
31
32
33
27,40 27,49 27,64 27,66 27,71 27,78
27,89 27,89 28,01 28,10 28,11
Fn(xi) 0,523 0,546 0,568 0,591 0,614 0,636
0,659 0,682 0,705 0,727 0,750
F(xi) 0,456 0,492 0,555 0,561 0,583 0,610
0,656 0,656 0,701 0,731 0,735
d n+
0,067 0,053 0,013 0,030 0,031 0,026
0,003 0,026 0,003 0,004 0,015
d n-
0,044 0,031 0,010 0,007 0,008 0,00з
0,019 0,00з 0,020 0,027 0,008
i
xi
34
35
36
37
38
39
40
41
42
43
44
28,37 28,38 28,50 28,63 28,67 28,90
28,99 28,99 29,03 29,12 29,28
Fn(xi) 0,773 0,795 0,818 0,841 0,864 0,886
0,909 0,932 0,955 0,977 1,000
F(xi) 0,817 0,819 0,851 0,879 0,888 0,928
0,939 0,940 0,944 0,954 0,968
d n+
0,044 0,024 0,032 0,038 0,024 0,042
0,030 0,008 0,010 0,024 0,032
d n-
0,067 0,046 0,055 0,061 0,047 0,064
0,053 0,031 0,013 0,001 0,009
325
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В данном примере максимальные значения d n+ и d n- одинаковы и равны
0,067. Из таблицы распределения Колмогорова для α= 0,1 найдем значение
λα=1,22. Для n=44 критическое значение отклонения определится из
соотношения
d m (a = 1) n = la ; d m (0.1) =
1.22
= 0.184 .
1.44
Поскольку величина maxdn=0,067 меньше критического значения,
гипотеза о принадлежности выборки нормальному закону не отвергается.
Б.6 Пример проверки гипотезы с помощью критерия Мизеса
Проверить с помощью критерия Мизеса гипотезу о том, что ЭД,
представленные
в
предыдущем
примере,
подчиняются
нормальному
распределению при уровне значимости α = 0,1.
Решение. Исходные данные и результаты вычислений представлены в
таблице Б.8.
Таблица Б.8 – Исходные данные для вычислений
i
xi
1
2
3
4
5
6
7
8
9
10
11
25,79 25,98 25,98 26,12 26,13 26,49 26,52 26,60 26,66 26,69 26,74
Fn(xi) 0,011 0,034 0,057 0,080 0,102 0,125 0,148 0,171 0,193 0,216 0,237
F(xi)
0,036 0,055 0,055 0,073 0,075 0,144 0,151 0,170 0,188 0,196 0,211
Di×10-3 0,618 0,429 0,003 0,047 0,726 0,378 0,009 0,000 0,025 0,409 0,742
i
xi
12
13
14
15
16
17
18
19
20
21
22
26,85 26,90 26,91 26,96 27,02 27,11 27,19 27,21 27,28 27,30 27,38
Fn(xi) 0,261 0,284 0,307 0,330 0,352 0,375 0,398 0,421 0,443 0,466 0,489
F(xi)
0,246 0,263 0,267 0,284 0,305 0,337 0,371 0,378 0,406 0,412 0,447
326
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
i
Продолжение таблицы Б.8
12
13
14
15
xi
26,85 26,90 26,91 26,96 27,02 27,11 27,19 27,21 27,28 27,30 27,38
16
17
18
19
20
21
22
Di×10-3 0,231 0,439 1,572 2,071 2,243 1,467 0,717 1,790 1,391 2,866 1,755
i
xi
23
24
25
26
27
28
29
30
31
32
33
27,40 27,49 27,64 27,66 27,71 27,78 27,89 27,89 28,01 28,10 28,11
Fn(xi) 0,511 0,534 0,557 0,580 0,602 0,625 0,648 0,671 0,693 0,716 0,739
F(xi)
0,456 0,492 0,555 0,561 0,583 0,610 0,656 0,656 0,701 0,731 0,735
Di×10-3 3,103 1,765 0,003 0,332 0,374 0,216 0,063 0,213 0,067 0,238 0,013
i
xi
34
35
36
37
38
39
40
41
42
43
44
28,37 28,38 28,50 28,63 28,67 28,90 28,99 28,99 29,03 29,12 29,28
Fn(xi) 0,761 0,784 0,807 0,830 0,852 0,875 0,898 0,921 0,943 0,966 0,989
F(xi)
0,817 0,819 0,851 0,879 0,888 0,928 0,939 0,940 0,944 0,954 0,968
Di×10-3 3,090 1,230 1,908 2,461 1,271 2,791 1,737 0,381 0,001 0,149 0,432
В этой таблице:
Fn(x1)=(1-0,5)/44 – значение эмпирической функции распределения;
F(x1) – значение теоретической функции распределения, соответствует
значению функции нормального распределения в точке x1;
D= [Fn(xi)– F(xi)]2.
Критическое значение статистики критерия Мизеса при заданном
уровне значимости равно 0,347 (таблица распределения Мизеса). Фактическое
значение статистики
nw n2 =
44
1
+ å Di = 0.044
12 × 44 i =1
327
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
что меньше критического значения. Следовательно, гипотеза Н0 не
противоречит имеющимся данным.
Б.7Пример метода максимального правдоподобия
Время до выхода из строя прибора определяется показательным
распределением
ìle - lx , x ³ 0;
f (x ) = í
î0, x < 0.
По выборке 2, 3, 5, 6, 8 найти оценку параметра λ.
Решение: Функция правдоподобия имеет вид:
L(2,3,5,6,8, l ) = le - l 2 × le -l 3 × le - l 5 × le - l 6 × le - l 8 = l5e -l 24 .
Тогда InL(2,3,5,6,8, λ) = 5Inλ - 24 λ. Уравнение правдоподобия будет
иметь вид:
¶ ln L 5
~ 5
= - 24 = 0 . Отсюда получаем оценку l = .
24
¶l
l
Б.8 Пример метода моментов
Время до выхода из строя прибора определяется показательным
распределением
ìle - lx , x ³ 0;
f (x ) = í
.
î0, x < 0.
328
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
По выборке x1,x2,....xn найдём точечную оценку неизвестного параметра
распределения λ.
Так
как
для
показательного
распределения
нужно
оценить
единственный параметр λ, то для его оценивания нужно одно уравнение.
Приравняем, например, первые начальные моменты – теоретический и
выборочный.
Первый начальный теоретический момент равен
¥
m1 = ò x × le - lx dx =
0
1
.
l
Первый начальный выборочный момент вычисляется по формуле
n
xi
.
n
i =1
m 1В = å
1 n xi
~
Приравнивая их, получим
= å . Отсюда l =
l i =1 n
329
1
.
n
xi
ån
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПриложениеВ
(справочное)
Табличные значения типовых распределений
Таблица В.1 - Нормальное распределение
Уровень
значимости a
Ua
0,1
0,05
0,04
0,02
1,64
1,96
2,05
2,33
0,01
2,58
0,005
0,002
0,001
2,81
3,09
3,29
Таблица В.2 – Значение t-распределения Стьюдента
f
Уровни значимости
0,10
0,05
0,02
0,01
1
6,31
12,71
31,82
63,66
2
2,92
4,30
6,97
9,93
3
2,35
3,18
4,54
5,84
4
2,13
2,78
3,75
4,60
5
2,02
2,57
3,37
4,03
6
1,94
2,45
3,14
3,71
7
1,90
2,37
3,00
3,50
8
1,86
2,31
2,90
3,36
9
1,83
2,26
2,82
3,25
10
1,81
2,23
2,76
3,17
11
1,80
2,20
2,71
3,11
12
1,78
2,18
2,68
3,06
13
1,77
2,16
2,65
3,01
14
1,76
2,15
2,62
3,00
15
1,75
2,13
2,60
2,95
16
1,75
2,12
2,58
2,92
330
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы В.2
Уровни значимости
f
0,10
0,05
0,02
0,01
17
1,74
2,11
2,57
2,90
18
1,73
2,10
2,55
2,88
19
1,73
2,09
2,54
2,86
20
1,73
2,09
2,53
2,85
30
1,70
2,04
2,46
2,75
40
1,68
2,02
2,42
2,70
60
1,67
2,00
2,39
2,66
120
1,66
1,98
2,36
2,61
¥
1,65
1,96
2,33
2,58
Таблица В.3 – Значения F критерия Фишерадля уровня значимости
a = 0,05 (5%)
Число
Значения критерия при числе степеней свободы для большей
степеней
дисперсииf1
свободы
f2
1
2
3
4
5
6
12
24
¥
1
161,4 199,5 215,7 224,6 230,2 234,0 244,9 249,0 254,3
2
18,5
19,2
19,2
19,3
19,3
19,3
19,4
19,5
19,5
3
10,1
9,6
9,3
9,1
9,0
8,9
8,7
8,6
8,5
4
7,7
6,9
6,6
6,4
6,3
6,2
5,9
5,8
5,6
5
6,6
5,8
5,4
5,2
5,1
5,0
4,7
4,5
4,4
6
6,0
5,1
4,8
4,5
4,4
4,3
4,0
3,8
3,7
7
5,6
4,7
4,4
4,1
4,0
3,9
3,6
3,4
3,2
8
5,3
4,5
4,1
3,8
3,7
3,6
3,3
3,1
2,7
9
5,1
4,3
3,9
3,6
3,5
3,4
3,1
2,9
2,5
10
5,0
4,1
3,7
3,5
3,3
3,2
2,9
2,7
2,4
331
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы В.3
Значения критерия при числе степеней свободы для большей
Число
дисперсииf1
степеней
свободыf2
1
2
3
4
5
6
12
24
¥
11
4,9
4,0
3,6
3,4
3,2
3,1
2,8
2,6
2,3
12
4,8
3,9
3,5
3,3
3,1
3,0
2,7
2,5
2,2
13
4,7
3,8
3,4
3,2
3,0
2,9
2,6
2,4
2,1
14
4,6
3,7
3,3
3,1
3,0
2,9
2,5
2,3
2,1
15
4,5
3,7
3,3
3,1
2,9
2,8
2,5
2,3
2,0
16
4,5
3,6
3,2
3,0
2,9
2,7
2,4
2,2
2,0
17
4,5
3,6
3,2
3,0
2,8
2,7
2,4
2,2
2,0
18
4,4
3,6
3,2
2,9
2,8
2,7
2,3
2,1
1,9
19
4,4
3,5
3,1
2,9
2,7
2,6
2,3
2,1
1,9
20
4,4
3,5
3,1
2,9
2,7
2,6
2,3
2,1
1,8
30
4,2
3,3
2,9
2,7
2,5
2,4
2,1
1,9
1,6
40
4,1
3,2
2,9
2,6
2,5
2,3
2,0
1,8
1,5
60
4,0
3,2
2,8
2,5
2,4
2,3
1,9
1,7
1,4
120
3,9
3,1
2,7
2,5
2,3
2,2
1,8
1,6
1,3
¥
3,8
3,0
2,6
2,4
2,2
2,1
1,8
1,5
1,0
Таблица В.4 – Проверка коэффициента корреляции на значимость
относительно нуля
Числосте
пенейсво
Уровни значимости
0,05
0,01
1
0,997
-
2
0,950
3
0,878
боды
Числостеп
енейсвобо
Уровни значимости
0,05
0,01
21
0,413
0,526
0,990
22
0,404
0,515
0,959
23
0,396
0,505
ды
332
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы В.4
Числосте
Уровни значимости
Числостеп
пенейсво
енейсвобо
Уровни значимости
0,05
0,01
24
0,388
0,496
0,875
25
0,381
0,487
0,707
0,834
26
0,374
0,478
7
0,666
0,798
27
0,367
0,470
8
0,632
0,765
28
0,361
0,463
9
0,602
0,735
29
0,355
0,456
10
0,576
0,708
30
0,349
0,449
11
0,553
0,684
35
0,325
0,418
12
0,532
0,661
40
0,304
0,393
13
0,514
0,641
50
0,273
0,354
14
0,497
0,623
60
0,250
0,325
15
0,482
0,606
70
0,232
0,302
16
0,468
0,590
80
0,217
0,283
17
0,456
0,575
100
0,195
0,254
18
0,444
0,561
200
0,138
0,181
19
0,433
0,549
300
0,113
0,148
20
0,423
0,537
400
0,0978
0,128
0,05
0,01
4
0,811
0,917
5
0,754
6
боды
ды
Таблица В.5 – Значение критерия Кохрена G для уровня значимости
a = 0,05
f2
f1
1
2
3
4
2
0,9985
0,9750
0,9392
0,9057
3
0,9669
0,8709
0,7977
0,7457
4
0,9065
0,7679
0,6841
0,6287
333
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы В.5
f1
f2
1
2
3
4
5
0,8412
0,6838
0,5981
0,5441
6
0,7808
0,6161
0,5321
0,4803
7
0,7271
0,5612
0,4800
0,4307
8
0,6798
0.5157
0,4377
0,3910
9
0,6385
0,4775
0,4027
0,3584
10
0,6020
0,4450
0,3733
0,3311
12
0,5410
0,3924
0,3264
0,2880
15
0,4709
0,3346
0,2758
0,2419
20
0,3894
0,2705
0,220
0,1921
24
0,3434
0,2354
0,1907
0,1656
30
0,2929
0,1980
0,1593
0,1377
40
0,2370
0,1576
0,1259
0,1082
60
0,1737
0,1131
0,0895
0,0765
Таблица В.6 – Значения G-критерия при 5 % - ном уровне значимости
n-1
N
1
2
3
4
5
6
7
8
9
4
0,9065 0,7679 0,6841 0,6287 0,5895 0,5598 0,5365 0,5175 0,5017
6
0,7808 0,6161 0,5321 0,4803 0,4447 0,4184 0,3980 0,3817 0,3682
8
0,6798 0,5157 0,4377 0,3910 0,3595 0,3362 0,3185 0,3043 0,2926
10
0,6020 0,4450 0,3733 0,3311 0,3029 0,2823 0,2666 0,2541 0,2439
12
0,5410 0,3924 0,3624 0,2880 0,2624 0,2439 0,2299 0,2187 0,2098
15
0,4709 0,3346 0,2758 0,2419 0,2195 0,2034 0,1911 0,1815 0,1736
20
0,3894 0,2705 0,2205 0,1921 0,1735 0,1602 0,1501 0,1422 0,1357
334
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица В.7 – Значения t - критерия при 5% - ном уровне значимости
Число степеней
1
2
3
4
5
6
7
8
12,71
4,30
3,18
2,78
2,57
2,45
2,37
2,30
9
10
11
12
13
14
15
16
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
17
18
19
20
21
22
23
24
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
25
26
27
28
29
30
40
60
2,06
2,06
2,05
2,05
2,05
2,04
2,02
2,00
свободы
Значения t
Число степеней
свободы
Значения t
Число степеней
свободы
Значения t
Число степеней
свободы
Значения t
Таблица В.8 – Значения χ2 при 5 % - ном уровне значимости
Число степеней
Число степеней свободы
Значения χ2
1
3,84
16
26,з
2
5,99
17
27,6
3
7,82
18
28,9
4
9,49
19
30,1
5
11,07
20
31,4
6
12,59
21
32,7
7
14,07
22
33,9
8
15,51
23
35,2
9
16,92
24
36,4
10
18,31
25
37,7
11
19,68
26
38,9
335
свободы
Значения χ2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы В.8
Число степеней
Число степеней свободы
Значения χ2
12
21,0
27
40,1
13
22,4
28
41,3
14
23,7
29
42,6
15
25,0
30
43,8
336
свободы
Значения χ2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение Г
(справочное)
Таблица Г.1 – Таблица значений функции Лапласа
t
F(t)
t
F(t)
t
F(t)
t
F(t)
0.00
0.00000
1.00
0.68269
2.00
0.95450
3.00
0.99730
0.01
0.00798
1.01
0.68750
2.01
0.95557
3.01
0.99739
0.02
0.01596
1.02
0.69227
2.02
0.95662
3.02
0.99747
0.03
0.02393
1.03
0.69699
2.03
0.95764
3.03
0.99755
0.04
0.03191
1.04
0.70166
2.04
0.95865
3.04
0.99763
0.05
0.03988
1.05
0.70628
2.05
0.95964
3.05
0.99771
0.06
0.04784
1.06
0.71086
2.06
0.96060
3.06
0.99779
0.07
0.05581
1.07
0.71538
2.07
0.96155
3.07
0.99786
0.08
0.06376
1.08
0.71986
2.08
0.96247
3.08
0.99793
0.09
0.07171
1.09
0.72429
2.09
0.96338
3.09
0.99800
0.10
0.07966
1.10
0.72867
2.10
0.96427
3.10
0.99806
0.11
0.08759
1.11
0.73300
2.11
0.96514
3.11
0.99813
0.12
0.09552
1.12
0.73729
2.12
0.96599
3.12
0.99819
0.13
0.10348
1.13
0.74152
2.13
0.96683
3.13
0.99825
0.14
0.11134
1.14
0.74571
2.14
0.96765
3.14
0.99831
0.15
0.11924
1.15
0.74986
2.15
0.96844
3.15
0.99837
0.16
0.12712
1.16
0.75395
2.16
0.96923
3.16
0.99842
0.17
0.13499
1.17
0.75800
2.17
0.96999
3.17
0.99848
0.18
0.14285
1.18
0.76200
2.18
0.97074
3.18
0.99853
0.19
0.15069
1.19
0.76595
2.19
0.97148
3.19
0.99858
0.20
0.15852
1.20
0.76986
2.20
0.97219
3.20
0.99863
0.21
0.16633
1.21
0.77372
2.21
0.97289
3.21
0.99867
0.22
0.17413
1.22
0.77754
2.22
0.97358
3.22
0.99872
0.23
0.18191
1.23
0.78130
2.23
0.97425
3.23
0.99876
0.24
0.18967
1.24
0.78502
2.24
0.97491
3.24
0.99880
337
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы Г.1
t
F(t)
t
F(t)
t
F(t)
t
F(t)
0.25
0.19741
1.25
0.78870
2.25
0.97555
3.25
0.99855
0.26
0.20514
1.26
0.79233
2.26
0.97618
3.26
0.99889
0.27
0.21284
1.27
0.79592
2.27
0.97679
3.27
0.99892
0.28
0.22052
1.28
0.79945
2.28
0.97739
3.28
0.99896
0.29
0.22818
1.29
0.80295
2.29
0.97798
3.29
0.99900
0.30
0.23582
1.30
0.80640
2.30
0.97855
3.30
0.99903
0.31
0.24344
1.31
0.80980
2.31
0.97911
3.31
0.99907
0.32
0.25103
1.32
0.81316
2.32
0.97966
3.32
0.99910
0.33
0.25860
1.33
0.81648
2.33
0.98019
3.33
0.99913
0.34
0.26614
1.34
0.81975
2.34
0.98072
3.34
0.99916
0.35
0.27366
1.35
0.82298
2.35
0.98123
3.35
0.99919
0.36
0.28115
1.36
0.82617
2.36
0.98172
3.36
0.99922
0.37
0.28862
1.37
0.82931
2.37
0.98221
3.37
0.99925
0.38
0.29605
1.38
0.83241
2.38
0.98269
3.38
0.99928
0.39
0.30346
1.39
0.83547
2.39
0.98315
3.39
0.99930
0.40
0.31084
1.40
0.83849
2.40
0.98360
3.40
0.99933
0.41
0.31819
1.41
0.84146
2.41
0.98405
3.41
0.99935
0.42
0.32552
1.42
0.84439
2.42
0.98448
3.42
0.99937
0.43
0.33280
1.43
0.84728
2.43
0.98490
3.43
0.99940
0.44
0.34006
1.44
0.85013
2.44
0.98531
3.44
0.99942
0.45
0.34729
1.45
0.85294
2.45
0.98571
3.45
0.99944
0.46
0.35448
1.46
0.85571
2.46
0.98611
3.46
0.99946
0.47
0.36164
1.47
0.85844
2.47
0.98649
3.47
0.99948
0.48
0.36877
1.48
0.86113
2.48
0.98686
3.48
0.99950
0.49
0.37587
1.49
0.86378
2.49
0.98723
3.49
0.99952
0.50
0.38292
1.50
0.86639
2.50
0.98758
3.50
0.99953
0.51
0.38995
1.51
0.86696
2.51
0.98793
3.51
0.99955
338
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы Г.1
t
F(t)
t
F(t)
t
F(t)
t
F(t)
0.52
0.39694
1.52
0.87149
2.52
0.98826
3.52
0.99957
0.53
0.40389
1.53
0.87398
2.53
0.98859
3.53
0.99958
0.54
0.41080
1.54
0.87644
2.54
0.98891
3.54
0.99960
0.55
0.41768
1.55
0.87886
2.55
0.98923
3.55
0.99961
0.56
0.42452
1.56
0.88124
2.56
0.98953
3.56
0.99963
0.57
0.43132
1.57
0.88358
2.57
0.98983
3.57
0.99964
0.58
0.43809
1.58
0.88589
2.58
0.99012
3.58
0.99966
0.59
0.44481
1.59
0.88817
2.59
0.99040
3.59
0.99967
0.60
0.45149
1.60
0.89040
2.60
0.99068
3.60
0.99968
0.61
0.45814
1.61
0.89260
2.61
0.99095
3.61
0.99969
0.62
0.46474
1.62
0.89477
2.62
0.99121
3.62
0.99971
0.63
0.47131
1.63
0.89690
2.63
0.99146
3.63
0.99972
0.64
0.47783
1.64
0.89899
2.64
0.99171
3.64
0.99973
0.65
0.48431
1.65
0.90106
2.65
0.99195
3.65
0.99974
0.66
0.49075
1.66
0.90309
2.66
0.99219
3.66
0.99975
0.67
0.49714
1.67
0.90508
2.67
0.99241
3.67
0.99976
0.68
0.50350
1.68
0.90704
2.68
0.99263
3.68
0.99977
0.69
0.50981
1.69
0.90897
2.69
0.99285
3.69
0.99978
0.70
0.51607
1.70
0.91087
2.70
0.99307
3.70
0.99978
0.71
0.52230
1.71
0.91273
2.71
0.99327
3.71
0.99979
0.72
0.52848
1.72
0.91457
2.72
0.99347
3.72
0.99980
0.73
0.53461
1.73
0.91637
2.73
0.99367
3.73
0.99981
0.74
0.54070
1.74
0.91814
2.74
0.99386
3.74
0.99982
0.75
0.54675
1.75
0.91988
2.75
0.99404
3.75
0.99982
0.76
0.55275
1.76
0.92159
2.76
0.99422
3.76
0.99983
0.77
0.55870
1.77
0.92327
2.77
0.99439
3.77
0.99984
0.78
0.56461
1.78
0.92492
2.78
0.99456
3.78
0.99984
339
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы Г.1
t
F(t)
t
F(t)
t
F(t)
t
F(t)
0.79
0.57047
1.79
0.92655
2.79
0.99473
3.79
0.99985
0.80
0.57629
1.80
0.92814
2.80
0.99489
3.80
0.99986
0.81
0.58206
1.81
0.92970
2.81
0.99505
3.81
0.99986
0.82
0.58778
1.82
0.93124
2.82
0.99520
3.82
0.99987
0.83
0.59346
1.83
0.93275
2.83
0.99535
3.83
0.99987
0.84
0.59909
1.84
0.93423
2.84
0.99549
3.84
0.99988
0.85
0.60468
1.85
0.93569
2.85
0.99563
3.85
0.99988
0.86
0.61021
1.86
0.93711
2.86
0.99576
3.86
0.99989
0.87
0.61570
1.87
0.93852
2.87
0.99590
3.87
0.99989
0.88
0.62114
1.88
0.93989
2.88
0.99602
3.88
0.99990
0.89
0.62653
1.89
0.94124
2.89
0.99615
3.89
0.99990
0.90
0.63188
1.90
0.94257
2.90
0.99627
3.90
0.99990
0.91
0.63718
1.91
0.94387
2.91
0.99639
3.91
0.99991
0.92
0.64243
1.92
0.94514
2.92
0.99650
3.92
0.99991
0.93
0.64763
1.93
0.94639
2.93
0.99661
3.93
0.99992
0.94
0.65278
1.94
0.94762
2.94
0.99672
3.94
0.99992
0.95
0.65789
1.95
0.94882
2.95
0.99682
3.95
0.99992
0.96
0.66294
1.96
0.95000
2.96
0.99692
3.96
0.99992
0.97
0.66795
1.97
0.95116
2.97
0.99702
3.97
0.99993
0.98
0.67291
1.98
0.95230
2.98
0.99712
3.98
0.99993
0.99
0.67783
1.99
0.95341
2.99
0.99721
3.99
0.99993
340
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПриложениеД
(справочное)
Таблица Д.1 – Распределение хи-квадрат
k – число степеней свободы
k
0,10
0,05
0,01
k
0,10
0,05
0,01
1
2,706
3,841
6,635
17
24,769
27,587
33,409
2
4,605
5,991
9,210
18
25,989
28,869
34,805
3
6,251
7,815
11,341
19
27,204
30,144
36,191
4
7,779
9,488
13,277
20
28,412
31,410
37,566
5
9,236
11,070
15,086
21
29,615
32,671
38,932
6
10,645
12,592
16,812
22
30,813
33,924
40,289
7
12,017
14,067
18,475
23
32,007
35,172
41,638
8
13,362
15,507
20,090
24
33,196
36,415
42,980
9
14,684
16,919
21,666
25
34,382
37,652
44,314
10
15987
18,307
23,209
26
35,563
38,885
45,642
11
17,275
19,675
24,725
27
36,741
40,113
46,963
12
18,549
21,026
26,217
28
37,916
41,337
48,278
13
19,812
22,362
27,688
29
39,087
42,557
49,588
14
21,064
23,685
29,141
30
40,256
43,773
50,892
341
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение таблицы Д.1
k – число степеней свободы
k
0,10
0,05
0,01
k
0,10
0,05
0,01
15
22,307
24,996
30,578
40
51,805
55,758
63,691
16
23,542
26,296
32,000
60
74,397
79,082
88,3379
342
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение Е
(справочное)
Таблица Е.1 - Значения G-критерия при 5 %-ном уровне значимости
n-1
опыт
2
3
4
5
6
7
8
9
4
0,8643 0,7814 0,7212 0,6761 0,6410 0,6129 0,5897 0,5702
6
0,7818 0,6258 0,5635 0,5195 0,4866 0,4608 0,4401 0,4229
8
0,6152 0,5209 0,4627 0,4226 0,3932 0,3704 0,3522 0,3373
10
0,5358 0,4469 0,3934 0,3572 0,3308 0,3106 0,2945 0,2813
12
0,4751 0,3919 0,3428 0,3099 0,2861 0,2680 0,2535 0,2419
15
0,4069 0,3317 0,2822 0,2593 0,2386 0,2228 0,2104 0,2002
20
0,3297 0,2654 0,2288 0,2048 0,1877 0,1748 0,1646 0,1567
343
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Учебное пособие
А. Л. Воробьёв, И. И. Любимов, Д. А. Косых
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА
В УПРАВЛЕНИИ КАЧЕСТВОМ
ISBN 978-5-4417-0476-2
9 785441 704762
Подписано в печать 30.11.2014 г.
1
Формат 60х84 /16. Бумага писчая. Цена свободная.
Усл. печ. листов 21,4. Тираж 500. Заказ 237.
ООО ИПК «Университет»
460007, г. Оренбург, ул. М. Джалиля, 6.
E-mail: ipk_universitet@mail.ru
Тел./факс: (3532) 90-00-26
Документ
Категория
Без категории
Просмотров
608
Размер файла
5 654 Кб
Теги
планирование, эксперимент, 9635, управления, организации, качество
1/--страниц
Пожаловаться на содержимое документа