close

Вход

Забыли?

вход по аккаунту

?

Shchenikov

код для вставкиСкачать
Федеральное агенТство по образованию
Государственное образовательное учреждение
высшего профессионального образования
Санкт-петербургский государственный университет
аэрокосмического приборостроения
Я. А. Щеников
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ
ЭКСПЕРИМЕНТА
Учебное пособие
Санкт-Петербург
2008
УДК 519.242
ББК 22.172
Щ51
Рецензенты:
генеральный директор ООО «Пантес» Г. И. Коршунов;
генеральный директор ООО НПФ «Торэкс» К. А. Бруснецов
Утверждено редакционно-издательским советом университета
в качестве учебного пособия
Щеников Я. А.
Щ51 Планирование и организация эксперимента: учебное пособие / Я. А. Щеников. – СПб.: ГУАП, 2008. – 80 с.: ил.
ISBN 978-5-8088-0339-8
В пособии приводятся теоретические сведения, примеры построения планов экспериментов, рекомендуемая литература.
Предназначено для студентов специальностей 220501 «Управление качеством», 220601 «Управление инновациями», 190800
«Метрология и метрологическое обеспечение» направления
220600 «Инноватика».
УДК 519.242
ББК 22.172
ISBN 978-5-8088-0339-8
© ГУАП, 2008
© Я. А. Щеников, 2008
Содержание
Введение....................................................................... 5
1. Планирование эксперимента как раздел теории
эксперимента................................................................ 6
1.1. Термины и определения теории планирования
эксперимента................................................................ 6
1.2. Классификация экспериментов............................. 7
1.3. Основные требования к эксперименту..................... 9
1.4. Другие требования к эксперименту........................ 9
1.5. Основные этапы подготовки измерительного
эксперимента................................................................10
1.6. Выбор средств измерения......................................11
2. Параметр оптимизации ...............................................13
2.1. Требования, предъявляемые к параметру
оптимизации.................................................................13
2.2. Задачи с несколькими параметрами оптимизации.... 13
2.3. Обобщенный параметр оптимизации......................14
2.4. Простейшие способы построения обобщенного
отклика........................................................................14
3. Факторы...................................................................18
3.1. Количество факторов............................................18
3.2. Характеристика факторов.....................................18
3.3. Формализация процесса отбора факторов................ 19
3.4. Кодирование факторов.........................................19
3.5. Выбор нулевого (основного) уровня........................ 20
3.6. Выбор интервалов варьирования факторов.............. 21
4. Регрессионный анализ как основа планирования
эксперимента................................................................22
4.1. Уравнение регрессии............................................22
4.2. Примеры регрессионных моделей..........................23
4.3. Проверка значимости коэффициентов регрессии...... 24
5. Планы экспериментов типа 2k и 2(k–l) ............................26
5.1. Полный факторный эксперимент типа 2k................ 26
5.2. Свойства полного факторного эксперимента типа 2k.. 28
5.3. Расчет коэффициентов регрессии........................... 28
5.4. Физический смысл взаимодействий.......................29
5.5. Дробный факторный эксперимент – план типа 2(k–l).. 29
5.6. Минимизация числа опытов..................................30
5.7. Дробная реплика.................................................31
5.8. Выбор полуреплик. Генерирующие соотношения
и определяющие контрасты.............................................32
6. Планы экспериментов типа 3k и 3(k–l).............................35
6.1. Планирование экспериментов типа 3(k–l) .................35
6.2. Планы бокса–бенкена .........................................36
6.3. Планы для факторов на двух и трех уровнях............ 37
6.4. Метод наименьших квадратов для нелинейных
моделей........................................................................38
7. Методы повышения качества проведения эксперимента... 40
7.1. Виды ошибок измерений.......................................40
7.2. Рандомизация.....................................................42
7.3. Параллельные опыты...........................................44
8. Анализ качества модели .............................................45
8.1. Необходимость анализа качества полученной
модели.........................................................................45
8.2. Дисперсии, используемые в регрессионном анализе.. 45
8.3. Анализ информативности модели...........................45
8.4. Анализ адекватности модели.................................46
8.5. Анализ предсказывающих свойств модели.............. 47
9. Планирование отсеивающих экспериментов................... 48
9.1. Назначение отсеивающих экспериментов................ 48
9.2. Априорное ранжирование факторов
(психологический эксперимент).......................................48
9.3. Насыщенные и сверхнасыщенные планы................ 49
9.4. Метод случайного баланса.....................................50
9.5. Планы плакетта–бермана....................................53
10. Специальные планы..................................................56
10.1. Применение пассивных экспериментов
для получения математических моделей........................... 56
10.2. Латинские, греко-латинские,
гипер-греко-латинские квадраты.....................................58
10.3. Методы тагути: робастное планирование
эксперимента................................................................60
10.4. Планы для смесей..............................................62
10.5. Планирование экспериментов при наличии
неоднородностей............................................................67
Заключение..................................................................69
Рекомендуемая литература.............................................70
Приложение 1. Справочные таблицы................................ 72
Приложение 2. Исходные данные для генерации планов..... 78
ВВЕДЕНИЕ
Необходимость в проведении эксперимента обычно связана с
решением научных или производственных задач: оптимизация
качества материалов, отыскание оптимальных условий проведения процессов, нахождение математических моделей процессов,
разработка наиболее рациональных конструкций оборудования
и т. д.
Многие современные системы являются сложными и не поддаются теоретическому изучению в заданные сроки. В таком случае целесообразно использовать теорию планирования и организации эксперимента.
До середины XX века использовались пассивные методы исследований, основанные на поочередном варьировании отдельных независимых переменных – факторов. Резкое увеличение
сложности технических и производственных систем привело к
невозможности дальнейшего применения таких методов ввиду
больших затрат времени и средств. На замену им пришли методы
активного эксперимента, позволяющие проводить экономичные
эксперименты, обеспечивающие принятие решений, близких к
оптимальным. В противовес широко распространенному однофакторному эксперименту была показана целесообразность одновременного варьирования всеми факторами.
Практически одновременно возникло направление, связанное
с оптимизацией процессов – планирование экстремального эксперимента. Суть его заключается в проведении последовательных небольших серий опытов таким образом, чтобы после математической обработки предыдущей серии можно было выбрать
условия проведения следующей серии и таким образом постепенно достигнуть области оптимума.
Применение теории планирования эксперимента делает поведение экспериментатора целенаправленным и организованным,
существенно способствует повышению производительности труда и надежности полученных результатов. Важно, что теория является универсальной, пригодной во многих областях человеческой деятельности.
5
1. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
КАК РАЗДЕЛ ТЕОРИИ ЭКСПЕРИМЕНТА
1.1. Термины и определения теории планирования
эксперимента
Эксперимент – целенаправленное воздействие на объект исследования с целью получения достоверной информации.
Эксперимент – совокупность действий, направленных на выявление свойств изучаемого объекта или его математической модели.
Планирование эксперимента – это процедура выбора числа
и условий проведения опытов, необходимых и достаточных для
решения поставленной задачи с требуемой точностью.
Математическая теория планирования эксперимента – наука о способах:
составления экономных экспериментальных планов, которые
позволяют извлекать наибольшее количество информации об
объекте;
проведения эксперимента;
обработки экспериментальных данных;
использования полученных результатов для оптимизации исследуемых объектов.
Опыт – простейшее действие, из которых складывается эксперимент.
Объект исследования – для его описания удобно использовать
понятие «черного ящика» (рис. 1.1). Стрелки справа изображают
численные характеристики целей исследования – параметры
оптимизации. Для проведения эксперимента необходимо иметь
возможность воздействовать на поведение «черного ящика».
Параметр оптимизации 1
Фактор 1
Фактор 2
Объект исследования
(«черный ящик»)
Фактор k
Параметр оптимизации 2
.
.
.
Параметр оптимизации m
Рис. 1.1. Факторы, объект исследования, параметры оптимизации
6
Параметр оптимизации 1
Фактор 1
Фактор 2
Математическая
модель
Фактор k
Параметр оптимизации 2
.
.
.
Параметр оптимизации m
Рис. 1.2. Факторы, математическая модель объекта исследования,
параметры оптимизации
Все способы такого воздействия называются факторами (входы
«черного ящика»).
Модель – упрощенная система, отражающая отдельные стороны явлений изучаемого объекта. Каждый изучаемый процесс
или объект можно описать различными моделями, при этом ни
одна модель не может сделать это абсолютно полно и всесторонне. Планирование эксперимента напрямую связано с разработкой и исследованием математической модели объекта исследования (рис. 1.2).
Главное требование к модели – достаточно точное (адекватное) описание объекта.
Параметр оптимизации (другие названия: отклик, зависимая переменная, критерий оптимизации, целевая функция, выход «черного ящика» и т. д.) – количественная характеристика
цели эксперимента. Параметр оптимизации является откликом
на воздействие факторов, которые определяют поведение выбранной системы.
Фактор (другие названия: независимая переменная, регрессор) – измеряемая переменная величина, принимающая в некоторый момент времени определенное значение (уровень) и влияющая на объект исследования и, как следствие, на параметр
оптимизации [1,4].
1.2. Классификация экспериментов
Многие научные исследования тесно связаны с экспериментами, которые могут быть:
физическими. Проводятся непосредственно на объекте исследования: лабораторная установка, промышленное оборудование;
7
психологическими. Объект исследования – поведение живых
существ: экспериментальная группа людей, лабораторные животные;
модельными. Проводятся на модели объекта исследования:
например исследование ядерных реакций путем их моделирования на суперЭВМ.
Научные эксперименты характеризуются небольшим числом рассматриваемых факторов и, как правило, ориентированы
на получение математической модели.
Промышленные эксперименты, наоборот, характеризуются
большим числом факторов и направлены на выявление наиболее
значимых для процесса факторов или на поиск оптимальной области.
Активный эксперимент – эксперимент, при котором происходит активное вмешательство в его ход путем принудительной
установки в опытах нужных значений факторов. Подобные эксперименты чаще проводятся в научных исследованиях. Позволяют заметно уменьшить количество опытов, требуемое для получения математической модели.
Пассивный эксперимент – эксперимент, при котором проводятся только наблюдение значений факторов и регистрация
соответствующих этим значениям уровней параметра оптимизации. Используется, как правило, на производстве для поиска
оптимальных условий, если вмешательство в технологический
процесс может привести к значительным материальным потерям.
Экстремальный эксперимент. Одним из важнейших применений теории планирования эксперимента является определение
уравнения связи выходного параметра качества изделия с параметрами этого изделия или технологического процесса – факторами, что необходимо для нахождения оптимальных условия его
реализации. Процесс их решения называется процессом оптимизации, а эксперименты – экстремальными.
Таким образом, эксперименты используются для: поиска оптимальных условий – задача оптимизации, робастного проектирования, построения интерполяционных формул, выбора существенных факторов, оценки и уточнение констант теоретических
моделей, выбора наиболее приемлемых из некоторого множества
гипотез о механизме явлений, исследования диаграмм состав–
свойство и т. д.
8
1.3. Основные требования к эксперименту
Управляемость. Процедура планирования эксперимента подразумевает активное вмешательство в работу объекта исследования. Объект, на котором возможен активный эксперимент, называется управляемым. На практике в процессе эксперимента
на объект воздействуют как управляемые, так и неуправляемые
факторы – так называемый «шум» эксперимента.
Воспроизводимость. Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения. Если повторить некоторые опыты через неравные промежутки времени и сравнить результаты измерений, то разброс их
значений характеризует воспроизводимость эксперимента. Если
разброс не превышает некоторой заданной величины, то эксперимент удовлетворяет требованию воспроизводимости.
Если хотя бы одно из основных требований не соблюдается,
приходится переходить к другим методам исследования.
1.4. Другие требования к эксперименту
Еще одним важнейшим требованием к эксперименту является получение максимума полезной информации об исследуемом
объекте при минимально возможном числе опытов. На практике
полностью удовлетворить это требование не удается из-за наличия ограничения на число опытов N:
С = f(N),
T = f(N),
N = f(k,p),
где С – стоимость проведения эксперимента; T – время проведения эксперимента; k – количество рассматриваемых факторов;
p – количество значений, которое принимает фактор в эксперименте – уровней.
Очевидно, что имеет место противоречие: требование получения максимума полезной информации влечет за собой рост материальных и временных затрат. Разрешить это противоречие возможно только при условии внимательного подхода к подготовке
и организации проведения эксперимента. Эффективный эксперимент должен удовлетворять следующим требованиям:
минимум общего числа опытов, но не в ущерб точности получаемой модели;
9
одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам – план эксперимента;
использование математического аппарата, формализующего
многие действия экспериментатора;
наличие четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов, а также в
случае их неудачи.
1.5. Основные этапы подготовки измерительного эксперимента
Любое экспериментальное исследование содержит три этапа:
постановка задачи;
планирование и проведение эксперимента;
анализ и интерпретация результатов.
Обоснование цели эксперимента. Эксперименты, направленные на нахождение математической модели, могут преследовать
следующие цели: минимизация расхода материалов при сохранении качества; замена дорогостоящих или дефицитных материалов на более дешевые и распространенные; сокращение времени
обработки; перевод режимов в некритические зоны, снижение
трудоемкости; улучшение надежности, количества, однородности продукции; увеличение надежности и быстродействия
управления; увеличение эффективности контроля качества; создание условий для автоматизации процесса управления. Эксперименты, направленные на решение задачи оптимизации могут
преследовать следующие цели: выбор оптимального состава многокомпонентных смесей и сплавов, повышение производительности действующих установок, повышение качества продукции,
снижение затрат на получение продукции, робастное проектирование процессов.
Выбор предварительной модели объекта исследования. Привлекается вся имеющаяся в распоряжении информация: литература, отчеты о НИР, опыт специалистов. Возможно проведение
предварительных измерений для уточнения модели и выбора
средства измерения, не реагирующего на мешающие факторы.
Обоснование необходимой точности эксперимента. Учитываются цель эксперимента и ряд ограничений: технические
возможности, материальные и временные затраты и т. п. Принимается вариант, в наибольшей степени удовлетворяющий тре-
10
бованиям удобства, простоты при соблюдении необходимой точности.
Разработка методики проведения эксперимента. Совокупность действий с использованием различных способов и измерительных, вычислительных, вспомогательных средств, обеспечивающих измерения с необходимой точностью:
выбор вида измерений: прямые, косвенные, совместные или
совокупные;
выбор метода измерений: непосредственной оценки, сравнения с мерой и т. д.;
выбор одно- или многократных измерений.
В результате данного этапа подготовки эксперимента разрабатываются: схема измерений, план проведения эксперимента,
методика обработки результатов измерений, методика оценки
погрешности полученного результата измерения.
1.6. Выбор средств измерения
Используемые в эксперименте средства измерений должны
соответствовать принятым моделям, измеряемым величинам,
целям и условиям проведения эксперимента. Каждый из вариантов прорабатывается на соответствие метрологических характеристик используемого средства измерения установленным требованиям по точности и их влиянию на результаты измерений.
Среди факторов, учитываемых при выборе средств измерения,
следующие.
Воздействие средства измерений на объект исследования.
Имеет место, когда отсутствует согласование между ними по
мощности. Например, при измерении температуры маленького
объекта массивным термометром возможна погрешность из-за
дополнительного охлаждения объекта термометром. Мера борьбы: чем меньше мощность, потребляемая средством измерений
от объекта (или выделяемая на объекте), тем меньше погрешность измерения.
Неадекватность принятой модели объекта измерения. Имеет место, когда показания средств измерений зависят от неинформативных параметров принятой модели измеряемой величины.
Например, влияние на результат измерения отклонений формы
кривой сигнала от синусоидальной. Мера борьбы: из возможных
вариантов средств измерений использовать такой, который не
11
реагирует на форму кривой сигнала, либо использовать для коррекции измеренных значений коэффициент формы.
Погрешности средств измерения. Точностные свойства данного экземпляра средства измерения. Меры борьбы: введение
поправок, исключающих систематические погрешности, учет
влияние внешних факторов, выбор предела измерений ближе к
верхнему пределу, где у многих средств измерений погрешность
минимальна.
Частотный диапазон выбираемых средств измерения. С
одной стороны, должен быть шире частотного спектра входных
сигналов, чтобы обеспечивать их неискаженное прохождение. С
другой стороны, расширение частотного диапазона увеличивает
вероятность прохождения помехи, следовательно, диапазон выбираемых средств измерений должен быть как можно более узким, но без ущерба для прохождения сигнала.
Другие критерии выбора средств измерения. Например, требования к быстродействию, к конструкции и т. п.
12
2. ПАРАМЕТР ОПТИМИЗАЦИИ
Выбор функции отклика (параметра оптимизации, критерия
оптимизации) – важный этап работы на стадии предварительного изучения объекта исследования, так как правильная постановка задачи зависит от правильности выбора параметра оптимизации, являющегося функцией цели. Объект исследования
может характеризоваться одним или несколькими параметрами
оптимизации [1,4].
2.1. Требования, предъявляемые к параметру оптимизации
Параметр оптимизации должен:
измеряться при любой комбинации режимов технологического процесса;
задаваться числом, т. е. быть количественным (для перевода
качественных факторов в количественные используются соответствующие шкалы);
выражаться одним числом, соотношений типа А:В = 3:2 лучше избегать;
быть статистически эффективным, т. е. измеряться с наибольшей точностью;
быть информационным, т. е. всесторонне характеризовать
технологический процесс;
иметь физический смысл, т. е. должна быть возможность достижения полезных результатов при соответствующих условиях
процесса;
быть однозначным, т. е. должно минимизироваться или максимизироваться только одно свойство изделия;
быть однозначным в статистическом смысле (заданному набору значений факторов должно соответствовать одно значение
параметра оптимизации, при этом обратное неверно);
должен быть универсален или полон, в частности, технологические параметры недостаточно универсальны – они не учитывают экономику;
желательно, чтобы параметр оптимизации имел физический
смысл, был простым и легко вычисляемым.
2.2. Задачи с несколькими параметрами оптимизации
На практике чаще всего имеется несколько параметров оптимизации, например: физические, технологические, экономичес13
кие, эстетические, эргономические и др. Как правило, улучшение одного параметра ведет к ухудшению другого. Для решения
данной проблемы возможны следующие варианты действий:
использование одного, наиболее важного, параметра оптимизации – другие параметры оптимизации будут служить ограничениями;
использование обобщенного параметра оптимизации, который включает в себя ряд частных параметров оптимизации: типичный пример – известное соотношение «цена/качество».
Для уменьшения числа частных параметров оптимизации
можно использовать корреляционный анализ. Для этого между всевозможными парами параметров необходимо вычислить
коэффициент парной корреляции. При высокой значимости
коэффициента корреляции (близок к +1 или -1) любой из двух
анализируемых параметров можно исключить из рассмотрения.
Исключить можно тот параметр, который труднее измерить, или
тот, физический смысл которого менее ясен. Следует помнить,
что коэффициент парной корреляции имеет четкий математический смысл только при линейной зависимости между параметрами и в случае их нормального распределения.
2.3. Обобщенный параметр оптимизации
Обобщение частных параметров оптимизации в единый количественный признак связано с двумя проблемами:
проблема несогласованности размерностей частных параметров оптимизации – решается введением для каждого частного
параметра оптимизации некоторой однотипной безразмерной
шкалы;
проблема выбора правила комбинирования исходных частных откликов в обобщенный показатель.
2.4. Простейшие способы построения обобщенного отклика
Способ 1. Перемножение частных параметров оптимизации.
Yi = n
n
∏ yui ,
u =1
где Yi – обобщенный отклик в i-м опыте;
частных откликов y1i, y2i, …, yni.
14
n
∏ yui
u =1
– произведение
Для каждого частного параметра оптимизации введена простейшая шкала: 0 – брак, 1 – годный продукт. Если хотя бы один
из частных откликов обратился в 0, то и обобщенный отклик будет нулем.
Недостатки этого способа: грубость и жесткость.
Способ 2. Суммирование частных откликов с учетом их веса.
2
N
Yi =
 y − y u0 
au  ui
 ,
 y u0 
i =1
∑
где
N
∑ au = 1 и аu > 0.
u=1
Здесь: au – вес u-го частного параметра оптимизации; yui – результат измерения u-го параметра оптимизации в i-м опыте; yu0 –
«идеальное» значение u-го параметра оптимизации.
Если в некотором опыте все частные параметры оптимизации
совпадут с идеалом (выражение в круглых скобках), то Yi станет
равным нулю. Это и есть то значение, к которому нужно стремиться.
Вес аu вводится для устранения нивелировки частных откликов. Для нахождения значений весов можно воспользоваться экспертными оценками.
Способ 3. Шкала желательности Харрингтона
Назначение шкалы Харрингтона – установление соответствия
между физическими и психологическими параметрами. Здесь
под физическими параметрами понимаются всевозможные частные параметры оптимизации, характеризующие функционирование исследуемого объекта: технические, эстетические, статистические параметры. Под психологическими параметрами
понимаются чисто субъективные оценки экспериментатора желательности того или иного значения отклика. Чтобы получить
шкалу желательности, удобно пользоваться готовыми таблицами соответствии между отношениями предпочтения в эмпирической и числовой системах (табл. 2.1).
Таблица 2.1. Стандартные отметки на шкале желательности
Желательность
Отметки на шкале желательности
Очень хорошо
Хорошо
1,00–0,80
0,80–0,63
15
Продолжение табл. 2.1
Удовлетворительно
Плохо
Очень плохо
0,63–0,37
0,37–0,20
0,20–0,00
В табл. 2.1 представлены числа, соответствующие некоторым точкам
кривой (рис. 2.1), которая задается уравнением
−y
d = e −e .
На оси ординат нанесены значения желательности, изменяющиеся от 0 до 1. По оси абсцисс указаны значения параметра оптимизации, записанные в условном масштабе. За начало отсчета
0 по этой оси выбрано значение, соответствующее желательности 0,37. Выбор именно этой точки связан с тем, что она является
точкой перегиба кривой, что в свою очередь создает определенные удобства при вычислениях.
Кривую желательности обычно используют как номограмму.
После выбора шкалы желательности и преобразования частных параметров оптимизации в частные функции желательности приступают к построению обобщенной функции желательности. Обобщают по формуле
D=n
n
∏ du ,
u=1
где D – обобщенная желательность; du – частные желательности.
d
1
0.8
0.6
0.4
0.2
0
0
100%
�0.2
�0.4
�6
�4
�2
0
Рис. 2.1. Функция желательности
16
1000
0
2
4
6
8
y
Способ задания обобщенной функции желательности таков,
что если хотя бы одна желательность du = 0, то обобщенная функция будет равна нулю. С другой стороны D = 1 только тогда, когда du = 1. Обобщенная функция весьма чувствительна к малым
значениям частных желательностей.
Способ задания базовых отметок шкалы желательности,
представленный в табл. 2.1, один и тот же, как и для частных,
так и для обобщенных желательностей. Обобщенная функция
желательности является некоторым абстрактным построением,
но она обладает такими важными свойствами, как адекватность,
статистическая чувствительность, эффективность, причем эти
свойства не ниже, чем таковые для любого технологического
показателя, им соответствующего. Обобщенная функция желательности является количественным, однозначным, единым и
универсальным показателем качества исследуемого объекта и,
обладая такими свойствами, как адекватность, эффективность,
статистическая чувствительность, может использоваться в качестве критерия оптимизации.
17
3. ФАКТОРЫ
3.1. Количество факторов
Каждый фактор может принимать в опыте одно из нескольких дискретных значений – уровней. Все сочетания уровней
факторов составляют множество различных состояний объекта
исследования, что одновременно составляет число возможных
опытов эксперимента. Объекты исследования обычно обладают
большой сложностью. Так, простая система с пятью факторами
на четырех уровнях имеет 1024 состояний, а для десяти факторов на четырех уровнях их уже 1048576, что вызывает сомнения
в возможности проведения такого эксперимента. Отсюда возникает проблема выбора количества факторов и их уровней, необходимых для достижения цели исследования [2].
После выбора объекта исследования и параметра оптимизации нужно рассмотреть все факторы, которые могут влиять на
процесс. Неучтенные и неконтролируемые экспериментатором
факторы могут значительно увеличить ошибку опыта. При поддержании этих факторов на фиксированных уровнях может быть
получено ложное представление об оптимуме, так как нет гарантии, что полученный уровень является оптимальным. Таким
образом, чем больше факторов рассматривается при проведении
эксперимента, тем меньше ошибка эксперимента. С другой стороны большое число факторов увеличивает число опытов
N = pk,
(3.1)
где р – число уровней; k – число факторов.
Таким образом, с одной стороны, для уменьшения ошибки
эксперимента количество факторов должно быть максимально,
с другой стороны, с увеличением количества факторов в геометрической прогрессии растет число опытов. Итак, выбор факторов
является весьма существенным, так как от этого зависит успех
эксперимента.
3.2. Характеристика факторов
Факторы могут быть непрерывными или дискретными. При
планировании эксперимента используют только дискретные
значения факторов.
Факторы могут быть количественные и качественные. Качественные факторы: различные вещества, технологические
18
способы, приборы, исполнители и т. п. При планировании эксперимента с качественными факторами производится кодирование
с использованием соответствующих шкал.
Фактор считается заданным, если указаны его название и область определения. В выбранной области определения он может
иметь несколько значений (уровни фактора), которые соответствуют числу его различных состояний.
3.3. Формализация процесса отбора факторов
Для отбора значимых факторов используются следующие методы:
априорная информация: литература, специалисты;
метод экспертных оценок: априорное ранжирование;
предварительные и отсеивающие эксперименты.
3.4. Кодирование факторов
В большинстве случаев желаемая математическая модель
представляет собой уравнение регрессии, т. е. геометрическое
место точек математических ожиданий условных распределений
целевой функции
y = α0 +
N
∑
i =1
α ix i +
N
∑
i≠ j
α ij x ix j +
N
∑ α iixi 2 + ... , ( 3.2)
i =1
где α 0, α 1, ..., α N , α 12, ... – коэффициенты регрессионной модели; x1, … xK – натуральные в своей размерности значения факторов.
Получить регрессионную модель с натуральными значениями факторов сразу в большинстве случаев не представляется возможным. Поэтому вначале получают полином с кодированными
безразмерными значениями факторов
y = a0 +
N
N
N
i =1
i≠ j
i =1
∑ ai x i + ∑ aij x i x j + ∑ aii x i 2 + ... , (3.3)
где x 1, ..., x k – кодированные (безразмерные) значения факторов; a0, a1, … – коэффициенты, значения которых в общем случае отличны от значений аналогичных коэффициентов модели
(3.2).
Кодированные значения факторов определяются соотношением
19
λj
λj
Xjн
Xj0
–1
0
Xjв
Xj
+1
Xj
Рис.3.1. Уровни варьирования фактора xj
xj =
x j − x j0
λj
,
(3.4)
где xj – натуральное текущее значение j-го фактора; xj0 – натуральное значение нулевого уровня j-го фактора; λj – половина
размаха варьирования j-го фактора, называется обычно интервалом варьирования; j – номер фактора (j = 1…k).
Уровень j-го фактора, соответствующий большему значению
xjв, называют верхним, а соответствующий меньшему значению
xjн – нижним. Посредине между ними размещен основной (нулевой или базовый) уровень (рис. 3.1).
При кодировании уровней факторов с использованием выражения (4.4) план эксперимента не зависит от физики процесса
(явления). На практике стремятся уровни варьирования выбрать
так, чтобы получить x j = ±1 . Это упрощает эксперимент и обработку его результатов. Значение x j = −1 соответствует нижнему,
а значение x j =+1 – верхнему уровням варьирования (рис. 4.1).
В дальнейшем будут рассмотрены эксперименты, в которых кодированные уровни факторов принимают значения –1 или +1.
3.5. Выбор нулевого (основного) уровня
Выбор нулевой точки эквивалентен определению исходного
состояния объекта исследования. Для оптимизации желательно,
чтобы нулевая точка была в области оптимума или как можно
ближе к ней, что ускоряет поиск оптимальных решений. За нулевую также можно принять такую точку, которой соответствует наилучшее значение параметра оптимизации, установленного
в результате формализации априорной информации. Еще один
20
вариант: предположим, в некоторой задаче фактор (температура) мог изменяться от 140 до 180 °С. Естественно, за нулевой уровень было принято среднее значение фактора, соответствующее
160 °С.
3.6. Выбор интервалов варьирования факторов
Под интервалом варьирования фактора подразумевается разность между двумя его значениями, принятая за единицу при
кодировании (см. рис. 3.1). Интервалы варьирования выбирают
с учетом того, что значения факторов, соответствующие уровням
+1 и –1, должны быть достаточно отличимы от значения, соответствующему нулевому уровню. Поэтому во всех случаях величина интервала варьирования должна быть больше удвоенной
квадратичной ошибки фиксирования данного фактора. Очень
большой интервал варьирования нежелателен – это может привести к снижению эффективности поиска оптимума. А очень малый интервал варьирования уменьшает область эксперимента,
что замедляет поиск оптимума. При выборе интервала варьирования целесообразно учитывать, если это возможно, число уровней варьирования факторов в области эксперимента. От числа
уровней зависят объем эксперимента (3.1) и эффективность оптимизации.
Минимальное число уровней – два: верхний (+1) и нижний
(–1) уровни. Два уровня используются в отсеивающих экспериментах, на стадии движения в область оптимума и при описании
объекта исследования линейными моделями. С увеличением числа уровней (моделей второго и более) порядка повышается чувствительность эксперимента, но одновременно возрастает число
опытов. Здесь необходимы факторы на 3-, 4- или 5-м уровнях.
Наличие нечетных уровней указывает на проведение опытов в
нулевых (основных) уровнях.
В каждом отдельном случае число уровней выбирают с учетом
условий задачи и предполагаемых методов планирования эксперимента. Здесь необходимо учитывать наличие качественных и
дискретных факторов. При получении моделей второго порядка качественные факторы не применимы, так как они не имеют
ясного физического смысла для нулевого уровня. Для дискретных факторов часто применяют преобразование измерительных
шкал, чтобы обеспечить фиксацию значений факторов на всех
уровнях
21
4. РЕГРЕССИОННЫЙ АНАЛИЗ
КАК ОСНОВА ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Регрессия – статистическая зависимость условного математического ожидания случайной величины от случайного вектора
(случайной величины).
Регрессионный анализ – раздел математической статистики,
изучающий зависимость между случайными величинами и возможностью её функционального представления по данной выборке.
Регрессионная функция – функция от случайного вектора, дающая для некоторой случайной величины наилучшую оценку в
смысле наименьших квадратов [7].
4.1. Уравнение регрессии
Описание исследуемого объекта нельзя получить в виде точной формулы функции, справедливой во всем диапазоне существования аргументов. Оно может быть лишь приближенным и
на небольшом участке в окрестностях выбранной базовой точки.
Аппроксимация искомой математической зависимости представляет собой некоторый полином – отрезок ряда Тейлора, в который разлагается неизвестная зависимость:
y = f (x1, x 2, ... x n ) = a0 +
n
n
n
i =1
i≠ j
i =1
∑ aixi + ∑ aijxix j + ∑ aiixi 2 + ... (4.1)
где
ai =
∂f 
∂ 2f 
∂ 2f 
| x =0; aij =
| x =0; aii =
|
.
∂x i
∂x i∂x j
∂x 2 x =0
i
В силу наличия неуправляемых и даже неконтролируемых
факторов хi изменение величины y носит случайный характер,
а потому уравнение (4.1) не дает нам точной связи между входом
и выходом объекта и является лишь условным математическим
ожиданием случайной величины y, т. е. уравнением регрессии.
Чтобы найти коэффициенты уравнения регрессии по результатам экспериментов в N точках факторного пространства (что
является типичной задачей регрессионного анализа), необходимо выполнение следующих предпосылок:
22
результаты наблюдений y1, y2,..., yn выходной величины в N
точках факторного пространства представляют собой независимые, нормально распределенные случайные величины;
выборочные дисперсии опытов однородны, т. е. статистически
неразличимы. Это требование означает независимость выборочной дисперсии от местоположения точки факторного пространства, в которой проводится конкретный опыт;
факторы x1, x2,..., xn измеряются с ошибкой много меньшей,
чем величина возможного отклонения параметра оптимизации
под влиянием неучтенных факторов.
Тогда задача отыскания коэффициентов уравнения регрессии
сводится к решению системы так называемых нормальных уравнений:
N
N
d
∑ (y g − y g ) 2 = ∑ (y g − ∑ aixig ) 2 → min, (4.2)
g =1
g =1
i =0
где yg – экспериментальные значения параметра оптимизации,
полученные в g-й точке факторного пространства; y g – значение
выходного параметра, найденное по уравнению регрессии в тех
же точках; d – количество членов в уравнении регрессии.
Выражение (4.2) является основным критерием проверки
правильности найденного уравнения регрессии.
Чтобы система нормальных уравнений, которая может быть
представлена в виде матрицы, имела единственное решение,
необходимо, чтобы матрица была невырожденной, т. е. чтобы
вектор-столбцы были линейно-независимы. Чтобы величины коэффициентов уравнения регрессии не зависели от числа членов
матрицы, нужно на нее наложить дополнительное условие ортогональности вектор-столбцов.
Простейшим примером регрессионной модели является уравнение парной корреляции, где на целевую функцию воздействует
один фактор. На практике в реальном производстве на целевую
функцию воздействуют много факторов и искомое уравнение
регрессии становится многомерным.
4.2. Примеры регрессионных моделей
Модели первого порядка без взаимодействий:
y = a0 + a1x1;
y = a0 + a1x1 + a2x2 (рис. 4.1, а);
23
а)
в)
4
3
2
1
0
1
3
2
1
0
�1
1
б)
10
5
0
0
1
0 0.5
�1 �1 �0.5
г)
�5
1
1
0.5 0
0.5
�0.5 �1 �1 �0.5 0
3
2
1
0
0
�0.5
�1 �1
1
0 0.5
1
0
�1 �1 �0.5
1
0 0.5
Рис. 4.1. Графики функций различных регрессионных моделей
y = a0 + a1x1 + a2x2 + a3x3.
Модели первого порядка с взаимодействиями:
y = a0 + a1x1 + a2x2 + a12x1x2 (рис. 4.1, б);
y = a0 + a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3;
y = a0 + a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3 +
+ a123x1x2x3.
Модели второго порядка без взаимодействий:
y = a0 + a1x1 + a11x21;
y = a0 + a1x1 + a2x2 + a11x21 + a22x22 (рис. 4.1, в);
y = a0 + a1x1 + a2x2 + a3x3 + a11x21 + a22x22 + a33x23.
Модели второго порядка с взаимодействиями
y = a0 + a1x1 + a2x2 + a12x1x2 + a11x21 + a22x22 (рис.4.1. г);
y = a0 + a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3 +
+ a123x1x2x3 + a11x21 + a22x22 + a33x23.
4.3. Проверка значимости коэффициентов регрессии
Проверить значимость коэффициента регрессии означает дать
ответ на вопрос, за счет чего коэффициент оказался отличным от
24
Iγ(a)
ан
а*
ав
а
Рис. 4.2. Доверительный интервал для коэффициента а: а* – точечная оценка
нуля – за счет случайных причин (ограниченного числа опытов),
либо за счет того, что это объективно имеет место.
Реализуется обычно следующий алгоритм. Для рассматриваемого коэффициента определяется доверительный интервал (интервальная оценка) Iγ(a), соответствующий доверительной вероятности γ:
Iγ(a) = {ан; aв},
где ан, aв – границы интервала.
Далее уточняется вопрос, попадает ли в построенный доверительный интервал Iγ(a) точка a = 0 (рис. 4.2).
Если это происходит, то нет оснований точечную оценку а*,
полученную при статистической обработке, считать значимой,
ибо отличной от нуля она могла оказаться за счет ограниченности числа опытов, погрешностей эксперимента и других случайных причин. Следовательно, такой коэффициент (слагаемое с
коэффициентом а*) не следует включать в формируемую математическую модель.
25
5. ПЛАНЫ ЭКСПЕРИМЕНТОВ ТИПА 2K и 2(K–L)
Работу по планированию эксперимента начинают со сбора априорной информации: параметр оптимизации, факторы, наилучшие условия проведения исследования, характер поверхности
отклика и т. д. Источники априорной информации: специальная
литература, опрос специалистов, результаты однофакторных экспериментов. На основе анализа априорной информации делается выбор экспериментальной области факторного пространства,
который заключается в выборе основного (нулевого) уровня и
интервалов варьирования факторов. Основной уровень является
исходной точкой для построения плана эксперимента, а интервалы варьирования определяют расстояния по осям координат
от верхнего и нижнего уровней до основного уровня. При планировании эксперимента значения факторов кодируются путем
линейного преобразования координат факторного пространства
с переносом начала координат в нулевую точку и выбором масштабов по осям в единицах интервалов варьирования факторов.
Используют здесь соотношение (3.4).
5.1. Полный факторный эксперимент типа 2K
Первый этап планирования эксперимента для получения
линейной модели основан на варьировании на двух уровнях. В
этом случае, при известном числе факторов, можно найти число
опытов, необходимое для реализации всех возможных сочетаний
уровней факторов (формула 3.1). Эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется
полным факторным экспериментом (ПФЭ). Если число уровней
факторов равно двум, то имеем ПФЭ типа 2K [3]. Условия эксперимента удобно записывать в виде таблицы, которую называют
матрицей планирования эксперимента (табл. 5.1).
Таблица 5.1. Матрица планирования эксперимента 22
26
Номер опыта
X1
X2
Y
1
–1
–1
y1
2
–1
+1
y2
3
+1
–1
y3
4
+1
+1
y4
При заполнении матрицы планирования значения уровней
факторов, в целях упрощения, обозначают соответствующими
знаками, а цифру 1 опускают. С учетом взаимодействия факторов х1 и х2 табл. 5.1 можно переписать следующим образом.
Таблица 5.2. Матрица планирования эксперимента с учетом взаимодействий
Номер опыта
X1
X2
X1X2
Y
1
–
–
+
y1
2
–
+
–
y2
3
+
–
–
y3
4
+
+
+
y4
Каждый столбец в матрице планирования называют векторстолбцом, а каждую строку – вектор-строкой. Таким образом, в
табл. 5.2 имеем два вектора-столбца независимых переменных и
один вектор-столбец параметра оптимизации. То, что записано в
алгебраической форме, можно изобразить графически. В области
определения факторов находится точка, соответствующая основному уровню, и проводят через нее новые оси координат, параллельные осям натуральных значений факторов. Далее выбирают
масштабы по новым осям так, чтобы интервал варьирования для
каждого фактора равнялся единице. Тогда условия проведения
опытов будут соответствовать вершинам квадрата, при k = 2, и
вершинам куба, при k = 3. Центрами этих фигур является основной уровень, а каждая сторона равна двум интервалам (рис. 5.1).
Площадь, ограниченная этими фигурами, называется областью
1.5
1
1
0.5
0.5
0
0
�0.5
�0.5
�1
1
0.5
�1
�1.5
�1.5
�1 �0.5 0
0.5
1
1.5
0
�0.5
�1 �1
�0.5
0
0.5
1
Рис. 5.1. Расположение точек в факторном пространстве для ПФЭ
при k = 2 (слева) и k = 3 (справа)
27
эксперимента. По аналогичному принципу располагаются экспериментальные точки при k> 3.
5.2. Свойства полного факторного эксперимента типа 2K
Полный факторный эксперимент относится к числу планов,
которые являются наиболее эффективными при построении линейных моделей. Эффективность, иначе оптимальность, полного
факторного эксперимента достигается за счет ниже перечисленных его свойств.
• Симметричность относительно центра эксперимента: алгебраическая сумма элементов вектора-столбца каждого фактора равна нулю.
• Условие нормировки: сумма квадратов элементов каждого
столбца равна числу опытов, или N. Это следствие того, что значения факторов в матрице задаются +1 и –1.
• Ортогональность матрицы планирования: сумма почленных произведений любых двух вектор-столбцов матрицы равна
нулю.
• Ротатабельность: точки в матрице планирования подбираются так, что точность предсказаний значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления. Выполнение этих условий
обеспечивает не только минимальную дисперсию коэффициентов регрессии, но и равенство дисперсии. Это облегчает статистический анализ результатов эксперимента.
5.3. Расчет коэффициентов регрессии
Построив матрицу планирования, осуществляют эксперимент. Получив экспериментальные данные, рассчитывают значения коэффициентов регрессии.
Значение свободного члена a0 находят как среднее арифметическое всех значений параметра оптимизации в матрице:
N
∑ yg
(5.1)
a 0 = g =1 , N
где yg – значение параметра оптимизации в g-м опыте; N – число
опытов в матрице.
28
Линейные коэффициенты регрессии рассчитывают по формуле
N
∑ xig y g
g=1
,
(5.2)
ai =
N
где xig – кодированное значение i-го фактора в g-м опыте.
Коэффициенты регрессии, характеризующие парное взаимодействие факторов, находят по формуле
N
a ij =
∑ xig x jg y g
g=1
N
.
(5.3)
Полное число всех возможных коэффициентов регрессии,
включая а0, линейные коэффициенты и коэффициенты взаимодействий всех порядков, равно числу опытов полного факторного эксперимента.
Чтобы найти число взаимодействий некоторого порядка, можно воспользоваться формулой числа сочетаний
Ckm =
k!
m!(k − m)!
где k – число факторов; m – число элементов во взаимодействии.
Так, для плана 24 число парных взаимодействий равно шести.
Отсюда видно, что с ростом числа факторов число возможных
взаимодействий быстро растет.
5.4. Физический смысл взаимодействий
Пусть на некоторый химический процесс влияют два фактора: температура и время реакции. В области низких температур
увеличение времени увеличивает выход продукта. При переходе
в область высоких температур эта закономерность нарушается.
Здесь необходимо уменьшить время реакции. Это и есть проявление эффекта взаимодействия.
5.5. Дробный факторный эксперимент – план типа 2(K–L)
Количество опытов в полном факторном эксперименте значительно превосходит число определяемых линейных коэффи29
циентов. Так как наибольшую значимость обычно имеют линейные коэффициенты, а коэффициенты взаимодействий, начиная
с тройных и выше, часто не значимы, то получается, что полный
факторный эксперимент обладает избыточностью опытов. Было
бы заманчивым сократить число опытов за счет той информации,
которая не очень существенна при построении линейных моделей. При этом нужно стремиться к тому, чтобы матрица планирования не лишилась своих оптимальных свойств. Сделать это
не так просто, но все же возможно. Рассмотрим пути минимизации числа опытов.
5.6. Минимизация числа опытов
Еще раз рассмотрим матрицу планирования типа 22 (табл.
5.3).
Таблица 5.3. Матрица планирования типа 22
Номер опыта
X0
X1
X2
(X3) = X1X2
Y
1
2
3
4
+
+
+
+
+
–
+
–
+
+
–
–
+
–
–
+
y1
y2
y3
y4
Пользуясь таким планированием, можно вычислить четыре
коэффициента и представить результаты эксперимента в виде
неполного квадратного уравнения
y = a0 + a1x1 + a2x2 + a12x1x2.
Если имеются основания считать, что в выбранных интервалах варьирования процесс может быть описан линейной моделью,
то достаточно определить три коэффициента: a0, a1, a2. Остается одна степень свободы. Употребим ее для минимизации числа
опытов. При линейном приближении a12 → 0 и вектор-столбец
x1x2 можно использовать для нового фактора x3. Поставим этот
фактор в скобках над взаимодействием x1x2 и посмотрим, каковы будут оценки коэффициентов. Здесь уже не будет тех раздельных оценок, которые были в полном факторном эксперименте.
Оценки смешиваются следующим образом:
a1 → α1 + α23; a2 → α2 + α13; a3 → α3 + α12.
30
Если постулируются линейная модель, следовательно, все
парные взаимодействия незначимы. Главное, найдено средство минимизации числа опытов: вместо восьми опытов для
изучения трех факторов оказывается можно поставить четыре! При этом матрица планирования не теряет своих оптимальных свойств (ортогональность, ротатабельность и т. п.). Найденное правило можно сформулировать: чтобы сократить число опытов, нужно новому фактору присвоить вектор-столбец
матрицы, принадлежащей взаимодействию, которым можно
пренебречь. Тогда значения нового фактора в условиях опытов
определяется знаками этого столбца. Мы рассмотрели самый
простой случай. С увеличением числа факторов вопрос о минимизации опытов превращается в сложную задачу, и для определения ее требуется ввести новые определения и понятия:
дробная реплика, генерирующее соотношение, определяющий
контраст.
5.7. Дробная реплика
Поставив четыре опыта для оценки влияния трех факторов,
мы воспользовались половиной факторного эксперимента 23,
или полурепликой. Если бы мы приравняли х3 к –х1х2, то получили бы вторую половину матрицы 23. В этом случае:
a1 → α1 – α23; a2 → α2 – α13; a3 → α3 – α12.
При реализации обеих полуреплик можно получить раздельные оценки для линейных коэффициентов (эффектов) и коэффициентов взаимодействия, как и в полном факторном эксперименте 23. Объединение этих двух полуреплик и есть полный
факторный эксперимент 23. Матрица из восьми опытов для четырехфакторного планирования будет полурепликой от полного
факторного эксперимента 24, а для пятифакторного планирования – четвертьрепликой от 25. В последнем случае два линейных эффекта приравниваются к эффектам взаимодействия. Для
обозначения дробных реплик, в которых L линейных эффектов
приравнены к эффектам взаимодействия, удобно пользоваться
условными обозначением 2(K-L). Так полуреплика от 26 запишется в виде 26-1, а четвертьреплика от 25 – в виде 25-2. Условные
обозначения дробных реплик и количество опытов приведены в
табл. 5.4.
31
Таблица 5.4. Условные обозначения дробных реплик и соответствующее число опытов
Число опытов
Число
факторов
3
4
5
6
7
5
6
7
8
9
10
11
12
13
14
15
Условное
Для
обозначение дробной
реплики
Дробная реплика
1/2 – реплика от 23
1/2 – реплика от 24
1/4 – реплика от 25
1/8 – реплика от 26
1/16 – реплика от 27
1/2 – реплика от 25
1/4 – реплика от 26
1/8 – реплика от 27
1/16 – реплика от 28
1/32 – реплика от 29
1/64 – реплика от 210
1/128 – реплика от 211
1/256 – реплика от 212
1/512 – реплика от 213
1/1024 – реплика от 214
1/2048 – реплика от 215
23-1
24-1
25-2
26-3
27-4
25-1
26-2
27-3
28-4
29-5
210-6
211-7
212-8
213-9
214-10
215-11
4
8
8
8
8
16
16
16
16
16
16
16
16
16
16
16
Для полного
факторного
эксперимента
8
16
32
64
128
32
64
128
256
512
1024
2048
4096
8192
16384
32768
5.8. Выбор полуреплик. Генерирующие соотношения
и определяющие контрасты
При построении полуреплик 23-1 существует две возможности: приравнять х3 к +х1х2 или к – х1х2. Поэтому есть только две
полуреплики 23-1 (табл. 5.5).
Таблица 5.5. Полуреплики плана типа 23–1
Номер опыта
1
2
3
4
I. X3 = X1X2
х0
х1
х2
х1 х2 х3
+
–
+
–
+
–
–
+
+
+
–
–
+
+
+
+
II. X3 = – X1 X2
Номер опыта
1
2
3
4
32
+
–
+
–
+
–
–
+
–
–
+
+
–
–
–
–
Для произведения трех столбцов матрицы I выполняется соотношение +1 = х1 х2 х3, а для матрицы II: –1 = х1х2х3. Это наглядно изображено в табл. 5.5, в первом случае все знаки столбца произведений одинаковы и равны плюс единице, а во втором
– минус единице. Символическое обозначение столбцов, равных
+1 или –1, называется определяющим контрастом. Контраст
помогает определять смешанные эффекты. Для того чтобы определить, какой эффект смешан с данным, нужно помножить
обе части определяющего контраста на столбец, соответствующий данному эффекту. Так, если 1 = х1х2х3, то для х1 имеем х1 =
= х12х2х3 = х2х3, так как всегда хi2 = 1.
Для х2 находим х2 = х1х22х3 = х1х3, для х3 получается х3 =
= х1х2х32 = х1х2.
Это значит, что коэффициенты линейного уравнения будут
оценками
b1 → β 1 + β 23;
b2 → β 2 + β 13;
b3 → β 3 + β 12.
Соотношение, показывающее, с каким из эффектов смешан
данный эффект, называется генерирующим соотношением. При
выборе полуреплики 24–1 возможно восемь:
1) х4 = х1х2;
3) х4 = х2х3;
5) х4 = х1х3;
7) х4 = х1х2х3;
2) х4 = –х1х2;
4) х4 = –х2х3;
6) х4 = –х1х3;
8) х4 = –х1х2х3.
Разрешающая способность этих полуреплик различна. Так,
реплики с первой по шестую имеют три фактора в определяющем
контрасте, седьмая и восьмая по четыре. Реплики семь и восемь
имеют максимальную разрешающую способность и называются
главными. Разрешающая способность задается системой смешивания данной реплики. Она будет максимальной, если линейные
эффекты смешаны с эффектами взаимодействия наибольшего
порядка. Рассмотрим полуреплики, заданные определяющими
контрастами 1 = х1х2х3х4 и 1 = – х1х2х3х4. Совместные оценки
здесь определяются соотношениями:
х1 = х2х3х4
х2 = х1х3х4
х3 = х1х2х4
х4 = х1х2х3
х1 = –х2х3х4
х2 = –х1х3х4
х3 = –х1х2х4
х4 = –х1х2х3
х1х2 = х3х4
х1х3 = х2х4
х1х4 = х2х3
х1х2 = –х3х4
х1х3 = –х2х4
х1х4 = –х2х3
Такой тип смешивания дает возможность оценивать линейные эффекты совместно с тройными эффектами взаимодействий,
33
а двойные взаимодействия – совместно друг с другом. Здесь коэффициенты линейного уравнения будут оценками
b1 → β 1 + β 234,
b3 → β 3 + β 124,
b12 → β 12 + β 34,
b2 → β 2 + β 134,
b4 → β 4 + β 123,
b13 → β 13 + β 24,
b14 → β 14 + β 23.
Если полуреплики заданы генерирующими соотношениями
х4 = х1 х2 и х4 = – х1 х2, то в этом случае определяющими контрастами являются 1 = х1 х2 х4 и 1 = – х1 х2 х4. Некоторые эффекты
смешиваем с парными взаимодействиями:
х1 = х2х4
х2 = х1х4
х3 = х1х2х3х4
х4 = х1х2
х1 = –х2х4
х2 = –х1х4
х3 = –х1х2х3х4
х4 = –х1х2
х1х3 = х2х3х4
х2х3 = х1х3х4
х3х4 = х1х2х3
х1х3 = –х2х3х4
х2х3 = –х1х3х4
х3х4 = –х1х2х3
Разрешающая способность этих полуреплик ниже, чем у предыдущего примера. Здесь линейный коэффициент фактора х3 зависим от взаимодействии других факторов: b3 → β 3 + β 1234 .
Выбор такой полуреплики разумен, если имеется априорная
информация о большей значимости тройных взаимодействий
по сравнению с парными или о незначимости трех парных взаимодействий х2х4, х1х4, х1х2. Из изложенного выше видно, что
выбор дробной реплики требует много труда и терпения, знания
значительной априорной информации, что не всегда возможно.
34
6. ПЛАНЫ ЭКСПЕРИМЕНТОВ ТИПА 3K и 3(K–L)
В некоторых случаях приходиться анализировать факторы,
имеющие более двух уровней. Например, если предполагается,
что влияние факторов на зависимую переменную нелинейное,
то необходимо, по меньшей мере, три уровня для проверки линейных и квадратичных эффектов и взаимодействий. Ввиду
стремительного числа опытов с ростом числа рассматриваемых
факторов (например, N = 34 = 81) планы типа 3K используют редко, вместо них используют планы типа 3(K–L) – аналоги дробного
факторного эксперимента 2(K–L) [12].
6.1. Планирование экспериментов типа 3(K–L)
Общий механизм построения дробных факторных планов типа
3(K–L) очень схож с тем, который описан для 2(K–L) планов. Именно, отправляясь от полного факторного плана, взаимодействия
используются для построения «новых» факторов с помощью определения их уровней равными соответствующим членам взаимодействий. Например, рассмотрим следующий простой факторный план 3(3–1) (табл. 6.1).
Таблица 6.1. Факторный план типа 3(3–1)
N
X1
X2
X3
Y
1
–
2
–
–
–
y1
0
+
y2
3
–
+
0
y3
4
0
–
+
y4
5
0
0
0
y5
6
0
+
–
y6
7
+
–
0
y7
8
+
0
–
y8
9
+
+
+
y9
2(K–L),
Как и в случае планов
план строится из полного факторного плана 3 –1 = 2, чьи факторы перечислены в первых двух
столбцах таблицы (факторы x1 и х2). Фактор х3 строится на основании взаимодействия х1х2 первых двух факторов. Значения
фактора х3 вычисляются по формуле
х3 = 3 – mod3 (х1 + х2),
35
где символ mod3(x) обозначает сравнение по модулю 3 (остаток от
деления x на 3).
Например, mod3(0) = 0, mod3(1) = 1, mod3(3) = 0, mod3(5) =
= 2 (3 – наибольшее число, не большее 5, делящееся на 3; так что
окончательно, 5–3 = 2) и так далее.
Если применить эту функцию к сумме столбцов х1 и х2 в
табл.6.1 можно получить третий столбец х3.
6.2. Планы Бокса–Бенкена
Эти планы конструируются комбинированием двухуровневых
факторных планов с планами неполных блоков и имеют сложную
смесь взаимодействий. Тем не менее они экономичны, и, следовательно, особенно полезны в случаях, когда дорого проводить
необходимые опыты. Исходные матрицы плана Бокса–Бенкена
для 3–5 факторов приведены в приложении 2.
Рассмотрим построение матрицы эксперимента для трех факторов (табл. 6.2).
Таблица 6.2. Исходная матрица (слева) и план эксперимента (справа) плана Бокса–Бенкена для трех факторов на трех
уровнях
Исходная матрица
План эксперимента
X1
X2
X3
N
X1
X2
X3
Y
±1
±1
0
±1
0
±1
0
±1
±1
0
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
–1
–1
+1
+1
–1
–1
+1
+1
0
0
0
0
0
–1
+1
–1
+1
0
0
0
0
–1
–1
+1
+1
0
0
0
0
0
–1
+1
–1
+1
–1
+1
–1
+1
0
y1
y2
y3
y4
y5
y6
y7
y8
y9
y10
y11
y12
y13
14
15
0
0
0
0
0
0
y14
y15
Анализ плана приведен в п. 6.4.
36
6.3. Планы для факторов на двух и трех уровнях
Если априорно известно линейное влияние одного или нескольких факторов на параметр оптимизации, то имеется возможность сократить количество экспериментов за счет использования смешанных планов на двух и трех уровнях. Эти планы
очень эффективны, они необязательно ортогональны [12].
План эксперимента 2K3M является комбинацией процедур,
описанных для планов 2(K–P) и 3(K–P) (табл. 6.3). Заполнение матрицы планирования начинается с факторов, находящихся на
трех уровнях, а затем производится дополнение факторами, находящимися на двух уровнях.
Таблица 6.3. Примеры планов типа 2131 (слева) и 2231 (справа)
N
X1
X2
Y
N
X1
X2
X3
Y
1
–
–
y1
1
–
–
–
y1
2
+
–
y2
2
–
+
–
y2
3
–
0
y3
3
+
–
–
y3
4
+
0
y4
4
+
+
–
y4
5
–
+
y5
5
–
–
0
y5
6
+
+
y6
6
–
+
0
y6
7
+
–
0
y7
8
+
+
0
y8
9
–
–
+
y9
10
–
+
+
y10
11
+
–
+
y11
12
+
+
+
y12
Примеры получаемых регрессионных моделей:
y = a0+a1x1+a2x2+a22x22,
y = a0+a1x1+a2x2+a12x1x2+a33x32.
Для нахождения коэффициентов модели используется МНК
для нелинейных моделей (см. п. 6.4), который не требует ортогональности плана.
37
Рис. 6.1.Виды поверхностей отклика для планов типа 2131 без взаимодействий (слева) и с взаимодействиями (справа)
6.4. Метод наименьших квадратов для нелинейных моделей
Для линейных моделей вида (см. рис. 4.1, а, б) нахождение коэффициентов осуществляется по достаточно простым формулам
(5.1–5.3). Наличие большого числа алгоритмов оптимизации и
мощных вычислительных средств дает исследователю еще один,
наиболее универсальный, способ нахождения коэффициентов,
который заключается в «подгонке» заданной пользователем модели к экспериментальным данным.
Нахождение коэффициентов модели осуществляется с помощью ЭВМ, используется программная реализация какого-либо
алгоритма оптимизации. В настоящий момент существует большое количество видов и модификаций оптимизирующих алгоритмов, но разработчики программного обеспечения отдают
предпочтения, как правило, градиентным алгоритмам, которые,
несмотря на относительно высокую сложность реализации, обладают хорошей скоростью и точностью работы. Тем не менее каких-либо принципиальных ограничений на применение других
алгоритмов оптимизации не существует – главное, чтобы последние эффективно решали поставленную задачу.
Исходными данными для алгоритма являются:
план эксперимента;
предварительно обработанные измерения (удалены грубые и
систематические ошибки, оценена воспроизводимость опытов);
желаемый вид модели (обычно со всеми факторами и взаимодействиями).
Задача нахождения коэффициентов модели с помощью алгоритмов оптимизации заключается в подборе таких коэффициентов модели, при которых расхождение между экспериментальными и расчетными данными будут минимальными, а в идеальном случае равны нулю. Процесс оптимизации носит итерационный характер и длится до тех пор, пока либо функция ошибки не
38
а)
б)
в)
г)
д)
Рис. 6.2. Алгоритм «подгонки» модели в динамике: а – в начале работы алгоритма коэффициентам модели присваиваются
случайные или заданные пользователем значения; б, в – изменение оценок коэффициентов модели в ходе работы алгоритма, г – оценки коэффициентов модели приближаются к
оптимальным, д – конец работы алгоритма, оценки коэффициентов достигли оптимальных значений
снизится до заданного уровня, либо пока не исчерпается количество заданных итераций алгоритма оптимизации. В качестве
функции ошибки используется сумма квадратов разностей измеренных и расчетных на данной итерации значений.
Достоинством нелинейного МНК является его универсальность. Его можно применять для большинства существующих
планов эксперимента, в том числе для нахождения коэффициентов линейных моделей. Используется в большинстве программных пакетов для обработки результатов эксперимента. Метод
требует наличия средств вычислительной техники. Метод наименьших квадратов применяют только при обработке ненасыщенных и насыщенных планов эксперимента, и он не применим
для сверхнасыщенного планирования.
39
7. МЕТОДЫ ПОВЫШЕНИЯ КАЧЕСТВА ПРОВЕДЕНИЯ
ЭКСПЕРИМЕНТА
Эксперимент весьма требователен к точности измерений при
фиксировании факторов и при оценке значений критериев оптимизации в отдельных опытах. Задачей измерения является
не только определение значения самой измеряемой величины,
но и также и оценка погрешности, допущенной при измерении
(ошибки измерения).
7.1. Виды ошибок измерений
Грубые ошибки (промахи) – результат измерений резко отличается от других.
Причины появления. Нарушения условий измерений: неверные показания прибора, невнимательность исследователя.
Меры борьбы. Проверить измерения другим исследователем,
которому неизвестны результаты, полученные первым. Повторить измерения спустя некоторое время.
Систематические ошибки – воздействие факторов, которые
проявляются одинаково при многократном повторении одних и
тех же измерений.
Причины появления. Например, при измерениях прибором с
неправильной регулировкой, приведшей к смещению начала отсчета.
Меры борьбы. Измерения разными приборами или разными
методами одних и тех же величин. После обнаружения устраняются путем введения необходимых поправок, если ошибка известной природы и известной величины. Рандомизация – перевод
систематических ошибок в случайные, если ошибки известного
происхождения, но неизвестной величины либо ошибки неизвестного происхождения.
Случайные ошибки – воздействие факторов, которые неодинаковы при каждом измерении и не могут быть учтены в отдельности.
Причины появления. Случайные ошибки связаны с суммарным эффектом влияния многих факторов, например, изменение
погодных условий, разница показателей различных партий сырья и т. д.
Меры борьбы. Бороться со случайными ошибками трудно, но
их величину можно оценить.
40
При обнаружении грубой ошибки рекомендуется сразу же
отбросить соответствующий результат измерения. При проведении исследований, связанных с планированием эксперимента,
до начала обработки экспериментальных данных все возможные
грубые и систематические ошибки должны быть выявлены и устранены.
Случайные ошибки обычно характеризуются определенным
законом их распределения. Очень часто распределение случайных величин, в том числе случайных ошибок измерения, подчиняется закону Гаусса, который относится к так называемому нормальному распределению. При оценке результатов измерений
важно знать не только точность, но и надежность результатов.
Степень надежности полученного результата можно оценить,
если известна его доверительная вероятность. На практике очень
часто принимают доверительную вероятность a равную 0,95 (или
95%). При этом доверительные границы для среднего значения
результата измерений можно найти по выражению
y = y ± ∆y = y ± 1,96
σ
,
n
где y – среднее арифметическое случайной величины; σ – средняя квадратичная ошибка; n – число повторных измерений.
Величину y, которая считается наиболее вероятным значением измеряемой величины, находят по формуле
u
y=
∑ yi
i =1
n
,
где yi – измеряемые значения, i – номер опыта.
Среднюю квадратичную ошибку определяют из выражения
N
σ≈S=+ S =
∑ (yi − y) 2
i =1
n −1
.
Величина f = n–1 называется степенью свободы, под которой
понимается число независимых сравнений или число независимых измерений (общее число измерений минус число наложенных связей). В нашем случае на измерения наложена одна связь
(для вычислений требуется знание среднего значения) и поэтому
f = n–1.
41
Вычисления облегчаются при использовании табл. 7.1, в которой приводятся доверительные вероятности a для величины Δy,
выраженные в долях средней квадратичной ошибки  θ = ∆y .
σ 

Таблица 7.1. Вспомогательная таблица для нахождения доверительной вероятности a
∆y 

θ =

σ 

a
3,9
2,6
2,4
2,0
0,9999 0,99 0,984 0,950
1,65
0,7
0,3
0,15 0,05
0,9
0,51 0,24 0,12 0,04
До сих пор речь шла о доверительных вероятностях для отдельного измерения yi. На практике важнее знать о допустимых
отклонениях среднего арифметического y от истинного значения y. Соответствующие задачи могут быть решены, если Δy определяется из следующего соотношения:
∆y = ±
ts
n
где t – критерий Стьюдента; s – средняя квадратичная ошибка;
n – число измерений. Критерий Стьюдента – характеристика,
сходная с θ. Этот критерий играет роль θ в тех случаях, когда
число измерений, учитываемых при определении средней квадратичной ошибки, не очень велико. Значения критерия Стьюдента при разных a и n приведены в табл.1 приложения 1. С учетом последнего выражения доверительные границы для среднего значения результата измерения можно записать в следующем
виде:

ts
ts 
≤y≤y+
P y −
 = a.
n
n

7.2. Рандомизация
Термин «рандомизация» происходит от английского слова
random – случайный. Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, исполнителей и т. д.), рекомендуется случайная последовательность при постановке опытов запланированной матрицей.
42
Рассмотрим матрицу планирования эксперимента типа 22.
Предположим, что, начиная с третьего опыта, в измеренных данных появилась систематическая ошибка е (табл. 7.2).
Таблица 7.2. Матрица планирования эксперимента 22
Номер опыта
X1
X2
X1X2
Y
1
–1
–1
+1
y1
2
–1
+1
–1
y2
3
+1
–1
–1
y3 + e
4
+1
+1
+1
y4 + e
Рассчитаем в коэффициенты модели с учетом ошибки:
a’0 = (y1 + y2 + y3 + e + y4 + e)/4 = a0 + e/2,
a’1 = (– y1 – y2 + y3 + e + y4 + e)/4 = a1 + e/2,
a’2 = (– y1 + y2 – y3 – e + y4 + e)/4 = a2,
a’12 = (y1 – y2 – y3 – e + y4 + e)/4 = a12.
Изменим порядок опытов (табл. 7.3) и снова рассчитаем коэффициенты модели.
Таблица 7.3. Рандомизированная матрица планирования эксперимента 22
Номер опыта
X1
X2
X1X2
Y
4
+1
+1
+1
y4
1
–1
–1
+1
y1
3
+1
–1
–1
y3+ e
2
–1
+1
–1
y2+ e
a’0 = (y1 + y2 + e + y3 + e + y4)/4 = a0 + e/2,
a’1 = ( – y1 – y2 – e + y3 + e + y4)/4 = a1
a’2 = ( – y1 + y2 + e – y3 – e + y4)/4 = a2
a’12 = (y1 – y2 – e – y3 – e + y4)/4 = a12 – e/2.
Видно, что ошибка сместилась в область менее значимых коэффициентов – взаимодействий. Однако с ошибкой остался постоянный член уравнения регрессии a0. Но, поскольку данная
ошибка носит систематический характер, после построения мо43
дели эту ошибку легко устранить введением соответствующей
поправки e/2.
На практике неизвестно, на какой именно коэффициент влияет ошибка, поэтому опыты располагают в случайном порядке,
используя таблицы либо датчики случайных чисел. Выбранную
случайным образом последовательность опытов не рекомендуется нарушать.
Таким образом, рандомизация – придание случайного характера порядку проведения опытов с целью борьбы с систематическими ошибками, когда заранее неизвестно в каких опытах она
будет.
7.3. Параллельные опыты
Любой эксперимент сопровождается погрешностями (ошибками воспроизводимости). Для оценки воспроизводимости осуществляют параллельные опыты, т. е. каждый опыт матрицы
планирования выполняют в конечном итоге несколько раз. Число серий n характеризует параллельность опытов матрицы планирования. Каждая серия должна включать N неповторяющихся
опытов матрицы планирования (табл. 7.4). Число параллельных
опытов, а следовательно, и число серий опытов n рекомендуется
выбирать из условия n ≥ 2–5.
Отметим, что оценка воспроизводимости опытов, по сути, сводится к расчету так называемой дисперсии воспроизводимости.
Если эта дисперсия известна априори или же каким-либо способом может быть оценена до проведения эксперимента, то параллельные опыты необязательны.
Таблица 7.4. Неправильный и правильный порядок проведения параллельных опытов
Неправильный порядок
N
1
…
N
44
Факторы X
X1
…
Xk
Правильный порядок
Измерения Y
y1
y2
y3
1→ 2→ 3→
Любой
факторный 4→ 5→ 6→
план
7→ 8→ 9→
N
1
…
N
Факторы X
X1
…
Xk
Любой
факторный
план
Измерения Y
y1
y2
y3
1↓
4↓
7↓
2↓
5↓
8↓
3↓
6↓
9↓
8. АНАЛИЗ КАЧЕСТВА МОДЕЛИ
8.1. Необходимость анализа качества полученной модели
Перед использованием модели обязательно следует провести комплексную оценку её статистических и потребительских
свойств. В результате анализа делается вывод либо о возможности
использования полученной модели, либо, если модель не удовлетворяет требованиям, о целесообразности построения более сложной модели. Комплексная оценка включает себя проверку: информативности, адекватности, предсказывающих свойств модели [7].
8.2. Дисперсии, используемые в регрессионном анализе
При анализе качества используют некоторые дисперсии:
дисперсия воспроизводимости (S2воспр)
N
m
∑∑ (Yij − Yi ) / N(n − 1 ),
2
i =1 j =1
остаточная дисперсия (S2ост)
N
∑ (Yi − Y i2 )/(N − k),
j =1
общая дисперсия (дисперсия относительно общего среднего)
N
∑ (Yi − Y i ) /(N − 1),
2
j =1
дисперсия, объясняемая моделью
N
∑ (Y i − Y ) /(k − 1),
2
j =1
где N – число опытов; k – число членов модели; n – число параллельных опытов в каждом эксперименте, Yij – значение отклика
в i-м эксперименте j-м повторе; Yi – среднее значение по повтор – значение отклика, рассчиным опытам в i-м эксперименте; Y
i
танное для i-го эксперимента по модели; Y – общее среднее.
8.3. Анализ информативности модели
Результат проверки информативности модели отвечает на вопрос: насколько качественно проведен эксперимент, т. е. насколь45
ко точно в точках проведения эксперимента измеренные данные
совпадают с данными, рассчитанными по полученной модели.
Необходимое условие для оценки информативности: величина множественного коэффициента детерминации R2 должна
быть как можно ближе к единице. Величина R2 представляет собой долю общей суммы квадратов, объясняемой моделью
R2 =
N
2
i =1
N
2
∑ (Y − Yi )
∑ (Yi − Y )
.
i =1
Эмпирически установлено, что для активного эксперимента
величина R2 должна быть не менее 0,96–0,97.
Достаточным условием для оценки информативности является проверка значимости коэффициента множественной корреляции по критерию Фишера
FR =
S R2
> Fα , υ , υ ,
2
R
ост
Sост
где υ R , υ ост – степени свободы для дисперсии, объясняемой моделью и остаточной дисперсией соответственно; Fα , υ , υ
– табR
ост
личное значения критерия Фишера (табл. 2 приложения 1).
8.4. Анализ адекватности модели
Проверка адекватности модели отвечает на вопрос: насколько модель соответствует описываемому процессу или объекту,
но окончательное решение об адекватности модели следует принимать исходя из пригодности модели к практическому применению, т. е. формально модель может быть неадекватной, а для
пользователя, с прикладной точки зрения, процесс описывается
адекватно.
Проверка адекватности сводится к проверке по критерию
Фишера принадлежности дисперсии воспроизводимости и остаточной дисперсии к одной генеральной совокупности. При положительном ответе (F-табличное меньше F-расчетного) модель
считается адекватной с заданным уровнем значимости, при этом
различие дисперсий статистически незначимо.
При наличии параллельных опытов адекватность модели проверяют по критерию Фишера
46
2
2
F = Sвосп
/ Sост
< Fα,(n −1 ) N,N −k.
В случае, когда параллельные опыты отсутствуют, модель
считается адекватной, если выполняется условие
( N − k) Fα,k −1,n −k
S2
>
.
2
Sост ( N − 1 )(1 + (k − 1 )( N − k))
Расчетное значение F-критерия всегда должно быть больше
единицы (т. е. это отношение большей дисперсии к меньшей).
Если оно оказалось меньше единицы, его необходимо пересчитать.
8.5. Анализ предсказывающих свойств модели
Проверкой предсказывающих свойств является проверка
адекватности модели по контрольной выборке. Целью проверки является ответ на вопрос: в состоянии ли полученная модель
достаточно точно описывать объект или процесс в точках факторного пространства, находящихся в пределах используемых
интервалов варьирования, но не совпадающих с теми, в которых
проводился эксперимент. Предсказания по модели с указанными
ограничениями являются интерполяцией, а не экстраполяцией.
Оценка предсказывающих свойств обычно производится по
среднему или максимальному проценту отклонения предсказанных по модели и экспериментальных значений. Для этого необходимо просмотреть таблицу остатков. Для инженерных задач
допустимо 10–15-процентное различие экспериментальных и
расчетных данных. Разумеется, чем больше количество используемых контрольных точек, тем лучше оценка предсказывающих свойств.
Плохие предсказывающие свойства могут быть обусловлены
неправильным выбором модели или тем, что она усложнена за
счет «баластных» факторов. Эти эффекты можно обнаружить по
диаграмме распределения силы влияния факторов. В такой ситуации необходимо повысить барьер для включения факторов в
модель.
47
9. ПЛАНИРОВАНИЕ ОТСЕИВАЮЩИХ ЭКСПЕРИМЕНТОВ
9.1. Назначение отсеивающих экспериментов
При очень большом числе факторов непосредственное привлечение их к составлению математического описания исследуемого объекта методами ПФЭ или ДФЭ может потребовать непомерного увеличения объема экспериментальной работы, что редко
выполнимо в силу экономических, технологических и прочих
ограничений. Таким образом, возникает необходимость в предварительном отсеивании несущественных и выделении тех факторов процесса (объекта), которые оказывают наиболее заметное
влияние на целевую функцию [1, 2].
9.2. Априорное ранжирование факторов
(психологический эксперимент)
На стадии предварительного изучения объекта исследования
при формализации априорных сведений иногда полезно проведение психологического эксперимента, заключающегося в объективной обработке данных, полученных в результате опроса специалистов или из исследований, опубликованных в литературе.
Такой эксперимент позволяет более правильно спроектировать
объект исследования, принять или отвергнуть некоторые предварительные гипотезы, дать сравнительную оценку влияния
различных факторов на параметры оптимизации и тем самым
правильно отобрать факторы для последующего активного эксперимента, обоснованно исключив некоторые из них из дальнейшего рассмотрения.
Особенность метода априорного ранжирования факторов заключается в том, что факторы ранжируются в порядке убывания
вносимого им вклада. Вклад каждого фактора оценивается по величине ранга – места, которое отведено исследователем (специалистом при опросе, экспертом) данному фактору при ранжировании всех факторов с учетом их предполагаемого (количественно
неизвестного) влияния на параметры оптимизации. При сборе
мнений путем опроса специалистов каждому из них предлагается заполнить анкету, в которой перечислены факторы, их размерность и предполагаемые интервалы варьирования. Заполняя
анкету, специалист определяет место факторов в ранжированном
ряду. Одновременно он может включить дополнительные факто48
Рис. 9.1. Диаграмма значимости факторов
ры или высказать мнение об изменении интервалов варьирования. Далее строят среднюю диаграмму рангов, откладывая по одной оси факторы, а по другой – соответствующие суммы рангов.
Чем меньше сумма рангов данного фактора, тем выше его место в
диаграмме. С помощью последней оценивается значимость факторов (рис. 9.1).
В случае неравномерного экспоненциального убывания распределения часть факторов можно исключить из дальнейшего
рассмотрения, отнеся их влияние к шумовому полю. Если же
их распределение равномерное, то в эксперимент рекомендуется
включать все факторы.
Построение средней априорной диаграммы рангов по известным литературным источникам полезно с той точки зрения, что
она по существу является сокращенным литературным обзором
по объему исследования.
9.3. Насыщенные и сверхнасыщенные планы
Применение насыщенных регулярных дробных факторных
планов (полуреплик, четвертьреплик и т. д.) оказывается возможным лишь для относительно небольшого числа факторов (n = 3,
7, 15, 31, 63 и т. д.). Использование же ненасыщенных дробных
факторных планов, как правило, бывает не очень эффективным,
так как число экспериментов значительно превышает число определяемых параметров. Например, при исследовании действия
16 факторов нужно применять дробный факторный план типа
216-11, который состоит из 32 экспериментов. Если число факторов очень велико, имеет смысл применять сверхнасыщенные
планы (число всех изучаемых факторов превышает число экспе49
риментов), чтобы число экспериментов оставалось в разумных
пределах. N > k – ненасыщенные планы; N – k – насыщенные
планы; N < k – сверхнасыщенные планы.
9.4. Метод случайного баланса
В качестве планов для проведения отсеивающих экспериментов возможно применение ПФЭ и ДФЭ, однако существует ряд
причин, по которым их применение может вызвать ряд затруднений, а именно:
в производственных условиях трудно обеспечить независимость факторов, ортогональность и симметричность плана эксперимента, а также требование гомоскедастичности, т. е. равенства дисперсий условных распределений плотности вероятности
f(y/xk).
количество рассматриваемых факторов может быть достаточно большим даже для ДФЭ.
Метод случайного баланса (МСБ) является сверхнасыщенным
планом, для которых возможно нарушение симметричности.
Важнейшей теоретической предпосылкой МСБ служит априорное знание того, что из всей совокупности рассматриваемых факторов только небольшое их число действительно являются значимыми – остальные могут быть отнесены к «шумовому полю».
Цель любого отсеивающего эксперимента – произвести предварительное расщепление (сортировку) оценок коэффициентов
математической модели, отнеся большую часть эффектов к шумовому полю. Тогда оставшиеся эффекты могут быть оценены
количественно. Отсюда следует, что метод случайного баланса
обладает меньшей чувствительностью, чем ПФЭ или ДФЭ (под
чувствительностью метода понимается способность выделять коэффициенты регрессии, значимо отличающиеся от нуля). Зато
МСБ обладает большей разрешающей способностью: в благоприятных условиях он позволяет выделить раздельно формирующиеся эффекты среди очень большого числа рассматриваемых
факторов.
Суть МСБ заключается в том, что вместо дробных реплик, которые представляют собой систематические выборки из полного
факторного эксперимента, предлагается брать случайные выборки. При этом совместные оценки оказываются смешанными некоторым случайным образом.
50
При построении плана эксперимента все факторы разбиваются на группы (обычно до 4–6 факторов в группе) и для каждой
из них выбирается ПФЭ или ДФЭ возможно меньшего объема.
Разбивку на группы можно связать с физикой исследуемого процесса (объекта) либо формально. При наличии априорной информация о том, какие факторы являются доминирующими, целесообразно так составить план эксперимента, чтобы эти факторы
вошли в одну группу. Полностью план проведения эксперимента
методом случайного баланса образуется путем случайного смешивания строк соответствующих групповых планов.
Например, пусть требуется исследовать 21 эффект (6 линейных эффектов и 15 парных взаимодействий) от 6 факторов и выделить наиболее существенные из них с помощью наибольшего
числа N (например всего 8 опытов).
Разобьем факторы на две группы: 1) х1, х2, х3; 2) х4, х5, х6 и
используем планы ПФЭ типа 23. С помощью таблицы равномерно
распределенных случайных чисел для каждой группы факторов
случайным образом выбираются строки, из которых и формируются строки матрицы случайного баланса. При этом, очевидно,
возможна ситуация, когда некоторые строки матрицы ПФЭ будут встречаться в общей матрице несколько раз, в то время как
другие – ни разу (табл. 9.1).
Таблица 9.1. Матрица плана и результаты эксперимента МСБ
g
1
1–я группа
2–я группа
Yg
YgI
YgII
–
12,6
12,6
10,7
g1
x1
x2
x3
g2
x4
x5
x6
4
+
+
–
2
+
–
2
8
+
+
+
8
+
+
+
16,3
14,1
12,2
3
7
–
+
+
7
–
+
+
13,5
11,3
11,3
4
6
+
–
+
1
–
–
–
12,2
12,2
12,2
5
2
+
–
–
3
–
+
–
13,8
11,6
11,6
6
5
–
–
+
4
+
+
–
14,3
12,1
10,2
7
3
–
+
–
7
–
+
+
12,4
10,2
10,2
8
6
+
–
+
5
–
–
+
10,8
10,8
10,8
На следующем этапе полученный экспериментальный материал анализируется с помощью диаграмм рассеивания результатов
наблюдений по отдельным факторам (рис. 9.2) С этой целью для
каждого исследуемого фактора на графике проводится своя ор51
Рис. 9.2. Диаграмма рассеяния для всех факторов
дината. Слева от неё отмечаются точками те значения выходной
величины Y, которые соответствуют положению данного фактора на нижнем уровне «–» варьирования, а справа – полученные
при положительных уровнях «+» данного фактора.
Далее находятся медианы отдельно для точек, расположенных слева и справа от ординаты каждого фактора. Разность между медианой уровня «+» и медианой «–» называется вкладом
данного фактора (эффекта) и обозначается Вхi. Чем больше разность между медианами, тем больше воздействие соответствующего фактора.
Для нахождения других существенных факторов необходимо
устранить влияние фактора х5 на Y. С этой целью следует привести фактор х5 к одному уровню варьирования, например к х5 =
= –1, для чего необходимо из всех Y, для которых х5 = +1, вычесть величину вклада Вх5. После этой операции получается новый вектор результатов эксперимента YgI (табл. 9.1), строится
новая диаграмма рассеяния, на которую вектор х5 уже не оказывает влияния.
Процедура выделения значимых факторов (и аналогично их
парных взаимодействий) продолжается до момента, когда в очередном цикле самый старший вклад станет соизмеримым с шумом эксперимента (вкладами остальных факторов).
Достоинства МСБ состоят в том, что этот метод позволяет выделять как значимые некоторые факторы при соблюдении ряда
52
общих требований: проведение активного эксперимента, возможность использования свернасыщенного плана и независимость (некоррелированность) факторов.
К недостаткам МСБ относятся громоздкие графоаналитические расчеты, неопределенность момента остановки процедуры,
большая трудоемкость при последовательном выделении значимых факторов в связи с неортогональностью планов МСБ.
Попытки преобразовать МСБ так, чтобы можно было находить
независимые оценки коэффициентов, привели к использованию
случайных ортогональных (или почти ортогональных) планов.
Таким образом, создались все предпосылки для модификации
МСБ.
9.5. Планы Плакетта–Бермана
Плакетт и Берман расширили класс насыщенных ортогональных планов эксперимента за счет конструирования специальных
матриц плана. Число экспериментов в этих матрицах кратно
четырем (N = 4k), и с их помощью можно исследовать влияние
(4k – 1) факторов (k = 2 (1) 25, k ≠ 23). При 4k = 2n планы Плакетта–Бермана совпадают с насыщенными регулярными дробными
факторными планами. Поскольку эти планы являются ортогональными, линейные эффекты факторов находятся независимо
друг от друга.
В приложении 2 приведены первые строки матриц планов,
содержащих от 8 до 72 экспериментов. Полные матрицы планов
конструируются следующим образом: исходя из заданной первой строки, вторую и последующие строки получают путем сдвига всех элементов предыдущей строки на одну позицию вправо
(или влево) и перестановки последнего (первого) элемента на первую (последнюю) позицию. Этот процесс повторяется (N – 2) раз.
Последняя строка состоит только из элементов –1 (–). Матрица
плана имеет размерность N(N – 1).
Таблица 9.2. Пример плана Плакетта–Бермана для 15 факторов
N X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Y
1
+
+
+
+
–
+
–
+
+
–
–
+
–
–
–
y1
2
+
+
+
–
+
–
+
+
–
–
+
–
–
–
+
y2
3
+
+
–
+
–
+
+
–
–
+
–
–
–
+
+
y3
4
+
–
+
–
+
+
–
–
+
–
–
–
+
+
+
y4
53
Окончание табл. 9.2
N X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Y
5
–
+
–
+
+
–
–
+
–
–
–
+
+
+
+
y5
6
+
–
+
+
–
–
+
–
–
–
+
+
+
+
–
y6
7
–
+
+
–
–
+
–
–
–
+
+
+
+
–
+
y7
8
+
+
–
–
+
–
–
–
+
+
+
+
–
+
–
y8
9
+
–
–
+
–
–
–
+
+
+
+
–
+
–
+
y9
10 –
–
+
–
–
–
+
+
+
+
–
+
–
+
+ y10
11 –
+
–
–
–
+
+
+
+
–
+
–
+
+
–
y11
12 +
–
–
–
+
+
+
+
–
+
–
+
+
–
–
y12
13 –
–
–
+
+
+
+
–
+
–
+
+
–
–
+ y13
14 –
–
+
+
+
+
–
+
–
+
+
–
–
+
–
15 –
+
+
+
+
–
+
–
+
+
–
–
+
–
–
y15
16 –
–
–
–
–
–
–
–
–
–
–
–
–
–
–
y16
y14
Чтобы получить план Плакетта–Бермана для N = 16, выбирается первая строка плана из приложения 2 и применяется сформулированное правило. Кроме того, добавляется еще строка с
элементами «–».
Вслед за реализацией плана эксперимента производится обработка его результатов, которая состоит из следующих операций.
1. Расчет эффектов отдельных факторов.
Оценка эффекта Bi равна разности между суммами значений
целевой функции для фактора xi на уровнях +1 и –1, поделенной
на N/2:
N
i =
B
∑ y ixi j
j =1
N /2
.
Из матрицы плана следует, что оценки эффектов могут быть
рассчитаны независимо друг от друга (свойство ортогональности). Значения âi равны половинам соответствующих оценок эффектов.
2. Проверка значимости параметров.
Для выявления существенных факторов используется t-критерий и проверяется условие
54
|âi | ≥ tкрsi,
где tкр – критическое значение t-распределения для уровня значимости α и φ степеней свободы; s2i –оценка дисперсии коэффициента âi.
Дисперсия ошибок наблюдений оценивается с помощью специальных экспериментов, например дублированием наблюдений
или введением в план фиктивных факторов от xi+1 до xN–1. Если,
например, план строится для анализа 12 факторов, то можно добавить к нему 3 фиктивных фактора и применить план типа N =
= 16. Эффекты этих фиктивных переменных будут равны нулю
лишь в том случае, если не имеется взаимодействий и измерения
являются абсолютно точными. Поскольку на практике это обычно не выполняется, их можно использовать для расчета оценки
дисперсии наблюдений.
Обозначим
s2l = 4k(â2i+1+ â2i+2+…+ â2N+1)/(4k–l–1)
и
sl = sqrt(s2l)
Уровень значимости обычно выбирают равным α = 0,05 и из
таблиц t-распределения находят значение t0,05[4k–l–1]. Дисперсия оценок параметров âi
s2i = s2l/4k.
Значимость параметров проверяется обычным способом путем проверки неравенства
|âi| ≥ tкрsi.
55
10. СПЕЦИАЛЬНЫЕ ПЛАНЫ
10.1. Применение пассивных экспериментов для получения
математических моделей
Пассивный эксперимент – эксперимент, матрица независимых переменных которого, с точки зрения статистических критериев, была построена не оптимально. Пассивный эксперимент
по качеству исходного материала существенно уступает активному. Результат его сложно обрабатывать, а качество полученной
модели практически всегда не очень высоко, особенно для показателей информативности, устойчивости и предсказывающим
свойствам [7].
Самая худшая форма пассивного эксперимента – когда результаты эксперимента и значения независимых переменных
снимаются непосредственно с действующего в установившемся
режиме эксплуатации технологического процесса. Попытка получения информации, таким образом, заранее обречена на неудачу (за исключением случаев, когда технологический процесс
сильно «расстроен»).
Основная причина этого в том, что любой технологический
процесс функционирует в некоторой квазистационарной области: интервалы изменения независимых переменных (параметров
управления процессом) выбраны таким образом, чтобы их изменение существенно не влияло на отклик. Поэтому при обычном
функционировании технологического процесса на отклик в основном влияют случайные факторы. Таким образом, получение
полезной информации из результатов такого эксперимента, мягко говоря, маловероятно.
Опишем основные этапы процедуры получения математических моделей с использованием пассивных экспериментов [3].
1. Для рассматриваемого объекта исследования выявляются
факторы, в наибольшей степени влияющие на параметр оптимизации. Число этих факторов k рекомендуется ограничивать значением k ≤ 5–8.
2. Определить требуемое количество опытов пассивного эксперимента N
N≥
56
(1 − r
2 min 2
σ
)
2r
,
(10.1)
где rmin – минимальное значение коэффициента парной корреляции между фактором и параметром оптимизации, считаемое еще
значимым (существенным, весомым); обычно rmin = 0,2 ...0,3;
σr – среднее квадратическое отклонение коэффициента корреляции.
Значение σr определяют как
σr =
rmin
,
tγ
(10.2)
где tγ – коэффициент, зависящий от доверительной вероятности γ
(см. табл.1 приложения 1).
3. Проводятся опыты пассивного эксперимента. Проведение
опытов включает:
наблюдение (измерение) значений факторов для объекта исследования;
регистрацию (измерение) значения выходного параметра, соответствующего наблюдаемым значениям факторов.
Результаты опытов рекомендуется сводить в таблицу (табл.
10.1).
Таблица 10.1.Рекомендуемая форма записи результатов пассивного
эксперимента
Номер опыта
1
….
N
Значение фактора
X1
…
XK
x11
…
xN1
…
…
…
x1K
…
xNK
Параметр
оптимизации Y
y1
…
yN
Такая таблица удобна тем, что приводимая в ней информация
может сразу вводиться для обработки в ЭВМ без переписывания
и систематизации условий и результатов опытов.
4. Выполняется статистическая обработка результатов опытов. В общем случае сложность математической обработки зависит от того, коррелированны ли между собой факторы.
Статистическая обработка в настоящее время, как правило, выполняется на ЭВМ с использованием библиотечных программ.
По результатам статистической обработки строят модели в
виде уравнения регрессии. Часто вначале строят линейную модель
57
y = a0 + a1x1 +…+ akxk,
где y – параметр оптимизации; x1, …, xk – факторы; k – количество факторов, принятых во внимание; a0, a1, …, ak – коэффициенты модели, получаемые из эксперимента.
10.2. Латинские, греко-латинские, гипер-греко-латинские
квадраты
Планы на латинских квадратах следует применять только,
когда интересующие нас факторы имеют более двух уровней, и
заранее известно, что между факторами нет взаимодействий или
ими можно пренебречь [12].
Пусть имеется три фактора: x1, x2, x3, каждый из которых может находиться на четырех уровнях. Тогда план на латинских
квадратах будет выглядеть следующим образом (табл. 10.2).
Таблица 10.2. Латинский квадрат (слева), план на его основе (справа)
X2
N
X1
X2
X3
Y
X1
1
2
3
4
1
1
1
1
y1
1
1
2
3
4
2
1
2
2
y2
2
2
1
4
3
3
1
3
3
y3
3
3
4
1
2
4
1
4
4
y4
4
4
3
2
1
...
...
...
...
...
16
3
3
2
y16
Приведенный в табл.10.2 латинский квадрат является лишь
одним из трех возможных расположений уровней факторов, позволяющих получить несмещенные оценки коэффициентов модели.
Замечательное свойство латинских квадратов состоит в том,
что они могут накладываться друг на друга, образуя греко-латинские квадраты. Например, латинские квадраты 1 и 2 (табл.
10.3) в результате наложения дадут греко-латинский квадрат
(табл. 10.4). Если к получившемуся греко-латинскому квадрату
добавить еще один латинский квадрат, то можно получить гипер-греко-латинский квадрат (табл. 10.5).
58
Таблица 10.3. Варианты латинских квадратов
Латинский квадрат 1
Латинский квадрат 2
Латинский квадрат 3
1
2
3
4
1
2
3
4
1
2
3
4
2
1
4
3
3
4
1
2
4
3
2
1
3
4
1
2
4
3
2
1
2
1
4
3
4
3
2
1
2
1
4
3
3
4
1
2
Таблица 10.4.Греко-латинский квадрат (слева) – результат наложения латинских квадратов 1 и 2, план на его основе
(справа)
X2
X1
1
1
2
4
N
X1
X2
X3
X4
Y
1
1
1
1
1
y1
2
3
11
22
33
44
2
1
2
2
2
y2
23
14
41
32
3
1
3
3
3
y3
3
34
43
12
21
4
1
4
4
4
4
42
31
24
13
...
...
...
...
...
...
16
4
4
1
3
y9
Таблица 10.5.Гипер-греко-латинский квадрат (слева) – результат
наложения латинских квадратов 1, 2 и 3, план на его
основе (справа)
X2
X1
1
2
3
4
N
X1
X2
X3
X4
X5
Y
1
1
1
1
1
1
y1
1
111 222 333 444
2
1
2
2
2
2
y2
2
234 143 412 321
3
1
3
3
3
3
y3
3
342 431 124 213
4
1
4
4
4
4
4
423 314 241 132
...
...
...
...
...
16
4
4
1
3
...
2
y9
Для анализа планов латинских квадратов обычно строится
диаграмма средних (рис. 10.1). В ней на оси абсцисс откладываются используемые факторы и их уровни, а на оси ординат –
среднее арифметическое измерений для соответствующего уровня каждого фактора, используемого в эксперименте.
Анализ латинских квадратов заключается в выборе тех уровней факторов, при которых параметр оптимизации y достигает
59
Рис. 10.1.Диаграмма средних для латинского квадрата (см. табл.10.2)
максимальное (или минимальное значение). На рис.10.1 максимальное значение y обеспечивается при нахождении фактора X1
на уровне 4, X2 – на уровне 3, X3 – на уровне 1.
Достоинство планов на латинских квадратах – вместо требующихся в полном факторном эксперименте 43 = 64, 44 = 256, 45 =
= 1024 опытов достаточно выполнить только 16. Недостаток –
при наличии существенных взаимодействий между факторами
планы на латинских квадратах использовать нельзя.
10.3. Методы Тагути: робастное планирование эксперимента
Методы Тагути используются в промышленности для управления качеством продукции. «Робастность» заключается в нахождении таких значений управляющих сигналов – факторов,
находящихся под контролем оператора, при которых влияние
шума – факторов, находящихся вне контроля оператора, минимально.
Таким образом, имеет место максимизация отношения сигнал/шум. В идеальном случае процесс или продукт будет реагировать только на сигналы оператора и не будет реагировать на
случайный шум.
Суть робастного планирования эксперимента:
определяются управляющие факторы, которые могут быть
установлены оператором, выбирается количество уровней этих
факторов;
60
выбирается план эксперимента (в терминологии Тагути – ортогональный массив);
находится способ измерения интересующей характеристики
качества (см. соотношение сигнал/шум, предложенные Тагути);
проводится эксперимент, включая параллельные опыты для
оценки воспроизводимости;
строится диаграмма средних и выявляются факторы, наиболее сильно влияющие на выбранное отношение сигнал/шум;
процесс регулируется до достижения максимального соотношения сигнал/шум.
Отношения сигнал/шум, предложенные Тагути. Максимизация этих отношений приводит к возрастанию качества.
«Меньше – лучше». Используется, когда необходимо минимизировать число появлений некоторых дефектов
n

2 
η = −10log 10 (1/ n ) (yi )  ,
i =1


∑
где n – число параллельных опытов.
«Больше – лучше». Используется, когда необходимо максимизировать некоторый показатель качества, например прочность
n

2 
η = −10log 10 (1/ n ) (1/ yi )  .


i =1
∑
«Номинальное – наилучшее значение». Используется, когда
идеальное качество совпадает с конкретным номинальным значением. Имеет место фиксированная величина сигнала (номинальное значение – Mean), и дисперсия – Variance вокруг этого
значения рассматривается как результат действия шумов:
η = 10log 10 ( Mean 2 / Variance).
«Цель со знаком». Используется, когда характеристика качества имеет идеальное значение – ноль и могут встречаться как
положительные, так и отрицательные значения качества – отклонения от нулевого значения
η = −10log 10 (s 2 ),
где s – дисперсия характеристики качества по измерениям.
61
«Доля дефектов». Используется для минимизации отходов,
минимизации доли пациентов, у которых развиваются побочные
реакции на препарат, и т. д.
η = −10log 10  p / (1 − p ) ,
где p – доля дефектных изделий.
«Упорядоченные категории» (аккумуляционный анализ).
Используется, если характеристики качества могут быть получены только в терминах категорий, например, покупатели могут
категоризировать товар как превосходный, хороший, средний
или ниже среднего. В этом случае максимизируется количество
продуктов, оцениваемых как превосходные и хорошие. Обычно
результат аккумуляционного анализа представляется в виде гистограммы.
В качестве планов экспериментов Тагути предложил систему
табулированных, ортогональных планов, позволяющих оценить
максимальное число главных эффектов при помощи минимального числа опытов в эксперименте. В зависимости от числа рассматриваемых управляемых факторов используются ПФЭ, ДФЭ,
Планы Бокса-Бенкена, латинские и греко-латинские квадраты,
планы Плакетта-Бермана [12].
Визуализация итогов эксперимента состоит в нанесении на
график средних η (см. рис.10.1) по уровням факторов. По этой
диаграмме легко могут быть установлены оптимальные значения отношения сигнал/шум каждого фактора.
10.4. Планы для смесей
Назначение: используются, когда анализируются смеси компонент, например пищевые продукты, бытовая и промышленная
химия, лекарства и т. п [12].
Ограничение: компоненты, участвующие в смеси в сумме
должны давать константу, например 100%.
Одним из способов, с помощью которого могут быть представлены пропорции в смеси, являются треугольные диаграммы
(диаграммы на треугольнике). Например, предположим, что
есть смесь, которая состоит из трех компонент A, B, C. Любая
смесь трех компонент может быть представлена точкой в системе координат на треугольнике, определяемой тремя переменными. Например, возьмем следующие 6 смесей из трех компонент
(табл. 10.6).
62
Таблица 10.6. Шесть смесей из трех компонент А, B, C
A
1
0
0
0,5
0,5
0
B
0
1
0
0,5
0
0,5
C
0
0
1
0
0,5
0,5
Сумма для каждой смеси равна 1, т. е. значения компонент
в каждой смеси могут интерпретироваться как пропорции. Если
нанести эти данные на график в виде обычной трехмерной диаграммы рассеяния, станет очевидно, что точки образуют треугольник в трехмерном пространстве. Только точки внутри треугольника, где сумма значений компонент равна 1, представляют
настоящие смеси. Следовательно, можно просто наносить данные только в треугольник (в данном случае двумерный), чтобы
изображать значения компонент (пропорции) для каждой смеси
(см. рис. 10.2).
Чтобы определить координаты точки в треугольном графике,
необходимо соединить прямой линией точку с вершинами треугольника.
Вершина, соответствующая конкретному фактору, представляет собой чистую смесь, т. е. состоящую только из данной компоненты. Так что координата соответствующей вершине компоненты равна 1 (или 100% или любой другой величине в зависимости
от шкалирования) и равна 0 (нулю) для всех других компонент.
На стороне, противоположной соответствующей вершине, значеC
1.2
1
0.8
0.6
0.4
0.2
0
A 0
0.2
0.4
0.6
0.8 1
1 0.8
0.6
0.4
0.2
0 B
Рис. 10.2. Треугольные координаты
63
ние данной компоненты равно 0 (нулю), а для других компонент
0,5 (или 50% и так далее).
Тернарные поверхности и контуры. Можно теперь добавить
четвертое измерение и нанести на график значения параметра
оптимизации для каждой точки внутри треугольника. Поверхность отклика может быть представлена либо в трехмерном пространстве, где параметр оптимизации наносится, как расстояние
поверхности от плоскости треугольника, либо в виде контурной
диаграммы, где контуры равной высоты наносятся на двухмерном треугольнике (рис. 10.3).
Виды полиномов для смесей. При составлении полиномов для
смесей накладывается ограничение, состоящее в том, что сумма
значений компонентов должна быть постоянной. Рассмотрим
простую линейную модель с двумя факторами
y = a0 + aAxA + aBxB,
где y – параметр оптимизации; a0, aA и aB – коэффициенты регрессии; xA и xB – значения факторов.
Предположим, что xA и xB должны в сумме давать 1, тогда
можно умножить a0 на 1 = (xA + xB):
y = (a0xA + a0xB) + aAxA + aBxB
или
y = a’AxA + a’BxB,
где
a’A = a0 + aA и a’B = a0 + aB.
Рис. 10.3.Два способа отображения параметра оптимизации в треугольных координатах: в виде поверхности (слева) или в виде
контуров равного уровня (справа)
64
Таким образом, оценивание в этой модели сводится к подгонке модели множественной регрессии без свободного члена.
Примеры моделей для смесей:
Линейная модель
y = a1x1 + a2x2 + a3x3.
Квадратичная модель
y = a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3.
Специальная кубическая модель
y = a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3 + a123x1x2x3.
Полная кубическая модель
y = a1x1 + a2x2 + a3x3 + a12x1x2 + a13x1x3 + a23x2x3 + d12x1x2 ×
× (x1 – x2) + d13x1x3(x1 – x3) + d23x2x3(x2 – x3) + a123x1x2x3.
Коэффициенты dij также являются параметрами модели.
Обычно используются два типа стандартных планов экспериментов для смесей. Оба они оценивают поверхности отклика в
вершинах треугольника и в центрах сторон. Иногда в эти планы
добавляют дополнительные внутренние точки.
Симплекс-вершинные планы. При этом размещении точек
плана m+1 для каждого фактора или компоненты в модели тестируются равноразмещенные точки:
xi = 0, 1/m, 2/m,..., 1 i = 1,2,..., q а также все их комбинации.
Получающийся план называется симплекс-вершинным планом.
Например, симплекс-вершинный план с {q = 3, m = 2} включает
следующие смеси (табл. 10.7 и 10.8).
Таблица 10.7. Симплекс-вершинный план с {q = 3, m = 2}
N
A
B
C
Y
1
1
0
0
y1
2
0
1
0
y2
3
0
0
1
y3
4
0.5
0.5
0
y4
5
0.5
0
0.5
y5
6
0
0.5
0.5
y6
Таблица 10.8. Симплекс-вершинный план с {q = 3, m = 3}
N
A
B
C
Y
1
1
0
0
y1
65
Окончание табл. 10.8
N
A
B
C
Y
2
0
1
0
y2
3
0
0
1
y3
4
1/3
2/3
0
y4
5
1/3
0
2/3
y5
6
0
1/3
2/3
y6
7
2/3
1/3
0
y7
8
2/3
0
1/3
y8
9
0
2/3
1/3
y9
10
1/3
1/3
1/3
y10
Симплекс-центроидные планы. Другой способ размещения
факторов является так называемым симплекс-центроидным
планом. При его применении точки плана соответствуют всем
перестановкам чистых смесей (например, 1 0 0; 0 1 0; 0 0 1), перестановкам бинарных смесей (Ѕ Ѕ 0; Ѕ 0 Ѕ; 0 Ѕ Ѕ), перестановкам
с тремя одинаковыми по пропорции компонентами и так далее.
Например, для трех факторов симплекс-центроидный план состоит из точек (вершины, центры сторон, центр треугольника)
(табл. 10.9).
Таблица 10.9. Пример симплекс-центроидного плана
N
A
B
C
Y
1
1
0
0
y1
2
0
1
0
y2
3
0
0
1
y3
4
1/2
1/2
0
y4
5
1/2
0
1/2
y5
6
0
1/2
1/2
y6
7
1/3
1/3
1/3
y7
Добавление внутренних точек. Подобные планы иногда дополняются внутренними точками. Например, для трех факторов
можно добавить следующие внутренние точки (табл. 10.10).
66
Таблица 10.10. Внутренние точки
A
B
C
2/3
1/6
1/6
1/6
2/3
1/6
1/6
1/6
2/3
Если эти точки нанести на диаграмму рассеяния в треугольных координатах, можно увидеть, как ровно эти планы заполняют экспериментальную область, определенную на треугольнике.
Анализ экспериментов для смесей похож на множественную
регрессию со свободным членом, равным нулю. Основное ограничение: сумма всех компонентов должна быть постоянной – может
быть реализовано в подгонке модели множественной регрессии,
не включающей свободный член. Для нахождения коэффициентов модели можно использовать метод наименьших квадратов
для нелинейных моделей (см. п. 6.4.)
10.5. Планирование экспериментов при наличии
неоднородностей
При проведении многофакторных экспериментов в неоднородных условиях возникает задача исключения или существенного
уменьшения влияния источников неоднородностей на результаты, полученные в виде математической модели.
Источниками неоднородностей являются, например, номинально одинаковые партии используемого сырья, лабораторные
животные, стенды, технологическое оборудование, операторы и
прочее. Они образуют группу факторов, не входящих в матрицу планирования, и могут быть непрерывного или дискретного
типа.
Источники непрерывного типа характеризуются изменением свойств объекта (его дрейфом) во времени или по какой-либо
другой переменной. В случае невысоких (по сравнению с продолжительностью проведения всех опытов эксперимента) скоростей
дрейфа можно использовать обычные методы ПОЭ. При высоких
скоростях дрейфа применяют специальные планы, построенные,
например, на основе ортогональных полиномов Чебышева и т. п.
[7].
Источники дискретного типа: различие в сырье, технологических аппаратах, способах проведения процессов, исполните67
Блок 1
Блок 2
Блок 3
Рис. 10.4.Разбиение плана эксперимента на блоки. Количество блоков
соответствует количеству уровней, которое принимает
блоковый фактор
лях и т. д. В данном случае задача ПОЭ заключается в сокращении числа оцениваемых возможных сочетаний изучаемых факторов, т. е. относится к классу комбинаторных задач. Последние
решают с помощью планов, основанных на специальных правилах размещения факторов по уровням в каждом опыте. Существует множество способов организации таких планов, из которых
наиболее распространены планы, использующие свойства латинских и греко-латинских квадратов, кубов и др.
Одним из возможных методов, применяемых в таких ситуациях, является разбиение плана эксперимента на ортогональные
блоки. Задача заключается во введении в план эксперимента дополнительного фактора (нескольких факторов, которые называются блоками) таким образом, чтобы все главные эффекты были
ортогональными ко всем главным эффектам остальных факторов
плана.
Под блоками понимается множество опытов плана, которым
соответствует один и тот же уровень блокового фактора, если их
несколько – одно и то же сочетание уровней блоковых факторов
(рис. 10.4).
Таблица 10.11. Пример записи плана с блоковым фактором
N
X1
X2
X3 (блоковый)
Y
1
–
–
1
y1
2
–
+
y2
3
+
–
y3
4
+
+
y4
68
Окончание табл. 10.11
5
–
–
2
6
–
+
y6
7
+
–
y7
8
+
+
y8
3
y5
9
–
–
10
–
+
y10
11
+
–
y11
12
+
+
y12
y9
Необходимо стремиться к тому, чтобы возможные условия
опытов внутри блока, которые не являются факторами в матрице планирования, были как можно более близкими для различных опытов.
С каждым уровнем блокового фактора связывается один и тот
же уровень любого источника неоднородностей: одна партия сырья, один стенд, один объект технологического оборудования,
один исполнитель и т. п. Если это не представляется возможным,
необходимо ввести второй, третий и т. д. блочный фактор и оставшиеся источники неоднородностей объединить в эти блоковые факторы. При этом различные блоковые факторы будут ортогональны друг другу, если не будут взаимодействовать между
собой.
Такой подход позволяет вычленить влияние как изучаемых
факторов, так и источников неоднородностей и определить их
вклад в результаты, что очень важно для принятия решений. Например, это дает возможность оценить, стоит ли тратить средства на устранение источников неоднородностей и на какие из них
направить усилия в первую очередь.
Заключение
Высокий уровень абстракции теории планирования и организации эксперимента позволяет достаточно просто реализовывать
программы обработки результатов эксперимента и применять их
совершенно в различных областях человеческой деятельности.
Существуют следующие варианты реализации обработки экспериментальных данных программным путем [12–15].
1. Использование электронных таблиц или универсальных математических пакетов: Excel, Open/StarOffice, Gnumeric, MatLab,
69
MathCAD, Octave, SciLab, FreeMat, Maxima, Mathematica и т. п.
Достоинства такого подхода: доступность, относительно невысокая стоимость. Недостатки: генерировать план и осуществлять
обработку необходимо вручную: для электронных таблиц – путем написания макросов, для математических пакетов – путем
написания программ на встроенном языке.
2. Использование надстроек над электронными таблицами:
Excel + SigmaXL. Достоинства: процедуры генерации плана эксперимента и обработки измерений уже осуществлены. Недостатки: как правило, узкий круг решаемых задач и ощутимая стоимость такой надстройки.
3. Использование специализированного статистического ПО:
Statistica, MiniTab, SPSS, MODDE, ПРИАМ. Достоинства: наличие алгоритмов генерации планов, автоматическая обработка
результатов измерений, визуализация результатов, реализация
алгоритмов «подгонки» моделей к экспериментальным данным,
генерация отчетов, хорошая документация. Недостатки: высокая цена, необходимость освоения.
Рекомендуемая литература
1. Адлер Ю. П. Введение в планирование эксперимента. М.:
Наука, 1969. 213 с.
2. Адлер Ю. П. Планирование эксперимента при поиске оптимальных условий. М.: Наука, 1976. 293 с.
3. Адлер Ю. П., Маркова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий. М.: Наука,
1976. 280 с.
4. Боровиков С. М. Теоретические основы конструирования,
технологии и надежности. Минск: Дизайн ПРО, 1998. 336 с.
5. ГОСТ 24026–80. Исследовательские испытания. Планирование эксперимента. Термины и определения. М.: Изд-во стандартов, 1980. 22 с.
6. ГОСТ 8.207–76. Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Основные положения. М.: Изд-во стандартов, 2001. 33 с.
7. Калайда В. Т. Планирование эксперимента. Методы обработки результатов эксперимента и основы математической теории планирования эксперимента: учебное пособие. Томск: издво Томского университета, 1997. 70 с.
70
8. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке
и бизнесе. Киев: МОРИОН, 2002. 640 с.
9. Маркова Е. В., Лисенко А. Н. Планирование эксперимента в
условиях неоднородностей. М.: Наука, 1973. 174 с.
10. Налинов В. В., Чернова Н. А. Статистические методы планирования экстремальных экспериментов. М.: Наука, 1965.
280 с.
11. Федоров В. В. Теория оптимальных экспериментов (при
выяснении механизма явлений). М.: Наука, 1971. 242 с.
12. Хикс Ч. Основные принципы планирования эксперимента. М.: Мир, 1965. 127 с.
13. www.statsoft.ru – электронный учебник по статистике и
программа «Statistica».
14. http://minitab.ru/ – Сайт программы «MiniTab».
15. http://www.umetrics.com/ – Сайт программы Modde.
16. http://www.sigmaxl.com/ – Сайт расширения Excel «SigmaXL».
71
72
3,0770
1,8850
1,6377
1,5332
1,4759
1,4390
1,4149
1,3968
1,3830
1,3720
1,363
2
3
4
5
6
7
8
9
10
11
0,80
1,795
1,8125
1,8331
1,8596
1,8946
1,943
2,01500
2,13180
2,35340
2,9200
6,3130
0,90
2,201
2,2281
2,2622
2,3060
2,3646
2,4460
2,570
2,776
3,182
4,3020
12,7060
0,95
2,718
2,7638
2,8214
2,8965
2,998
3,1420
3,649
3,746
4,540
6,964
31,820
0,98
p
3,105
3,1693
3,2498
3,3554
3,4995
3,7070
4,0321
4,604
5,840
9,924
63,656
0,99
3,496
3,5814
3,6897
3,832
4,2293
4,316
4,773
5,597
7,458
14,089
127,656
0,995
4,024
4,1437
4,2968
4,5008
4,785
5,2070
5,893
7,173
10,214
22,327
318,306
0,998
4,437
4,5869
4,780
5,0413
5,4079
5,958
6,863
8,610
12,924
31,599
636,619
0,999
Критические значения коэффициента Стьюдента (t-критерия) для различной доверительной
вероятности p и числа степеней свободы f
1
f
Таблица 1.
СПРАВОЧНЫЕ ТАБЛИЦЫ
ПРИЛОЖЕНИЕ 1
73
1,3562
1,3502
1,3450
1,3406
1,3360
1,3334
1,3304
1,3277
1,3253
1,3230
1,3212
1,3195
1,1378
1,3163
1,315
1,3137
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Продолжение табл. 1
1,7033
1,705
1,7081
1,7109
1,7139
1,7117
1,7200
1,7247
1,7291
1,7341
1,7396
1,7450
1,7530
1,7613
1,7709
1,7823
2,0518
2,059
2,0595
2,0639
2,0687
2,0739
2,2,0790
2,08600
2,0930
2,1009
2,1098
2,1190
2,1314
2,1448
2,1604
2,1788
2,4727
2,478
2,4851
2,4922
2,4999
2,5083
2,5170
2,5280
2,5395
2,5514
2,5668
2,5830
2,6025
2,6245
2,6503
2,6810
2,7707
2,778
2,7874
2,7969
2,8073
2,8188
2,8310
2,8453
2,8609
2,8784
2,8982
2,9200
2,9467
2,976
3,1123
3,0845
3,0565
3,0660
3,0782
3,0905
3,1040
3,1188
3,1350
3,1534
3,1737
3,1966
3,2224
3,2520
3,2860
3,3257
3,3725
3,4284
3,4210
3,4360
3,4502
3,4668
3,4850
3,5050
3,5270
3,5518
3,5794
3,6105
3,6458
3,6860
3,732
3,787
3,852
3,929
3,6896
3,7060
3,7251
3,7454
3,7676
3,7921
3,8190
3,8495
3,8834
3,9216
3,965
4,0150
4,072
4,140
4,220
4,178
74
1,3125
1,3114
1,3104
1,3080
1,3070
1,3050
1,3042
1,303
1,320
1,301
1,300
1,299
298
1,997
1,2958
1,2947
28
29
30
32
34
36
38
40
42
44
46
48
50
55
60
65
Продолжение табл. 1
1,6686
1,6706
1,673
1,6759
1,6772
1,6767
1,6802
1,682
1,6839
1,6860
1,6883
1,6909
1,6930
1,6973
1,6991
1,7011
1,997
2,0003
2,0040
2,0086
2,0106
2,0129
2,0154
2,018
2,0211
2,0244
2,0281
2,0322
2,0360
2,0423
2,0452
2,0484
2,3851
2,3901
2,3960
2,4033
2,4056
2,4102
2,4141
2,418
2,4233
2,4286
2,4345
2,4411
2,4480
2,4573
2,4620
2,4671
2,6536
2,6603
2,6680
2,6778
2,6822
2,6870
2,6923
2,6980
2,7045
2,7116
2,7195
2,7284
2,7380
2,7500
2,7564
2,7633
3,9060
3,9146
2,9240
3,9370
3,9426
3,9488
3,9555
2,6930
3,9712
3,9808
9,490
3,9520
3,0140
3,0298
3,0360
3,0469
3,2204
3,2317
3,2560
3,2614
3,2689
3,2771
3,2861
3,2960
3,3069
3,3190
3,3326
3,3479
3,3650
3,3852
3,3962
3,4082
3,4466
3,4602
3,4760
3,4060
3,5051
3,5150
3,5258
3,5370
3,5510
3,5657
3,5821
3,6007
3,6210
3,6460
3,8494
3,6739
75
1,2938
1,2820
1,2910
1,2901
1,2888
1,2872
1,2858
1,2849
1,2844
1,2837
1,2830
70
80
90
100
120
150
200
250
300
400
500
Окончание табл. 1
1,6470
1,6487
1,6499
1,6510
1,6525
1,6551
1,6577
1,6602
1,6620
1,6640
1,6689
1,9640
1,9659
1,9679
1,9695
1,9719
1,9759
1,9719
1,9840
1,9867
1,9900
1,9944
2,3330
2,3357
2,3388
2,3414
2,3451
2,3515
2,3578
2,3642
2,3885
2,3730
2,3808
2,7850
2,5882
2,5923
2,5966
2,6006
2,6090
2,6174
2,6259
2,6316
2,6380
2,6479
2,8190
2,8227
2,8279
2,8222
2,8385
2,8482
2,8598
2,8707
2,8779
2,8870
3,8987
3,1060
3,1107
3,1176
3,1232
3,1315
3,1455
3,1595
3,1737
3,1833
3,1950
3,2108
3,3100
3,3150
3,3233
3,3299
3,3398
3,3566
3,3735
3,3905
3,4019
3,4160
3,4350
76
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
f2
1
2
199,50
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3
215,71
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
4
224,58
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
5
230,16
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
6
233,99
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
f1
236,77
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
7
238,88
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
8
10
15
240,54 241,88 245,95
19,38
19,40 19,43
8,81
8,79
8,70
6,00
5,96
5,86
4,77
4,74
4,62
4,10
4,06
3,94
3,68
3,64
3,51
3,39
3,35
3,22
3,18
3,14
3,01
3,02
2,98
2,85
2,90
2,85
2,72
2,80
2,75
2,62
2,71
2,67
2,53
2,65
2,60
2,46
2,59
2,54
2,40
2,54
2,49
2,35
2,49
2,45
2,31
2,46
2,41
2,27
2,42
2,38
2,23
2,39
2,35
2,20
9
Значения критерия Фишера (F-критерия) для уровня значимости p = 0,05 (f1 – число степеней
свободы большей дисперсии, f2 – число степеней свободы меньшей дисперсии)
161,45
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
Таблица 2.
77
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
4,33
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,09
4,00
3,92
3,84
Окончание табл. 2
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,15
3,07
3,00
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,05
2,93
2,92
2,84
2,76
2,68
2,61
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,53
2,45
2,37
2,69
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,37
2,29
2,21
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,25
2,18
2,10
2,49
2,46
2,44
2,42
2,41
2,39
2,37
2,36
2,35
2,33
2,25
2,17
2,09
2,01
2,42
2,40
2,38
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,10
2,02
1,94
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,04
1,96
1,88
2,32
2,30
2,28
2,26
2,24
2,22
2,20
2,19
2,18
2,16
2,08
1,99
1,91
1,83
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,84
1,75
1,67
78
++++–+–++––+–––
++––++++–+–+––––++–
+++++–+–++––++––+–+––––
N = 16 N = 20 N = 24 Количество факторов
3
±1 ±1 0
±1 0 ±1
0 ±1 ±1
0 0 0
План эксперимента
Таблица 2. Исходные матрицы планов Бокса–Бенкена
N = 28 Первые девять строк
Исходные матрицы планов Бокса–Бенкена
++–+++–––+–
N = 12 Первые строки планов Плакетта–Бермана
N=8
+++–+––
ИСХОДНЫЕ ДАННЫЕ ДЛЯ ГЕНЕРАЦИИ ПЛАНОВ
Количество опытов
N = 15
ПРИЛОЖЕНИЕ 2
79
5
4
Окончание табл. 2
±1
0
0
±1
0
0
0
±1
0
±1
0
0
±1
0
±1
0
0
0
±1
0
0
0
±1
0
0
±1
0
±1
0
0
±1
0
±1
0
0
0
0
±1
0
0
±1
0
0
±1
0
0
±1
0
0
0
±1
0
±1
0
0
0
±1
±1
0
0
±1 ±1 0 0
0 0 ±1 ±1
0 0 0 0
±1 0 0 ±1
0 ±1 ±1 0
0 0 0 0
±1 0 ±1 0
0 ±1 0 ±1
0 0 0 0
N = 46
N = 27
Учебное издание
Щеников Ярослав Алексеевич
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ
ЭКСПЕРИМЕНТА
Учебное пособие
Редактор А. В. Подчепаева
Верстальщик С. Б. Мацапура
Сдано в набор 28.03.08. Подписано к печати 19.05.08.
Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ л. 4,7.
Уч.-изд. л. 5,0. Тираж 100 экз. Заказ № .
Редакционно-издательский центр ГУАП
190000, Санкт-Петербург, Б. Морская ул., 67
Документ
Категория
Без категории
Просмотров
2
Размер файла
1 498 Кб
Теги
shchenikov
1/--страниц
Пожаловаться на содержимое документа