close

Вход

Забыли?

вход по аккаунту

?

90.Основы научных исследований. Организация и планирование эксперимента

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки России
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Казанский национальный исследовательский
технологический университет»
Р.Г. Сафин, А.И. Иванов, Н.Ф. Тимербаев
ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ.
ОРГАНИЗАЦИЯ И ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТА
Учебное пособие
Казань
Издательство КНИТУ
2013
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 001.8(075)
БКК Ч215я7
Сафин Р.Г.
Основы научных исследований. Организация и планирование
эксперимента : учебное пособие / Р.Г. Сафин, А.И. Иванов, Н.Ф. Тимербаев; М-во образ. и науки России, Казан. нац. исслед. технол. ун-т. –
Казань : Изд-во КНИТУ, 2013. – 156 с.
ISBN 978-5-7882-1412-2
Приведены сведения по планированию и организации эксперимента, измеряемым величинам и средствам измерений, погрешностям
измерений и способам математической обработки результатов измерений.
Предназначено для магистров, обучающихся по направлению
250400 – «Технология лесозаготовительных и деревоперерабатывающих производств».
Подготовлено на кафедре переработки древесных материалов.
Печатается по решению редакционно-издательского совета Казанского национального исследовательского технологического университета
Рецензенты: ген. директор ЗАО «Ласкрафт» Е.К. Воронин
зам. директора НТЦ РТО канд. техн. наук,
доц. А.Р. Садртдинов
ISBN 978-5-7882-1412-2
© Сафин Р.Г., Иванов А.И., Тимербаев Н.Ф., 2013
© Казанский национальный исследовательский
технологический университет, 2013
-2-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВВЕДЕНИЕ
Важным фактором в повышении производительности труда инженеров и научных работников является автоматизация исследований,
включающая в себя широкий круг задач — от моделирования творческого процесса, организации коллективов и планирования научных
исследований на основе применения методов кибернетики до создания автоматизированных научных приборов, средств и систем автоматизации экспериментов. Однако все эти задачи неразрешимы без проведения экспериментов.
Эксперимент занимает главенствующее место среди способов
получения информации о внутренних взаимосвязях явлений в природе
и технике. Он является отправной точкой и критерием достоверности,
подлинности большинства наших знаний. Экспериментальные поиски
часто ведутся в таких областях, где теоретически нельзя сделать каких-либо прогнозов. С помощью экспериментальных данных, получаемых непосредственно от изучаемых объектов, проверяется истинность теоретических предпосылок. Чтобы представить себе масштабы
повседневной экспериментальной работы, достаточно наряду с натурными исследованиями, проводимыми в различных областях науки,
при проектировании новой техники учесть также испытания образцов
опытной и серийной продукции на тысячах заводов.
По мере роста сложности исследуемых процессов и явлений
возрастают затраты на аппаратуру и проведение эксперимента. Для
проведения некоторых специальных экспериментов требуется такое
количество энергии, которое было бы достаточным для энергоснабжения города средней величины. При этом постоянно возрастает
сложность решаемых задач, а большой объем информации, необходимой для выяснения внутренних взаимосвязей в природе и технике,
заставляет применять все более сложные многомашинные комплексы
для ее обработки. Все чаще оказываются недоступными непосредственному измерению характеристики объектов испытаний, подлежащие определению в результате эксперимента. Вследствие этого совокупность технико-экономических показателей, по которым проводится оценка испытуемого объекта или принимаются важные организационные и инженерные решения, не совпадает, как правило, с совокупностью параметров объекта, определяемых по результатам натурного эксперимента.
-3-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Важной задачей является организация испытаний объектов, исследование процессов, которые носят сложный динамический характер и подвержены существенному влиянию со стороны изменяющихся
условий внешней среды или динамических свойств человека. В ходе
испытаний собирается большое количество экспериментальных данных, требующих обработки и анализа. Разработка технического объекта (или технологического процесса) в большинстве случаев включает следующие этапы: лабораторная установка — опытная установка
— промышленная экспериментальная установка, хотя установки, построенные в лабораторных условиях, во многом допускают экстраполяцию на промышленные установки. При этом продолжительность
анализа и осмысливания результатов испытаний и их учета для корректировки характеристик новых изделий весьма значительна. Этот
процесс хорошо иллюстрируется в отечественной и зарубежной практике соотношением час испытаний — тысяча часов обработки.
Широкое применение экспериментальных методов привело к
созданию теории эксперимента. Эта теория призвана дать экспериментатору ответы на следующие вопросы:
1) как нужно организовать эксперимент, чтобы наилучшим образом решить поставленную задачу (в смысле затрат времени и
средств или точности результатов);
2) как следует обрабатывать результаты эксперимента, чтобы
получить максимальное количество информации об исследуемом объекте (или явлении);
3) какие обоснованные выводы можно сделать об исследуемом
объекте по результатам эксперимента.
1. ОБЩИЕ ПОЛОЖЕНИЯ ТЕОРИИ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
1.1. Основные понятия
Теория ПЭ охватывает практически все встречающиеся на практике варианты исследования объектов. В дальнейшем будут рассмотрены следующие типовые задачи экспериментального исследования:
1) Поиск значений параметров системы, обеспечивающих достижение оптимального значения показателя качества исследуемого
-4-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
объекта при известных ограничениях на значения этих параметров.
Перебор всех допустимых сочетаний значений параметров системы с
целью поиска оптимального варианта нерационален по затратам ресурсов. Для решения указанной задачи ТПЭ предлагает такую последовательность проведения опытов, которая позволяет применять градиентные методы поиска при априорно неизвестной функции, связывающей показатель качества с параметрами системы.
2) Приближенное аналитическое описание функциональной связи показателей качества с параметрами системы по результатам проведенного эксперимента. Традиционные методики проведения экспериментов из-за зависимости компонентов восстанавливаемого аналитического описания не позволяют определить раздельное влияние
каждого фактора на результирующий показатель, т. е. эти методики
обеспечивают получение аналитических зависимостей, пригодных
лишь для решения интерполяционных задач. В отличие от них ТПЭ
дает возможность оценить вклад каждого параметра в значение показателя, т.е. приближенно восстановить закон функционирования объекта по экспериментальным данным. Полученное аналитическое описание объекта можно использовать для предварительного исследования вариантов построения системы или в интересах построения модели старшей системы, включающей данный объект на правах элемента.
3) Оценка дифференциального влияния уровней параметров
системы на показатель качества. Такая задача возникает в случае, когда параметры системы являются по своей природе качественными
или когда количественные параметры могут принимать небольшое
число различных значений.
Кроме указанных, существуют и других задачи, решаемые с помощью ТПЭ, например:
1) Испытания образцов техники. Планирование должно позволить оценить степень соответствия показателей качества образцов
заданным требованиям при минимальном объеме испытаний.
2) Отсеивающие эксперименты. Предназначены выявить параметры, незначительно влияющие на показатель качества системы.
Соответствующие планы применяют на начальных этапах исследования, когда нет конкретных сведений о влиянии тех или иных параметров. Отсеивание несущественных факторов снижает трудоемкость
решения задач оптимизации или приближенного аналитического описания системы.
-5-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3) Адаптивное планирование. Применяется в условиях управления технологическим процессом, когда система управления все время
должна приспосабливаться к конкретным условиям функционирования, а возможно, и предсказывать дальнейшее развитие процесса.
Решение задач с применением ТПЭ предусматривает использование априорной информации об изучаемом процессе для выбора общей последовательности управления экспериментами, которая уточняется после очередного этапа проведения исследований на основе
вновь полученных сведений. Тем самым достигается возможность
рационального управления экспериментами при неполном первоначальном знании характеристик исследуемого объекта. Целесообразность применения ТПЭ тем выше, чем сложнее исследуемая система.
В ТПЭ исследуемый объект (реальный объект, модель объекта)
рассматривается как «черный ящик», имеющий входы v (управляемые
независимые параметры) и выходы y .
Переменные v принято называть факторами. Теория ПЭ изучает только активный тип экспериментов, когда имеется возможность
независимо и целенаправленно менять значения факторов v во всем
требуемом диапазоне. Факторы в эксперименте бывают качественными и количественными. Качественные факторы можно квантифицировать или приписать им числовые обозначения, тем самым перейти к
количественным значениям. В дальнейшем будем считать, что все
факторы являются количественными и представлены непрерывными
величинами (если другое не оговорено особо). Переменным v можно
сопоставить геометрическое понятие факторного пространства –
пространства, координатные оси которого соответствуют значениям
факторов. Совокупность конкретных значений всех факторов образует
точку в многомерном факторном пространстве. Примерами факторов
являются: интенсивность потока запросов к базе данных, скорость
передачи данных по каналу, объем запоминающего устройств. Кроме
того, на объект воздействуют возмущающие факторы, они являются
случайными и не поддаются управлению.
Область планирования задается интервалами возможного изменения факторов vi min < vi < vi max для i =1, 2… k, где k – количество факторов. В теории ПЭ часто используют нормализацию факторов, т.е.
преобразование натуральных значений факторов в безразмерные (кодированные) величины. Переход к безразмерным значениям xi задается преобразованием
-6-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(1.1)
xi = (vi – vi0)/∆vi,
где vi – натуральное значение фактора; vi0 – натуральное значение основного уровня фактора, соответствующее нулю в безразмерной шкале; ∆vi – интервал варьирования. Совокупность основных уровней
всех факторов представляет собой точку в пространстве параметров,
называемую центральной точкой плана или центром эксперимента. С
геометрической точки зрения нормализация факторов равноценна
линейному преобразованию пространства факторов, при котором проводятся две операции: перенос начала координат в точку, соответствующую значениям основных уровней факторов; сжатие – растяжение
пространства в направлении координатных осей.
Активный эксперимент включает систему воздействий, при которых воспроизводится функционирование объекта; регистрацию
отклика объекта. План эксперимента задает совокупность данных,
определяющих количество, условия и порядок реализации опытов.
Опыт составляет элементарную часть эксперимента и предусматривает воспроизведение исследуемого явления в конкретных условиях с
последующей регистрацией результата. В условиях случайности в
одних и тех же условиях проводятся параллельные (повторные) опыты
в интересах получения статистически устойчивых результатов. Опыт
u предполагает задание конкретных значений факторам vu = v1u, v2u…
vku, а совокупность значений факторов во всех N точках плана эксперимента образует матрицу плана
v11, v21… vk1
v12, v22… vk2
.
.
.
.
(1.2)
.
v1N, v2N… vkN .
Строки матрицы соответствуют опытам, столбцы – факторам, элемент
матрицы viz задает значение z-го фактора в i-м опыте.
Вектор y называется откликом. В ТПЭ обычно изучается ситуация, в которой вектор отклика y состоит из одного элемента y. При
наличии нескольких составляющих вектора y, каждую из них можно
исследовать отдельно. Зависимость отклика от факторов носит название функции отклика, а геометрическое представление функции отклика – поверхности отклика. Функция отклика рассматривается как
показатель качества или эффективности объекта. Этот показатель является функцией от параметров – факторов. На практике широкое
-7-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
распространение получили простые функции вида М{y'} = bf(v), где
b=(b0, b1…bh) – вектор неизвестных параметров модели размерности
h+1, f(v)=(f0(v), f1(v)…fh(v)) – вектор заданных базисных функций,
М{y'} – математическое ожидание функции отклика. Такое представление функции отклика соответствует линейной по параметрам модели регрессионного анализа, т.е. функция отклика есть линейная комбинация базисных функций от факторов.
Вследствие влияния на результаты экспериментов случайных
воздействий истинные значения коэффициентов можно определить
только приближенно. Оценку β = (β0, β1, …, βh) вектора неизвестных
параметров b находят по результатам экспериментов, в ходе которых
получают значения yu при заданных значениях факторов vu. Эти оценки обычно рассчитываются с помощью метода наименьших квадратов
(МНК) на основе выборок значений факторов и откликов системы на
воздействия [8]. В качестве оценки β вектора b выбирается такое зна-
1
N
чение, которое минимизирует
N
∑(y
'
u
− yu ) 2 , где y'u – вычисленное
u =1
на модели значение функции отклика в u-й точке факторного пространства. Приравнивая к нулю частные производные от данной квадратичной формы, взятые по переменным β0, β1, …, βh, можно получить
систему уравнений вида
1
N
N
∑(y
'
u
− y u ) f (vi ) = 0 , где i= 0, 1, 2…h.
u =1
Значение β находят путем решения этой системы уравнений. Решение
системы возможно при линейной независимости базисных функций.
Если не принимать специальных мер, то оценки коэффициентов
β станут взаимозависимыми, и полученное выражение для функции
отклика можно рассматривать только как интерполяционную формулу, что затрудняет ее физическую интерпретацию и последующие
расчеты. Однако, формируя специальным образом матрицу плана,
можно получить независимые значения β. И эти величины будут характеризовать вклад каждого фактора в значение функции отклика.
Итак, задача заключается в определении общей формы записи
функции отклика y'. В большинстве случаев вид этой функции, получается теоретически, сложен для практического применения, а при
неполном знании объекта вообще неизвестен. По данным причинам
функцию целесообразно представить в универсальном, удобном для
-8-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
практического применения виде, чему соответствует представление в
виде полинома. Тогда системой базисных функций будет совокупность степенных функций с целыми неотрицательными значениями
показателей степени. Полиномиальная форма представления функции
отклика примет вид
y' = β0 + β1x1 + …+ βkxk + β12x1x2 + β13x1x3+… +βk–1,k xk–1xk +
(1.3)
+β11x21 + … +βkkx2k + … + ε,
где ε – случайная составляющая функции отклика (величина, характеризующая ошибку опыта).
Такая функция отклика линейна относительно неизвестных коэффициентов и будет полностью определена, если известны степень
полинома и коэффициенты. Степень полинома задается исследователем априорно и уточняется в ходе исследования. На практике наибольшее распространение получили полиномы первого и второго порядка, соответственно линейные и квадратичные модели. Коэффициенты полинома принято называть эффектами факторов.
Иногда функцию отклика целесообразно представить в другом
виде, например в виде степенной функции, так как достижение заданной точности требует применения полинома высокого порядка. Однако использование функций, нелинейных относительно неизвестных
параметров, усложняет вычисления, затрудняет оценку их свойств. В
некоторых случаях задачу можно упростить путем искусственного
преобразования нелинейной функции в линейную. При этом требуется
соответствующее преобразование и результатов экспериментов.
Применение ТПЭ основано на ряде допущений, а именно :
1) Функция отклика содержит в своем составе неслучайную и
случайную составляющую. Многие показатели качества автоматизированных систем обработки информации носят случайный характер.
Это требует многократного повторения опытов в одних и тех же условиях в целях получения статистически устойчивых результатов, а получаемые оценки показателей должны обладать свойствами состоятельности, эффективности, несмещенности и достаточности. Оценки
типовых показателей формируются путем усреднения результатов
наблюдений. Поэтому при достаточно большом количестве наблюдений можно считать, что случайная составляющая ε распределена по
нормальному закону с нулевым математическим ожиданием, что позволяет получить несмещенную оценку математического ожидания
функции отклика в конкретной точке плана. Будем также считать, что
-9-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
величина ε имеет дисперсию, не зависящую от значений факторов.
Иначе говоря, результаты, полученные путем усреднения повторных
опытов в каждой точке плана, представляют собой независимые, нормально распределенные случайные величины.
2) Факторы v1, v2…vk измеряются с пренебрежимо малой ошибкой по сравнению с ошибкой в определении величины y (учет помех в
задании факторов приводит к трудно разрешимым проблемам в оценке коэффициентов функции отклика). Ошибка в определении значения
функции отклика объясняется не столько погрешностью измерений,
сколько влиянием на результат работы системы неучтенных или случайных факторов, например различиями в формируемой последовательности случайных чисел при статистическом моделировании.
3) Дисперсии среднего значения функции отклика в различных
точках равны друг другу (выборочные оценки дисперсии однородны).
Это означает, что при многократных повторных наблюдениях над
величиной yu при некотором наборе значений v1u, v2u…vku, получаемая
оценка дисперсии среднего значения не будет отличаться от оценки
дисперсии, полученной при многократных наблюдениях для любого
другого набора значений независимых переменных v1s, v2s… vks.
Указанные допущения позволяют использовать для расчетов коэффициентов полинома МНК, который дает эффективные и несмещенные оценки коэффициентов и обеспечивает простоту проведения
самих расчетов. Применение МНК, вообще говоря, не требует соблюдения нормального распределения результатов наблюдения. Этот метод в любом случае дает решение, минимизирующее сумму квадратов
отклонений результатов наблюдения от значений функции отклика.
Допущение о нормальном распределении используется при проведении различного рода проверок, например при проверке адекватности
функции отклика и экспериментальных данных. Естественно, что точность оценок коэффициентов функции отклика повышается с увеличением числа опытов, по которым вычисляются коэффициенты.
1.2. Критерии оптимальности и типы планов
В настоящее время используется свыше 20 различных критериев
оптимальности планов, которые подразделяются на две основные
группы. К первой группе относят критерии, связанные с ошибками
оценок коэффициентов, а ко второй – критерии, связанные с ошибкой
- 10 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
оценки поверхности отклика [2, 3, 6]. Далее будут охарактеризованы
только те критерии, которые наиболее часто применяются при решении задач оптимизации, описания поверхности отклика и оценки
влияния факторов.
Критерии первой группы представляют интерес для задач оптимизации, выделения доминирующих (наиболее значимых) параметров
на начальных этапах решения оптимизационных задач или для выявления несущественных параметров в задачах восстановления закономерности функционирования объекта. Геометрическое истолкование
свойств ошибок коэффициентов связано со свойствами эллипсоида их
рассеяния, определяемого математическим ожиданием и дисперсией
значений ошибок. Пространственное расположение, форма и размер
эллипсоида полностью зависят от плана эксперимента.
Критерию D-оптимальности соответствует минимальный объем
эллипсоида рассеяния ошибок (минимум произведения всех дисперсий коэффициентов полинома). В соответствующем плане эффекты
факторов максимально независимы друг от друга. Этот план минимизирует ожидаемую ошибку предсказания функции отклика. Критерию
A-оптимальности соответствует план с минимальной суммарной дисперсией всех коэффициентов, критерию E-оптимальности – план, в
котором максимальная дисперсия коэффициентов минимальна.
Выбор критерия зависит от задачи исследования. Так, при изучении влияния отдельных факторов на поведение объекта применяют
критерий Е-оптимальности, а при поиске оптимума функции отклика
– критерий D-оптимальности. Если построение D-оптимального плана
вызывает затруднения, то можно перейти к А-оптимальному плану,
построение которого проще.
Критерии второй группы используются при решении задач описания поверхности отклика, определения ограничений на значения
параметров. Основным здесь является критерий G-оптимальности,
который позволяет построить план с минимальным значением наибольшей ошибки в описании функции отклика. Применение Gоптимального плана дает уверенность в том, что в области планирования нет точек с чрезмерно большой ошибкой описания функции.
Среди всех классов планов основное внимание в практической
работе уделяется ортогональным и ротатабельным планам.
- 11 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ортогональным называется план, для которого выполняется условие парной ортогональности столбцов матрицы планирования, в
частности, для независимых переменных
N
∑x
iu
x ju = 0, i ≠ j , i, j = 1, k , где N – количество точек плана экспе-
u =1
римента, k – количество независимых факторов. При ортогональном
планировании коэффициенты полинома определяются независимо
друг от друга – вычеркивание или добавление слагаемых в функции
отклика не изменяет значений остальных коэффициентов полинома.
Для ортогональных планов эллипсоид рассеяния ориентирован в пространстве так, что направления его осей совпадают с направлениями
координат пространства параметров.
Использование ротатабельных планов обеспечивает для любого направления от центра эксперимента равнозначность точности
оценки функции отклика (постоянство дисперсии предсказания) на
равных расстояниях от центра эксперимента. Это особенно важно при
решении задач поиска оптимальных значений параметров на основе
градиентного метода, так как исследователь до начала экспериментов
не знает направление градиента и поэтому стремится принять план,
точность которого одинакова во всех направлениях. В ряде случаев
при исследовании поверхности отклика требуется униморфность модели, а именно соблюдение постоянства значений дисперсии ошибки
в некоторой области вокруг центра эксперимента. Выполнение такого
требования целесообразно в тех случаях, когда исследователь не знает
точного расположения области поверхности отклика с оптимальными
значениями параметров. Указанная область будет определена на основе упрощенной модели, полученной по результатам экспериментов.
По соотношению между количеством оцениваемых неизвестных
параметров модели и количеством точек плана эксперимента все планы подразделяются на три класса: ненасыщенные – количество параметров меньше числа точек плана; насыщенные – обе величины одинаковы; сверхнасыщенные – количество параметров больше числа
точек плана. Метод наименьших квадратов применяют только при
ненасыщенном и насыщенном планировании, и он неприменим для
сверхнасыщенного планирования.
Для некоторых планов важную роль играет свойство композиционности. Так, композиционные планы для построения полиномов
- 12 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
второго порядка получают добавлением некоторых точек к планам
формирования линейных функций. Это дает возможность в задачах
исследования сначала попытаться построить линейную модель, а затем при необходимости, добавив наблюдения, перейти к моделям второго порядка, используя ранее полученные результаты и сохраняя при
этом некоторое заданное свойство плана, например его ортогональность.
Между критериями оптимальности и методами построения оптимальных планов экспериментов существует жесткая связь. Построение планов производится путем использования или каталогов
планов или непосредственно методов планирования экспериментов,
что является непростой задачей и требует достаточно высокой квалификации исследователя в области ТПЭ.
Кроме рассмотренных критериев, в планировании экспериментов вполне естественно применяется критерий минимума числа экспериментов, т.е. среди всех планов желательно выбирать такой, который
требует минимального числа опытов при соблюдении требований к
качеству оценки функции или ее параметров.
Как было отмечено выше, одной из областей применения ТПЭ
является решение задач оптимизации, причем непосредственно для
поиска оптимальных решений используются градиентные методы.
Вычисление оценки градиента осуществляется на основе обработки
экспериментальных данных. Хотя градиентный метод оптимизации не
является составной частью ТПЭ, в целях удобства освоения материала
далее приводим его краткое изложение.
2. ГРАДИЕНТНЫЕ МЕТОДЫ ОПТИМИЗАЦИИ
2.1. Понятие градиента
Любую совокупность вещественных чисел (v1, v2…vk), взятых в
определенном порядке, можно рассматривать как точку или вектор с
теми же координатами в пространстве k-измерений (k-мерном пространстве). Запись вида v = (v1, v2…vk) обозначает точку или вектор v с
указанными в скобках координатами [4]. Если для k-мерных векторов
v и w справедливы основные алгебраические операции:
– сложение и вычитание
v ± w = (v1 ± w1, v2 ± w2 … vk ± wk),
- 13 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– умножение на действительное число υ
υ × v = (υ × v1, υ × v2…υ × vk),
– скалярное произведение
v × w = (v1 × w1, v2 × w2…vk × wk),
то совокупность всех таких векторов называют k-мерным евклидовым
пространством и обозначают Ek.
За длину вектора v принимают число, определяемое по формуле
v = v v = v12 + v22 + ... + vk2 .
(2.1)
Длину вектора можно вычислить только тогда, когда компоненты
вектора представлены в одной шкале измерений или когда они являются безразмерными величинами, полученными, например, в результате преобразования (1.1), – кодированные переменные безразмерны.
Если произведение v × w = 0 при |v| ≠ 0 и |w| ≠ 0, то векторы v и
w являются ортогональными.
Единичным называют вектор, определяемый по формуле
v v v
t = (t1 , t2 , ... tk ) =  1 , 2 ... k
v v v

.


(2.2)
Пусть в Ek заданы некоторая точка V = (v1, v2…vk), единичный
вектор t и непрерывно дифференцируемая по всем аргументам функция f(V) = f(v1, v2…vk). Производной в точке V от функции f(V) по направлению луча, определяемому вектором t, называется предел
f (v1 + λ t1 , v2 + λ t 2 ...vk + λ t k ) − f (v1 , v2 ...vk )
∂ f (V )
= lim
λ
∂t
λ →0
или ∂ f (V ) =  ∂ f (V ) t1 , ∂ f (V ) t 2 ... ∂ f (V ) t k  .
∂t
 ∂ v1
∂ v2
∂ vk

Градиентом функции f(V) называют вектор ∇f(V) с координатами, равными частным производным по соответствующим аргументам
 ∂ f (V ) ∂ f (V ) ∂ f (V ) 
.
∇f (V ) = 
;
...
(2.3)
∂ v2
∂ vk 
 ∂ v1
Градиент указывает направление наибольшего возрастания функции.
Противоположное направление –∇f(V) называется антиградиентом и
показывает направление наискорейшего убывания функции. В точке
экстремума V* градиент равен нулю ∇f(V* ) = 0. Если аналитически
производные определить невозможно, их вычисляют приближенно:
- 14 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
∂f(V) / ∂vi ≈ ∆f(V) / ∆vi, где ∆f(V) – приращение функции f(V) при изменении аргумента на величину ∆vi. Двигаясь по градиенту (антиградиенту), можно достичь максимума (минимума) функции. В этом и состоит сущность градиентного метода оптимизации.
2.2. Способы градиентной оптимизации
Существует несколько модификаций метода градиентной оптимизации применительно к дискретным вычислениям [4].
Если подъем происходит поочередно по каждой отдельной координате v1, v2…vk , то такой метод называют покоординатным подъемом или методом Гаусса – Зейделя. Движение осуществляется из
некоторой точки по координате v1 до тех пор, пока не станет равной
нулю соответствующая производная ∂f(V) / ∂v1 = 0. Все остальные координаты (аргументы функции) сохраняют постоянное значение. После этого подъем начинается по другой координате. Порядок перебора
координат не играет принципиальной роли, а влияет только на скорость поиска, поэтому обычно начинают с v1, затем - с v2 и т.д. После
того как будет произведен подъем по всем координатам, начинают
повторно с v1. Процесс заканчивается, когда все частные производные
будут равны нулю (будут меньше порога чувствительности).
Метод наискорейшего подъема предполагает определение градиента в исходной точке, далее подъем в этом направлении осуществляется до тех пор, пока производная df(V) / dV в этом направлении не
обратится в нуль. После этого снова определяют градиент и осуществляют по нему подъем до нулевого значения производной и т.д. Модификация этого метода предусматривает вычисление градиента в
каждой новой точке траектории перемещения.
Все отмеченное, касающееся сущности методов поиска максимума функции, легко транспонируется и для поиска минимума. Рассмотренные выше методы предполагают возможность движения по
любому выбранному направлению, т.е. ограничений на область допустимых значений аргументов нет. В качестве начальной точки может быть взята любая точка пространства Ek. Равенство ∇f(V*) = 0 является необходимым, но недостаточным условием экстремума функции в точке V*, да и точек V* может быть несколько. Поэтому требуются дополнительные исследования для установления, какая из точек
- 15 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
действительно является оптимумом (а не точкой перегиба) и какая из
них является глобальной.
Одна из основных проблем применения градиентного метода
поиска заключается в выборе величины каждого дискретного шага.
Шаги могут быть постоянными или переменными. Второй вариант в
реализации алгоритма более сложный, но обычно требует меньшего
количества итераций.
Поиск максимума функции включает следующие этапы:
1. Определение аналитических соотношений для вычисления
градиента функции ∇f(V), длины вектора градиента |∇f(V)| и единичного вектора t(V) с помощью соответственно формул (2.1), (2.2) и
(2.3).
2. Выбор исходной точки Vn при n = 0 (начальных значений аргументов функции).
3. Вычисление координат единичного вектора t(Vn) по формуле,
полученной на шаге 1, и определение координат новой точки при
движении по направлению единичного вектора.
4. Выбор шага a изменения координат текущей точки Vn. Осуществляется из условия предельного увеличения функции f[Vn +
at(Vn)] одного аргумента a в соответствии с уравнением
df [Vn + at (Vn )]
=0.
da
(2.4)
Корень этого уравнения, максимизирующий функцию f(V), обозначим
an. Следующее приближение Vn + 1 вычисляется по формуле
Vn+1 = Vn+аn t(Vn).
Производится возврат к этапу 3. В результате формируется последовательность приближений V0, V1, V2 … Вычислительный процесс
заканчивается, когда будет достигнута точка Vn, в которой оценка градиента будет равна нулю (коэффициенты функции отклика становятся
незначимыми).
Пример 2.2.1. Выполнить шаг крутого восхождения для функции отклика у = – 3х12 – 2х22.
Решение. Решение осуществляется в несколько этапов:
Этап 1. Общий вид градиента функции ∇f(V):
∂у/∂х1 = – 6х1, ∂у/∂х2 = – 4х2 ; ∇f(V) = (– 6х1; – 4х2).
Длина вектора градиента:
|∇f(V)| = [(∂у/∂х1)2; (∂у/∂х2)2]0,5 = [36 х12; 16х22 ]0,5.
- 16 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Единичный вектор t:
t = (t1; t2) = ∇f(V) / |∇f(V)| = – (6х1; 4х2) / [36 х12 +16х22 ]0,5.
Этап 2. Выбор начальной точки, например V0 = (5; 3).
Этап 3. Вычисление координат единичного вектора:
t(V0)= –(30; 12)/[36·25 + 16·9]0,5= – (30; 12)/[32,31] =
= (–0,93; –0,37).
Координаты точки V1 при движении по направлению вектора t:
V1 =V0 + a·t(V0)= (5; 3) + a·(– 0,93; – 0,37) =
=(5 – a·0,93; 3 – a·0,37).
Функция отклика у в точке V1 пространства двух переменных:
у = – 3·(5 – a·0,93)2 – 2·(3 – a·0,37)2.
Этап 4. Выбор шага а изменения координат текущей точки в соответствии с уравнением (2.4):
32,34 – 5,737·а = 0.
Следовательно, шаг а = 5,637.
Координаты точки V1 после выполнения первого шага крутого
восхождения: V1 = V0 + а· t(V0) = (– 0,242; 0,914).
Аналогично выполняется следующий шаг крутого восхождения.
Рассмотренный алгоритм применяют только для нелинейных
функций. Если функция отклика является линейной, то выбор оптимального значения параметра a невозможен. В этом случае шаг выбирается исходя из эвристических предположений исследователя о виде
функции отклика.
2.3. Особенности применения градиентной оптимизации
совместно с методами планирования экспериментов
Применение методов планирования экспериментов вносит в типовую процедуру градиентных методов поиска свою специфику.
1. В задачах экспериментального исследования функция f(V)
обычно изначально неизвестна, ее вид выбирается относительно произвольно, а параметры устанавливается по результатам эксперимента.
На начальных этапах исследования трудоемкость решения задачи оптимизации можно снизить, используя неполные полиномы k-го порядка или линейные полиномы:
(2.5)
y' = β0 + β1x1 +…+ βkxk + β12x1x2 + β13x1x3 +…
+ βk–1,k xk–1xk+ …+ β12…k x1х2…хk + ε;
(2.6)
y' = β0 + β1x1 + …+ βkxk + ε.
- 17 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, вместо самого градиента применяется его оценка. Оба вида полинома являются линейными относительно конкретного фактора. Количество членов полинома типа (2.5) составляет 2k , а
для типа (2.6) равно k+1. Теоретически оценки коэффициентов в точке
оптимума должны стать равными нулю, что и будет признаком завершения поиска решения. Однако использования этих моделей может
стать нерациональным в области, близкой к оптимуму, из-за больших
относительных погрешностей в оценке коэффициентов указанных
моделей. Поэтому для исследования области оптимума следует переходить к полиномам более высокой степени.
2. Применение градиентных методов предполагает, что движение по градиенту может осуществляться в любом направлении изменения аргументов функции f(V), т.е. ограничений на область допустимых значений аргументов нет. В практических задачах всегда существуют ограничения на значения параметров, поэтому при выборе направления движения следует учитывать это обстоятельство.
3. Значение градиента зависит от принятой системы перехода к
кодированным значениям переменных, т.е. не является инвариантным
к выбору центральной точки и интервала варьирования в формуле
(1.1). Но знаки частных производных при переходе от одной системы
координат к другой сохраняются. Поэтому направление перемещения
в методе градиентного поиска не меняется при смене системы координат. Следовательно, в любой системе координат градиентный метод
приводит к оптимуму, хотя скорость поиска и будет зависеть от выбранных значений центра и интервала варьирования переменных.
4. Рассмотренный выше способ определения шага крутого восхождения применяют только при описании поверхности отклика полными полиномами второй или более высокой степени. При анализе
линейных функций определение шага изменения аргументов производится на основе неформальных процедур. Для полиномов (2.5, 2.6)
шаг ∆vi* изменения i-го фактора относительно центра (в центре области планирования все нормализованные переменные равны нулю) определяется пропорционально соответствующей составляющей оценки
градиента и величине интервала варьирования ∆vi:
(2.7)
∆vi* = ∆vi βi /[β12 +β22 + … + βk2 ]0,5.
Новое значение основного уровня фактора vi,1 в исходной шкале измерений составит величину vi, 1= vi, 0 + ∆vi*.
- 18 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5. Применение метода крутого восхождения в его классическом
виде предполагает вычисление градиента на каждом этапе, что означает необходимость проведения достаточно большого количества
опытов. Бокс и Уилсон предложили в 1951 г. модификацию метода
крутого восхождения. Они рекомендуют на начальном этапе поиска
применять линейные полиномы для описания функции отклика. Значение градиента оценивается в начальной точке, после чего пошаговое
движение по градиенту продолжается до попадания в частный оптимум (до тех пор, пока значение функции отклика возрастает при переходе от точки к точке). В точке частного оптимума с помощью факторного эксперимента снова определяется градиент. И пошаговое
движение начинается по новому направлению. Так продолжается до
попадания в область глобального экстремума. Эта область не может
быть адекватно описана линейным уравнением. Поэтому переходят к
более точному описанию поверхности отклика на основе полиномов
второго порядка и уточнению положения точки глобального оптимума. Построение плана для формирования полинома второй степени
производится путем добавления некоторых точек к «ядру», уже сформированному для линейного приближения (такие планы получили
наименование композиционных). В целом метод Бокса – Уилсона во
многих случаях требует меньшего количества опытов при возможно
несколько большем числе шагов.
6. Градиентные методы не обеспечивают гарантированного нахождения глобального оптимума при нарушении условия унимодальности функции отклика. Выбор начальной точки для крутого восхождения предопределяет область поиска локального экстремума. Поэтому при наличии априорных сведений о возможности существования
нескольких локальных экстремумов целесообразно решить задачу
оптимизации для нескольких вариантов задания исходных значений
параметров.
7. Если эксперимент проводится на реальном объекте и требует
больших затрат ресурсов, то поиск значений параметров может завершиться при получении удовлетворительных, а не оптимальных
значений функции отклика. Градиентный метод позволяет находить
приемлемые решения и в этом случае.
Однако градиентный метод не всегда эффективен. Например,
если поверхность функции отклика имеет овражный характер, то движение будет происходить с одного склона на другой с медленным
- 19 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
продвижением к точке минимума. Для таких функций разработано
несколько эвристических методов ускоренного продвижения вдоль
оврага или гребня.
3. ПЛАНЫ ДЛЯ РЕШЕНИЯ ЗАДАЧ ОПТИМИЗАЦИИ
3.1. Постановка задачи оптимизации
Поиск оптимальных значений параметров - одна из важных задач, решаемых при создании новых технических систем, управлении
производством или технологическими процессами. В соответствии с
теорией эффективности необходимо [1]:
– сформировать критерий эффективности (функцию отклика в
терминах ТПЭ);
– выделить управляемые и неуправляемые параметры (факторы) системы и среды, оказывающие существенное влияние на критерий эффективности;
– определить ограничения на значения параметров;
В большинстве случаев эффективность определяется совокупностью показателей, характеризующих частные свойства исследуемой
системы и выполняемой ею операции. Критерий эффективности строится на множестве значений частных показателей с использованием
теории полезности или методов векторной оптимизации. В некоторых
случаях критерий эффективности удается построить на множестве
значений одного показателя, переведя все остальные показатели в
разряд ограничений.
Задача оптимизации заключается в нахождение экстремума
функции отклика в области допустимых значений параметров. Чтобы
найти экстремум, необходимо иметь описание поверхности отклика в
диапазоне варьирования параметров, что далеко не всегда удается
получить теоретически, так как функция отклика в аналитическом
виде может быть априори неизвестна.
Реализация задачи оптимизации, основанная на применении
ТПЭ, как и любой задачи экспериментального исследования, начинается с определения объекта анализа, цели исследования, изучения
сущности исследуемого процесса, анализа имеющихся ресурсов, возможности проведения экспериментов с изучаемым объектом в необходимом диапазоне изменения факторов.
- 20 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Объектом анализа выступает заданный критерий эффективности
исследуемой системы, рассматриваемый как функция от существенных параметров системы и внешней среды. Система может представлять собой реальный физический объект или его модель – физическую
или математическую (имитационную, сложную аналитическую).
В ходе изучение процесса функционирования объекта выявляются факторы, оказывающие существенное влияние на функцию отклика. Выбор существенных переменных потенциально определяет
степень достижения адекватности получаемой модели: отсутствие в
исходном перечне существенных параметров, да еще и произвольно
меняющихся в ходе эксперимента, не позволяет правильно решить
задачу оптимизации; включение несущественных параметров усложняет модель, вызывает значительное увеличение объема экспериментов, хотя по результатам исследования несущественность соответствующих параметров будет выявлена.
Для каждой переменной следует определить диапазон и характер изменения (непрерывность или дискретность). Ограничения на
диапазон изменений могут носить принципиальный или технический
характер. Принципиальные ограничения факторов не могут быть нарушены при любых обстоятельствах. Эти ограничения задаются исходя из физических представлений (например, емкость устройств памяти всегда имеет положительное значение). Второй тип ограничений
связан с технико-экономическими соображениями, например с наличием соответствующего аппаратно-программного комплекса, принятой технологией обработки информации.
Выделение области изменения факторов не является формальной задачей, оно основывается на опыте исследователя. В рамках области допустимых значений факторов необходимо выделить начальную область планирования эксперимента. Этот выбор включает определение основного (нулевого) уровня как исходной точки построения
плана и интервалов варьирования. Интервал варьирования задает относительно основного уровня значения фактора, при которых будут
производиться эксперименты. Обычно интервалы являются симметричными относительно центрального значения. Интервал варьирования должен отвечать двум ограничениям: его применение не должно
приводить к выходу фактора за пределы области допустимых значений; он должен быть больше погрешности задания значений фактора
(в противном случае уровни фактора станут неразличимыми). В пре-
- 21 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
делах этих ограничений выбор конкретного значения является неформальной процедурой, учитывающей ориентировочную информацию о
кривизне поверхности функции отклика.
Фактор должен быть управляемым, т.е. экспериментатор может
поддерживать его постоянное значение в течение всего опыта. Для
фактора необходимо указать его конкретные значения и средства
контроля. Сам фактор должен быть первичным, ибо сложно управлять
фактором, который, в свою очередь, является функцией других факторов. Для каждого фактора следует указать точность его задания и поддержания в ходе эксперимента.
Одновременное изменение факторов предполагает их совместимость, а следовательно, осуществимость и безопасность всех их сочетаний. Необходимо также обеспечить независимость изменения каждого фактора, что означает возможность установления любого значения фактора вне связи со значениями других факторов.
Цель исследования, требуемая точность получаемых результатов, имеющиеся ресурсы ограничивают множество допустимых моделей функции отклика (с усложнением модели и повышением точности оценки показателей резко возрастает объем необходимых опытов)
и соответственно предопределяют план проведения экспериментов.
3.2. Полный факторный эксперимент типа 2k
На начальных этапах оптимизации для определения градиента
применяют неполные полиномы второго порядка или линейные полиномы [2, 5, 6]. Вычисление оценок коэффициентов таких полиномов
осуществляется на основе обработки результатов реализации наиболее
простых планов, в которых каждый фактор принимает только два значения vi min или vi max, расположенные симметрично относительно нулевого уровня или центра плана по данному фактору. Значения уровней
варьирования выбирает исследователь, исходя из возможного диапазона изменения каждого фактора и возможности применения линейной аппроксимации функции отклика в выбранном диапазоне изменений параметра. Без ограничения общности можно считать, что кодированные значения xi принимают значения – 1 и +1 соответственно
(принято обозначать – или +). Множество всех точек в k-мерном пространстве, координаты которых являются комбинациями "+" и "–",
называется полным факторным планом или планом полного фактор-
- 22 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ного эксперимента типа 2k (ПФЭ). Количество точек в этом плане
N =2k.
Для примера возьмем полный факторный эксперимент с тремя
независимыми переменными x1, х2 и x3, (табл. 3.1). Второй, третий и
четвертый столбцы таблицы соответствуют собственно плану экспериментов, пятый – восьмой столбцы содержат значения произведений
независимых переменных. Фиктивная переменная x0 =1 (первый столбец) введена для единообразия записи расчетных формул коэффициентов полинома. Строки соответствуют опытам. Например, первая
строка характеризует эксперимент, в котором все независимые переменные находятся на нижнем уровне.
Таблица 3.1
Полный факторный эксперимент с тремя независимыми переменными x1, х2 и x3
x0
+
+
+
+
+
+
+
+
x1
–
–
–
–
+
+
+
+
x2
–
–
+
+
–
–
+
+
Матрица планирования
x3 x1 x2 x1 x3 x2 x3 x1 x2 x3
–
+
+
+
–
+
+
–
–
+
–
–
+
–
+
+
–
–
+
–
–
–
–
+
+
+
–
+
–
–
–
+
–
–
–
+
+
+
+
+
Вектор результатов
y
y1
y2
y3
y4
y5
y6
y7
y8
Существует несколько способов построения подобных матриц
планирования. В частности, можно воспользоваться приемом, характерным для записи последовательности двоичных чисел. В столбце
последней переменной x3 знаки меняются поочередно, в столбце
предпоследней переменной x2 – чередуются через два элемента, в
столбце третьей справа переменной x1 – через четыре элемента. Аналогично строится матрица для любого количества переменных, порядок перечисления переменных роли не играет. Столбцы с произведениями переменных вычисляются путем умножения значений элементов в соответствующих столбцах простых переменных.
Из анализа матрицы планирования легко отметить, что полный
факторный эксперимент обладает свойствами: ортогональности, симметричности, нормированности.
- 23 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В соответствии с ортогональностью сумма парных произведений элементов любых двух различных столбцов равна нулю. В частN
ности, для простых переменных
∑x
iu
x ju = 0, i ≠ j , i, j = 0, k .
u =1
Симметричность предполагает, что сумма всех элементов любого столбца, за исключением первого, равна нулю. Например,
N
∑x
iu
= 0, i = 1, k .
u =1
Нормированность определяет, что сумма квадратов элементов
любого столбца равна числу опытов. Так, для i-й переменной
N
∑x
2
iu
= N , i = 0, k .
u =1
Первые два свойства обеспечивают независимость оценок коэффициентов модели и допустимость их физической интерпретации.
Нарушение этих свойств приводит к взаимной зависимости оценок и
невозможности придания смысла коэффициентам.
Включение в матрицу планирования переменных вида xi2 приведет к появлению единичных столбцов, совпадающих друг с другом
и со столбцом x0. Следовательно, нельзя будет определить, за счет
чего получено значение β0. Поэтому планы ПФЭ 2k неприменимы для
построения функции отклика в виде полного полинома второй степени.
3.3. Оценки коэффициентов функции отклика
Эксперимент, проведенный по плану, представленному в табл.
3.1, позволяет оценить коэффициенты неполного полинома третьей
степени y' = β0 + β1x1 + β2x2 + βх3 + β12x1x2 + β13x1x3 + β 23x2x3 + β123x1x2х3
или линейной функции y' = β 0 + β1x1 + β2x2 + βх3. Первый вид полинома
позволяет оценить не только влияние отдельных факторов, но и один
из часто встречающихся видов нелинейности, когда эффект одного
фактора зависит от уровня других факторов, т.е. присутствует эффект
взаимодействия факторов. Эффект взаимодействия вида xi xj называют
парным, а эффект взаимодействия вида xi xj xk – тройным и т.д. С ростом количества факторов число возможных взаимодействий быстро
увеличивается. Суммарно количество всех коэффициентов функции
- 24 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отклика такого типа равно числу опытов полного факторного эксперимента.
Оценки коэффициентов полинома определяются на основе метода наименьших квадратов и для рассматриваемого типа ПФЭ вычисляются по простым соотношениям.
1 N
∑ xiu yu ,
N u =1
i = 0, k ;
1 N
= ∑ xiu ... xmu yu ,
N u =1
i = 1, k ,
βi =
β i ,...,m
(3.1)
m>i .
Здесь величина y u соответствует значению отклика y u в указанной
точке факторного пространства при отсутствии повторных опытов
или является оценкой математического ожидания yu =
1
ru
ru
∑y
ui
зна-
i =1
чений функции отклика по всем ru повторным опытам в данной точке.
Повторные опыты проводятся в тех случаях, когда на функционирование системы оказывают влияние случайные воздействия. Количество повторных опытов в разных точках плана может различаться.
Допустима следующая интерпретация оценок коэффициентов:
– β0 соответствует значению функции отклика в центре проводимого эксперимента;
– βi равен приращению функции при переходе значения фактора i с нулевого уровня на верхний (это вклад фактора в значение
функции);
– βij равен нелинейной части приращения функции при одновременном переходе факторов i и j с нулевого уровня на верхний и
т.п.
Ошибки в определении коэффициентов полинома можно охарактеризовать соответствующей дисперсией. С учетом того, что кодированные значения факторов принимают значения +1 и – 1, оценка
дисперсии коэффициента определяется соотношением
1
 1 N
1 1
x
y
D ( yu ) = 
∑
u u =
2 ∑
N N
 N u =1
 N u =1
N
σ 2 (βi ) = D 
- 25 -
N
∑ D( y
u =1
u

)

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следовательно, оценка дисперсии всех коэффициентов одинакова и определяется только дисперсией средних значений функции
отклика и числом опытов. Эту формулу можно применять, если количество опытов во всех точках плана одинаково. При факторном эксперименте в отличие от классического одновременно варьируются все
факторы, поэтому каждый коэффициент полинома определяется по
результатам всех экспериментов, тем самым оценка дисперсии коэффициентов получается в N раз меньше средней дисперсии всех опытов. Оценка дисперсии среднего значения в конкретной точке плана:
D( yu ) = σ u2 / ru , где σu2 – оценка дисперсии функции отклика в точке
u; ru – число повторных опытов в этой точке плана. Дисперсия оценок
всех коэффициентов одинакова, поэтому ПФЭ рассмотренного типа
являются ротатабельными.
При использовании неполных полиномов k-го порядка количество точек плана равно количеству оцениваемых параметров. Поэтому
не остается степеней свободы для проверки гипотезы об адекватности
представления результатов эксперимента заданной математической
моделью. Если применять полиномы первой степени, то тогда остаются степени свободы для проверки гипотезы об адекватности модели.
3.4. Дробный факторный эксперимент
С ростом количества факторов k число точек плана в ПФЭ растет по показательной функции 2k. Планы ПФЭ позволяют получить
несмещенные оценки градиента функции отклика в центральной точке, но в случае применения линейного полинома оказываются недостаточно эффективными по количеству опытов при большом числе
независимых переменных, так как остается слишком много степеней
свободы на проверку адекватности модели. Например, при k = 5 на
проверку адекватности линейной модели остается 26 степеней. Хотя
большое количество опытов и приводит к существенному снижению
погрешности в оценке коэффициентов, все же такое число степеней
свободы для проверки адекватности является чрезмерным.
Таким образом, в случаях, когда используются только линейные
приближения функции отклика, количество опытов следует сократить,
используя для планирования так называемые регулярные дробные
реплики ПФЭ, содержащие подходящее число опытов и сохраняющие
основные свойства матрицы планирования. Реплика, включающая
- 26 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
только половину экспериментов ПФЭ, называется полурепликой,
включающая четвертую часть опытов – четвертьрепликой и т. д.
Краткое обозначение указанных дробных реплик: 2k – 1, 2 k– 2 соответственно.
Построение регулярной дробной реплики, или проведение дробного факторного эксперимента (ДФЭ) типа 2k–p, предусматривает
отбор из множества k факторов k–p основных, для которых строится
план ПФЭ. Этот план дополняется р столбцами, которые соответствуют остальным факторам. Каждый из этих столбцов формируется по
специальному правилу, а именно получается как результат поэлементного умножения не менее двух и не более k–p определенных
столбцов, соответствующих основным факторам. Иначе говоря, в
дробных репликах p линейных эффектов приравнены к эффектам
взаимодействия. Но именно такое построение матрицы планирования
и позволяет обеспечить ее симметричность, ортогональность и нормированность.
Таблица 3.2
Генератор плана
Матрица планирования
Вектор результатов
x
x
x
y
0
1
2
3
–
–
+
y1
–
+
+
+
–
+
–
–
+
y2
y3
y4
Правило образования каждого из p столбцов ДФП называют генератором плана. Каждому дополнительному столбцу соответствует
свой генератор (для плана типа 2k– p должно быть задано p различных
генераторов). Генератор задается как произведение основных факторов, определяющее значение элементов соответствующего дополнительного столбца матрицы планирования. Примером записи генератора для плана 23 – 1 служит выражение x3 = x1x2 (табл. 3.2). Матрица планирования ДФП типа 2k– p содержит k + 1 столбец и N = 2k– p строк.
- 27 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.5. Оценки коэффициентов функции отклика в дробном
факторном эксперименте
Применение дробных реплик ведет к смешиванию оценок параметров модели, а их построение предполагает исключение из рассмотрения некоторых взаимодействий факторов. Оценки смешиваются в связи с тем, что каждый из р столбцов дробного факторного плана
совпадает с некоторым произведением основных факторов.
Запись плана в виде 2k– p не дает полной характеристики регулярной дробной реплики, так как основные эффекты можно приравнять к различным эффектам взаимодействия. Правило смешивания,
определяющее коррелированные основные эффекты и эффекты взаимодействия, удобно описывать с помощью определяющего контраста
реплики. Определяющий контраст полуреплики получается путем умножения генерирующего соотношения на его же левую часть. Поскольку, как для любой кодированной переменной, xi2 =1, то левая
часть формулы определяющего контраста всегда равна единице и обозначается I. В частности, для ДФП типа 23 – 1 и при генераторе x3 = x1x2
имеет место определяющий контраст I = x1 x2 x3 (генератор умножается
на переменную x3, следовательно, x3 x3 = I = x1 x2 x3).
Чтобы определить, с какими параметрами смешана оценка коэффициента данного фактора, следует умножить обе части определяющего контраста на этот фактор. Учитывая равенство xi2 =1, получим порядок смешивания оценок коэффициентов при использовании
конкретного плана. Для плана 23 – 1 и определяющего контраста I = x1
x2 x3 порядок смешивания факторов следующий:
x1 = x12 x2 x3 = x2 x3; x2 = x1 x22 x3 = x1 x3; x3 = x1 x2 x32 = x1 x2 .
Оценки коэффициентов линейной модели для этого плана эксперимента не могут быть получены раздельно и будут смешанными:
β1*= β1 + β23 ; β2*= β 2 + β13 ; β3*= β3 + β12 .
Планы типа 2k–р являются ортогональными для моделей с взаимодействиями. Поэтому для вычисления оценок коэффициентов получаются простые формулы, как и для ПФЭ:
β i* =
1 N
∑ xiu yu ,
N u =1
i = 0, k .
Планы дробных реплик строят различным образом, но так, чтобы соблюдались основные свойства матрицы планирования. Например, ДФП 23–1 можно представить одной из двух полуреплик, генера-
- 28 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
торами которых являются x3 = x1 x2 и x3 = – x1 x2 соответственно. Определяющие контрасты этих полуреплик: x32 =I=x1 x2 x3 и x32 =I = – x1 x2 x3.
Смешивание факторов задается соотношениями:
а) первая полуреплика x1 = x2 x3 , x2 = x1 x3 , x3 = x1 x2 ;
б) вторая полуреплика x1 = – x2 x3 , x2 = – x1 x3 , x3 = – x1 x2 .
Коэффициенты линейного полинома полуреплик:
а) β1* = β1 + β23 ; β2* = β2 + β13 ; β3* = β3 + β23 ;
б) β1* = β1 – β23 ; β2* = β2 – β13 ; β3* = β3 – β23 .
Реализовав обе полуреплики, путем сложения и вычитания значений коэффициентов βi* можно получить раздельные оценки для линейных эффектов и эффектов взаимодействия. Такой вариант плана,
по сути, соответствует ПФЭ.
Разрешающая способность полуреплик (возможность раздельного определения коэффициентов уравнения) зависит от генерирующих соотношений. Так, если для плана 24 – 1 выбрать генерирующее
соотношение x4 = x1 x2, то получим реплику с контрастом I = x1 x2 x4 и
разрешающей способностью x1 = x2 x4 и т.д. Здесь линейные эффекты
определяются совместно с парными взаимодействиями. Очевидно, что
в первую очередь следует пренебречь взаимодействием более высоких
порядков из-за их более низкой вероятности существования по сравнению с парными. У полуреплики с контрастом I = x1 x2 х3 x4 или равноценным I = – x1 x2 х3 x4 линейные эффекты будут определяться совместно уже только с тройными взаимодействиями, что повышает
точность оценок параметров модели, так как величина смещения в
оценке коэффициента потенциально уменьшается. С ростом количества независимых переменных растет разрешающая способность полуреплик, позволяя оценивать раздельно сначала линейные эффекты,
затем парные, тройные взаимодействия и т.д. Но при этом растет и
избыточность экспериментов.
Реплики можно строить высокой степени дробности, тем самым
сокращая количество экспериментов. Пусть необходимо изучить
влияние пяти переменных и известно, что все эффекты взаимодействия пренебрежимо малы. Для линейного приближения следует определить шесть коэффициентов, что потребует применения плана с количеством точек не менее шести. Ближайшее большее число, соответствующее целой степени 2, равно восьми, что дает возможность получить дробную реплику, эквивалентную ПФЭ 23, т. е. реплику 25 – 2, или
четвертьреплику. Для построения четвертьреплики необходимы два
- 29 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
генерирующих соотношения. В целях построения такой реплики целесообразно пожертвовать тройным и одним из двойных взаимодействий. Пусть этим двойным взаимодействием будет x1x2. Тогда можно
построить четыре различные четвертьреплики, каждая из которых
задается двумя генерирующими соотношениями:
а) x4 = x1 x2 , x5 = х1 x2 x3 ;
б) x4 = x1 x2 , x5 = – х1 x2 x3 ;
в) x4 = – x1 x2 , x5 = х1 x2 x3 ;
г) x4 = – x1 x2 , x5 = – х1 x2 x3 .
Определяющие контрасты каждой четвертьреплики задаются
двумя соотношениями:
а) I = х1 x2 x4 , I = х1 x2 x3 x5 ;
б) I = х1 x2 x4 , I = – х1 x2 x3 x5 ;
в) I = – х1 x2 x4 , I = х1 x2 x3 x5 ;
г) I = – х1 x2 x4 , I = – х1 x2 x3 x5 .
Из этой совокупности четвертьреплик следует выбрать только
одну. Например, выберем реплику, задаваемую первой парой генерирующих соотношений. Матрица планирования ДФП получается из
матрицы ПФЭ 2k–p для k – p основных факторов добавлением р столбцов, элементы которых вычисляются по соответствующим генерирующим соотношениям (табл. 3.3).
Для полной характеристики разрешающей способности четвертьреплик вводят обобщающие определяющие контрасты, третий
компонент которых получается путем перемножения попарно первых
двух контрастов. Для выбранной четвертьреплики обобщающий определяющий контраст I = х1 x2 x4 = х1 x2 x3 x5 = x3 x4 x5 .
- 30 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 3.3
Таблица генерирующих соотношений
х
0
х
1
+
+
+
+
+
+
+
+
Матрица планирования
х
х
2
–
+
–
+
–
+
–
+
3
–
–
+
+
–
–
+
+
х
4
–
–
–
–
+
+
+
+
х
5
+
–
–
+
+
–
–
+
–
+
+
–
+
–
–
+
Вектор
результатов
y1
y2
y3
y4
y5
y6
y7
y8
Все совместные оценки находятся путем умножения обобщающего определяющего контраста последовательно на х1, х2 и т.д. В
рассматриваемом случае совместные оценки задаются соотношениями:
x1 = x2 x4 = x2 x3 х5 = x1 x3 x4 х5,
x2 = x1 x4 = x1 x3 х5 = x2 x3 x4 х5,
. . . . . . .
x5 = х1 x2 x4 х5= x1 x2 х3 = x3 x4 .
Оценки коэффициентов линейного полинома задаются соотношениями:
β1* = β1 + β24 + β235 + β1345 ,
β2* = β2 + β14 + β135 + β2345 ,
и т. д.
Разрешающая способность выбранной четвертьреплики невысокая – все линейные эффекты определяются совместно с парными
взаимодействиями. Этой репликой можно пользоваться для оценки
линейных эффектов при условии равенства нулю соответствующих
парных взаимодействий. Если такой уверенности нет, то следует применить полуреплику (что требует в два раза большего количества точек плана эксперимента по сравнению с четвертьрепликой) с генерирующим соотношением x5 = х1 x2 x3 x4 , пользуясь которым, можно разделить все линейные эффекты и парные взаимодействия.
Построение обобщающего определяющего контраста для реплик более высокой степени дробности производится аналогично по-
- 31 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
строению контраста для четвертьреплики: исходные контрасты сначала перемножаются попарно, получаются контрасты первого уровня;
затем контрасты первого уровня снова перемножаются попарно, получаются контрасты второго уровня, и так далее, пока не будет исчерпана возможность перемножения. Если получается два и более одинаковых контрастов, то из них оставляется только один. Обобщающий
определяющий контраст составляется путем перечисления выражений
для всех сформированных контрастов.
Взаимодействие факторов, выбранных в качестве генераторов
плана, может быть значимым или незначимым. Для построения дробных реплик следует выбирать незначимые взаимодействия, которые
выбираются по физическим соображениям на основе априорных сведений. Следует учитывать, что ДФЭ позволяет получить несмещенную оценку градиента функции отклика тогда и только тогда, когда ее
обобщающий определяющий контраст больше трех. Наличие смещения в оценке градиента увеличивает количество шагов оптимизации,
вносит систематическую ошибку в описание функции отклика.
4. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
4.1. Предварительная обработка
После того как составлен план проведения эксперимента, можно
приступать к его проведению. Вопросы непосредственного осуществления эксперимента рассматривать не будем, а перейдем к обработке
результатов. Сущность обработки результатов эксперимента во многом одинакова для различных областей применения – поиска оптимума функции, описания поверхности отклика и др.
Необходимо учитывать, что любой эксперимент сопровождается погрешностями (методическими, измерений) и содержит элементы
неопределенности (случайности). Проведение повторных опытов не
дает полностью совпадающих результатов. Поэтому процедура обработки должна учитывать эти обстоятельства. Обработка результатов
включает предварительную обработку результатов экспериментов,
вычисление оценок коэффициентов функции отклика и проведение
ряда проверок: однородности дисперсии воспроизводимости, адекватности модели и значимости коэффициентов [2, 5, 6]. Расчетные соотношения будут приведены в предположении, что в каждой точке плана производится различное количество повторных опытов ru .
- 32 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В ходе предварительной обработки вычисляются следующие
параметры для всех точек u = 1, N плана экспериментов:
1
– среднее значение функции отклика yu =
ru
ru
∑y
ui
;
i =1
– несмещенная оценка дисперсии функции отклика
σ u2 =
1 ru
2
(
yu i − yu ) (для данной величины количество степеней
∑
ru −1 i =1
свободы ϕu = ru – 1;
– оценка дисперсии среднего значения функции отклика (оцен2
ка дисперсии воспроизводимости) D ( yu ) = σ u / ru = Du.
На основе частных оценок вычисляется средняя величина оценки дисперсии воспроизводимости среднего значения функции отклика
по всей области планирования:
N
 N
 N
 N

u=1
 u=1
 u=1
 u=1

σ 2 ( y) =∑(ru −1) Du /∑(ru −1) = ∑(ru −1) Du /∑ru − N.
(4.1)
Эта оценка является несмещенной, и ее можно рассматривать как случайную величину с количеством степеней свободы ϕ ( y ) =
N
∑r
u
−N.
u =1
Именно величину σ2 (y) следует использовать как оценку дисперсии
воспроизводимости среднего значения функции отклика вместо
1
N
N
∑ D( y
u
) в выражении (3.2).
u =1
4.2. Проверка однородности дисперсии воспроизводимости
Необходимым условием применения метода наименьших квадратов для расчета оценок коэффициентов модели является однородность оценок дисперсии воспроизводимости среднего значения
функции отклика во всех точках плана. Поэтому обязательным этапом
обработки должна быть проверка статистической гипотезы об однородности совокупности дисперсий воспроизводимости. В условиях
различного количества опытов в точках плана применяют критерии
Фишера или Бартлетта. Если количество повторных опытов в каждой
- 33 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
точке плана достаточно велико (больше 7), то средние значения функции отклика можно считать распределенными по нормальному закону.
Проверка однородности по критерию Фишера сводится к проверке гипотезы о равенстве дисперсий двух нормально распределенных случайных величин. Из совокупности оценок дисперсии среднего
значения функции отклика выбирается минимальное Du min и максимальное Du max значения с числом степеней свободы соответственно ϕu
min и ϕu max. Вычисляется значение критерия Фишера F = Du max / Du min,
которое сравнивается с критическим значением Fкр = F(α; ϕu max; ϕu min),
где α – уровень значимости (обычно α выбирают в пределах от 0,01
до 0,1). Критическая область является односторонней (альтернативная
гипотеза допускает между проверяемыми оценками дисперсии соотношение Du max > Du min). Критическое значение определяют по специальным таблицам или с использование стандартных функций математических пакетов. Гипотеза об однородности оценок дисперсии воспроизводимости в различных точках плана принимается, если условие
F ≤ Fкр выполняется, в противном случае отвергается. Существенным
недостатком критерия Фишера является игнорирование всех оценок
дисперсии воспроизводимости, кроме максимального и минимального
значения.
Проверка однородности по Бартлетту учитывает оценки дисперсии воспроизводимости во всех точках плана и производится на основе вычисления критерия
N


2,303ϕ ( y )lg Du − ∑ (ru −1)lg Du 
u =1

 .
B=
N


1
1
1
1+
−
∑

3( N −1)  u =1 (ru − 1) ϕ ( y ) 
Случайная величина В при справедливости гипотезы об однородности
дисперсий распределена приближенно как хи-квадрат с N – 1 степенями свободы, если все ru > 3. Следовательно, критическое значение Вкр
= χ2 (α; N – 1), оно определяется по специальным таблицам или с использованием стандартных функций математических пакетов. Если
В≤Вкр, то гипотеза об однородности принимается, при В > Вкр – отвергается.
- 34 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критерий Бартлетта чувствителен к отклонениям распределения
от нормального, поэтому к результатам сравнения следует относиться
осторожно, а при одинаковом объеме опытов в различных точках плана лучше применять критерий Кочрена.
Итак, если не выявлена неоднородность дисперсии воспроизводимости, то обработку результатов экспериментов можно продолжать
дальше. В противном случае следует выявить и устранить причины
неоднородности. Обычно неоднородность является следствием принятых решений по организации и проведению экспериментов.
Во-первых, возможно в экспериментальном исследовании не
учтен некоторый существенный фактор (факторы), который изменялся в ходе опытов. Такой фактор (факторы) следует выявить, включить
в модель или обеспечить его стабильность в ходе исследований и повторить опыты.
Во-вторых, повторных опытов в точках плана с большой дисперсией функции отклика проведено недостаточно. Действительно,
дисперсия функции отклика σu2 может существенно различаться в
разных точках плана. Так, дисперсия среднего количества заявок в
очереди для одноканальной системы массового обслуживания при
пуассоновском входном потоке и экспоненциально распределенном
времени обслуживания равна ρ / (1 – ρ)2, где ρ – загрузка системы.
Иначе говоря, эта дисперсия заведомо неоднородна при изменении
загрузки. В частности, изменение загрузки от 0,8 до 0,9 приводит к
увеличению дисперсии в 4,5 раза. Поэтому для обеспечения однородности дисперсии воспроизводимости среднего значения в точке плана
при ρ = 0,9 следует провести в 4,5 раза больше повторных опытов по
сравнению с точкой плана, в которой ρ = 0,8.
Итак, неоднородность можно снизить за счет уменьшения интервала варьирования факторов или увеличения количества опытов в
соответствующих точках плана. Изменение интервалов варьирования
влечет за собой необходимость повторения опытов во всех точках
плана. Поэтому из указанных способов снижения неоднородности
следует выбрать тот, который требует меньшего количества новых
опытов.
После того как установлена однородность дисперсии воспроизводимости, можно приступать к вычислению оценок коэффициентов
функции отклика. Оценки коэффициентов функции отклика вычисляются по формуле (3.1). Результаты вычислений этих оценок всегда
- 35 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отличаются от нуля. Но это не значит, что они являются значимыми,
т.е. сами коэффициенты не равны нулю. Проверку значимости оценок
обычно осуществляют после проверки адекватности модели.
4.3. Проверка адекватности модели
Проверка адекватности математической модели данным эксперимента проводится только в случае ненасыщенного планирования на
основе сопоставления дисперсии воспроизводимости среднего значения функции отклика σ2 (y) и дисперсии адекватности. Оценка дисперсии адекватности характеризует отклонения между результатами
наблюдений и значениями, формируемыми по функции отклика
σ a2 =
1 N
yu − yu'
∑
N − m u =1
(
)
2
, N > m,
где m – количество оцениваемых коэффициентов модели; yu – среднее
значение результатов наблюдения в u-й точке плана; y'u – значение
отклика в этой же точке, предсказанное на модели. Количество степеней свободы дисперсии адекватности ϕa = N – m. При насыщенном
планировании нет степеней свободы и сумма отклонений равна нулю.
Проверка адекватности сводится к проверке гипотезы об однородности оценки дисперсии воспроизводимости σ2 (y) с количеством
степеней свободы ϕ(y) и оценки дисперсии адекватности. Проверка
осуществляется по критерию Фишера аналогично рассмотренной выше проверке однородности дисперсий воспроизводимости. Оценки
дисперсий в формуле расчета критерия расставляются так, чтобы его
величина была больше единицы, критическая область является двусторонней. Если вычисленное значение критерия меньше критического, то нет оснований для сомнений в адекватности модели. Однако
положительный исход статистической проверки не гарантирует достоверной адекватности, а тем более истинности модели, хотя и не противоречит такому предположению. Когда гипотеза отклоняется, следует вывод о неадекватности модели, следовательно, она заведомо не
является истинной. Дальнейшее применение неадекватной модели
обычно нецелесообразно, и надо принять меры по ее совершенствованию.
- 36 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Причиной неадекватности могут являться: ошибки в организации и проведении опытов, например неконтролируемое изменение
неучтенных в модели факторов; погрешности в задании исходных
данных и в измерении результатов; большой размах варьирования
факторов и другие причины. Иначе говоря, анализ причин неадекватности требует серьезного изучения сущности исследуемого процесса
и методов его исследования.
4.4. Проверка значимости оценок коэффициентов модели
Проверка значимости оценок коэффициентов полинома производится на основе проверки статистической гипотезы о равенстве математического ожидания случайной величины нулю, т.е. проверки
условия bi = 0 для всех коэффициентов. Проверка осуществляется с
помощью критерия Стьюдента: ti = (| βi| – 0)/ σ(βi) = |βi| / σ(βi). Критическое значение tкр = t(α; ϕ(y)) находится стандартным образом:
критическая область является двусторонней, так как коэффициент
может быть положительным или отрицательным; количество степеней
свободы соответствует количеству степеней свободы для оценки дисперсии воспроизводимости ϕ(y). Если вычисленное значение критерия
больше tкр, то данный коэффициент отличается от нуля и оставляется
в уравнении функции отклика, иначе коэффициент незначим. Отсутствие значимости коэффициента в моделях описания поверхности
отклика говорит о целесообразности исключения соответствующего
слагаемого из уравнения (частный градиент равен нулю).
После проверки значимости коэффициентов может оказаться,
что все коэффициенты незначимы. Эти выводы являются следствием
одной их следующих причин:
– достигнута область оптимума функции отклика, следует перейти к построению функции на основе полных полиномов второго
порядка;
– интервал варьирования факторов слишком мал, необходимо
увеличить интервал варьирования факторов;
– отклик системы не зависит от выбранных факторов, в выбранной области значений факторы не оказывают влияния на функцию отклика или для анализа выбраны несущественные факторы.
Формальных правил выявления соответствующих ситуаций не
существует.
- 37 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рассмотренные этапы обработки результатов экспериментов
должны выполняться не только в случае полного или дробного факторного эксперимента, но и при реализации других планов оптимизации и описания поверхности отклика.
В условиях относительно небольшого влияния случайности на
значение функции отклика (например, случайные ошибки измерительных приборов) в каждой точке плана проводится только по одному опыту. Очевидно, что в такой ситуации оценка дисперсии воспроизводимости невозможна. Следовательно, проверки однородности
дисперсии воспроизводимости и адекватности модели не проводятся.
И только в условиях ненасыщенного планирования возможна проверка значимости коэффициентов полинома, если в качестве дисперсии
коэффициентов взять величину σ2 (βi) = σa2/N с количеством степеней
свободы ϕa = N – m.
5. ПЛАНЫ ДЛЯ ОПИСАНИЯ ПОВЕРХНОСТИ ОТКЛИКА
5.1. Композиционные планы
Применение линейных планов совместно с методом градиентного поиска оптимума позволяет достичь окрестностей точки оптимума. Поиск оптимального решения в этой области требует перехода
от линейных моделей к моделям более высокого порядка – как минимум к полиномам второй степени [2, 6]. Полином второго порядка
содержит N = (k + 1)(k + 2) / 2 эффектов:
k
y ' = b0 + ∑ bi xi +
i =1
k
k
i , j =1
i =1
∑ bij xi x j + ∑ bii xi2 ,
j >i
(5.1)
Построение такой модели требует применения плана, в котором
каждая переменная принимает хотя бы три различных значения. Существуют различные подходы к построению планов второго порядка.
Можно воспользоваться ПФЭ типа 3k, но такие планы обладают
большой избыточностью. Например, для трех переменных количество
точек плана составит 27, а количество оцениваемых коэффициентов в
функции отклика равно 10. В соответствии с идеей пошагового эксперимента планирование рационально осуществлять путем добавления
специально подобранных точек к ядру, образованному планированием
для линейного приближения. Такие планы называют композиционны-
- 38 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ми (последовательными), они позволяют использовать информацию,
полученную в результате реализации линейного плана.
Композиционные планы бывают задействованы обычно на заключительном этапе исследования, когда модель приходится подбирать последовательно, начиная с простейшего линейного уравнения,
которое потом достраивается до полной квадратичной формулы. В
этом случае композиционные планы дают выигрыш по числу опытов
по сравнению с другими планами. Эти планы можно применять и при
непосредственном построении функции отклика в виде полинома
(5.1).
Решение подобных задач основано на применении ортогональных или ротатабельных центральных композиционных планов (ЦКП).
Эти планы используют в качестве ядра полный факторный эксперимент или минимально возможные регулярные дробные реплики типа
2k – p. В качестве дробной реплики используют такую, в которой два
любых парных взаимодействия по модулю не равны друг другу:
|xixj| ≠ |xs xz|
(5.2)
для любых попарно различных индексов. Именно план ПФЭ или
дробные реплики, удовлетворяющие указанному условию, служат
ядром ЦКП. На практике широкое распространение получили два
типа ЦКП, известные как планы Бокса и Хартли. Понятие «центральный» означает, что факторы принимают значения, симметричные относительно центра плана.
Центральный композиционный план второго порядка называют
планом Бокса, если его ядром является ПФЭ 2k или регулярная реплика типа 2k – p, для которой парные взаимодействия не равны по модулю
линейным факторам: xi ≠ ±xsxz; s ≠ z; i, s, z = 1, 2…k, и, кроме того,
выполняется условие (5.2). Применение ПФЭ или регулярных реплик,
отвечающих этим условиям, позволяет получить несмещенные оценки
коэффициентов модели (5.1). Из условий построения дробной реплики
следует, что разрешающая способность ядра плана должна быть
больше четырех, т.е. определяющий контраст должен содержать не
менее пяти переменных. Следовательно, ядром плана Бокса при k < 5
является ПФЭ, а при k ≥ 5 может быть ДФЭ. План Бокса можно сделать ортогональным либо ротатабельным. Но нельзя добиться одновременного и строгого соблюдения обоих свойств. В некоторых случаях ЦКП можно сделать приближенно и ортогональным, и ротата-
- 39 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бельным, если вначале построить ротатабельный план, а затем подобрать необходимое количество опытов в центральной точке.
Центральный композиционный план второго порядка называют
планом Хартли, если его ядром является регулярная реплика типа 2k –p,
в которой некоторые парные взаимодействия равны по модулю линейным факторам. Иначе говоря, ЦКП второго порядка будет или
планом Бокса, или планом Хартли. Планы Хартли более экономичны
по числу опытов, чем планы Бокса, но уступают им по точности оценивания коэффициентов, кроме того, их нельзя сделать ни ортогональными, ни ротатабельными. Такой план не позволяет получить
раздельные оценки соответствующих коэффициентов. Планы Хартли
целесообразно применять, если известно, что часть эффектов bj или bju
в модели отсутствует (следовательно, простые эффекты можно смешивать с парными взаимодействиями, не теряя в разрешающей способности плана), или тогда, когда дисперсия наблюдений относительно мала.
5.2. Ортогональные центральные композиционные планы
В планах Бокса к ядру, построенному на основе ПФЭ или ДФЭ,
добавляется одна точка в центре плана с координатами (0, 0...0) и 2k
«звездных» точек с координатами (± γ, 0...0)...(0, 0...± γ). Построенный
таким образом план будет ЦКП второго порядка. Общее количество
точек плана при использовании композиционного планирования составит N = N0 +2k+ 1, где N0 – количество точек ядра плана. В табл. 5.1
и 5.2 содержится описание соответствующих матриц планирования
для ЦКП при k = 2. Количество опытов для данного плана N = 22 + 2·2
+ 1 = 9. Аналогично строятся ЦКП для произвольного числа факторов,
при этом каждый фактор варьируется на пяти уровнях: – γ; – 1; 0; 1; γ.
Таблица 5.1
Матрица планирования
ядра плана
Таблица 5.2
Матрица планирования для
дополнительных точек
Ядро плана
x1
x2
+
+
–
+
+
–
Дополнительные точки
x1
x2
0
γ
0
–γ
0
γ
- 40 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
–
–
0
0
–γ
0
Таблица 5.3
ЦКП второго порядка
План
ПФЭ
2
3
Звездный
план
Центр плана
x0
x1
x2
x3
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
–
+
–
+
–
+
–
+
–γ
γ
0
0
0
0
0
–
–
+
+
–
–
+
+
0
0
–γ
γ
0
0
0
–
–
–
–
+
+
+
+
0
0
0
0
–γ
γ
0
x1
x2
+
–
–
+
+
–
–
+
0
0
0
0
0
0
0
x1
x3
+
–
+
–
–
+
–
+
0
0
0
0
0
0
0
x2
x3
+
+
–
–
–
–
+
+
0
0
0
0
0
0
0
x12
x22
x32
+
+
+
+
+
+
+
+
γ2
γ2
0
0
0
0
0
+
+
+
+
+
+
+
+
0
0
γ2
γ2
0
0
0
+
+
+
+
+
+
+
+
0
0
0
0
γ2
γ2
0
В матрице плана второго порядка не у всех столбцов соблюдается условие симметрии и не все пары столбцов ортогональны. Например, рассмотрим ЦКП второго порядка для трех переменных (табл.
5.3). Суммы
N
N
u =1
u =1
∑ xiu2 ≠ 0, ∑ xiu2 x 2ju ≠ 0, так как xiu ≠ 0 для всех строк
2
плана. Для устранения асимметрии и нарушений ортогональности
ЦКП Бокса необходимо провести преобразование квадратичных параметров и специальным образом выбрать величину плеча γ.
Чтобы добиться соблюдения свойства симметричности, следует
перейти от xi2 к центрированным величинам xi* = xi2 – x2i ср (сумма центрированных величин равна нулю). Среднее значение x2i ср , как видно
из табл. 5.3, для всех xi2 одинаково и равно
- 41 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
c = (N0+2γ2)/N.
(5.3)
Тогда исходную квадратичную модель (5.1) можно преобразовать:
y' =b0 + b1x1+ … + b1xk + b12x1x2 + … + bk–1, k xk–1xk+
+b11(x12 – x21 ср + x21 ср) + … + bkk(xk2 – x2k ср + x2k ср) =
= d0 + b1x1+ … + b1xk + b12x1x2 + … + bk–1, k xk–1xk+ b11x1* +
+ …+ bkkxk*,
2
где d0 = b0 + b11 x 1 ср + … + bk–1, k x2k ср = b0 + c(b11 + … + bk–1, k).
Исходная и преобразованная модели эквивалентны. Кроме того, в них
все коэффициенты, за исключением нулевого, совпадают. После преобразования получим матрицу планирования (табл. 5.4). Нетрудно
заметить, что в этой таблице суммы элементов по всем столбцам, за
исключением столбца x0, равны нулю, т.е. в преобразованной таблице
соблюдается свойство симметричности.
Но столбцы квадратичных членов не являются ортогональными
при произвольных значениях γ:
N
N
u =1
u =1
∑ ( xiu2 − c)( x 2ju − c) = ∑ xiu* x *ju ≠ 0, i ≠ j.
N
Ортогонализация столбцов, т.е. приравнивание
∑x
*
iu
x *ju к нулю, дос-
u =1
тигается специальным выбором величины γ. Это значение величины γ
находится из уравнения
N
∑ xiu* x*ju = N (1 – c)
0
2
– 4c(γ2 – c) + (2k – 4)c2 + c2 = 0
u =1
или
N0 – 2сN0 + N0 с2 – 4cγ2 +4c2 + 2kс2 – 4c2 + c2 =
N0 – 2(N0 +2γ2)с + c2 (N0 + 2k +1)= N0 – 2с2 N + c2N = 0.
Следовательно, с2N = N0. Тогда с = (N0 /N)1/ 2.
Таблица 5.4
Матрицу планирования после преобразования
Пла
н
ПФЭ
23
x0
x1
x2
x3
+
+
–
+
–
–
–
–
x1
x2
+
–
- 42 -
x1
x3
+
–
x2
x3
+
+
x1 *
x2 *
x3 *
1–с
1–с
1–с
1–с
1–с
1–с
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
+
+
+
+
+
+
+
+
+
+
+
+
+
Звездный
план
Центр
плана
–
+
–
+
–
+
–γ
γ
0
0
0
0
0
+
+
–
–
+
+
0
0
–γ
γ
0
0
0
–
–
+
+
+
+
0
0
0
0
–γ
γ
0
–
+
+
–
–
+
0
0
0
0
0
0
0
+
–
–
+
–
+
0
0
0
0
0
0
0
–
–
–
–
+
+
0
0
0
0
0
0
0
1–с
1–с
1–с
1–с
1–с
1–с
γ2–с
γ2–с
–с
–с
–с
–с
–с
1–с
1–с
1–с
1–с
1–с
1–с
–с
–с
γ2–с
γ2–с
–с
–с
–с
1–с
1–с
1–с
1–с
1–с
1–с
–с
–с
–с
–с
γ2–с
γ2–с
–с
Подставим найденное значение величины с в (5.3):
(N0 /N)1/ 2 = (N0 + 2γ2 )/N.
Решив уравнение, найдем величину γ, которая придает матрице планирования (табл. 5.4) свойство ортогональности:
γ = {[(N N0)1/2 – N0]/2}1/ 2.
(5.4)
Значения γ, обеспечивающие ортогональность, например, для ядер 22,
23, 24, 25–1, составляют соответственно 1; 1,215; 1,414; 1,547.
Оценки коэффициентов регрессии определяются по модифицированной матрице независимых переменных, (табл. 5.4):
N
N
u =1
u =1
β i = ∑ xiu yu / ∑ xiu2 , i = 1, m .
2
m= C k + 2
В приведенной формуле
и обозначает общее количество
оцениваемых коэффициентов полинома, за исключением нулевого.
Оценка коэффициента: d 0 =
N
k
u =1
j =1
∑ yu / N , тогда β 0 = d 0 − c∑ β̂ jj .
Оценки дисперсии коэффициентов:
2
N
N 
σ (βi ) = ∑x σ ( yu ) /∑xi2u  ; σ 2 (d0 ) = ∑σ 2 ( yu ) / N 2 ;
u=1
u =1
u =1 
N
2
2
iu
2
- 43 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
σ (β 0 ) = σ ( d 0 ) + c
2
2
k
2
∑σ
2
( β ii ) ,
i =1
2
где σ ( yu ) – оценка дисперсии среднего значения функции отклика
в u-й точке плана.
Оценка дисперсии функции отклика:
σ 2 ( y ) = σ 2 (β 0 ) +
∑ x σ (β ) + ∑ x
2
i
1≤i ≤ k
2
i
2
i
1≤i < j ≤ k
x 2j σ 2 (β ij ) +
∑ (x
2
i
− c) 2σ 2 ( β ii ) .
1≤ i ≤ k
Оценки дисперсии коэффициентов являются различными, так
как вычисляются по разным совокупностям точек плана. Оценка дисперсии функции отклика зависит не только от расстояния до заданной
точки от центра, но и от ее положения в пространстве, т.е. ортогональный план второго порядка не является ротатабельным.
Проверка однородности дисперсии воспроизводимости, адекватности модели, значимости коэффициентов полинома в случае применения ортогональных ЦКП второго порядка осуществляется по
рассмотренной выше схеме.
5.3. Ротатабельные центральные композиционные планы
В некоторых случаях ортогональное планирование второго порядка не отвечает потребностям практики – при описании поверхности отклика, особенно в окрестностях точки оптимума, более значимой является оценка дисперсии уравнения в целом, чем оценка дисперсии отдельных коэффициентов полинома. В этом случае обычно
стремятся к равномерности распределения информации в уравнении
функции отклика по всем направлениям. Такому положению отвечают
ротатабельные планы. Кроме того, подобные планы второго порядка
позволяют минимизировать систематические ошибки, связанные с
неадекватностью представления результатов полиномами второго
порядка. Но построение ротатабельного плана второго порядка более
сложно, чем ортогонального, а сама задача построения не имеет однозначного решения. Один из подходов к построению таких планов состоит в следующем [2]. Путем специального подбора звездного плеча
γ ЦКП Бокса можно сделать ротатабельным, иначе говоря, ЦКП Бокса
- 44 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
можно сделать или ортогональным или ротатабельным. Точки ротатабельного ЦКП Бокса второго порядка располагают на концентрических гиперсферах, количество которых не менее двух. Первая гиперсфера может быть вырожденной, т. е. представлять собой центральную точку плана, ее радиус ρ1 = 0. Именно такая сфера часто используется на практике. Вторая гиперсфера соответствует вписанному в
нее кубу, выбранному в качестве ядра плана. Для ядра хi = ± 1, следовательно, радиус этой гиперсферы ρ2 = (х12 + х22 + … + хk2)1/2 = (k)1/2.
Ядро представляет собой ПФЭ вида 2k или ДФЭ вида 2k – p , причем
должно соблюдаться условие (k – p)/4 > 3/4. Следовательно, с учетом
ограничений на ЦКП Бокса, если k ≥ 5, то в качестве ядра можно использовать полуреплику, если k ≥ 8, ядром может служить четверть
реплика. Третья гиперсфера имеет радиус ρ3 = 2 k / 4 для ядра в виде
ПФЭ и радиус ρ3 = 2 (k - p) / 4 - для ядра в виде ДФЭ.
Таким образом, каждый фактор в ротатабельном ЦКП Бокса
варьируется на пяти уровнях. В некоторых случаях радиусы второй и
третьей гиперсферы совпадают:
n = 2. ρ2 = 2 1/2, ρ3 = 2 2/4 = 21/2;
n = 8 и p = 2. ρ2 = 8 1/2 = 2 3/2, ρ3 = 2 (8 – 2)/4 = 23/2.
Пример. Построить матрицу ротатабельного ЦКП Бокса второго порядка для трех факторов.
Решение. Ядром плана является ПФЭ вида 23 (радиус соответствующей гиперсферы ρ2 = 31/2 = 1,732). Звездные точки располагаются
на гиперсфере с радиусом ρ3 = 23/4 = 1,682 и имеют координаты ( ±
1,682; 0; 0), (0; ± 1,682; 0), (0; 0; ± 1,682). Матрица планирования
включает три гиперсферы и соответствует табл. 5.3, в которой γ =
1,682. План содержит 15 точек и является ненасыщенным – количество оцениваемых коэффициентов 10.
В табл. 5.5 приведены минимально необходимые сведения для
составления рассмотренного вида ротатабельных ЦКП.
Коэффициенты модели и их дисперсии рассчитываются по формулам
A = 1 / 2λ4 (k + 2)λ4 − kλ22 ;
[ (
N
λ4 =
)]
N
1
xi4u ; , λ2 = ∑ xi2u ;
∑
3 N u =1
u =1
- 45 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
N
k
A
2
β 0 = [2λ4 (k + 2)∑ y u − 2λ2 λ 4 ∑
N
u =1
i =1
N
∑x
2
iu
y u ];
u =1
Таблица 5.5
Минимально необходимые сведения для составления рассмотренного
вида ротатабельных ЦКП
Количество
факторов
Число точек
ПФЭ
4
8
16
32
16
64
32
128
64
2
3
4
5
5, полуреплика
6
6, полуреплика
7
7, полуреплика
βi =
βii =
1
N λ2
Число звездных
точек
4
6
8
10
10
12
12
14
14
Значение γ
1,414
1,682
2,000
2,378
2,000
2,828
2,378
3,364
2,828
N
∑x
iu
yu ;
u =1
N
k
N
N
A
(k + 2)λ4 − kλ22 ∑xiu2 yu + (λ22 − λ4 )∑ ∑xiu2 yu − 2λ2λ4 ∑yu };
N
u=1
i=1 u=1
u=1
N
1
β ij =
∑ xiu x ju yu ;
N λ4 u =1
{[
]
σ 2 ( β 0 ) = 2 Aλ24 (k + 2)σ 2 ( y ) / N ;
σ 2 ( β i ) = σ 2 ( y ) /( N λ2 ) ;
σ 2 ( β ij ) = σ 2 ( y ) /( Nλ4 ) ;
σ 2 ( β ii ) = A[λ4 (k + 1) − (k − 1) λ22 ]σ 2 ( y ) / N .
Представленные формулы справедливы для ротатабельного
планирования при любом количестве независимых переменных. Такое
планирование не позволяет получить независимые оценки для всех
коэффициентов модели, коррелированными оказываются коэффици-
- 46 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
енты (β0, βii) и (βii, βij). Взаимную связь этих пар коэффициентов можно охарактеризовать ковариациями:
cov(β0, βii) = – 2σ2(ỹ) λ4 A/N ;
cov(βii, βij) = σ2 (ỹ) (1–λ4 )A/N.
Проверка однородности дисперсии воспроизводимости, адекватности модели и значимости коэффициентов модели производится
по схеме, рассмотренной в разд. 4.
Если повторные наблюдения имеются только в центре плана, то
1 n0
1 n0
2
y0 = ∑ y0u и величина σ v =
( y0u − y0 ) 2 будет несмещен∑
n0 u =1
n0 − 1 u =1
ной оценкой дисперсии ошибок наблюдения. При ненасыщенном плаN
нировании остаточная сумма SR2 =
∑r (y
u
u
− yˆ u′ ) 2 отличается от нуля.
u =1
Здесь
yu′ –
величина, предсказанная уравнением модели;
σR2
yu –
вели-
чина, найденная экспериментально. Величина
=SR / [N–
(k+1)(k+2)/2] характеризует неадекватность модели и также является
несмещенной оценкой дисперсии ошибок наблюдения.
На основании рассчитанных величин можно провести все необходимые проверки коэффициентов и модели в целом.
Иногда интерес представляет информация о функции отклика в
некоторой окрестности центра плана. В этом случае следует добиться
одинаковой погрешности модели внутри гиперсферы единичного радиуса. План, обеспечивающий такое свойство функции отклика, называется униформ-ротатабельным. Для его формирования достаточно
обеспечить равенство дисперсии в центре плана (ρ0 = 0) и на поверхности гиперсферы радиуса ρ2 = 1. Этого добиваются подбором числа
наблюдений n0 в центре плана, а именно параметр λ4 следует взять
равным положительному корню квадратного уравнения
2λ4 (λ4 – 1)(k + 2) + λ4 (k + 1) – (k – 1) = 0.
Рассмотренное композиционное планирование представляет собой один из возможных подходов к построению ротатабельных планов второго порядка.
- 47 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.4. Композиционные планы типа Вn
Планы типа Вn представляют собой симметричные планы второго порядка с ядром в виде ПФЭ 2k или ДФЭ 2k–p, дополненные 2k
звездными точками с плечом γ =1 и опытами в центре плана. Иначе
говоря, эти планы состоят из 2k (2k–p) вершин k-мерного гиперкуба с
координатами ±1, из 2k центров (n–1)-мерных граней и некоторого
числа опытов в центре гиперкуба. Количество точек плана с ядром из
ПФЭ составляет N = 2k + 2k +1, для ДФЭ N = 2k–p + 2k +1. В каждой
точке проводится равное число опытов. Планы этого типа имеют минимальное количество уровней варьирования факторов, равное трем,
что позволяет более точно выдерживать режимы работы изделий при
натурных испытаниях по сравнению с планами, в которых требуется
большее число уровней изменения управляемых переменных. Планы
типа Вn близки к D- и G-оптимальным планам.
Обычно результаты опытов в нулевой точке служат для проверки гипотезы об адекватности модели экспериментальным данным.
Если оценку параметров выполнять по результатам опытов в звездных
точках и точках ядра, то [2]
β0 =
1  N
1
 ∑ yu − n−1− p
2(k − 1)  u = N1 +1
2
N1
∑y
u =1
u

;


N
β ii =
1
xiu2 yu − β 0 ;
∑
2 u = N1 +1
N
β i = (2 + 2 k − p ) −1 ∑ xiu yu ;
u =1
N
β ij = (2 k − p ) −1 ∑ xiu x ju yu ;
u =1
где N1 – число точек ядра плана; y u – среднее значение отклика в u-й
точке, полученное по r опытам. Если некоторые коэффициенты незначимы, то остальные уточняются по специальным формулам.
5.5. Каталоги оптимальных планов
Построение оптимальных планов для произвольных функций
отклика представляет собой сложную задачу. В целях облегчения ре-
- 48 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
шения такой задачи для некоторых типовых функций отклика составлены каталоги оптимальных планов [5, 9]. Рассмотрим некоторые из
них для случаев, когда многомерное пространство допустимых значений факторов представляет собой куб или шар. Соответственно допустимые области значений факторов должны удовлетворять условиям:
- для куба –1≤ хi ≤ 1, i= 1, 2…k;
- для шара х12 + х22 + … + хk2 ≤ 1.
1. Функция отклика представляет собой полином порядка q одного фактора (k = 1)
y ' = β0 + β1 x + β2 x2 + … + βq x q , q = 1, 2, … .
Примеры А-оптимальных планов представлены в табл. 5.6, Dоптимальных планов – в (табл. 5.7). Соблюдение свойства оптимальности планов требует выполнения определенных соотношений по
количеству реализаций в каждой точке плана. Это соотношение задается значением веса wj. Например, значение веса, равное 0,152, означает, что в соответствующей точке плана в ходе исследования следует
провести 0,152-ю часть всех опытов. Для A-оптимальных планов веса
точек различны, для D-оптимальных планов веса всех точек одинаковы.
Таблица 5.6
А-оптимальных планов
Значения фактора х / вес точки плана w
Степень
x (1) / w1
x (2) / w2
x (3) / w3
x (4) / w4
x (5) / w5
полинома q
2 –1,0 / 0,25
0,0 / 0,5
1,0 / 0,25
–
–
3 –1,0 / 0,152 –0,468/0,348 0,468/0,348 1,0/0,152
–
4 –1,0 / 0,107 –0,683/0,25 0,0/0,286 0,683/0,25 1,0/0,107
Таблица 5.7
D-оптимальных планов
Степень
полинома q
2
3
x (1)
–1,0
–1,0
Значения фактора х
x (2)
x (3)
x (4)
0,0
1,0
–
–0,447
0,447
1,0
- 49 -
x (5)
–
–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
–1,0
–0,655
0,0
0,655
1,0
2. Выше были рассмотрены композиционные планы для оценки
коэффициентов полной квадратичной функции (5.1) от k факторов.
Кроме них, существуют оптимальные планы на кубе, которые предусматривают выбор множеств точек с целочисленными координатами:
– точка в центре куба (множество М0) - все координаты равны
нулю;
– множество точек Мk, соответствующих вершинам куба - все
координаты равны ±1, количество точек 2k;
– множество Мk – 1 середин ребер – все координаты равны ±1, за
исключением одной нулевой координаты, количество точек k2 k– 1;
– множество центров граней размерности k – l (l координат равно нулю), количество точек равно Сkk – l2k – l, l = 2, 3…k – 1.
В табл. 5.8 приведены веса множества Мj, j = 0, 1, 2…k для различного количества факторов. Для получения веса конкретной точки
плана следует вес соответствующего множества разделить на количество точек в множестве. Как видно из табл. 5.8, каждый фактор варьируется на трех уровнях, и не все сочетания множеств допустимы для
конкретного плана.
Таблица 5.8
Веса множества Мj, j = 0, 1, 2…k для различного количества
факторов
Крите- КолиМножество точек плана
рий
чество
опти- перемальменМ0
М1
М2
М3
М4
М5
М6
ности ных,
k
плана
2
0,0962 0,3206 0,5832
3
0,0655
0,5103
0,4242
D
4
0,0474
0,5021
0,4506
5
0,0368
0,5622 0,4021 6
0,0216
0,6097 0,3297
0,391 0,233
2
0,376
3
0,425
0,569 0,060
A
4
0,370
0,552
0,078
5
0,427
0,573
6
0,404
0,556
0,040 -
- 50 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 1. Составить D-оптимальный план для k = 3.
Решение. План, представленный в табл. 5.9, включает: точку с
нулевыми координатами; двенадцать точек, соответствующих центрам ребер трехмерного куба; восемь точек, соответствующих вершинам куба. Этот план не включает точки, соответствующие центрам
граней трехмерного куба.
3. Оптимальные планы на шаре единичного радиуса для построения полных квадратичных моделей включают следующие множества точек:
- точку в центре шара (множество М0), все координаты равны
нулю;
- множество точек с координатами (±1, 0…0)….(0, 0…±1), это
множество М1 содержит 2k точек;
- множество М2 точек, соответствующих вершинам вписанного
в шар многомерного куба, координаты вершин куба принимают значения ±k1/2, количество вершин куба равно 2k.
Таблица 5.9
План решения задачи
№ пп
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
х1
х2
0
+1
–1
+1
–1
+1
–1
+1
–1
0
0
0
0
+1
–1
+1
–1
+1
–1
х3
0
+1
+1
–1
–1
0
0
0
0
+1
–1
+1
–1
+1
+1
–1
–1
+1
+1
0
0
0
0
0
+1
+1
–1
–1
+1
+1
–1
–1
+1
+1
+1
+1
–1
–1
Характеристика множества
Множество М0. Вес точки wj = 0,0655
- 51 -
Множество М2.
Суммарный вес точек множества
0,4242.
Количество точек 2⋅k⋅(k – 1).
Вес одной точки
wj = 0,4242 / 12 = 0,0353
Множество М3.
Суммарный вес точек множества 0,5103.
Количество точек 2⋅k = 8.
Вес одной точки
wj = 0,5103/ 8 = 0,0638
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20
21
+1
–1
–1
–1
–1
–1
В табл. 5.10 приведены веса множества Мj, j = 0, 1, 2 для различного количества факторов k. Расчет веса конкретной точки плана
производится делением веса соответствующего множества на количество точек в множестве. Как видно из табл. 5.10, каждый фактор варьируется на пяти уровнях.
Пример 2. Составить D-оптимальный план на шаре для k = 3.
Решение.D-оптимальный план имеет матрицу планирования для
основных переменных, представленную в табл. 5.11. Количество точек плана равно 15, каждый фактор варьируется на пяти уровнях.
По своим параметрам представленный план во многом аналогичен центральному композиционному плану Бокса. Отличие заключается в величине радиуса гиперсферы – он равен единице (в ЦКП Бокса
радиусы превышают единичное значение).
План на шаре более экономичен по сравнению с планом на кубе
по количеству точек (аналогичный план на кубе содержит 21 точку),
но вместо трех уровней варьирования фактора предполагает пять
уровней.
Таблица 5.10
Веса множества Мj, j = 0, 1, 2 для различного количества факторов k
Критерий
оптимальности
2
3
4
5
6
2
3
4
5
6
A
D
№
пп
х1
1
Количество факторов, k
Множество точек
М0
0,2918
0,1924
0,1377
0,1044
0,0825
0,1667
0,1000
0,0667
0,0476
0,0357
М1
0,2932
0,2586
0,2256
0,2000
0,1750
0,4167
0,3600
0,3111
0,2721
0,2411
М2
0,4148
0,5488
0,6368
0,6976
0,7425
0,4167
0,5400
0,6222
0,6803
0,7232
Таблица 5.11
Матрица планирования D-оптимального плана
Фактор
Вес
точки
Примечание
плана
х2
х3
0
0
0
0,1000 Множество М0
- 52 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
–1
0
0
0
0
0
0
1
–1
0
0
0
0
0
0
1
–1
3 – 1/2
– 3 – 1/2
3 – 1/2
– 3 – 1/2
3 – 1/2
– 3 – 1/2
3 – 1/2
– 3 – 1/2
3 – 1/2
3 – 1/2
–3 – 1/2
– 3 – 1/2
3 – 1/2
3 – 1/2
– 3 – 1/2
– 3 – 1/2
3 – 1/2
3 – 1/2
3 – 1/2
3 – 1/2
– 3 – 1/2
– 3 – 1/2
– 3 – 1/2
– 3 – 1/2
0,0600
0,0600
0,0600
0,0600
0,0600
0,0600
0,0675
0,0675
0,0675
0,0675
0,0675
0,0675
0,0675
0,0675
Множество М1.
Суммарный вес
0,3600. Количество точек 6
Множество М2.
Суммарный вес
0,5400. Количество точек 8
6. ПЛАНЫ ДЛЯ ОЦЕНКИ ВЛИЯНИЯ ФАКТОРОВ
6.1. Планы на латинских квадратах
При составлении планов поиска оптимальных значений функции и описания поверхности отклика предполагалось, что факторы
представляют собой непрерывные величины. Однако некоторые параметры систем носят дискретный характер и принимают только относительно небольшое количество значений, например емкость запоминающих устройств, тактовая частота системной шины персонального
компьютера. Другие факторы по своей природе имеют не количественную, а качественную природу, в частности однотипные изделия
выпускаются целым рядом изготовителей. Этим изделиям можно приписать некоторые обозначения в номинативной шкале измерений.
Таким образом, существуют параметры (характеристики), принимающие ограниченное количество значений, задаваемых в количественной или качественной шкале измерений. Необходимо в условиях
воздействия других факторов оценить влияние таких параметров на
показатель качества системы или определить их значимость. Полный
перебор возможных сочетаний параметров системы потребует чрезмерно большого количества опытов. С целью рационального сокращения экспериментальных исследований применяют специальный вид
планов – планы на латинских квадратах.
Латинский квадрат характеризуется особым расположением
некоторого числа символов в ячейках, сгруппированных в строки и
- 53 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
столбцы так, что каждый символ встречается один раз в каждой строке и в каждом столбце (табл. 6.1).
Таблица 6.1
Пример латинского квадрата
a
b
c
b
c
a
c
a
b
Для любого n > 2 существует множество вариантов построения
латинских квадратов. Количество вариантов латинских квадратов с
ростом n быстро увеличивается и определяется формулой
N(n, n) = n!( n – 1)!L(n).
Некоторые значения L(n)представлены в табл. 6.2
Таблица 6.2
Некоторые значения L(n)
n
L(n)
1
1
2
1
3
1
4
4
5
56
6
9048
Латинскому квадрату можно сопоставить план эксперимента, в
котором строки соответствуют различным значениям одного фактора,
столбцы – значениям другого, а латинские буквы – значениям третьего фактора, т.е. латинский квадрат позволяет исследовать влияние не
более чем трех факторов, причем все факторы варьируются на одинаковом количестве уровней. Можно ослабить это требование путем
приравнивания какого-либо уровня другому. Пример представления
плана на латинском квадрате для факторов L, P, Z, каждый из которых
варьируется на четырех уровнях (n = 4), приведен в табл. 6.3.
Таблица 6.3
Плана на латинском квадрате для факторов L, P, Z
L
L1
L2
L3
L4
P1
Z1
Z2
Z3
Z4
P2
Z3
Z1
Z4
Z2
P3
Z4
Z3
Z2
Z1
P4
Z2
Z4
Z1
Z3
Применение плана, построенного на основе латинского квадрата, позволяет оценить дифференциальный (разностный) эффект пар
- 54 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
уровней, но не дает информации о взаимодействии между факторами
(иначе говоря, факторы не зависят друг от друга). Так, сумма результатов экспериментов, соответствующих столбцу j, будет оценивать
эффект Pj, усредненный по всем L и Z. Тогда дифференциальный эффект увеличения значения фактора P от уровня 1 до уровня 2, усредненный по всем L и Z, можно оценить по разности между суммами
значений функции отклика столбца 2 и столбца 1. Порядок перечисления уровней факторов роли не играет.
В частности, рассмотренный план позволяет оценить влияние
размера видеопамяти графического адаптера (P) на скорость вывода
видеоизображений при различном быстродействии (L) процессора
компьютера и разном разрешении дисплея (Z). Применительно к рассмотренному примеру для трех факторов при четырех уровнях варьирования ПФЭ требуется 43 = 64 опытов, а с применением латинского
квадрата – только 16. Экономия достигается за счет потери информации о взаимодействии факторов.
Приведенный пример представляет одно из возможных расположений уровней факторов, позволяющих получить несмещенные
оценки главных эффектов. Различные латинские квадраты одного
размера можно накладывать друг на друга, образуя греко-латинские
квадраты. Например, два латинских квадрата 3×3 можно преобразовать в греко-латинский квадрат:
a
b
c
b
c
a
c
a
b
×
α
χ
β
β
α
χ
χ
β
α
=
aα
bχ
c β
bβ
c α
a χ
cχ
a β
bα
Здесь латинские буквы образуют один латинский квадрат, а греческие – другой латинский квадрат. Каждая латинская буква встречается в паре с конкретной греческой буквой только один раз. С помощью этого греко-латинского квадрата можно оценить главные эффекты четырех трехуровневых факторов (фактора строк, фактора столбцов, римских и греческих букв), проведя только 9 опытов.
Если наложить друг на друга три различных варианта латинских
квадратов, то получится план гипер-греко-латинского квадрата. С его
помощью можно оценить главные эффекты пяти факторов (фактора
строк, столбцов и трех расположений квадратов). В частности, для
- 55 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
пяти трехуровневых факторов потребуется провести только 9 опытов
вместо 243 опытов при переборе всех возможных сочетаний факторов.
Итак, планы латинских (греко-латинских) квадратов используются в тех случаях, когда требуется оценить влияние факторов, варьируемых более чем на двух уровнях, и заранее известно, что между
факторами нет взаимодействий или этими взаимодействиями можно
пренебречь. Имеются таблицы латинских и греко-латинских квадратов различных размеров, за исключением одного случая – не существует греко-латинского квадрата для 6 уровней факторов.
6.2. Оценка значимости фактора
Когда основным источником погрешности являются случайные
ошибки измерений, то в точках плана обычно проводятся однократные опыты. В такой ситуации ошибки различных опытов считают
взаимно независимыми случайными величинами, распределенными
по нормальному закону с нулевым математическим ожиданием и одинаковой, хотя и неизвестной, дисперсией. Следовательно, функция
отклика в различных точках плана также распределена нормально. Ее
математические ожидания неизвестны и могут быть различными.
Оценка влияния фактора в этих условиях проводится на основе применения метода дисперсионного анализа, суть которого заключается в
определении значимости различий между средними значениями
функции отклика для разных значений исследуемого фактора [3, 7].
Такое сравнение производится не путем непосредственного сравнения
средних значений, а путем сопоставления факторной дисперсии функции отклика и остаточной дисперсии, вызванной случайными причинами. Если дисперсия функции отклика, порожденная воздействием
различных значений фактора, значимо превышает остаточную дисперсию, то фактор оказывает существенное влияние на функцию отклика. А это значит, что и средние значения функции отклика на разных уровнях фактора различаются существенно.
Итак, исходными данными являются:
– план на латинском (греко-латинском, гипер-греко-латинском)
квадрате с количеством уровней изменения факторов, равном n (пусть
уровни анализируемого фактора Р соответствую столбцам квадрата);
– матрица значений функции отклика Y = |ykj| размерностью
n×n;
- 56 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– уровень значимости для проверки статистической гипотезы α.
Дисперсионный анализ включает следующие шаги.
1. Вычисление среднего значения функции отклика по всем
опытам и среднего значения по различным уровням фактора Р:
ycp =
1
n2
n
n
∑∑ y k j ; yô ( j) =
k =1 j =1
1 n
∑ yk j ,
n k =1
j = 1, n ;
2. Оценка факторной дисперсии:
µ 2, ô =
1 n
2
óñð − yô ( j ) .
∑
n −1 j =1
[
]
3. Оценка остаточной дисперсии:
µ 2, îñò =
1 n n
2
yô ( j ) − y k j .
∑∑
2
n − n j =1 k =1
[
]
4. Оценка значимости фактора Р. Производится на основе метода проверки статистических гипотез. Нулевая гипотеза Н0 соответствует равенству средних значений функции отклика при различных
значениях фактора. В этом случае факторная и остаточная дисперсия
являются несмещенными оценками неизвестной генеральной дисперсии функции отклика и поэтому не должны существенно различаться.
Очевидно, если оценка факторной дисперсии не превышает оценку
остаточной дисперсии, то справедлива гипотеза Н0. Альтернативная
гипотеза Н1 соответствует утверждению, что факторная дисперсия
существенно больше остаточной дисперсии, следовательно, средние
значения также значимо различаются. Проверка осуществляется на
основе критерия Фишера F = µ2, ф / µ2, ост. Критическое значение критерия Fкр = F(α; n – 1; n2 – n) находят стандартным образом. Здесь n–1
соответствует количеству степеней свободы факторной дисперсии, а
n2 – n – количеству степеней свободы остаточной дисперсии. Если
выполняется условие F > Fкр, то фактор Р существенно влияет на
функцию отклика, иначе влияние фактора несущественно.
Критерий Фишера применим только при сравнении дисперсий
нормально распределенных величин. Если такой уверенности нет, то к
полученному выводу следует относиться осторожно.
- 57 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В случае проведения повторных опытов в точках плана распределение средних значений функции отклика будет приближаться к
нормальному с увеличением количеств опытов. И применение критерия Фишера будет достаточно обосновано.
6.3. Оценка дифференциального эффекта уровней фактора
Дифференциальный эффект уровней позволяет оценить изменение среднего значения функции отклика системы при переходе фактора с уровня j на уровень i. При этом следует учитывать, что на это
изменение оказывают воздействие и случайные причины, а не только
анализируемый фактор. Как и в дисперсионном анализе, здесь возможны различные варианты решения задачи в зависимости от наличия
априорной информации и повторных опытов в точках плана. Рассмотрим два типовых варианта обработки данных [3].
В первом варианте рассматривается следующая ситуация. Результаты измерений в различных точках независимы, повторные опыты отсутствуют. Предполагается нормальное распределение значений
функции отклика в различных точках плана, дисперсии распределения
неизвестны, но одинаковы (случайность значений обусловлена ошибками измерений).
Данный вариант соответствует сравнению двух средних значений нормально распределенных генеральных совокупностей, дисперсии которых неизвестны, но предположительно одинаковы. Сравнение
предполагает выполнение следующих шагов.
1. Вычисление средних значений функции отклика для двух
сравниваемых значений факторов (уровни факторов соответствуют
столбцам j и i латинского квадрата):
yô ( j ) =
1 n
∑ yk j ,
n k =1
yô (i ) =
1 n
∑ yk i .
n k =1
2. Вычисление оценок дисперсии функции отклика для выбранных уровней факторов:
µ 2 ( j) =
1 n
1 n
2
ó
(
j
)
−
y
,
µ
(
i
)
=
∑ ô
∑ óô (i) − yk i 2 .
kj
2
n −1 k=1
n −1 k =1
[
]
[
]
3. Прежде чем приступить к сравнению средних значений функций отклика, следует проверить однородность оценок дисперсии по
критерию Фишера. Дисперсии расставляются так, чтобы значение
- 58 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
критерия было больше единицы. Например, при µ2(j) > µ2(i) критерий
F = µ2(j) / µ2(i). Если однородность нарушена, то проводить сравнение
средних неправомочно. Тогда следует устранить выявленное нарушение или отказаться от данного варианта проверки.
4. Если неоднородность дисперсий не обнаружена, то можно установить, значимо или незначимо различаются средние значения
функции отклика для двух значений факторов, используя критерий
Стьюдента. Гипотеза Н0 соответствует утверждению yф(j) = yф(i). В
качестве критерия проверки нулевой гипотезы выступает положительное значение случайной величины
T = [yф(j) – yф(i)] / [µ2(j)/n + µ2(i)/n]0,5.
Здесь µ2(j)/n и µ2(i)/n - дисперсии среднего значения случайной величины, которые, как известно, в n раз меньше дисперсии этой величины. Критерий Т является случайной величиной, которая при справедливости гипотезы Н0 имеет распределение Стьюдента с 2n – 2 степенями свободы.
Критическая область зависит от вида альтернативной гипотезы
Н1. Если Н1 соответствует yф(j) ≠ yф(i), то критическая область является двусторонней. Критическое значение tкр находится стандартным
образом по заданной величине уровня значимости α и количеству
степеней свободы. При T > tкр нулевая гипотеза отвергается, следовательно, фактор оказывает существенное влияние на функцию отклика.
Если Н1 соответствует yф(j) > yф(i) или yф(i) > yф(j), то критическая область будет правосторонней. В остальном проверка аналогична
предыдущему случаю.
Во втором варианте рассматривается следующая ситуация. В
точках плана проведены повторные опыты. Количество опытов в разных точках плана может различаться. Пусть m – количество всех опытов при значении фактора Pj, q – то же самое, но при значении фактора Pi. Причем m > 30 и q > 30. Результаты измерений функции отклика в различных опытах независимы. В такой ситуации выборочные
средние функции отклика распределены приближенно нормально, а
оценки дисперсии являются достаточно хорошими приближениями к
генеральным дисперсиям.
Порядок проверки гипотезы о значимости влияния фактора на
уровнях j и i следующий. Вычисляются средние значения функции
отклика yф(j) и yф(i) по всем опытам при значениях факторов Рj и Рi.
- 59 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Затем рассчитываются оценки дисперсии функции отклика µ2(j) и µ2(j)
для двух значений фактора.
Гипотезе Н0 соответствует утверждение yф(j) = yф(i). Поэтому в
качестве критерия можно взять величину
u = | yф(j) – yф(i)| / {Dф(j) /m + Dф(j) / q}0,5,
которая в случае справедливости нулевой гипотезы распределена приближенно нормально с нулевым математическим ожиданием и единичной дисперсией (величина u является центрированной и нормированной). Проверка гипотез осуществляется аналогично случаям, рассмотренным выше, только вместо распределения Стьюдента применяется распределение стандартизованной нормальной величины.
7. МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
7.1. Основные понятия и определения
7.1.1. Понятие статистики
Статистика, вернее ее методы исследования, широко применяется в различных областях человеческих знаний. Однако, как любая
наука, она требует определения предмета ее исследования. В связи с
этим различают статистику, занимающуюся изучением социальноэкономических явлений, которая относится к циклу общественных
наук, и статистику, занимающуюся закономерностями явлений природы, которая относится к наукам естественным.
Авторы большинства современных отечественных вузовских
учебников по теории статистики (общей теории статистики) под статистикой понимают предметную общественную науку, т.е. науку,
имеющую свои особые предмет и метод познания.
Статистика - общественная наука, которая изучает количественную сторону качественно определенных массовых социальноэкономических явлений и процессов, их структуру и распределение,
размещение в пространстве, движение во времени, выявляя действующие количественные зависимости, тенденции и закономерности,
причем в конкретных условиях места и времени.
7.1.2. Предмет статистики
Статистика как наука исследует не отдельные факты, а массо-
- 60 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вые социально-экономические явления и процессы, выступающие как
множество отдельных факторов, обладающих как индивидуальными,
так и общими признаками.
Объект статистического исследования в статистике называют
статистической совокупностью. Статистическая совокупность - это
множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояния отдельных
единиц и наличием вариации. Например, в качестве особых объектов
статистического исследования, т.е. статистических совокупностей,
может выступать множество коммерческих банков, зарегистрированных на территории Российской Федерации, множество акционерных
обществ, множество граждан какой-либо страны и т.д. Важно помнить, что статистическая совокупность состоит из реально существующих материальных объектов.
Каждый отдельно взятый элемент данного множества называется единицей статистической совокупности. Единицы статистической
совокупности характеризуются общими свойствами, именуемыми в
статистике признаками. Итак, под качественной однородностью совокупности понимается сходство единиц (объектов, явлений, процессов)
по каким-либо существенным признакам, но различающихся по каким-либо другим признакам.
Единицы совокупности наряду с общими для всех единиц признаками, обусловливающими качественную определенность совокупности, также обладают индивидуальными особенностями и различиями, отличающими их друг от друга, т.е. существует вариация признаков. Она обусловлена различным сочетанием условий, которые определяют развитие элементов множества. Например, уровень производительности труда работников банка определяется его возрастом, квалификацией сотрудников, отношением к труду и т.д. Именно наличие
вариации предопределяет необходимость статистики. Вариация
признака может отражаться статистическим распределением единиц
совокупности.
Статистика как наука изучает прежде всего количественную
сторону общественных явлений и процессов в конкретных условиях
места и времени, т.е. предметом статистики выступают размеры и
количественные соотношения социально-экономических явлений, закономерности их связи и развития.
Количественную характеристику статистика выражает через оп-
- 61 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ределенного рода числа, которые называются статистическими показателями. Статистический показатель отражает результат измерения
у единиц совокупности и совокупности в целом.
7.1.3. Теоретические основы статистики как науки
Теоретическую основу любой науки, в том числе и статистики,
составляют понятия и категории, в совокупности которых выражаются основные принципы данной науки. В статистике к важнейшим категориям и понятиям относятся: совокупность, вариация, признак,
закономерность. Статистические совокупности обладают определенными свойствами, носителями которых выступают единицы совокупности (явления), обладающие определенными признаками. По форме
внешнего выражения признаки делятся на атрибутивные (описательные, качественные) и количественные. Атрибутивные (качественные)
признаки не поддаются количественному (числовому) выражению.
Количественные признаки можно разделить на дискретные и непрерывные.
Важной категорией статистики является также статистическая закономерность. Статистическая закономерность - это
форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью вероятности, если причины (условия), порождающие события, не изменяются или изменяются незначительно. Статистическая закономерность устанавливается на основе анализа массовых данных, что обусловливает ее взаимосвязь с законом больших чисел.
Сущность закона больших чисел заключается в том, что в
числах, суммирующих результат массовых наблюдений, выступают определенные правильности, которые не могут быть обнаружены на небольшом числе факторов. Закон больших чисел
порожден свойствами массовых явлений. Тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют
силу лишь как массовые тенденции, но не как законы для каждого отдельного, индивидуального случая.
- 62 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.1.4. Метод статистики
Статистика как наука выработала приемы и способы изучения
массовых общественных явлений, зависящие от особенностей ее
предмета и задач, которые ставятся при его изучении. Приемы и способы, с помощью которых статистика изучает свой предмет, образуют
статистическую методологию.
Под статистической методологией понимается система приемов, способов и методов, направленных на изучение количественных
закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.
Задача статистического исследования состоит в получении
обобщающих характеристик и выявлении закономерностей в общественной жизни в конкретных условиях места и времени, которые проявляются лишь в большой массе явлений через преодоление свойственной ее единичным элементам случайности.
Статистическое исследование состоит из трех стадий: статистическое наблюдение; сводка и группировка результатов наблюдения;
анализ полученных обобщающих показателей. Все три стадии связаны между собой, и на каждой из них используются специальные методы, обусловленные содержанием выполняемой работы.
7.1.5. Понятие о выборочном наблюдении
Статистическая методология исследования массовых явлений
различает, как известно, два способа наблюдения в зависимости от
полноты охвата объекта: сплошное и несплошное. Разновидностью
несплошного наблюдения является выборочное.
Под выборочным наблюдением понимается такое несплошное
наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные
случайным способом.
Выборочное наблюдение ставит перед собой задачу - по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.
Выборочный метод позволяет получить необходимые сведения
приемлемой точности, когда факторы времени и стоимости делают
сплошную разработку нецелесообразной.
- 63 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.2. Характеристики выборочной и генеральной совокупности
Совокупность отобранных для обследования единиц в статистике принято называть выборочной, а совокупность единиц, из которых
производится отбор, - генеральной. Основные характеристики параметров генеральной и выборочной совокупностей обозначаются определенными символами (табл. 7.1). В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования, статистика выделяет два вида ошибок: регистрации и репрезентативности.
Ошибки регистрации могут иметь случайный (непреднамеренный) или систематический (тенденциозный) характер. Их можно избежать при правильной организации и проведении наблюдения.
Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Избежать ошибок
репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона
больших чисел, эти ошибки можно свести к минимальным значениям,
границы которых устанавливаются с достаточно большой точностью;
Ошибка выборочного наблюдения - это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяться следующим образом:
Σх
∆ ~x = х − ~
х , где х = i ,
N
Σх
~
х= i.
n
(7.1)
Величина ∆ ~xi называется предельной ошибкой выборки. Предельная ошибка выборки - величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные
теоремы закона больших чисел. Наиболее полно эти закономерности
раскрыты в теоремах Л.Л. Чебышева и А.М. Ляпунова.
Теорема П. Л. Чебышева: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т.е.
- 64 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
почти с достоверностью), утверждать, что отклонение выборочной
средней от генеральной будет сколько угодно малым.
Таблица 7.1
Символы основных характеристик параметров генеральной и выборочной совокупностей
№
п/п
Характеристика
Генеральная
совокупность
Выборочная
совокупность
1.
Оббьем совокупности (численность единиц)
N
n
2.
Численность единиц, обладающих обследуемым признаком
M
m
3.
Доля единиц, обладающих
обследуемым признаком
4.
Средний размер признака
5.
Дисперсия количественного
признака
M
N
W=
х=
Σхi
N
Σх
~
х= i
n
σ x2 =
Дисперсии доли
6.
P=
(
Σ xi − x
n
σ p2 = pq
)
2
σ x2 =
(
m
n
Σ xi − x
n
)
2
σ w2 = W (1 − W )
В теореме доказано, что величина ошибки не должна превышать
tµ . В свою очередь, величина µ , выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит
от колеблемости признака в генеральной совокупности σ и числа
отобранных единиц n . Эта зависимость выражается формулой
µ=
σ2
n
,
(7.2)
- 65 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где µ - средняя ошибка выборки; σ 2 - генеральная дисперсия; n объем выборочной совокупности.
Нетрудно убедиться, что при отборе большого числа единиц
расхождения между средними будут меньше, т.е. существует обратная
связь между средней ошибкой выборки и числом отобранных единиц.
Можно доказать, что увеличение колеблемости признака влечет
за собой увеличение среднего квадратического отклонения, а следовательно, и ошибки.
Соотношение между дисперсиями генеральной и выборочной
совокупностей выражается формулой
σ x2 = σ ~x ⋅
n
.
n −1
Так как величина
(7.3)
n
при достаточно больших n близка к 1 , можно
n −1
приближенно считать, что выборочная дисперсия равна генеральной
дисперсии, т.е. σ 2 ГЕН ≈ σ 2 ВЫБ .
Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о
величине этой ошибки можно судить с определенной вероятностью.
На величину вероятности указывает множитель t .
А. М. Ляпунов доказал, что распределение выборочных средних
(а следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной
средней и ограниченной дисперсией.
Математически теорему Ляпунова можно записать следующим образом:
Р{ х − ~
х ≤ ∆ ~x } =
1
2π
t
⋅ ∫e
−
t2
2
dt = F (t )
−t
,
±∆
(7.4)
~
x - предельная ошибка выборки. Значения этого интеграла
где
для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. Например:
- 66 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
t = 1 F (t) = 0.683;
t = 2 F (t) = 0.954;
t = 3 F (t) = 0.997;
t = 1.5 F (t) = 0.866;
t = 2.5 F (t) = 0.988;
t = 3.5 F (t) = 0.999.
В первом случае (t = 1 F (t) = 0.683) это может быть прочитано
так: с вероятностью 0.683 можно утверждать, что разность между
выборочной и генеральной средними не превышает одной величины
средней ошибки выборки. Другими словами, в 68.3% случаев ошибка репрезентативности не выйдет за пределы ± µ и т.д.
Зная выборочную среднюю величину признака ~
x и предельную
ошибку выборки ∆ x , можно определить границы (пределы), в которых
заключена генеральная средняя:
~
õ − ∆õ ≤ õ ≤ ~
õ + ∆õ
или
~
х − х = ± ∆ ~х .
Теорема Бернулли рассматривает ошибку выборки для альтернативного признака, у которого возможны только два исхода: наличие
признака (1) и отсутствие его (0).
Теорема Бернулли утверждает, что при достаточно большом
объеме выборки вероятность расхождения между долей признака в
выборочной совокупности w и долей признака в генеральной совокупности p будет стремиться к единице: Р w − p ≤ tµ → 1 ,
[
]
т.е. с вероятностью, сколько угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки частость
признака (выборочная доля) сколько угодно мало будет отличаться
от доли признака (в генеральной совокупности).
Ввиду того что вероятность расхождения между частостью и
долей следует закону нормального распределения, эту вероятность
можно найти по функции F (t ) в зависимости от задаваемой величины t .
Средняя ошибка выборки для альтернативного признака определяется по формуле
µ=
p⋅q
, где
n
q = 1− p .
- 67 -
(7.5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Поскольку доля признака в выборочной совокупности неизвестна, ее
необходимо заменить через долю того же признака в генеральной совокупности, т.е. принять w ≈ p , а дисперсию альтернативного признака принять за w(1 − w) . Тогда средняя ошибка выборки выразится
формулой
µ=
w(1 − w)
.
n
(7.6)
Предельная величина разности между частостью и долей называется предельной ошибкой выборки. О величине предельной ошибки
можно судить с некоторой вероятностью, которая зависит от множителя t , поскольку ∆ w = tµ . Зная выборочную долю признака w и предельную ошибку выборки ∆ w , можно определить границы, в которых
заключена генеральная доля p: w − ∆ w ≤ p ≤ w + ∆ w .
Результаты выборочного статистического исследования во многом зависят от уровня подготовки процесса наблюдения. Под уровнем
подготовки в данном случае подразумевается соблюдение определенных правил и принципов проектирования выборочного обследования.
Важнейшим элементом проектирования является составление организационного плана выборочного наблюдения.
В организационный план включаются следующие вопросы:
1. Постановка цели и задачи наблюдения.
2. Определение границ объекта исследования.
3. Отработка программы наблюдения (составление анкеты, опросного листа, формы отчета и т.д.) и разработка ее материалов.
4. Определение процедуры отбора, способа отбора и объема выборки.
5. Подготовка кадров для проведения наблюдения, размножение
формуляров, инструктивных документов и др.
6. Расчет выборочных характеристик и определение ошибок выборки.
7. Распространение выборочных данных на всю совокупность.
- 68 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.3. Основные способы формирования выборочной
совокупности
Достоверность рассчитанных по выборочным данным характеристик в значительной степени определяется репрезентативностью
выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности.
По виду различают индивидуальный, групповой и комбинированный отбор.
При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом
отборе - группы единиц, а комбинированный отбор предполагает
сочетание группового и индивидуального отбора. Метод отбора определяет возможность продолжения участия отобранной единицы в
процедуре отбора.
Бесповторным называется такой отбор, при котором попавшая в
выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор. При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора. При этом методе объем генеральной совокупности остается неизменным, что обусловливает постоянную вероятность попадания в выборку всех единиц совокупности.
В практике выборочных обследований наибольшее распространение получили следующие выборки: собственно-случайная; механическая; типическая; серийная; комбинированная.
7.3.1. Собственно-случайная выборка
При собственно-случайной выборке отбор единиц из генеральной совокупности производится наугад или наудачу, без каких-либо
элементов системности. При этом все без исключения единицы генеральной совокупности должны иметь абсолютно равные шансы попадания в выборку. Технически собственно-случайный отбор проводят
методом жеребьевки или по таблице случайных чисел.
Собственно-случайный отбор может быть как повторным, так и
бесповторным. Предположим, в результате выборочного обследова-
- 69 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ния жилищных условий жителей города, осуществленного на основе
собственно-случайной повторной выборки, получен следующий ряд
распределения (табл. 7.2). Для определения средней ошибки выборки
необходимо рассчитать выборочную среднюю величину и дисперсию
изучаемого признака (табл. 7.3).
Таблица 7.2
Результаты выборочного обследования жилищных условий
жителей города
Таблица 7.3
Расчет средней общей (полезной) площади жилищ,, приходящейся на
одного человека, и дисперсии
19005.0
~
х=
= 19.0 ;
1000
- 70 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
σ2 =
412250
− 19.0 2 = 51.25 ;
1000
σ = 51.25 = 7.16 .
Средняя ошибка выборки составит
µх =
7.16
1000
= 0.23 м 2 .
Определим предельную ошибку выборки с вероятностью 0.954
(t = 2) :
∆ х = t ⋅ µ x = 2 ⋅ 0.23 = 0.46 м 2 .
Установим границы генеральной средней:
~
х − ∆х ≤ ~
х≤~
х + ∆х
или
18.54 ≤ х ≤ 19.46 .
Таким образом, на основании проведенного выборочного обследования с вероятностью 0.954 можно заключить, что средний размер
общей площади, приходящейся на одного человека, в целом по городу
лежит в пределах от 18.5 до 19.5 м 2 .
При расчете средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:
µ=
n
1 −  .
n  N
σ2 
Если предположить, что представленные в табл. 7.1 данные являются результатом 5% − íîãî бесповторного отбора (генеральная
совокупность включает 20000 единиц), то средняя ошибка выборки
будет несколько меньше:
µx =
51.25 
1000 
2
1 −
 = 0.22 ì .
1000  20000 
- 71 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней.
Воспользуемся еще раз данными табл. 7.2 для того, чтобы определить границы доли лиц, обеспеченность жильем которых составляет
менее 10 м2. Согласно результатам обследования численность таких
лиц составила 103 человека.
Определим выборочную долю и дисперсию:
W=
103
= 0.103 ;
1000
σ w2 = w(1 − w) = 0.103 ⋅ 0.897 = 0.0924 .
Рассчитаем среднюю ошибку выборки:
µ w~ =
0.0924 
1000 
1 −
 = 0.0094 .
1000  20000 
Предельная ошибка выборки с заданной вероятностью составит
∆ w = 2 ⋅ 0.0094 = 0.0188 .
Определим границы генеральной доли:
0.103 − 0.019 ≤ p ≤ 0.103 + 0.019
или
0.084 ≤ p ≤ 0.122 .
Следовательно, с вероятностью 0.954 можно утверждать, что
доля лиц, имеющих менее 10 м2 на человека, в целом по городу находится в пределах от 8.4 до 12.2%.
7.3.2. Механическая выборка
Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. когда имеется
- 72 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
определенная последовательность в расположении единиц (списки
избирателей, телефонные номера респондентов, номера домов и квартир и т.п.). Для проведения механической выборки устанавливается
пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей.
Отбор единиц осуществляется в соответствии с установленной
пропорцией через равные интервалы. Например, при пропорции 1 : 50
(2% –ная выборка) отбирается каждая 50 – я единица.
Генеральную совокупность при механическом отборе можно
ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что позволит повысить репрезентативность
выборки. Однако в этом случае возрастает опасность систематической
ошибки, связанной с занижением значения изучаемого признака (если
из каждого интервала регистрируется первое значение) или его завышением (если из каждого интервала регистрируется последнее значение).
Целесообразно отбор начинать с середины первого интервала,
например при 5% - ной выборке отобрать 10, 30,50,70 и с таким же
интервалом - последующие единицы
Для определения средней ошибки механической выборки используется формула средней ошибки при собственно-случайном бесповторном отборе.
7.3.3. Типический отбор
Этот способ отбора используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим
способом. Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой дифференциации признака.
При выборке, пропорциональной объему типических групп,
число единиц, подлежащих отбору из каждой группы, определяется
следующим образом:
ni = n
Ni
,
N
- 73 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где Ni - объем i - й группы; ni- объем выборки из i - й группы.
Средняя ошибка такой выборки находится по формулам
µ=
σ2
n
- (повторный отбор);
n
1 −  -(бесповторный отбор),
n  N
σ2
µ=
(7.7)
(7.8)
где σ i2 - средняя из внутригрупповых дисперсий.
При выборке, пропорциональной дифференциации признака,
число наблюдений по каждой группе рассчитывается по формуле
ni = n
σ i Ni
,
Σσ i N i
(7.9)
где σ i - среднее квадратическое отклонение признака в i − é группе.
Средняя ошибка такого отбора определяется следующим образом:
σ i2 N i2
1
µ=
Σ
(повторный отбор),
N
ni
µ=
σ 2N 2
1
Σ i i
N
ni

n 
1 − i  (бесповторный отбор).
 Ni 
(7.10)
(7.11)
Рассмотрим оба варианта типической выборки на условном
примере.
Предположим, 10% – ный бесповторный типический отбор рабочих предприятия, пропорциональный размерам цехов, проведенный
с целью оценки потерь из-за временной нетрудоспособности, привел к
следующим результатам, представленным табл. 7.4.
Рассчитаем выборочную среднюю:
- 74 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Σσ i2 ni 49 ⋅ 100 + 25 ⋅ 140 + 16 ⋅ 80
σ =
=
= 30.25 .
Σni
100 + 140 + 80
2
Таблица 7.4
Результаты обследования рабочих предприятия
Цех
Всего
рабочих,
чел.
Обследовано,
чел.
I
II
III
1000
1400
800
100
140
80
Число дней временной нетрудоспособности за год
Средняя
Дисперсия
18
12
15
49
25
16
Определим среднюю и предельную ошибки выборки (с вероятностью 0.9564 ):
µх =
30.25 
320 
1 −
 ≈ 0.29 ;
320  3200 
∆ х = 2 ⋅ 0.29 = 0.58 .
Рассчитаем выборочную среднюю:
Σõ n 10 ⋅ 100 + 12 ⋅ 140 + 15 ⋅ 80
~
õ= i i =
= 14.6.
Σni
100 + 140 + 80
С вероятностью 0.954 можно сделать вывод, что среднее число
дней временной нетрудоспособности одного рабочего в целом по
предприятию находится в пределах
14.6 − 0.58 ≤ õ ≤ 14.6 + 0.58.
Воспользуемся полученными внутригрупповыми дисперсиями
для проведения отбора, пропорционального дифференциации признака. Определим необходимый объем выборки по каждому цеху:
Σσ i N i = 49 ⋅ 1000 + 25 ⋅ 1400 + 16 ⋅ 800 = 17200;
- 75 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n1 = 320 ⋅
49 ⋅ 1000
= 130 чел.;
17200
n 2 = 320 ⋅
25 ⋅ 1000
= 130 чел.;
17200
n3 = 320 ⋅
16 ⋅ 1000
= 60 чел.;
17200
С учетом полученных значений рассчитаем среднюю ошибку выборки:
µх =
1
3200
49 ⋅ 1000 2 
130  25 ⋅ 1400 2 
130  16 ⋅ 800 2 
60 
1 −
+
1 −
+
1 −
 = 0.28 .
130
130
60  800 
 1000 
 1400 
В данном случае средняя, а следовательно, и предельная ошибки
будут несколько меньше, что отразится и на границах генеральной
средней.
7.3.4. Серийный отбор
Данный способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. В качестве
таких серий могут рассматриваться упаковки с определенным количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения.
Сущность серийной выборки заключается в собственно-случайном либо в механическом отборе серий, внутри которых производится
сплошное обследование единиц.
Средняя ошибка серийной выборки (при отборе равновеликих
серий) зависит от величины только межгрупповой (межсерийной)
дисперсии и определяется по следующим формулам:
µ=
δ2
r
(повторный отбор);
- 76 -
(7.12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
µ=
r
1 −  (бесповторный отбор),
r  R
δ2 
(7.13)
где r - число отобранных серий; R - общее число серий.
Межгрупповую дисперсию вычисляют следующим образом:
Σ( x i − ~
x)
δ =
,
r
2
2
xi - средняя i − é серии; ~
x - общая средняя по всей выборочной
где ~
совокупности.
7.3.5. Комбинированный отбор
В практике статистических обследований, помимо рассмотренных выше способов отбора, применяется и их комбинация. Можно
комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп.
Возможна также комбинация серийного и собственно-случайного
отборов, при которой отдельные единицы отбираются внутри серии в
собственно-случайном порядке. Ошибка такой выборки определяется
ступенчатостью отбора.
Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы,
потом - более мелкие. И так до тех пор, пока не будут отобраны те
единицы, которые подвергаются обследованию.
Многофазная выборка предполагает сохранение одной и той же
единицы отбора на всех этапах его проведения, при этом отобранные
на каждой стадии единицы подвергаются обследованию (на каждой
последующей стадии отбора программа обследования расширяется).
На основании вышеизложенного в приведем формулы предельной ошибки выборки для наиболее часто используемых на практике
способов формирования выборочной совокупности (табл. 7.5).
Таблица 7.5
- 77 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Предельная ошибка выборки для некоторых способов формирования выборочной совокупности
Метод
отбора
Выборка
1.Собствен
нослучайная
и механическая
2. Типическая
3. Серийная
Повторный
Для
средней
t
δ2
n
2
t
δi
n
Для доли
t
r
Для средней
Для доли
w(1 − w)
w(1 − w) 
n
δ2 
n
t
1 − 
1 −  t
n
n
n  N
 N
t
2
wi (1 − wi )
n  t wi (1 − wi ) 1 − n 
δi 
1
−
t


n
n
 N
n  N
2
δx
Бесповторный
2
2
t
δw
r
t
r
1 − 
r  R
δx 
2
t
r
1 − 
r  R
δw 
8. ВЫБОЧНЫЕ НАБЛЮДЕНИЯ
8.1. Определение необходимого объема выборки
При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может
быть определена на базе допустимой ошибки при выборочном наблюдении исходя из вероятности, на основе которой можно гарантировать
величину устанавливаемой ошибки, и, наконец, на базе способа отбора.
Рассмотрим вначале величину необходимой численности в общем виде. Формула необходимой численности выборки для разных
способов отбора выводится из формулы предельной ошибки выборки.
Необходимая численность выборки рассчитывается по-разному для
выборочного наблюдения, в котором устанавливается средний размер
признака в совокупности, и для наблюдения, в котором определяется
доля единиц, обладающих данным признаком, в силу различных
методов вычисления меры колеблемости для варьирующего и альтернативного признаков.
- 78 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В частности, необходимая численность случайной повторной
выборки определяется по формуле, которая вытекает из формулы предельной ошибки:
n=
t 2 ⋅σ 2
∆2
(8.1)
(8.1) показывает, что с увеличением предполагаемой ошибки выборки
значительно уменьшается необходимый объем выборки. Так, увеличение допустимой ошибки выборки в два раза уменьшает необходимый ее объем в четыре раза.
На практике определение необходимого объема выборки часто
составляет серьезную проблему, связанную, в частности, с недостаточной разработанностью таких вопросов, как оценка вариации изучаемых признаков, обоснование численности выборки при изучении
нескольких признаков, зависимость объема выборочной совокупности
от программы разработки материалов наблюдения и др. Трудности
порождаются и тем, что, кроме чисто статистических, в определении
необходимой численности выборочной совокупности большое значение принадлежит факторам организационного порядка, которые
должны быть обязательно учтены. К ним относятся, например, обеспеченность обследования ресурсами, длительность обработки и срочность представления результатов.
Одним из наиболее важных и в то же время сложных вопросов
определения необходимого объема выборки в исследованиях является
расчет показателя вариации изучаемого признака σ . При подготовке
выборочного наблюдения у его организаторов часто отсутствуют необходимые для этих вычислений данные. Основой оценки степени
колеблемости изучаемого признака служат, как правило, материалы
предыдущих обследований. Обращение к ним при отсутствии какойлибо другой информации вполне оправданно. Однако следует иметь в
виду, что использование данных прошлых обследований имеет смысл
только тогда, когда за прошедший до нового обследования период в
генеральной совокупности не произошло значительных изменений.
Во многих случаях более точное представление об изучаемой
совокупности, в том числе о вариации интересующих исследователя
признаков, может дать пробное обследование. По его данным рассчитывают среднее квадратическое отклонение и дисперсию для последующего обоснования необходимого объема выборки.
- 79 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если же мера колеблемости признака неизвестна, то ее можно
найти приближенно по величине предполагаемого размаха или среднего линейного отклонения по следующим формулам:
σ=
R
6
и
σ = 1.25d
(8.2)
где σ - среднее квадратическое отклонение; R - размах вариации; d среднее линейное отклонение. Важным условием практического использования этих формул является близость фактического распределения к нормальному.
При статистическом исследовании социально-экономических
явлений очень часто приходится сталкиваться с качественными признаками, причем именно по ним нередко производится расчет необходимого объема выборочной совокупности.
Способ выражения качественных признаков не позволяет рассчитать по ним средние значения, поэтому оценка колеблемости производится, как правило, исходя из долей единиц, обладающих значениями этих признаков, т.е. выборочных долей. Выборочная доля также называется частостью.
Если расчет производится по качественному альтернативному
признаку и его доля в генеральной совокупности неизвестна (хотя бы
приблизительно), рекомендуется принять ее равной 0.5, так как дисперсия доли достигает максимума: σ w2 = 0.25 при w=0.5 Преимущество такого приема заключается в том, что он позволяет определить
численность выборочной совокупности, не располагая данными предыдущих обследований, и не проводить пробных обследований. Если
же качественный признак, по которому определяется необходимая
численность выборочной совокупности, не является альтернативным,
то использовать формулу σ w2 = w(1 − w) нельзя.
В ряде случаев приближенная оценка колеблемости может быть
осуществлена с помощью превращения изучаемого признака в альтернативный. Например, все категории работников предприятия можно условно разделить в зависимости от их принадлежности к рабочим
и служащим. Однако при этом следует учитывать, что такое деление
неизбежно приведет к потере некоторой части информации. Ведь существуют отдельные категории работников (МОП, охрана и др.), которые выделяются в самостоятельные группы. Поэтому применять
- 80 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
описанный выше прием можно лишь при условии, что существует
уверенность в незначительной доле неучтенных единиц во всей совокупности.
Приведем формулы необходимого объема выборки для
наиболее часто используемых на практике способов формирования выборочной совокупности (табл. 8.1). Рассмотрим несколько
примеров расчета объема выборки при различных способах отбора.
Пример 1. В микрорайоне проживает 5000 семей. В порядке
случайной бесповторной выборки предполагается определить средний
размер семьи при условии, что ошибка выборочной средней не должна превышать 0.8 человека с вероятностью Р = 0.954 и при среднем
квадратическом отклонении 3.0 человека (ошибка и среднее квадратическое отклонение определены на основе пробного обследования).
При Р = 0.954 и t = 2
n=
2 2 ⋅ 3 2 ⋅ 500
4 ⋅ 9 ⋅ 5000
180000
=
=
= 56 семей.
2
2
5000 ⋅ 0.64 + 4 ⋅ 9
3236
5000 ⋅ 0.64 + 2 ⋅ 3
Пример 2. Для определения средней длины детали следует провести выборочное обследование методом случайного повторного отбора. Какое количество деталей надо отобрать, чтобы ошибка выборки не превышала 3 мм с вероятностью 0,997 при среднем квадратическом отклонении 6 мм.
Таблица 8.1
Необходимый объем выборки для некоторых способов формирования выборочной совокупности
- 81 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При t = 3 и Р = 0,997 объем выборки рассчитывается сле32 ⋅ 6 2
дующим образом: n =
= 36 деталей.
32
Пример 3. В фермерских хозяйствах области 10 000 коров.
Из них в районе А – 5000, в районе Б – 3000, в районе В – 2000.
С целью определения средней удойности предполагается про- 82 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вести типическую выборку коров с пропорциональным отбором
внутри групп (механическим).
Какое количество коров следует отобрать, чтобы с вероятностью 0,954 ошибка выборки не превышала 5 л, если на основе предыдущих обследований известно, что дисперсия типической выборки
равна 1600.
Рассчитаем необходимую численность типической выборки:
n=
2 2 ⋅ 1600 ⋅ 10000
6400000
=
= 249.6 ≈ 250 коров.
2
2
5 ⋅ 10000 + 2 ⋅ 1600 250000 ⋅ 6400
Необходимо отобрать 250 коров, из них:
– в районе А: n1 = 250 ⋅
5000
= 125 коров;
10000
– в районе Б: n 2 = 250 ⋅
3000
= 75 коров;
10000
– в районе В: n3 = 250 ⋅
2000
= 50 коров;
10000
Ошибка и среднее квадратическое отклонение заданы исходя из
технических нормативов.
Пример 4. На склад АО «Машиностроитель» поступило 100
ящиков готовых изделий по 80 шт. в каждом. Для установления среднего веса деталей следует провести серийную выборку деталей методом механического отбора так, чтобы с вероятностью 0.954 ошибка
выборки не превышала 2 г.
На основе предыдущих обследований известно, что дисперсия
серийной выборки равна 4. Определяем необходимый объем выборки:
r=
2 2 ⋅ 4 ⋅ 100
1600
=
≈ 4 ящика.
2
2
100 ⋅ 2 + 2 ⋅ 4 416
Подробное рассмотрение вопросов определения дисперсии для
нахождения объема выборки не исключает использования в этих целях других показателей вариации.
- 83 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8.2. Оценка результатов выборочного наблюдения
Заключительным этапом выборочного наблюдения является
распространение его результатов на генеральную совокупность. Однако часто при статистическом изучении социально-экономических
явлений этому процессу предшествует оценка результатов наблюдения с точки зрения самой возможности распространения. Вывод о
возможности распространения в значительной степени зависит от
качества основы выборки, прежде всего от полноты.
Под полнотой подразумевается наличие или представленность
всех типов или групп данной генеральной совокупности в основе выборки. Неполнота основы может привести к нарушению представительности выборки и как следствие к неправильным выводам при анализе данных наблюдения.
Более точной основой суждения о возможности распространения представляется расчет относительной ошибки:
∆% =
∆ ~х
⋅ 100% - для средней;
x
∆% =
∆w
⋅ 100% - для доли,
p
(8.3)
(8.4)
где ∆ % - относительная предельная ошибка выборки; ∆ x и ∆ w предельная ошибка для среднего значения или доли признака; x и p
- генеральная средняя и доля соответственно.
Суждение о возможности распространения выборочных данных
можно составить, если в формулах (8.3) и (8.4) заменить x и p соответствующими выборочными характеристиками. Необходимым условием при этом является соответствие плановой и фактической численности и структуры выборочной совокупности. При больших расхождениях использование этого приема может привести к ошибочным
суждениям. Если величина относительной ошибки не превышает заранее установленного для данного обследования предельного значения, то данные выборочного наблюдения являются представительными и могут быть распространены на генеральную совокупность. В
противном случае следует попытаться восстановить исходные про-
- 84 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
порции генеральной совокупности.
Процесс восстановления пропорций выборки на основе исходной информации о таких пропорциях в генеральной совокупности
принято называть корректировкой выборки. При обработке данных
выборочного наблюдения целесообразно использовать два наиболее
часто применяемых способа корректировки.
Первый способ ориентирован на группу единиц, которые оказались недостаточно представлены в выборочной совокупности после
наблюдения. Формуляры с данными об этих единицах, пригодные для
обработки, следует сохранять в полном объеме. На основе сведений о
количестве таких формуляров проводятся дополнительные расчеты.
Их целью является определение числа хорошо представленных в фактической выборке формуляров остальных групп, часть которых необходимо исключить из обработки для сохранения пропорций генеральной совокупности. Данный способ корректировки называется методом «отсечения».
Рассмотрим условный пример. С целью изучения общественного мнения из генеральной совокупности численностью 1000 человек
было отобрано в порядке типической пропорциональной выборки 100
человек, принадлежащих к различным социальным группам: рабочие,
служащие, студенты. При этом в генеральной совокупности было
50%рабочих, 35% служащих и 15%студентов, т.е. пропорция по группам населения составила примерно 3.3:2.3:1.
Следовательно, для обеспечения представительности выборки
по признаку социального положения требовалось бы получить данные
о 50 рабочих, 35 служащих и 15 студентах. Однако по тем или иным
причинам часть анкет не была получена, а другая часть была забракована. В результате пригодными для дальнейшей обработки оказалось
40 анкет, заполненных рабочими, 30 - служащими и 10 - студентами.
Таким образом, пропорции по различным группам в массиве для обработки составили 4:3:1, что свидетельствует о нарушении структуры
генеральной совокупности.
Для проведения корректировки необходимо определить, анкеты
какой социальной группы респондентов должны быть сохранены в
процессе обработки полностью. Это можно сделать с помощью относительных величин, вычисляемых для каждой социальной категории
как отношение числа пригодных для обработки анкет к общему коли-
- 85 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
честву анкет по данной группе. Результат выражается в долях или
процентах.
Расчеты показывают, что наименьшая относительная величина
получается по студентам (приблизительно 66.7%). Следовательно,
формуляры, относящиеся к данной группе населения, необходимо
сохранить полностью. Чтобы восстановить реальные пропорции генеральной совокупности, нужно вновь обратиться к ее структуре, выраженной соотношением 3.3:2.3:1. Несложные вычисления показывают,
что для сохранения представительности выборки в массиве анкет для
дальнейшей обработки должны быть 33 анкеты, заполненные рабочими, 23 -служащими и 10 - студентами. Таким образом, из дальнейшей обработки следует «отсечь» по 7 анкет, относящихся к рабочим и служащим. Для «отсечения» возможно пользоваться процедурой случайной выборки.
После «отсечения» следует проверить, как исключение некоторого числа формуляров повлияло на обобщающие показатели фактической выборки. Для этого вначале следует найти средние по важнейшим показателям в совокупности пригодных для обработки формуляров, включая те, которые затем предполагается «отсечь» Затем
необходимо те же средние рассчитать по совокупности формуляров,
оставшихся после «отсечения», и сравнить полученные результаты.
Для оценки различий средних можно воспользоваться принципами оценки точности выборки. Если расхождения между средними,
рассчитанными до и после «отсечения», не превышают ± 5% , итоги
корректировки считаются вполне удовлетворительными. В противном
случае ее целесообразно повторить, исключив из обработки другие
формуляры.
Основное достоинство метода «отсечения» состоит в том, что
он дает возможность сохранить пропорции генеральной совокупности
в массиве данных, на основе которого будут делаться обобщения. Это
позволяет формулировать выводы на базе представительных данных.
В то же время корректировка способом «отсечения» имеет существенные недостатки. Во-первых, «отсечение» приводит к еще большему, если учитывать невозвращенные и забракованные формуляры,
уменьшению объема выборки. Во-вторых, из обработки и анализа
исключаются вполне пригодные для исследования формуляры. В нашем примере «отсекаются» 17.5% собранных формуляров по группе
- 86 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
рабочих и примерно 23.3% - по группе служащих. Сами по себе эти
показатели весьма значительны. Однако и они могут возрасти, если
для обработки окажутся пригодными не 10, а, скажем, 17 анкет студентов. Тогда из обработки потребуется исключить 17 из 40 анкет
рабочих (42.5%) и 14 из 30 анкет служащих (около 46.7%)
В таких случаях целесообразнее пользоваться способом «взвешивания». В отличие от первого способа корректировки «взвешивание» дает возможность сохранить в обрабатываемом массиве все или
почти все полученные формуляры. Достигается это путем многократного использования при обработке части формуляров. При этом несколько раз используются, как правило, те формуляры, число которых
настолько мало, что вызывает необходимость исключения из дальнейшей обработки большого числа формуляров, относящихся к другим группам.
Многократное применение формуляров проводится на основе
специально рассчитанных для этой цели «весов». Метод «взвешивания» наиболее удобно применять при обработке материалов выборочных обследований в случаях высокого процента невозвращенных или
забракованных формуляров. Это характерно прежде всего для почтовых опросов.
Собранные в результате выборочного наблюдения и при необходимости откорректированные данные распространяются на генеральную совокупность. Существует два основных метода распространения - прямой пересчет и способ коэффициентов.
8.2.1. Прямой пересчет
Способ прямого пересчета заключается в умножении среднего
значения признака, найденного в результате выборочного наблюдения, на объем генеральной совокупности. Например, на основании
выборочного обследования 1000 молодых семей требуется оценить
потребность в местах в детских яслях.
Известно, что ясли могут посещать дети в возрасте до трех лет.
По материалам выборочного обследования следует вычислить среднее
число детей этого возраста. Предположим, что оно составляет 1.3 человека. Умножив это число на численность генеральной совокупности, получим, что в детских яслях потребуется выделить 1300 мест.
Производя такие расчеты, мы считаем, что были обследованы
- 87 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
все единицы, попавшие в выборочную совокупность. Однако следует
учитывать, что в социальных исследованиях объемы фактической и
запланированной выборки часто не совпадают. Как правило, несоответствие фактической и запланированной выборки приводит, естественно, к неадекватному отражению в выборочных характеристиках,
полученных по фактическим данным соответствующих характеристик
генеральной совокупности.
Предположим, в нашем примере некоторое число семей по тем
или иным причинам не было обследовано. Это привело к снижению
объема фактической выборки по сравнению с запланированной. Среднее число детей, вычисленное по этой «неполной» выборке, составило
не 1.3, а 1.2. Тогда прямой пересчет выборочной характеристики на
объем генеральной совокупности даст результат 1200 мест.
Абсолютное отклонение от необходимого количества мест при
условии охвата обследованием всей выборочной совокупности составит 100 мест, а относительное отклонение – приблизительно 7.7%.
Если же объем генеральной совокупности был бы в 10 раз
больше, т.е. 10000 семей, то абсолютное отклонение также увеличилось бы в 10 раз и при сохранении тех же различий среднего числа
детей составило 1000 мест, относительное отклонение при этом не
изменится. Таким образом, размер абсолютного отклонения находится
в прямой зависимости от объема генеральной совокупности.
Данный пример показывает, что недоучет обстоятельства, при
котором на практике объемы фактической и запланированной выборок часто не совпадают, приводит к серьезным ошибкам при использовании распространенных на генеральную совокупность результатов
таких исследований. Руководствуясь данными, рассчитанными на
условном примере, пришлось бы принимать ошибочное решение о
строительстве дополнительного числа детских учреждений, мест в
которых не хватило бы на 100 (или на 1000 - в зависимости от объема
генеральной совокупности) детей. Но могла возникнуть и обратная
ситуация, когда вычисленное по «неполной» выборочной совокупности среднее число детей оказалось бы больше истинного. В этом случае появились бы лишние места.
Данный пример показывает, что результатами выборочного наблюдения необходимо пользоваться осторожно, особенно в случаях,
когда их использование связано с большими материальными затратами.
- 88 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8.2.2. Способ коэффициентов
Данный способ целесообразно использовать в случаях, когда
выборочное наблюдение проводится с целью проверки и уточнения
данных сплошного наблюдения, в частности численности учтенных
единиц совокупности. При этом следует использовать следующую
формулу:
Y1 = Y0 ⋅
y1
,
y0
(8.5)
где Y1 - численность совокупности с поправкой на недоучет; Y0 - численность совокупности без этой поправки; y0 - численность совокупности в контрольных точках по первоначальным данным; y1 - численность совокупности в тех же точках по данным контрольных мероприятий.
Отметим, что цели исследования многих явлений могут быть
достигнуты только путем сплошного наблюдения. Поэтому способ
проверки результатов сплошного наблюдения на основе коэффициентов успешно применяется в социальной и экономической статистике.
При уточнении данных сплошного наблюдения на основе контрольных выборочных мероприятий определяется так называемая
поправка на недоучет. Метод ее расчета наиболее широко применяется в обследованиях относительно небольших совокупностей, когда их
объем не превышает нескольких сотен или тысяч единиц.
Пример. При проведении учета коммерческих палаток в городе
было зарегистрировано следующее их количество по районам: в районе А – 2000шт.; в районе Б – 1500 шт.; в районе В – 750 шт. С целью
проверки данных сплошного учета проведены контрольные обходы
части обследованных районов. Их результаты содержатся в табл. 8.2.
Таблица 8.2
Количество коммерческих палаток в районах города до и после контрольных обходов, шт.
- 89 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 8.3
Уточненные данные учета коммерческих палаток в 13 районах
города,шт.
Рассчитанный по каждой категории работников коэффициент
Данные сплошного
наблюдения
Численность с поправкой на недочет
Количество коммерческих палаток в районах города
А
Б
В
2000
1500
750
2100
1550
800
недоучета является основой уточнения при распространении данных,
полученных при выборочных контрольных мероприятиях, на всю совокупность.
В нашем примере количество коммерческих палаток (по данным
сплошного учета) следует умножить на рассчитанный для каждого
Район
Зарегистрировано
при сплошном учете
Установлено при
контрольном обходе
Коэффициент
недоучета
А
400
420
1,050
Б
300
310
1,033
В
150
160
1,067
района коэффициент недоучета. В итоге получим результаты, представленные в табл. 8.3.
Применение метода коэффициентов связано, как правило, с использованием выборочного наблюдения с целью проверки данных
сплошного наблюдения. Однако это приводит к сознательному ограничению области применения данного метода. Метод коэффициентов
можно использовать для проверки данных выборочного наблюдения,
когда необходима очень высокая точность результатов и выборочная
совокупность имеет большой объем - порядка нескольких тысяч или
- 90 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
десятков тысяч единиц. В таких случаях списки единиц обследованной выборочной совокупности служат основой для отбора единиц в
«контрольную» выборку, т.е. производится выборка из выборки.
Контроль и, если это необходимо, уточнение данных основного
обследования проводятся по методике, описанной выше на условном
примере. Способ поправочных коэффициентов целесообразно использовать для распространения данных выборочного наблюдения в случаях, если его результаты значительно уступают в точности данным
статистической отчетности или точность собранного статистического
материала вызывает сомнение.
8.3. Малая выборка
В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме
выборочной совокупности n . От него зависит не только величина
пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.
При большом числе единиц выборочной совокупности ( n > 100
) распределение случайных ошибок выборочной средней в соответствии с теоремой Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений. Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла
Лапласа. Расчет ошибки выборки базируется на величине генеральной
2
, так как при больших n коэффициент n/(n–1), на
дисперсии σ ГЕН
который для получения генеральной умножается выборочная дисперсия, большой роли не играет.
В практике статистического исследования часто приходится
сталкиваться с небольшими по объему так называемыми малыми выборками. Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30. Разработка
теории малой выборки была начата английским статистиком
В.С.Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г.
Он доказал, что оценка расхождения между средней малой выборкой
и генеральной средней имеет особый закон распределения.
Для определения возможных пределов ошибки пользуются так
называемым критерием Стьюдента, определяемым по формуле
- 91 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
t=
где µ ÌÂ =
σ
n −1
~
x−x
µ ÌÂ
,
(8.6)
- мера случайных колебаний выборочной средней в
малой выборке.
Величина σ вычисляется на основе данных выборочного наблюдения:
Σ( xi − ~
x)
.
n
2
σ=
(8.7)
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки σ в генеральной совокупности.
При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.
Предельная ошибка малой выборки ∆МВ в зависимости от средней
ошибки µМВ представлена как ∆МВ = t • µМВ Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке.
Согласно распределению Стьюдента вероятная оценка зависит
как от величины t, так и от объема выборки в случае, если предельная
ошибка не превысит t – кратную среднюю ошибку в малых выборках.
Как видно из табл. 8.4, при увеличении n это распределение стремится
к нормальному и при n = 20 уже мало от него отличается. При n = ∞
в таблице даны вероятности нормального распределения. Для определения
вероятности соответствующие табличные значения следует разделить на
1000.
Покажем, как пользоваться таблицей распределения Стьюдента.
Таблица 8.4
Распределение вероятности в малых выборках в зависимости от коэффициента доверия t и объема выборки n
t
n
4
5
6
7
8
9
10
15
20
∞
0,5
348
356
362
366
368
370
372
376
378
383
- 92 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1,0
1,5
2,0
2,5
3,0
608
770
860
933
942
626
792
884
946
960
636
806
908
955
970
644
816
908
959
976
650
832
914
963
980
654
828
920
966
938
656
832
924
968
984
666
846
936
975
992
670
850
940
978
992
683
865
954
988
977
Пример. Предположим, что выборочное обследование 10 рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин): 3.4; 4.7;
1.8; 3.9; 4.2; 3.9; 3.7; 3.2; 2.2; 3.9. Найдем выборочные средние затраты:
3.4 + 4.7 + 1.8 + ... + 2.2 + 3.9
~
x=
= 3.49 мин.
10
Выборочная дисперсия:
σ х2 =
(3.4 − 3.49)2 + (4.7 − 3.49)2 + ... + (3.9 − 3.49)2
10
= 0.713 .
Отсюда средняя ошибка малой выборки:
µ ÌÂ =
0.713
= 28 мин.
10 − 1
По табл. 8.4 находим, что для коэффициента доверия t = 2 и
объема малой выборки n = 10 вероятность равна 0.924 .
Таким образом, с вероятностью 0.924 можно утверждать, что
расхождение между выборкой и генеральной средней лежит в пределах от − 2 µ до + 2 µ , т.е. разность ~
x − x не превысит по абсолютной
величине (0.56=2•0.28). Следовательно, средние затраты времени во
всей совокупности будут находиться в пределах от 2.93 до 4.05 мин.
Вероятность того, что это предположение в действительности
неверно и ошибка по случайным причинам будет больше, чем 0.56 ,
составляет: 1 − 0.924 = 0.076 .
Таблица вероятностей Стьюдента часто приводится в иной форме, нежели как табл. 8.4. Считается, что в ряде случаев такая форма
более удобна для практического использования (табл. 8.5). Из табл.
8.5 следует, что для каждого числа степеней свободы k = n − 1 указа-
- 93 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
на предельная величина tP (t0,95 или t0,99), которая с данной вероятностью p не будет превышена в силу случайных колебаний результатов
выборки.
На основе указанной в табл. 8.5 величины tP определяются доверительные интервалы ~
x –∆МВ и ~
x +∆МВ . Это область тех значений генеральной средней, выход за пределы которой имеет весьма
малую вероятность: q = 1 - p. В качестве доверительной вероятности
при двусторонней проверке используют как правило, p = 0.95 или p =
0.99, что не исключает, однако, выбора и других p, не приведенных в
табл. 8.5.
Вероятности q случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут
равны 0.05 и 0.01, т.е. весьма малы. Выбор между вероятностями 0.95
и 0.99 является до известной степени произвольным и во многом
определяется содержанием тех задач, для решения которых применяется малая выборка.
В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего
утверждения несколько меньше, чем при большой выборке (в частности, в приведенном ранее примере 0.924 и 0.954 соответственно).
Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому
малую выборку следует применять в статистическом исследовании
социально-экономических явлений с большой осторожностью, при
соответствующем теоретическом и практическом обосновании.
Таблица 8.5
Некоторые значения t -распределения Стьюдента
Число
tP
степеней
для одностороннего
для двустороннего
свободы
интервала
интервала
3
p=0,95
p=0,99
p=0,05
p=0,99
2,35
4,54
3,18
5,84
- 94 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
5
6
7
8
9
10
15
20
30
60
∞
2,13
2,01
1,94
1,89
1,86
1,83
1,81
1,75
1,73
1,70
1,67
1,64
3,75
3,37
3,14
3,00
2,90
2,82
2,76
2,60
2,53
2,46
2,39
2,33
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,13
2,09
2,04
2,00
1,96
4,60
4,03
3,71
3,50
3,36
3,35
3,17
2,95
2,85
2,75
2,66
2,58
Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически
нормальным. Необходимо также принимать во внимание и то, что
точность результатов выборки малого объема все же ниже, чем при
большой выборке.
9. МЕТОДЫ ПРОГНОЗИРОВАНИЯ В НАУЧНЫХ
ИССЛЕДОВАНИЯХ
9.1. Основные положения теории прогнозирования
В снабженческой, производственной и транспортной сфере широко используются методы прогнозирования, поскольку значения
прогнозных оценок развития анализируемых процессов или явлений
являются основой принятия управленческих решений при оперативном, тактическом и стратегическом планировании. Очевидно также,
что точность и надежность прогноза определяют эффективность реализации различных операций и функций - от оценки вероятности дефицита продукции на складе до выбора стратегии развития фирмы.
Различным аспектам теории прогнозирования посвящено значительное количество исследований. В большинстве работ по прогнозированию прогноз определяется как вероятностное научно обоснованное суждение о перспективах, возможных состояниях того или иного
явления в будущем и (или) об альтернативных путях и сроках их осуществления.
- 95 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Методология прогнозирования - область знаний о методах, способах и системах прогнозирования. Метод прогнозирования - способ
исследования объекта, направленный на разработку прогноза. Методика прогнозирования - совокупность одного или нескольких методов.
Система прогнозирования - упорядоченная совокупность методик и
средств реализации.
Теория прогнозирования включает:
– анализ объекта прогнозирования;
– методы прогнозирования, подразделяющиеся на математические (формализованные) и экспертные (интуитивные);
– системы прогнозирования.
При анализе объектов прогнозирования производится классификация прогнозов, при этом в качестве основных признаков указываются следующие:
– масштабность, отражающая количество значащих переменных в описании объекта;
– сложность, характеризующая степень взаимосвязи переменных;
– детерминированность или стохастичность переменных;
– информационная обеспеченность периода прогнозирования.
– собственно период прогнозирования (краткосрочный прогноз -
до 1 года; среднесрочный - до 5 лет; долгосрочный - свыше 5
лет).
Математические методы прогнозирования подразделяются на
три группы:
1. Симплексные (простые) методы экстраполяции по временным рядам.
2. Статистические методы, включающие корреляционный и
регрессионный анализ и др.
3. Комбинированные методы, представляющие собой синтез
различных вариантов прогнозов.
При формировании методики прогнозирования целесообразно
рассматривать прогноз в узком (1-й тип прогноза) и в широком смысле (2-й тип прогноза). В узком смысле прогноз выполняется при условии, что основные факторы, определяющие развитие прогнозируемого
процесса или явления, не претерпят существенных изменений.
Прогнозы 1-го типа осуществляются с применением симплексных или статистических методов на основе временных рядов. Число
- 96 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значимых переменных включает от одного до трех параметров, т.е. по
масштабности прогнозы этого типа относятся к сублокальным прогнозам. При использовании одного параметра, например, времени,
такие прогнозы считаются сверхпростыми, при двух-трех взаимосвязанных параметрах – сложными. По степени информационной обеспеченности прогнозы этого типа могут быть отнесены к объектам с
полным информационным обеспечением.
Прогноз 2-го типа подразумевает, что исходные данные для получения оценок определяются с использованием опережающих методов прогнозирования: патентного, публикационного и др. Как правило, прогнозы 2-го типа используются для долгосрочного прогнозирования и разбиваются на два этапа:
– первый - получение прогнозных оценок основных факторов;
– второй - собственно прогноз развития процесса или явления.
Наибольшее распространение получили методы прогнозирования 1-го типа.
Наиболее часто для прогнозирования 1-го типа используется
метод экстраполяции.
В общем случае модель прогноза включает три составляющие
(рис.9.1) и записывается в виде.
yt = y t + ν t + ε t ,
где
yt
(9.1)
- прогнозные значения временного ряда; y t - среднее значе-
ние прогноза (тренд);
νt
лебания (сезонная волна);
гноза.
- составляющая, отражающая сезонные ко-
εt
- случайная величина отклонения про-
- 97 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис.9.1. Прогнозирование на основе временных рядов:
рядов
1 - экспериментальные данные на интервале наблюдения А;
2 - тренд; 3 - тренд и сезонная волна; 4 - значение точечного прогноза
на интервале упреждения В; 5 - интервальный прогноз
При этом может быть предложена следующая последовательность расчета:
1. На основе значений временного ряда на предпрогнозном периоде (интервале наблюдения) с использованием метода наименьших
квадратов определяются коэффициенты уравнения тренда
y t , видом
которого задаются. Обычно для описания тренда используются полиномы различных порядков, экспоненциальные, степенные функции и
т.п.
2. Для исследования сезонной волны значения тренда исключаются из исходного временного ряда. При наличии сезонной волны
определяют коэффициенты ν t уравнения, выбранного для аппроксимации.
3. Случайные величины отклонения ε t определяются после исключения из временного ряда значений тренда и сезонной волны на
предпрогнозном периоде. Как правило, для описания случайной величины ε t используется нормальный закон распределения.
ния
- 98 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4. Для повышения точности прогноза применяются различные
методы (дисконтирование, адаптация и др.). Наибольшее распространение в практике расчетов получил метод экспоненциального сглаживания, позволяющий повысить значимость последних уровней временного ряда по сравнению с начальными.
9.2. Применение методов прогнозирования для решения
прикладных задач
Рассмотрим применение методов прогнозирования на основе
данных расхода деталей на складе. В табл.9.1 приведены три реализации текущего расхода, для каждой из которых даны величины расхода
за день и интегральные характеристики, представляющие собой расход деталей со склада за соответствующий цикл.
Проиллюстрируем возможные варианты прогнозов для одной
реализации и для ансамбля из трех реализаций.
Воспользуемся первой реализацией. Допустим, что нам известны значения расхода деталей со склада за пять дней работы (табл. 9.2).
Выберем уравнение тренда y t в виде линейной зависимости
yt = a 0 + a1t .
(9.2)
Расчет коэффициентов уравнения a0 и a1 производится по
формулам
a0 =
a1 =
∑ y i ∑ t i2 − ∑ t i ∑ y i t i
2
N ∑ t i2 − (∑ t i )
N ∑ yi t i − ∑ yi ∑ t i
N ∑ t i2 − (∑ t i )
2
;
(9.3)
.
(9.4)
Таблица 9.1
Динамика спроса в течение трех циклов расхода запасов
1-й цикл
2-й цикл
3-й цикл
День Спрос, Всего с День Спрос, Всего с День Спрос, Всего с
ед. начала
ед. начала
ед. начала
цикла
цикла
цикла
- 99 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
2
3
4
5
6
7
8
9
10
9
2
1
3
7
5
4
8
6
5
9
11
12
15
22
27
31
39
50
11
12
13
14
15
16
17
18
19
20
0
6
5
7
10
7
6
9
*
*
0
6
11
18
28
35
41
50
50
50
21
22
23
24
25
26
27
28
29
30
5
5
4
3
4
1
2
8
3
4
5
10
14
17
21
22
24
32
35
39
Формулы (9.3) и (9.4) получены на основе метода наименьших квадратов. Входящие в формулы значения сумм представлены в табл.9.2.
Подставляя их значения в (9.3) и (9.4), находим
a 0 = 45.2; a1 = −3.0 .
Таким образом, уравнение прогноза запишется в виде
yt = 45.2 − 3.0t
(9.5)
Для оценки границ интервального прогноза необходимо рассчитать среднее квадратичное отклонение:
σt =
N
2
1
⋅ ∑ yi − y .
N − 1 i=1
(
)
(9.6)
Вспомогательные расчеты приведены в табл.9.2. Подставляя
значения в формулу (9.6), находим σ t :
σt =
1
⋅ 13 = 1.8 .
5 −1
Таблица 9.2
Исходные данные и результаты расчета коэффициентов уравнения (9.2) при N = 5
- 100 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
На основании полученных зависимостей yt и σ t рассчитываются прогнозные оценки:
– среднего времени расхода текущего запаса T ;
– страхового запаса yC с заданной доверительной
вероятностью P ;
– вероятности отсутствия дефицита деталей на складе в течение
прогнозируемого периода.
Приняв yt = 0 , находим
T=
− a0 − 45.2
=
= 15 дней.
a1
− 3.0
Для расчета страхового запаса воспользуемся формулой
yC = σ t ⋅ t β ,
(9.7)
где σ t - среднее квадратичное отклонение, формула (9.6); tβ - параметр нормального закона распределения, соответствующий доверительной вероятности β.
Параметр tβ определяет для нормального закона число средних
квадратических отклонений, которые нужно отложить от центра рассеивания (влево и вправо) для того, чтобы вероятность попадания в
полученный участок была равна β. В нашем случае доверительные
интервалы откладывают вверх и вниз от среднего значения уt.
В табл. 9.3 приведены наиболее часто встречающиеся в практических расчетах значения вероятности β и параметра tβ для нормаль-
- 101 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ного закона распределения. Для рассматриваемого примера для доверительной вероятности β = 0.9 по табл. 9.3 находим tβ = 1.643 и по
формуле (9.7) - величину страхового запаса:
y C = 1.8 ⋅ 1.643 = 2.96
Примем yC = 3.0 .
Таблица 9.3
Доверительная вероятность
β
и параметр
t β нормального закона
распределения
β
tβ
β
tβ
0,80
1,282
0,92
1,750
0,82
1,340
0,94
1,880
0,84
1,404
0,95
1,960
0,86
0,88
1,475
1,554
0,96
0,98
2,053
2,325
0,90
1,643
0,99
2,576
0,91
1,694
0,999
3,290
Рис.2.1. Прогноз текущего расхода деталей на складе ( N
- 102 -
= 5 ):
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1 - исходные данные; 2 - уравнение тренда;
3,3- границы интер-
вального прогноза; 4 - время расхода запаса
T
Для учета возможных нарушений срока поставки необходимо оценить
влияние задержки, связанной с выполнением заказа, в частности с
транспортировкой.
По одной реализации невозможно оценить вероятностный характер длительности функциональных циклов поставки. В этом случае
для оценки прогнозной величины страхового запаса можно воспользоваться формулой
yC∗ = a1 τ + t β σ t ,
(9.8)
где τ - параметр, характеризующий количество дней задержки поставки заказа.
Рассчитаем величину страхового запаса при условии задержки
на один день по сравнению с прогнозной оценкой T = 15 дней, т.е. на
16-й день.
По формуле (9.8) находим
y C∗ = − 3.0 ⋅ 1.0 + 1.643 ⋅ 1.8 = 6.0 ед .
Аналогично при τ = 2 (17-й день)
*
y = 9.0 ед. .
C
Допустим, что отклонения ежедневного расхода деталей от
среднего значения (тренда) подчиняются нормальному закону распределения. Определим вероятность отсутствия дефицита по формуле
P( y ) = 1 − F ( y ) = 1 −
y
1
σ 2π
∫e
−
( y − yt )2
2σ 2
dy ,
(9.9)
−∞
где yt - уравнение тренда, формула (9.2); σ - среднее квадратическое отклонение, формула (9.6).
Произведем в интеграле замену переменной:
y − yt
σ
=x
- 103 -
(9.10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
и приведем его к виду
y − yt
x2
1 σ −2
F ( x) =
∫ e dx .
2π −∞
(9.11)
Для расчетов данного интеграла можно воспользоваться численными методами и ЭВМ или специальными таблицами.
Для нормальной функции распределения с параметрами m x = 0
и σ x =1
Ф( x) =
x
1
2π
∫e
−
t2
2
dt .
(9.12)
−∞
 y − yt 
.
 σ 
Очевидно, что F ( y ) = Ф
В табл. 9.4 приведен ряд значений функции Ф( x) и P ( x) . Между параметрами t β и x , а также β и Ф( x) существует соотношение
2Ф( x) − 1 = β .
(9.13)
Таблица 9.4
Значения нормальной функции распределения Ф(х) ,
вероятности Р(х) и параметра х
x
0,00
-0,125
-0,253
-0,385
-0,525
-0,675
-0,842
-1,037
Ф( x )
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
P( x)
x
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
-1,280
-1,75
-2,05
-2,30
-3,10
Ф(x)
0,10
0,08
0,06
0,05
0,04
0,02
0,01
0,001
P(x)
0,90
0,92
0,94
0,95
0,96
0,98
0,99
0,999
На рис. 9.2 приведены графики нормальной функции распределения и плотности нормального распределения.
- 104 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис.9.2. Нормальный закон распределения:
ления
а - плотность распределения; б - функция распределения
Появление дефицита означает, что текущая величина запаса на
складе равна нулю, т.е. y = 0 . Для определения вероятности отсутст-
вия дефицита необходимо: по формуле (9.10) рассчитать x =
− yt
σ
; по
табл. 9.4 с помощью x найти Р(х).
Для рассматриваемого примера рассчитаем вероятности отсутствия дефицита деталей на складе на 13-й, 14-й и 15-й день.
Для T = 13 получаем y = 45.2 − 3.0 = 6.2 ; x = − 6.2 1.8 = −3.44 .
По табл. 9.4 находим P > 0.999 , т.е. вероятность дефицита ничтожно
мала.
Для T = 14 получаем:
y = 3.2 ; x = −1.78 ; P ≈ 0.95 .
Для T = 15 получаем: P ≈ 0.5 .
Определим ошибку прогноза среднего времени T , поскольку
имеются реальные данные о текущем расходе в табл.9.1:
∆T =
TФ − Т П
⋅ 100% ,
ТП
(9.14)
где Т Ф , Т П - соответственно фактическая и прогнозная продолжительность цикла.
- 105 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
∆T =
10 − 15
⋅ 100% = 50% .
10
Ошибка прогноза велика, но это закономерно, так как нарушено
одно из эмпирических правил экстраполяционного прогнозирования:
между предпрогнозным периодом t и периодом упреждения (прогноза) τ = T − t должно соблюдаться соотношение
t
=3.
T −t
(9.15)
Если следовать соотношению (9.15), то при t = 5 допустимая величина времени прогноза:
4
T = t.
3
(9.16)
Следовательно, величина надежного прогноза соответствует
T ≈ 7 дням, и период упреждения составляет τ = 2 дня. Рассмотрим
ансамбль из трех реализаций расхода деталей на складе. Как и в предыдущем примере, допустим, что информация ограничена 7 днями.
Рассчитаем средние значения и дисперсии для каждого дня прогнозного периода по формулам
n
mj =
Dj
∑ mij
i =1
;
n
(m
=∑
mj =
Dj =
n
i =1
ij
− mj
n −1
(9.17)
)
2
.
(9.18)
41 + 50 + 45
= 45.3 ;
3
(41 − 45.3)2 + (50 − 45.3)2 + (45 − 45.3)2
3 −1
Результаты расчетов приведены на рис. 9.3.
- 106 -
= 19.9 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис.9.3. Зависимость средних значений и средних квадратических отклонений от времени для трех реализаций
Для аппроксимации средних значений m(t ) выберем линейную зависимость
m(t ) = b0 + b1t .
(9.19)
Воспользовавшись методом наименьших квадратов
квадратов, найдем коэффициенты b0 и b1 .
Таблица 9.5
Таблица значений переменных
Спрогнозируем среднюю величину времени расхода запаса:
- 107 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
− b0 − 51.6
=
= 10.49 дн.
b1
− 4.92
Зависимости D (t ) и σ (t ) имеют явно нелинейный характер, и
T=
для точных прогнозов они могут быть аппроксимированы полиномами различных порядков, например в виде параболы:
σ (t ) = c0 + c1t + c 2 t 2
(9.20)
В первом приближении ограничимся средними значениями дисперсии и среднего квадратического отклонения σ , которое рассчитывается по формуле
σ=
∑ Dj
N
∑ (m y − y y )
2
= ∑
N
.
(9.21)
При подстановке значений из табл. 9.5 находим
σ=
161.1
= 4.81 .
7
Рассчитаем величину страхового запаса. В первом случае расчет
производится по формуле (9.7). Например, при β = 0.95 находим
y c = 4.81 ⋅ 1.96 = 9.42 ≈ 9 .
Во втором случае расчет yc производится по формуле (9.8).
Особенность расчета для ансамбля реализаций состоит в том,
что имеется возможность оценки величины τ - среднего количества
дней, в которые наблюдается дефицит деталей. В общем случае τ
можно рассчитать по формуле
tn
τ =∑i i,
∑ ni
(9.22)
где t i - число дней дефицита в i -й реализации, t i = 0, 1, 2…; ni количество i -x реализаций.
Например, в рассматриваемом примере в первой реализации
(i = 1) не наблюдается дефицита, т.е. t1 = 0 ; во второй (i = 2) - два
- 108 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
дня дефицита t i = 2 ; а в третьей (i = 3) нет дефицита. Тогда по формуле (9.22):
τ =
0 ⋅ 2 + 2 ⋅1
= 0.66 .
3
При подстановке τ в (9.8) находим:
y c = 4.92 ⋅ 0.66 + 1.96 ⋅ 4.81 = 3.24 + 9.42 = 12.66
В заключение следует сделать следующие замечания:
1. Рассчитанные величины среднего запаса получены при условии, что наблюдающая величина дефицита и вариация ежедневного
расхода - независимые величины. Несомненно, это допущение требует
проверки.
2. При наличии большого количества реализаций расчет величины τ должен быть выполнен до проведения прогнозных расчетов.
Проверка формул (9.8) и (9.22) может быть осуществлена с использованием имитационного моделирования.
10. МЕТОДЫ ТЕОРЕТИЧЕСКИХ ИССЛЕДОВАНИЙ
10.1. Цели, задачи и стадии теоретических исследований
Целью теоретических исследований является выделение в процессе синтеза знаний существенных связей между исследуемым объектом и окружающей средой, объяснение и обобщение результатов
эмпирического исследования, выявление общих закономерностей и их
формализация.
Задачи теоретического исследования:
– обобщение результатов исследования, нахождение общих
закономерностей путем обработки и интерпретации опытных данных;
– расширение результатов исследования на ряд подобных объектов без повторения всего объема исследований;
– изучение объекта, недоступного для непосредственного исследования;
- 109 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– повышение надежности экспериментального исследования
объекта (обоснование параметров и условий наблюдения, точности
измерений).
Теоретические исследования включают:
– анализ физической сущности процессов, явлений;
– формулирование гипотезы исследования;
– построение (разработку) физической модели;
– проведение математического исследования;
– анализ теоретических решений;
– формулирование выводов.
Если не удается выполнить математическое исследование, то
формулируется рабочая гипотеза в словесной форме с привлечением
графиков, таблиц и т.д. В технических науках необходимо стремиться
к применению математической формализации выдвинутых гипотез и
выводов.
В процессе теоретических исследований приходится непрерывно ставить и решать разнообразные по типам и сложности задачи в
форме противоречий теоретических моделей, требующих разрешения.
Структурно любая задача включает условия и требования (рис. 10.1).
Условия - это определение информационной системы, из которой следует исходить при решении задачи. Требования - это цель, к которой
нужно стремиться в результате решения. Условия и требования могут
быть исходными, привлеченными и исковыми.
Исходные условия даются в первоначальной формулировке задачи (исходные данные). Если их оказывается недостаточно для решения задачи, то исследователь вынужден привлекать новые данные,
называемые привлеченными.
Искомые данные, или искомые условия, - это привлеченные условия, которые требуется отыскать в процессе решения задачи.
Процесс проведения теоретических исследований состоит
обычно из нескольких стадий.
- 110 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задача
Условия
задачи
Исходные
данные
Основные
противоречия
Требования
задачи
Исходные
требования
Искомые
данные
Исходные
требования
Преобразование
отношений
Привлеченные
данные
n-я
переформулировка .
данных
.
Привлеченные
требования
1-я
. переформулировка
данных
1-я
переформулировка .
требований
.
n-я
. переформулировка
требований
Непротиворечивые
отношения
Рис.10.1. Структурные компоненты решения задачи
Оперативная стадия включает проверку возможности устранения технического противоречия, оценку возможных изменений в среде, окружающей объект, анализ возможности переноса решения задачи из других отраслей знания или использования «прообразов» природы.
Вторая стадия исследования является синтетической, в процессе которой определяется влияние изменения одной части объекта на
построение других его частей, определяются необходимые изменения
других объектов, работающих совместно с данным, оценивается возможность применения найденной технической идеи при решении других задач.
Выполнение названных предварительных стадий дает возможность приступить к стадии постановки задачи, в процессе которой
определяется конечная цель решения задачи, выбирается наиболее
эффективный путь ее решения и определяются требуемые количественные показатели. Постановка задачи является наиболее трудной
частью ее решения. Преобразование в начале расплывчатой формулировки задачи в четкую, определенную часто облегчает решение задач.
Аналитическая стадия предполагает определение идеального
конечного результата, выявленное помех, мешающих получению иде-
- 111 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ального результата, и их причин, определение условий, обеспечивающих получение идеального результата с целью нахождения условий,
при которых исчезнет «помеха».
Теоретическое исследование завершается формированием теории, не обязательно связанной с построением ее математического аппарата. Теория проходит в своем развитии различные стадии - от качественного объяснения и количественного измерения процессов до
их формализации и в зависимости от стадии может быть представлена
как в виде качественных правил, так и в виде математических уравнений (соотношений).
10.2. Общая характеристика математических методов в
научных исследованиях
Решение практических задач математическими методами последовательно осуществляется путем математической формулировки
задачи (разработки математической модели), выбора метода проведения исследования полученной математической модели, анализа полученных результатов. Математическая формулировка задачи обычно
представляется в виде чисел, геометрических образов, функций, систем уравнений и т.д.
Математическая модель представляет собой систему математических соотношений - формул, функций, уравнений, систем уравнений, описывающих те или иные стороны изучаемого объекта, явления,
процесса. На этапе выбора типа математической модели с помощью
анализа данных поискового эксперимента устанавливаются: линейность или нелинейность, динамичность или статичность, стационарность или нестационарность, а также степень детерминированности
исследуемого объекта или процесса.
Установление общих характеристик объекта позволяет выбрать
математический аппарат, на базе которого строится математическая
модель. Выбор математического аппарата может быть осуществлен в
соответствии со схемой, представленной на рис. 10.2. Как видно из
данной схемы, выбор математического аппарата не является однозначным и жестким. Для описания сложных объектов с большим количеством параметров возможно разбиение объекта на элементы
(подсистемы), установление иерархии элементов и описание связей
между ними на различных уровнях иерархии.
- 112 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Особое место на этапе выбора вида математической модели занимает описание преобразования входных сигналов в выходные характеристики объекта.
Если на предыдущем этапе было установлено, что объект является статическим, то построение функциональной модели осуществляется с помощью алгебраических уравнений. При этом, кроме простейших алгебраических зависимостей, используются регрессионные
модели и системы алгебраических уравнений. Если заранее известен
характер изменения исследуемого показателя, то число возможных
структур алгебраических моделей резко сокращается и предпочтение
отдается той структуре, которая выражает наиболее общую закономерность или общеизвестный закон. Если характер изменения исследуемого показателя заранее неизвестен, то ставится поисковый эксперимент. Предпочтение отдается той математической формуле, которая
дает наилучшее совпадение с данными поискового эксперимента.
- 113 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Статические
Дифференциальные
уравнения
Теория
автоматов
Теория
марковских
процессов
Нестационарный
Теория
случайных
процессов
Динамический
Алгебра
Вероятноястный
Теория
автоматического
упавления
Детерминированный
Уравнения
в частных
производных
Интегральные
уравнения
Дифференциальные
уравнения
Объект
исследования
Стационарные
Дифференциальные
уравнения
Теория
вероятностей
Алгебра
Теория
информации
Алгебра
Рис.10.2. Математический аппарат для построения математической
модели
Результаты поискового эксперимента и априорный информационный массив позволяют установить схему взаимодействия объекта с
внешней средой по соотношению входных и выходных величин. В
принципе возможно установление четырех схем взаимодействия:
– одномерно-одномерная схема (рис. 10.3а) - на объект воздействует только один фактор, а его поведение рассматривается по одному показателю (один выходной сигнал);
- 114 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– одномерно-многомерная схема (рис.10.3б) - на объект воздействует один фактор, а его поведение оценивается по нескольким показателям;
– многомерно-одномерная схема (рис.10.3в) - на объект воздействует несколько факторов, а его поведение оценивается по одному
показателю;
– многомерно-многомерная схема (рис.10.3г) - на объект воздействует множество факторов, а его поведение оценивается по множеству показателей.
а)
x
б)
y
в)
x1
x2
xi
x
y1
y2
yi
г)
y
x1
x2
xi
y1
y2
yi
Рис.10.3. Схемы взаимодействия объекта с внешней средой
Процесс выбора математической модели объекта заканчивается
ее предварительным контролем. При этом осуществляются следующие виды контроля: размерностей; порядков; характера зависимостей;
экстремальных ситуаций; граничных условий; математической замкнутости; физического смысла; устойчивости модели.
Контроль размерностей сводится к проверке выполнения правила, согласно которому приравниваться и складываться могут только
величины одинаковой размерности.
Контроль порядков направлен на упрощение модели. При этом
определяются порядки складываемых величин и явно малозначительные слагаемые отбрасываются.
Контроль характера зависимостей сводится к проверке направления и скорости изменения одних величин при изменении дру-
- 115 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
гих. Направления и скорость, вытекающие из математической модели,
должны соответствовать физическому смыслу задачи.
Контроль экстремальных ситуаций сводится к проверке наглядного смысла решения при приближении параметров модели к
нулю или бесконечности.
Контроль граничных условий состоит в проверке соответствия
математической модели граничным условиям, вытекающим из смысла
задачи. При этом проверяется, действительно ли граничные условия
поставлены и учтены при построении искомой функции и что эта
функция на самом деле удовлетворяет таким условиям.
Контроль математической замкнутости сводится к проверке
того, что математическая модель дает однозначное решение.
Контроль физического смысла заключается в проверке физического содержания промежуточных соотношении, используемых при
построении математической модели.
Контроль устойчивости модели состоит в проверке того, что
варьирование исходных данных в рамках имеющихся данных о реальном объекте не приведет к существенному изменению решения.
11.ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
11.1. Классификация, типы и задачи эксперимента
Важнейшей составной частью научных исследований является
эксперимент, основу которого составляет научно поставленный опыт
с точно учитываемыми и управляемыми условиями. Само слово «эксперимент» происходит от лат. experimentum - проба, опыт. В научном
языке и исследовательской работе термин «эксперимент» обычно используется в значении, общем для целого ряда сопряженных понятий:
опыт, целенаправленное наблюдение, воспроизведение объекта познания, организация особых условий его существования, проверка
предсказания.
В это понятие обычно входит научная постановка опытов и наблюдение исследуемого явления в точно учитываемых условиях, позволяющих следить за ходом явлений и воссоздавать его каждый раз
при повторении этих условий. Само по себе понятие «эксперимент»
означает действие, направленное на создание условий в целях осуще-
- 116 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ствления того или иного явления и по возможности наиболее частого,
т.е. не осложняемого другими явлениями.
Основной целью эксперимента являются выявление свойств исследуемых объектов, проверка справедливости гипотез и на этой основе широкое и глубокое изучение темы научного исследования.
Постановка и организация эксперимента определяются его назначением, и различаются:
– по способу формирования условий (естественных и искусственных);
– по целям исследования (преобразующие, констатирующие,
контролирующие, поисковые, решающие);
– по организации проведения (лабораторные, натурные, полевые, производственные и т.п.);
– по структуре изучаемых объектов и явлений (простые, сложные);
– по характеру внешних воздействий на объект исследования
(вещественные, энергетические, информационные);
– по характеру взаимодействия средства экспериментального
исследования с объектом исследования (обычный и модельный);
– по типу моделей, исследуемых в эксперименте (материальный
и мысленный);
– по контролируемым величинам (пассивный и активный);
– по числу варьируемых факторов (однофакторный и многофакторный);
– по характеру изучаемых объектов или явлений (технологические, социометрические) и т.п.
Для классификации могут быть использованы и другие признаки.
Естественный эксперимент предполагает проведение опытов в
естественных условиях существования объекта исследования (чаще
всего используется в биологических, социальных, педагогических и
психологических науках).
Искусственный эксперимент имеет целью формирование искусственных условий (широко применяется в естественных и технических науках).
Преобразующий (созидательный) эксперимент включает активное изменение структуры и функций объекта исследования в соответ-
- 117 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ствии с выдвинутой гипотезой, формирование новых связей и отношений между компонентами объекта или между исследуемым объектом и другими объектами. Исследователь в соответствии со вскрытыми тенденциями развития объекта исследования преднамеренно создает условия, которые должны способствовать формированию новых
свойств и качеств объекта.
Констатирующий эксперимент используется для проверки определенных предположений. В процессе этого эксперимента констатируется наличие определенной связи между воздействием на объект
исследования и результатом, выявляется наличие определенных фактов.
Контролирующий эксперимент сводится к контролю за результатами внешних воздействий на объект исследования с учетом его
состояния, характера воздействия и ожидаемого эффекта.
Поисковый эксперимент проводится в том случае, если затруднена классификация факторов, влияющих на изучаемое явление,
вследствие отсутствия достаточных предварительных (априорных)
данных. По результатам поискового эксперимента устанавливается
значимость факторов, осуществляется отсеивание незначимых факторов.
Решающий эксперимент ставится для проверки справедливости
основных положений фундаментальных теорий в том случае, когда
две или несколько гипотез одинаково согласуются со многими явлениями. Это согласие приводит к затруднению, какую именно из гипотез считать правильной. Решающий эксперимент дает такие факты,
которые согласуются с одной из гипотез и противоречат другой.
Примером решающего эксперимента служат опыты по проверке
справедливости ньютоновской теории истечения света и волнообразной теории Гюйгенса. Эти опыты были поставлены французским ученым Фуко (1819-1868). Они касались вопроса скорости распространения света внутри прозрачных тел. Согласно гипотезе истечения скорость света внутри таких тел должна быть больше, чем в пустоте. Но
Фуко своими опытами доказал обратное: в менее плотной среде скорость света большая. Этот опыт Фуко и был тем решающим опытом,
который решил спор между двумя гипотезами (в настоящее время
гипотеза Гюйгенса заменена электромагнитной гипотезой Максвелла).
Другим примером решающего эксперимента может служить спор между Птолемеем и Коперником о движении Земли. Решающий опыт
- 118 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Фуко с маятником окончательно решил спор в пользу теории Коперника.
Лабораторный эксперимент проводится в лабораторных условиях с применением типовых приборов, специальных моделирующих
установок, стендов, оборудования и т.д. Чаще всего в лабораторном
эксперименте изучается не сам объект, а его образец. Этот эксперимент позволяет доброкачественно, с требуемой повторностью изучить
влияние одних характеристик при варьировании других, получить
хорошую научную информацию с минимальными затратами времени
и ресурсов. Однако такой эксперимент не всегда полностью моделирует реальный ход изучаемого процесса, поэтому возникает потребность в проведении натурного эксперимента.
Натурный эксперимент проводится в естественных условиях и
на реальных объектах. Этот вид эксперимента часто используется в
процессе натурных испытаний изготовленных систем. В зависимости
от места проведения испытаний натурные эксперименты подразделяются на производственные, полевые, полигонные, полунатурные и т.п.
Практически во всех случаях основная научная проблема натурного
эксперимента - обеспечить достаточное соответствие (адекватность)
условий эксперимента реальной ситуации, в которой впоследствии
будет работать создаваемый объект.
Центральными задачами натурного эксперимента являются:
– изучение характеристик воздействия среды на испытуемый
объект;
– идентификация статистических и динамических параметров
объекта;
– оценка эффективности функционирования объекта и проверка
его на соответствие заданным требованиям.
Эксперименты могут быть открытыми и закрытыми, они широко распространены в психологии, социологии, педагогике. В открытом эксперименте его задачи открыто объясняются испытуемым, в
закрытом - в целях получения объективных данных эти задачи скрываются от испытуемого.
Простой эксперимент используется для изучения объектов, не
имеющих разветвленной структуры, с небольшим количеством взаимосвязанных и взаимодействующих элементов, выполняющих простейшие функции.
В сложном эксперименте изучаются явления или объекты с
- 119 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
разветвленной структурой (можно выделить иерархические уровни) и
большим количеством взаимосвязанных и взаимодействующих элементов, выполняющих сложные функции. Высокая степень связности
элементов приводит к тому, что изменение состояния какого-либо
элемента или связи влечет за собой изменение состояния многих других элементов системы. В сложных объектах исследования возможно
наличие нескольких разных структур, нескольких разных целей.
Информационный эксперимент используется для изучения воздействия определенной (различной по форме и содержанию) информации на объект исследования (чаще всего информационный эксперимент используется в биологии, психологии, социологии, кибернетике и т.п.). С помощью этого эксперимента изучается изменение состояния объекта исследования под влиянием сообщаемой ему информации.
Вещественный эксперимент предполагает изучение влияния
различных вещественных факторов на состояние объекта исследования. Например, влияние различных добавок на качество стали и т.п.
Энергетический эксперимент используется для изучения воздействия различных видов энергии (электромагнитной, механической,
тепловой и т.д.) на объект исследования. Этот тип эксперимента широко распространен в естественных науках.
Обычный (или классический) эксперимент включает экспериментатора как познающего субъекта; объект или предмет экспериментального исследования и средства (инструменты, приборы, экспериментальные установки), с помощью которых осуществляется эксперимент.
В обычном эксперименте экспериментальные средства непосредственно взаимодействуют с объектом исследования. Они являются посредниками между экспериментатором и объектом исследования.
Модельный эксперимент в отличие от обычного имеет дело с
моделью исследуемого объекта. Модель входит в состав экспериментальной установки, замещая не только объект исследования, но часто
и условия, в которых изучается некоторый объект. Модельный эксперимент при расширении возможностей экспериментального исследования одновременно имеет и ряд недостатков, связанных с тем, что
различие между моделью и реальным объектом может стать источником ошибок, и, кроме того, экстраполяция результатов изучения поведения модели на моделируемый объект требует дополнительных за-
- 120 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
трат времени и теоретического обоснования правомочности такой
экстраполяции.
Различие между орудиями эксперимента при моделировании
позволяет выделить мысленный и материальный эксперимент.
Орудиями мысленного (умствённого) эксперимента являются
мысленные модели исследуемых объектов или явлений (чувственные
образы, образно-знаковые модели, знаковые модели). Для обозначения мысленного эксперимента иногда пользуются терминами: «идеализированный эксперимент» или «воображаемый эксперимент».
Мысленный эксперимент является одной из форм умственной деятельности познающего субъекта, в процессе которой в воображении
воспроизводится структура реального эксперимента.
Структура мысленного эксперимента включает: построение
мысленной модели объекта исследования, идеализированных условий
эксперимента и воздействий на объект; сознательное и планомерное
изменение, комбинирование условий эксперимента и воздействий на
объект; сознательное и точное применение на всех стадиях эксперимента объективных законов науки, благодаря чему исключается абсолютный произвол. В результате такого эксперимента формируются
выводы.
Материальный эксперимент имеет структуру, аналогичную
структуре мысленного эксперимента. Однако в материальном эксперименте используются материальные, а не идеальные объекты исследования. Основное отличие материального эксперимента от мысленного в том, что реальный эксперимент представляет собой форму объективной материальной связи сознания с внешним миром, между тем
как мысленный эксперимент является специфической формой теоретической деятельности субъекта.
Пассивный эксперимент предусматривает измерение только
выбранных показателей (параметров, переменных) в результате наблюдения за объектом без искусственного вмешательства в его функционирование.
Примером пассивного эксперимента является наблюдение:
– за интенсивностью, составом, скоростями движения транспортных потоков;
– за числом заболеваний вообще или какой-либо определенной
болезнью в частности;
– за работоспособностью определенной группы лиц;
- 121 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– за показателями, изменяющимися с возрастом;
– за числом дорожно-транспортных происшествий и т.п.
Пассивный эксперимент по существу является наблюдением,
которое сопровождается инструментальным измерением выбранных
показателей состояния объекта исследования.
Активный эксперимент связан с выбором специальных входных
сигналов (факторов) и контролирует вход и выход исследуемой системы.
Однофакторный эксперимент предполагает: выделение нужных
факторов; стабилизацию мешающих факторов; поочередное варьирование интересующих исследователя факторов.
Стратегия многофакторного эксперимента состоит в том, что
варьируются все переменные сразу и каждый эффект оценивается по
результатам всех опытов, проведенных в данной серии экспериментов.
Технологический эксперимент направлен на изучение элементов
технологического процесса (продукции, оборудования, деятельности
работников и т.п.) или процесса в целом.
Социометрический эксперимент используется для измерения
существующих межличностных, социально-психологических отношений в малых группах с целью их последующего изменения.
Для проведения эксперимента любого типа необходимо:
– разработать гипотезу, подлежащую проверке;
– создать программы экспериментальных работ;
– определить способы и приемы вмешательства в объект исследования;
– обеспечить условия для осуществления процедуры экспериментальных работ;
– разработать пути и приемы фиксирования хода и результатов
эксперимента;
– подготовить средства эксперимента (приборы, установки, модели и т.п.);
– обеспечить эксперимент необходимым обслуживающим персоналом.
Особое значение имеет правильная разработка методик эксперимента.
Методика - это совокупность мыслительных и физических
операций, размещенных в определенной последовательности, в соот-
- 122 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ветствии с которой достигается цель исследования.
При разработке методик проведения эксперимента необходимо
предусматривать:
– проведение предварительного целенаправленного наблюдения
над изучаемым объектом или явлением с целью определения исходных данных (гипотез, выбора варьирующих факторов);
– создание условий, в которых возможно экспериментирование
(подбор объектов для экспериментального воздействия, устранение
влияния случайных факторов);
– определение пределов измерений; систематическое наблюдение за ходом развития изучаемого явления и точное описание фактов;
– проведение систематической регистрации измерений и оценок
фактов различными средствами и способами;
создание повторяющихся ситуаций, изменение характера условий и перекрестные воздействия, создание усложненных ситуаций с
целью подтверждения или опровержения ранее полученных данных;
– переход от эмпирического изучения к логическим обобщениям, к анализу и теоретической обработке полученного фактического
материала.
Перед каждым экспериментом составляется его план (программа), который включает:
– цель и задачи эксперимента;
– выбор варьирующих факторов;
– обоснование объема эксперимента, числа опытов;
– порядок реализации опытов, определение последовательности
изменения факторов;
– выбор шага изменения факторов, задание интервалов между
будущими экспериментальными точками;
– обоснование средств измерений;
– описание проведения эксперимента;
– обоснование способов обработки и анализа результатов эксперимента.
Результаты экспериментов должны отвечать трем статистическим требованиям:
– требованию эффективности оценок, т.е. минимальность дисперсии отклонения относительно неизвестного параметра;
- 123 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
– требованию состоятельности оценок, т.е. при увеличении числа наблюдений оценка параметра должна стремиться к его истинному
значению;
– требованию несмещенности оценок т.е. отсутствие систематических ошибок в процессе вычисления параметров.
Важнейшей проблемой при проведении и обработке эксперимента является совместимость этих трех требований.
План-программу рассматривает научный руководитель, обсуждают в научном коллективе и утверждают в установленном порядке.
При разработке плана-программы эксперимента всегда необходимо
стремиться к его упрощению, наглядности без потери точности и достоверности. Это достигается предварительным анализом и сопоставлением результатов измерений одного и того же параметра различными техническими средствами, а также методов обработки полученных
результатов. В условиях интенсификации проведения научных исследований важнейшее место в процессе подготовки эксперимента должно отводиться его автоматизации (АСНИ) с вводом экспериментальных данных непосредственно в ЭВМ, с расчетом результирующих
показателей, с автоматическим управлением ходом эксперимента.
11.2. Элементы теории планирования эксперимента
Математическая теория эксперимента определяет условия оптимального проведения исследования, в том числе и при неполном
знании физической сущности явления. Для этого используются математические методы при подготовке и проведении опытов, что позволяет исследовать и оптимизировать сложные системы и процессы,
обеспечивать высокую эффективность эксперимента и точность определения исследуемых факторов.
Эксперименты обычно ставятся небольшими сериями по заранее согласованному алгоритму. После каждой небольшой серии опытов производится обработка результатов наблюдений и принимается
строго обоснованное решение о том, что делать дальше.
При использовании обычных методов математического планирования эксперимента возможно; решать различные вопросы, связанные с изучением сложных процессов и явлений; проводить эксперимент с целью адаптации технологического процесса к изменяющимся
- 124 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
оптимальным условиям его протекания и обеспечивать таким образом
высокую эффективность его осуществления, и др.
Теория математического эксперимента содержит ряд концепций, которые обеспечивают успешную реализацию задач исследования:
– концепцию рандомизации;
– концепцию последовательного эксперимента;
– концепцию математического моделирования;
– концепцию оптимального использования факторного пространства и ряд других.
Принцип рандомизации заключается в том, что в план эксперимента вводят элемент случайности. Для этого план эксперимента составляется таким образом, чтобы те систематические факторы, которые трудно поддаются контролю, учитывались статистически и затем
исключались в исследованиях как систематические ошибки.
При последовательном проведении эксперимент выполняется не
одновременно, а поэтапно, с тем, чтобы результаты каждого этапа
анализировать и принимать решение о целесообразности проведения
дальнейших исследований (рис.11.1). В результате эксперимента получают уравнение регрессии, которое часто называют моделью процесса.
Для конкретных случаев математическая модель создается исходя из целевой направленности процесса и задач исследования и с
учетом требуемой точности решения и достоверности исходных данных.
- 125 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис 11.1. Структурная схема эксперимента:
эксперимента
а - с целью математического описания исследуемого процесса;
б - с целью оптимизации исследуемого процесса
В настоящее время изданы каталоги планов эксперимента
эксперимента, в которых приводятся сравнительная оценка планов и рекомендации по их
выбору применительно к конкретным условиям эксперимента.
эксперимента
Важное место в теории планирования эксперимента занимают
вопросы оптимизации исследуемых процессов, свойств многокомпонентных систем или других объектов. Как правило, нельзя найти такое
сочетание значений влияющих факторов, при котором одновременно
достигается экстремум всех функций отклика. Поэтому в большинстве
случаев за критерий оптимальности выбирают лишь одну из переменных состояния - функцию отклика, характеризующую процесс
процесс, а остальные принимают приемлемыми для данного случая.
Методы планирования эксперимента в настоящее время быстро
развиваются, чему способствует возможность широкого использова-
- 126 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ния ЭВМ.
Вычислительным экспериментом называется методология и
технология исследований, основанные на применении прикладной
математики и электронно-вычислительных машин как технической
базы при использовании математических моделей. Таким образом,
вычислительный эксперимент основывается на создании математических моделей изучаемых объектов, которые формируются с помощью
некоторой особой математической структуры, способной отражать
свойства объекта, проявляемые им в различных экспериментальных
условиях.
Однако эти математические структуры превращаются в модели
лишь тогда, когда элементам структуры дается физическая интерпретация, когда устанавливается соотношение между параметрами математической структуры и экспериментально определенными свойствами объекта, когда характеристики элементов модели и самой модели в
целом находят соответствие свойствам объекта.
Таким образом, математические структуры вместе с описанием
соответствия экспериментально обнаруженным свойствам объекта и
являются моделью изучаемого объекта, отражая в математической,
символической (знаковой) форме объективно существующие в природе зависимости, связи и законы.
Каждый вычислительный эксперимент основывается как на математической модели, так и на приемах вычислительной математики.
Современная вычислительная математика состоит из многих разделов
развивающихся вместе с развитием электронно-вычислительной техники.
На основе математического моделирования и методов вычислительной математики были созданы теория и практика вычислительного эксперимента, технологический цикл которого принято разделять
на следующие этапы.
1. Для исследуемого объекта строится модель, обычно сначала
физическая, фиксирующая разделение всех действующих в рассматриваемом явлении факторов на главные и второстепенные, последние
из которых на данном этапе исследования отбрасываются. Одновременно формулируются допущения и условия применимости модели,
границы, в которых будут справедливы полученные результаты. Модель записывается в математических терминах, как правило, в виде
дифференциальных или интегродифференциальных уравнений.
- 127 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. Разрабатывается метод расчета сформулированной математической задачи. Эта задача представляется в виде совокупности алгебраических формул, по которым должны вестись вычисления, и условий, показывающих последовательность применения этих формул.
Набор этих формул и условий называется вычислительным алгоритмом.
Вычислительный эксперимент имеет многовариантный характер, так как решения поставленных задач часто зависят от многочисленных входных параметров. Тем не менее, каждый конкретный расчет в вычислительном эксперименте производится при фиксированных значениях всех параметров. Между тем в результате такого эксперимента часто ставится задача определения оптимального набора
параметров. Поэтому при создании оптимальной установки приходится проводить большое число расчетов однотипных вариантов задачи,
различающихся значением некоторых параметров. В связи с этим при
организации вычислительного эксперимента можно использовать эффективные численные методы.
3. Разрабатываются алгоритм и программа решения задачи на
ЭВМ. Программирование решений определяется теперь не только
искусством и опытом исполнителя, а перерастает в самостоятельную
науку со своими принципиальными подходами.
4. Расчетов осуществляется на ЭВМ. Результат получается в виде некоторой цифровой информации, которую далее необходимо будет расшифровать. Точность информации определяется при вычислительном эксперименте достоверностью модели, положенной в основу
эксперимента, правильностью алгоритмов и программ (проводятся
предварительные «тестовые» испытания).
5. Результаты расчетов обрабатываются, анализируются, и делаются выводы. На этом этапе могут возникнуть необходимость уточнения математической модели (усложнения или, наоборот, упрощения), создания упрощенных инженерных способов решения и формул,
дающих возможности получить необходимую информацию более
простым способом.
Вычислительный эксперимент приобретает исключительное
значение в тех случаях, когда натурные эксперименты и построение
физической модели оказываются невозможными. В науке и технике
известно немало областей, в которых вычислительный эксперимент
оказывается единственно возможным при исследовании сложных сис-
- 128 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
тем.
11.3. Метрологическое обеспечение экспериментальных
исследований
Важное место в экспериментальных исследованиях занимают
измерения. Измерение - это нахождение физической величины опытным путем с помощью специальных технических средств. Суть измерения составляет сравнение измеряемой величины с известной величиной, принятой за единицу (эталон). Теорией и практикой измерения
занимается метрология - наука об измерениях, методах и средствах
обеспечения их единства и способах достижения требуемой точности.
К основным проблемам метрологии относятся:
– общая теория измерений;
– единицы физических величин (величины, которым по определению присвоено числовое значение, равное единице) и их системы
(совокупность основных и производных единиц, образованная в соответствии с некоторыми принципами, например Международная система единиц СИ);
– методы и средства измерений (к методам относят совокупность приемов использования принципов и технических средств, применяемых при измерениях и имеющих нормирование метрологических свойств);
– методы определения точности измерений;
– основы обеспечения единства измерений, при которых результаты измерения выражены в узаконенных единицах, а погрешности
измерений известны с заданной вероятностью, что возможно при единообразии средств измерения (средства измерения должны быть проградуированы в узаконенных единицах, и их метрологические свойства должны соответствовать нормам).
Важнейшее значение в метрологии отводятся эталонам и образцовым средствам измерений.
К эталонам относятся средства измерений (или комплекс
средств измерений), обеспечивающие воспроизведение и хранение
единицы с целью передачи ее размера нижестоящим средствам измерения. Эталоны выполнены по особой спецификации. Эталонная база
содержит более 120 государственных эталонов, в том числе, например, единицы длины, массы и др.
- 129 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Образцовые средства измерений служат для проверки по ним
рабочих (технических) средств измерения, постоянно используемых
непосредственно в исследованиях. Передача размеров единиц от эталонов или образцовых средств измерений рабочим средствам осуществляется государственными и ведомственными метрологическими
органами, составляющими метрологическую службу, их деятельность
обеспечивает единство измерений и единообразие средств измерений
в стране.
Метрологическая служба связана со всей системой стандартизации в стране, поскольку метрология сама является по существу стандартизацией измерений и одной из основ стандартизации, так как
обеспечивает достоверность, сопоставимость показателей качества,
закладываемых в стандарты, представляет методы определения и контроля таких показателей.
Основоположником метрологии как науки в нашей стране принято считать великого русского ученого Д. И. Менделеева, создавшего
в 1893 г. Главную палату мер и весов.
Методы измерения можно подразделить на прямые и косвенные.
При прямых измерениях искомую величину устанавливают непосредственно из опыта, при косвенных - определяют функционально
от других величин, определенных прямыми измерениями. Например
b = f (a ) , где b - величина, найденная с помощью косвенных измерений. Различают также абсолютные и относительные измерения.
Абсолютные - это прямые измерения в единицах измеряемой
величины. Относительные измерения представляют собой отношение
измеряемой величины к одноименной величине, играющей роль единицы или измерения этой величины по отношению к одноименной,
принимаемой за исходную. Например, влажность воздуха принимается в относительных единицах (процентах) по отношению к полному
его водонасыщению.
В исследованиях применяются совокупные и совместные измерения. При совокупных измерениях одновременно измеряются несколько одноименных величин, а искомую величину при этом находят
путем решения системы уравнений. При совместных измерениях одновременно проводят измерения неодноименных величин для нахождения зависимости между ними.
- 130 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выделяется несколько основных методов измерения.
Метод непосредственной оценки соответствует определению
значения величины непосредственно по отсчетному устройству измерительного прибора прямого действия (например, измерение массы на
циферблатных весах).
При использовании метода сравнения с мерой измеряемую величину сравнивают с величиной, воспроизводимой мерой (например,
измерение массы на рычажных весах с уравновешиванием гирями).
При методе противопоставления осуществляется сравнение с
мерой (измеряемая величина и величина, воспроизводимая мерой,
одновременно воздействуют на прибор, с помощью которого устанавливается соотношение между этими величинами, как, например, при
измерении массы на равноплечных весах с помещением измеряемой
массы и гирь на двух противоположных чашках весов).
При дифференциальном методе на измерительный прибор воздействует разность измеряемой и известной величины, воспроизводимой мерой (например, измерения, выполняемые при проверке мер
длины сравнением с образцовой мерой на компараторе).
При нулевом методе результирующий эффект воздействия величины на прибор доводят до нуля (например, измерение электрического сопротивления мостом с полным его уравновешиванием).
При методе замещения измеренную величину замещают известной величиной, воспроизводимой мерой (например, взвешивание
с поочередным помещением измеряемой массы и гири на одну и ту же
чашку весов).
При методе совпадений разность между измеряемой величиной
и величиной, воспроизводимой мерой, измеряется с использованием
совпадения отметок шкал или периодических сигналов.
Неотъемлемой частью экспериментальных исследований являются средства измерений, т.е. совокупность технических средств,
имеющих нормированные погрешности, которые дают необходимую
информацию для экспериментатора. К средствам измерений относят
меры, измерительные приборы, установки и системы. Простейшим
средством измерения является мера, предназначенная для воспроизведения физической величины заданного размера (например, гиря - мера
массы).
Измерительным прибором называют средство измерения, предназначенное для получения определенной информации об изучаемой
- 131 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
величине в удобной для экспериментатора форме. В этих приборах
измеряемая величина преобразуется в показание или сигнал. Прибор
состоит из двух основных узлов: воспринимающего сигнал и преобразующего его в показание. Приборы классифицируют, например, по
способу отсчета значения измеряемой величины на показывающие и
регистрирующие. Приборы также классифицируют по точности измерения, стабильности показаний, чувствительности, пределам измерения и др.
Измерительная установка (стенд) представляет собой систему,
состоящую из основных и вспомогательных средств измерений, предназначенных для измерения одной или нескольких величин. Установки включают в себя различные средства измерений и преобразователи,
предназначенные для одно- или многоступенчатого преобразования
сигнала до такого уровня, чтобы можно было зафиксировать его измерительным механизмом. Измерительные установки могут вырабатывать также сигналы, удобные для автоматической обработки результатов измерений.
Измерительные приборы (отсчетные устройства) характеризуются: величиной погрешности; точностью; стабильностью измерений;
чувствительностью.
Погрешности приборов бывают абсолютными и относительными.
Под абсолютной погрешностью измерительного прибора принимается величина
b = ± (xИ − x Д ) ,
где xИ - показания прибора (номинальное значение измеряемой
величины);
x Д - действительное значение измеренной величины, полученное более точным методом.
Погрешность средства измерения - одна из важнейших его характеристик. Она возникает вследствие недоброкачественных материалов, комплектующих изделий, применяемых для приготовления
приборов; плохого качества изготовления приборов; неудовлетворительной эксплуатации и др.
Существенное влияние оказывают градуировка шкалы и периодическая поверка приборов. Кроме этих систематических погрешно-
- 132 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
стей, возникают случайные, обусловленные сочетаниями случайных
факторов - ошибками отсчета, параллаксом, вариацией и т.д.
Таким образом, необходимо рассматривать не какие-либо отдельные, а суммарные погрешности приборов.
Относительная погрешность определяется отношением
bОТН = ±
(x
И
− xД )
xД
⋅ 100% .
Суммарные погрешности, установленные при нормальных условиях ( t В = 20 o ; влажность воздуха 80%; p = 1.01325 ⋅10 5 H м 2 ),
являются основными погрешностями прибора.
Диапазоном измерений – это та часть диапазона показаний прибора, для которой установлены погрешности прибора (если известны
погрешности прибора, то диапазон измерений и диапазон показаний
прибора совпадают).
Размахом называют разность между максимальным и минимальным показаниями прибора. Если эта величина непостоянная, т.е.
если при обратном ходе имеется увеличение или уменьшение хода, то
эту разность называют вариацией показаний W . Величина W - простейшая характеристика погрешности прибора.
Другой характеристикой прибора является его чувствительность, т.е. способность отсчитывающего устройства реагировать на
изменения измеряемой величины.
Под порогом чувствительности прибора понимают наименьшее
значение измеренной величины, вызывающее изменение показания
прибора, которое можно зафиксировать.
Основной характеристикой прибора является его точность. Она
характеризуется суммарной погрешностью. Средства измерения делятся на классы точности. Класс точности - это обобщенная характеристика, определяемая пределами основной и дополнительных допускаемых погрешностей, влияющих на точность.
Стабильность (воспроизводимость прибора) - это свойство отсчетного устройства обеспечивать постоянство показаний одной и той
же величины. Со временем в результате старения материалов стабильность показаний приборов нарушается. Стабильность прибора
определяется вариацией показания. Поэтому при установлении ста-
- 133 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бильности нормируют величину допускаемой вариации W Д . Поскольку вариация принимается с одним знаком, а допускаемая погрешность имеет положительные или отрицательные значения, то
W Д = 0.5 ⋅ b Д ,
где b Д - допустимая относительная погрешность прибора.
Все средства измерения (приборы, используемые для измерения
в научных исследованиях) проходят периодическую поверку на точность, предусматривающую определение и по возможности уменьшение погрешностей приборов. Поверка позволяет установить соответствие данного прибора регламентированной степени точности и
определяет возможность его применения для данных измерений, т.е.
определяются погрешности и устанавливается, не выходят ли они за
пределы допускаемых значений.
Поверку средств измерений производят на различных уровнях от специальных государственных организаций до низовых звеньев.
Государственные метрологические институты и лаборатории по надзору за стандартами и измерительной техникой производят государственный контроль за обеспечением в стране единства мер. На высокоточные измерительные средства государственные метрологические
организации выдают специальное свидетельство, в котором после
поверки указывают номинальные значения измеряемой величины,
класс точности, предельную допускаемую погрешность, результаты
поверки погрешности прибора в виде таблиц, вариации измерений.
Для приборов меньшей ответственности свидетельство может не выдаваться и заменяться лишь указанием о том, что прибор удовлетворяет требованиям стандарта или инструкции. Вместо инструкции прибор (или футляр) снабжают клеймом поверки.
Таким образом, метрологическое обеспечение научных исследований и особенно обеспечение единства измерений и однообразия
средств измерения является важнейшим фактором успешного проведения научных исследований. Без успешного развития метрологии
невозможен прогресс в развитии пауки, и, наоборот, без успешного
развития науки невозможен прогресс в метрологии.
- 134 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12. ОСНОВЫ ТЕОРИИ СЛУЧАЙНЫХ ОШИБОК
И МЕТОДЫ ОЦЕНКИ СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ
В ИЗМЕРЕНИЯХ
Анализ случайных погрешностей основывается на теории случайных ошибок, дающей возможность с определенной гарантией вычислить действительное значение измеренной величины и оценить
возможные ошибки.
Основу теории случайных ошибок составляют следующие
предположения:
– при большом числе измерений случайные погрешности одинаковой величины, но разного знака встречаются одинаково часто;
– большие погрешности встречаются реже, чем малые (вероятность появления погрешности уменьшается с ростом ее величины);
– при бесконечно большом числе измерений истинное значение
измеряемой величины равно среднеарифметическому значению всех
результатов измерений;
– появление того или иного результата измерения как случайного события описывается нормальным законом распределения.
На практике различают генеральную и выборочную совокупность измерений.
Под генеральной совокупностью подразумевают все множество
возможных значений измерений xi или возможных значений погрешностей ∆xi .
Для выборочной совокупности число измерений n ограничено,
и в каждом конкретном случае строго определяется. Считают, что
если n > 30 , то среднее значение данной совокупности измерений x
достаточно приближается к его истинному значению.
12.1. Интервальная оценка с помощью доверительной
вероятности
Для большой выборки и нормального закона распределения общей оценочной характеристикой измерения являются дисперсия D и
коэффициент вариации kB:
- 135 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
( x i − x )2
i =1
n −1
D =σ = ∑
2
;
kB = σ x .
(12.1)
Дисперсия характеризует однородность измерения. Чем выше
D, тем больше разброс измерений. Коэффициент вариации характеризует изменчивость. Чем выше kB ,тем больше изменчивость измерений
относительно средних значений. Для оценки достоверности результатов измерений вводятся в рассмотрение понятия доверительного интервала и доверительной вероятности.
Доверительным называется интервал значений, в к xi который
попадает истинное значение xД измеряемой величины с заданной вероятностью.
Доверительной вероятностью (достоверностью) измерения называется вероятность того, что истинное значение измеряемой величины попадает в данный доверительный интервал, т.е. в зону
a ≤ x Д ≤ b . Эта величина определяется в долях единицы или в процентах:
(
) (
)
ϕ b − x ϕ a − x 
PД = P[a ≤ x Д ≤ b] = 0.5
−
,
σ 
 σ
где ϕ (t ) - интегральная функция Лапласа (табл.12.1)
Интегральная функция Лапласа определяется следующим выражением:
ϕ (t ) =
2
2π
ti
∫e
−
t2
2
dt .
0
Аргументом этой функции является гарантийный коэффициент:
t=
µ
, где µ = b − x ; µ = −(a − x) .
σ
(
)
- 136 -
(12.2)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если же на основе определенных данных установлена доверительная вероятность РД(часто ее принимают равной 0.90; 0.95; 0.9973),
то устанавливается точность измерений (доверительный интервал
2 µ ) на основе соотношения PД = ϕ ( µ σ ) .
Таблица 12.1
Интегральная функция Лапласа
Половина доверительного интервала:
µ = σ arg ϕ ( PД ) = tσ ,
(12.3)
где arg ϕ ( PД ) - аргумент функции Лапласа, если n ≥ 30 (табл.12.1);
arg ϕ ( PД ) - функции Стьюдента, если n < 30 (табл.12.2).
Таким образом, доверительный интервал характеризует точность измерения данной выборки, а доверительная вероятность - достоверность измерения.
Пример. Выполнено 30 измерений прочности дорожного покрытия участка автомобильной дороги при среднем модуле упругости
Е=170 МПа и вычисленном значении среднеквадратического отклонения σ=3.1 МПа.
Таблица 12.2
- 137 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коэффициент Стьюдента αCT
Необходимо определить требуемую точность измерений для
разных уровней доверительной вероятности 0.90; 0.95; 0.9973, приняв
значения t по (табл.12.1).
В этом случае соответственно
µ = ±3.1 ⋅1.65 = 5.1; ± 3.1 ⋅ 2.0 = 6.2; ± 3.1 ⋅ 3.0 = 9.3 МПа
Следовательно, для данного средства и метода измерений
доверительный интервал возрастает примерно в два раза, если
увеличить PД только на 10% .
Пример. Определить достоверность измерений для установленного доверительного интервала µ = ±7 МПа .
По формуле (12.2) имеем t =
7
µ
=
= 2.26 . По табл.12.1 для
σ 3 .1
t= 2.26 определяем PД =0.95. Это означает, что в заданный доверительный интервал из 100 измерений не попадают только 3.
Значение (1- PД) называют уровнем значимости. Из него следует, что при нормальном законе распределения погрешность
погрешность, превы-
- 138 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
шающая доверительный интервал, будет встречаться один раз из nИ
измерений, где
nИ =
РД
1 − РД
.
(12.4)
Это означает, что приходится браковать одно из nИ измерений.
На основании приведенных выше примеров можно вычислить
количество измерений, из которых одно измерение превышает доверительный интервал. Если PД =0.9, то по формуле (12.4) определяется
n =0.9/(1-0/9)=9 измерений. Если PД равна 0.95 и 0.9973- соответственно 19 и 367 измерений.
12.2. Определение минимального количества измерений
Для проведения опытов с заданной точностью и достоверностью
необходимо знать то количество измерений, при котором экспериментатор уверен в положительном исходе. В связи с этим одной из первоочередных задач при статистических методах оценки является установление минимального, но достаточного числа измерении для данных условий. Задача сводится к установлению минимального объема
выборки (числа измерении) Nmin при заданных значениях доверительного интервала 2 µ и доверительной вероятности PД.
При выполнении измерений необходимо знать их точность:
∆=
σ0
x
; σ0 =
σ
n
,
(12.5)
где σ 0 - среднеарифметическое значение среднеквадратического отклонения σ.Значение σ0 часто называют средней ошибкой.
Доверительный интервал ошибки измерения ∆ определяется
выражением µ = tσ 0 .С помощью t легко определить доверительную
вероятность ошибки измерений по табл.12.1.
В исследованиях часто по заданной точности ∆ и доверительной вероятности измерения определяют минимальное количество измерений, гарантирующих требуемые значения ∆ и PД .
- 139 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При Nmin = n получаем
N min =
σ 2t 2
∆2
,
(12.6)
Для определения Nmin может быть принята следующая последовательность вычислений.
1. Проводится предварительный эксперимент с количеством измерений n, которое составляет в зависимости от трудоемкости опыта
от 20 до 50.
2. Вычисляется среднеквадратическое отклонение σ по формуле (12.1).
3. В соответствии с поставленными задачами эксперимента устанавливается требуемая точность измерений ∆ , которая не должна
превышать точности прибора.
4. Устанавливается нормированное отклонение t , значение которого обычно задается (зависит также от точности метода).
5. По формуле (12.6) определяют Nmin,и в дальнейшем в процессе эксперимента число измерений не должно быть меньше Nmin.
Пример. При приемке сооружений комиссия в качестве одного
из параметров замеряет их ширину. Согласно инструкции требуется
выполнять 25 измерений. Допускаемое отклонение параметра
∆ = ±0.1 м . Если предварительно вычисленное значение σ = 0.4 м, то
можно определить, с какой достоверностью комиссия оценивает данный параметр.
Из формулы (12.6) можно записать.
t = n ⋅ ∆ σ = 25 ⋅ 0.1 0.4 = 1.25 .
Доверительная вероятность для t = 1.25 PД = 0.79. Это низкая
вероятность.
Погрешность,
превышающая
доверительный
интервал
2 µ = 0.2 м , согласно выражению (12.2) будет встречаться один раз
из 0.79 (1 − 0.79 ) = 3.37 , т.е. из четырех измерений. Это недопустимо. В связи с этим необходимо вычислить минимальное количество
измерений с доверительной вероятностью PД, равной 0.9 и 0.95.
По формуле (12.6) имеем N min = 0.4 2 ⋅ 1.65 2 0.12 = 43 измере-
- 140 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ния при PД = 0.9 и 64 измерения при PД = 0.95, что значительно превышает установленные 25 измерений. Для нахождения границы доверительного интервала при малых значениях (n<30) применяют метод,
предложенный в 1908 г. английским математиком Госсетом В.С.
(псевдоним Стьюдент). Кривые распределения Стьюдента в случае
n→∞ (практически при n>20) переходят в кривые нормального распределения. Для малой выборки доверительный интервал
Рис.12.1. Кривые распределения Стьюдента для различных значений:
1 - при n→∞; 2 - при n = 10; 3 - при n = 2
в зависимости от значения доверительной вероятности PД.
µ СТ = σ 0α СТ ,
(12.7)
где α СТ - коэффициент Стьюдента, принимаемый по табл.
табл 12.2
Зная µ СТ , можно вычислить действительное значение изучаемой величины для малой выборки
x Д = x ± µ СТ .
(12.8)
Возможна и иная постановка задачи. По n известных измерений малой выборки необходимо определить доверительную вероятность PД при условии, что погрешность среднего значения не выйдет
за пределы ± µ СТ .
- 141 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задачу решают в следующей последовательности:
1.Вначале
вычисляется
среднее
значение
x,
σ0
и
α СТ = µ СТ σ 0 .
2. С помощью величины αCT, известного n и данных в табл.12.2
определяют доверительную вероятность.
В процессе обработки экспериментальных данных следует исключить грубые ошибки ряда. Появление этих ошибок вполне вероятно, а сами они ощутимо влияют на результат измерений. Однако, прежде чем исключить то или иное измерение, необходимо убедиться,
что это действительно грубая ошибка, а не отклонение вследствие
статистического разброса.
Известно несколько методов определения грубых ошибок статистического ряда. Наиболее простым способом исключения из ряда
резко выделяющегося измерения является правило "трех сигм": разброс случайных величин от среднего значения не должен превышать
x max, min = x ± 3σ .
(12.9)
Более достоверными являются методы, базируемые на использовании доверительного интервала. Пусть имеется статистический ряд
малой выборки, подчиняющийся закону нормального распределения.
При наличии грубых ошибок критерии их появления вычисляются по
формулам
β1 =
x max − x
n −1
σ
n
; β2 =
x − x min
n −1
σ
n
(12.10)
где xmax , xmin - наибольшее и наименьшее значения из n измерений.
В табл.12.3 приведены максимальные значения βmax, возникающие вследствие статистического разброса, в зависимости от доверительной вероятности. Если β1 >βmax, то значение xmax необходимо исключить из статистического ряда как грубую погрешность. Если
β2>βmax, исключается величина xmin. После исключения грубых ошибок
определяют новые значения x и σ из (n − 1) или (n − 2 ) измерений.
- 142 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 12.3
Критерий появления грубых ошибок
Второй метод установления грубых ошибок основан на использовании критерия Романовского В.И. и применим также для малой
выборки.
Методика выявления грубых ошибок сводится к следующему.
следующему
1. Задаются доверительной вероятностью PД и по табл.12.4 в
зависимости от n находят коэффициент q .
2. Вычисляют предельно допустимую абсолютную ошибку отдельного измерения
ε ПР = σ q .
(12.11)
Если x − x max > ε ПР , то измерение xmax исключают из ряда наблюдений.
В случае более глубокого анализа экспериментальных данных
рекомендуется следующая последовательность:
1. После получения экспериментальных данных в виде статистического ряда его анализируют и исключают систематические
ошибки.
2. Анализируют ряд в целях обнаружения грубых ошибок и
промахов:
устанавливают подозрительные значения xmax или xmin;
определяют среднеквадратичное отклонение σ ;
- 143 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вычисляют по (12.10) критерии β1, β2 и сопоставляют с βmax, βmin,
исключают при необходимости из статистического ряда xmax или xmin и
получают новый ряд из новых членов.
3. Вычисляют среднеарифметическое x , погрешности отдель-
(
)
ных измерений x − xi и среднеквадратичное очищенного ряда σ .
4. Находят среднеквадратичное σ 0 серии измерений, коэффициент вариации k В .
5. При большой выборке задаются доверительной вероятностью
PД = ϕ (t ) или уравнением значимости 1 − PД и по табл. 12.1 опре-
(
)
деляют t .
6. При малой выборке ( n ≤ 30 ) в зависимости от принятой доверительной вероятности PД и числа членов ряда n принимают коэффициент Стьюдента α СТ ; с помощью формулы (12.2) для большой
выборки или (12.7) для малой выборки определяют доверительный
интервал.
7. Устанавливают по (12.8) действительное значение исследуемой величины.
8. Оценивают относительную погрешность ( % ) результатов серии измерений при заданной доверительной вероятности PД :
δ=
δ 0α СТ
x
⋅ 100% .
Таблица 12.4
Доверительной вероятностью PÄ
n
1
2
3
Таблица 12.5
Таблица данных18 измерений
Значение q при PД
0,95
15,56
4,97
3,56
0,98
38,97
8,04
5,08
0,99
77,96
11,46
6,58
(12.12)
0,995
779,7
36,5
14,46
- 144 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
5
6
7
8
9
10
12
14
16
18
20
3,04
2,78
2,62
2,51
2,43
2,37
2,29
2,24
2,20
2,17
2,15
1,96
4,10
3,64
3,36
3,18
3,05
2,96
2,83
2,74
2,68
2,64
2,60
2,33
5,58
4,36
3,96
3,71
3,54
3,41
3,23
3,12
3,04
3,00
2,93
2,58
9,43
7,41
6,37
5,73
5,31
5,01
4,62
4,37
4,20
4,07
3,98
3,29
xi
67
67
68
68
69
70
71
73
47
75
76
77
78
79
80
81
82
92
x=
=74,83
xi − x xi − x ′
(x
-8
-8
-7
-7
-6
-5
-4
-2
-1
0
1
2
3
4
5
6
7
17
∑=–3
64
64
49
49
36
25
16
4
1
0
1
4
9
16
25
36
49
289
∑=737
-7,83
-7,83
-6,83
-6,83
-5,83
-4,83
-3,83
-1,83
-0,83
0,17
1,17
2,17
3,17
4,17
5,17
6,17
7,17
17,27
Проверка
-46,5
+46,5
i
− x′
)
Если погрешность серии измерений соизмерима с погрешностью прибора BПР , то границы доверительного интервала
2
2
0
µ СТ = σ α
2
СТ
 α (∞ ) 
+  СТ
 .
 3 
(12.13)
Формулой (12.13) следует пользоваться при α СТ σ 0 ≤ 3ВПР . Если же
α СТ σ 0 > 3В ПР , то доверительный интервал вычисляют с помощью
(12.1) или (12.8).
Пример. Пусть имеется 18 измерений (табл. 12.5). Анализ
средств и результатов измерений показал, что систематических оши-
- 145 -
2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бок в эксперименте не обнаружено. Необходимо выяснить, не содержат ли измерения грубых ошибок.
Если воспользоваться первым методом (критерий β max ), то надо
вычислить среднеарифметическое x и отклонение σ .
При этом удобно пользоваться формулой
x = x′ +
xi − x′
,
n
где x ′ - среднее произвольное число.
Если принять x′ = 75 то x = 75 − 3 18 = 74.83 .
(
В формуле (12.1) значение x − xi
методом:
)
2
можно найти упрощенным
(x − x ) = ∑(x − x′) − (x −nx′) = (x − x )
2
2
i
2
i
i
i
= 737−
32
= 736.5 .
18
Используя (12.1), получим
σ=
736.5
= 6.58 ;
18 − 1
kВ =
6.58
⋅100% = 8.8% .
74.83
Следовательно,
β1 =
(92 − 74.83)
18 − 1
6.58 ⋅
18
= 2.68 .
Как видно из табл. 12.3, при доверительной вероятности
PД = 0.99 и n = 18 β max = 2.90 . Поскольку 2.68 < β max , измерение
92 не является грубым промахом. Если PД = 0.95 , β max = 2.58 , то
значение 92 следует исключить.
Если применить правило 3σ , то xmax, min = 74.83 ± 3 ⋅ 6.58 =
= 94.6…55.09, т.е. измерение 92 следует оставить.
В случае, когда измерение 92 исключается,
- 146 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x = 73.8; σ = 5.15 ;
Среднеквадратичное отклонение для всей серии измерений
σ0 =
6.58
= 1.55
18
при
n = 18 .
При очищенном ряде
5.15
= 1.25 .
17
Поскольку n < 30 , ряд следует отнести к малой выборке, и до-
σ0 =
верительный интервал вычисляется с применением коэффициента
Стьюдента α СТ .
По табл. 12.2 принимается доверительная вероятность 0.95
α СТ = 2.11
при
n = 18 ;
α СТ = 2.12
при
n = 17 .
Доверительный интервал:
µ СТ = ±1.55 ⋅ 2.11 = 3.2
при
n = 18 ;
µ СТ = ±1.25 ⋅ 2.12 = 2.7
при
n = 17 .
Действительное значение измеряемой величины:
x Д = 74.8 ± 3.2
при
n = 18 ;
x Д = 73.8 ± 2.7
при
n = 17 .
Относительная погрешность результатов серии измерений:
δ=
3.2
⋅ 100% = 4.3%
74.8
при
n = 18 ;
δ=
2.7
⋅100% = 3.7%
73.8
при
n = 17 .
Таким образом, если принять xi = 92 за грубый промах, то погрешность измерения уменьшается с 4,3 до 3,7%, т.е. на 14%.
- 147 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если необходимо вычислить минимальное количество измерений при заданной точности, проводят серию опытов, вычисляют σ ,
затем с помощью формулы (12.6) определяют N min .
В рассмотренном случае σ = 6.58; k В = 8.91% . Пусть задана
точность ∆ = 5 % и ∆ = 3% при доверительной вероятности
PД = 95% и α СТ = 2.11 .
Тогда
N min
8.912 ⋅ 2.112
=
= 14
52
при
∆ =5%;
8.912 ⋅ 2.112
= 40
32
при
∆ = 3% .
N min =
Таким образом, требование повышения точности измерения (но
не выше точности прибора) приводит к значительному увеличению
повторяемости опытов.
Выше были рассмотрены общие методы проверки экспериментальных измерений на точность и достоверность.
Ответственные эксперименты должны быть проверены и на
воспроизводимость результатов, т.е. на их повторяемость в определенных пределах измерений с заданной доверительной достоверностью. Суть такой проверки сводится к следующему.
1. Для каждой серии вычисляется среднеарифметическое значение xi ( n - число измерений одной серии, принимаемое обычно равным 3–4).
2. Далее вычисляют дисперсию Di .
Таблица 12.6
m
2
3
4
5
6
Критерий Кохрена kKT при PД=0.95
q=n-1
4
5
6
8
10
1
2
3
0,99
0,97
0,90
0,84
0,78
0,97
0.93
0,76
0.68
0,61
0.93
0,79
0,68
0.60
0,53
0,90
0,74
0.62
0.54
0.48
0.87
0.70
0.59
0.50
0,44
- 148 -
0.85
0.76
0.56
0.48
0.42
0.81
0,63
0,51
0,41
0,38
0.78
0.60
0,48
0,41
0,35
16
36
0,73
0,54
0,43
0,36
0,31
0,66
0,47
0,36
0,26
0,25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7
8
9
10
12
15
20
24
30
40
60
12
0.72
0,68
0,64
0,60
0,57
0,47
0,39
0,34
0.29
0,24
0,17
0.09
0,56
0,51
0,47
0,44
0,39
0,33
0.27
0,29
0,20
0,16
0,11
0,06
0,48
0,43
0,40
0,37
0,32
0,27
0,22
0,19
0,16
0.12
0,08
0,04
0,43
0.39
0,35
0,33
0.29
0,24
0,19
0,16
0,14
0,10
0.07
0.04
0,39
0.36
0,33
0,30
0,26
0,22
0,17
0,15
0,12
0,09
0,06
0.03
0.37
0,33
0,30
0,28
0,24
0,20
0,16
0,14
0.11
0,08
0,06
0.03
0.34
0,30
0,28
0.25
0,22
0,18
0,14
0,12
0,10
0,07
0,05
0.02
0,31
0,28
0,25
0,23
0.20
0,17
0,13
0,11
0.09
0,07
0.05
0,02
0.27
0,24
0.22
0,20
0,17
0.14
0,11
0,09
0,07
0,06
0,04
0,02
0,23
0.20
0,18
0,16
0,14
0,11
0.08
0.07
0,06
0,04
0,02
0,01
3. Чтобы оценить воспроизводимость, рассчитывают критерий
Кохрена (расчетный):
k КР =
max Di
m
,
2 ≤ m ≤ 4 (12.14),
∑ Di
1
где max Di - наибольшее значение дисперсий из числа рассматриваемых параллельных серий m ;
m
∑ Di
- сумма дисперсий m серий.
1
Опыты считаются воспроизводимыми при k КР ≤ k КТ , где k КТ табличное значение критерия Кохрена (табл.12.6). Здесь m - число
серий опытов; n - число измерений в серии; q - число степеней свободы.
Пример. Пусть проведено три серии опытов по измерению
прочности грунта (табл.12.7). В каждой серии выполнялось по пять
измерений (повторностей). Тогда по формуле (12.14)
k КР =
2.96
= 0.55 .
2.96 + 2.0 + 0.4
Вычислим число степеней свободы q = n − 1 = 5 − 1 = 4 .
Для m = 3 и q = 4 согласно табл.12.6 значение критерия Кохрена k КТ = 0.74 .
Так как k КР < k КТ , то измерения в эксперименте следует считать воспроизводимыми. Если бы оказалось наоборот, т.е. k КР > k КТ ,
- 149 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
то необходимо было бы увеличить число серий m или число измерений n .
Таблица 12.7
Результаты измерений прочности грунта
Серия
Измерение величины и повторности
опытов
1
2
3
4
5
1
7
9
6
8
4
2
9
7
8
6
5
3
8
8
7
9
8
- 150 -
Вычисленные
величины
Di
xi
6,8
2,96
7,0
2,0
8,0
0,4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Библиографический список
1. Анфилатов, В.С. Системный анализ в управлении / В.С. Анфилатов, А.А. Емельянов, А.А. Кукушкин. – М.: Финансы и статистика, 2006.
2. Асатурян, В.И. Теория планирования эксперимента /
В.И. Асатурян.– М.: Радио и связь, 1983.
3. Гмурман, В.Е. Теория вероятностей и математическая статистика. / В.Е. Гмурман. – М.: Высшая школа, 2003.
4. Надежность и эффективность в технике: справочник: в 10 т. –
М.: Машиностроение, 1989.
5. Таблицы планов эксперимента для факторных и полиномиальных моделей / под ред. В.В. Налимова. – М.: Металлургия, 1982.
6. Ходасевич, Г.Б. Обработка экспериментальных данных на
ЭВМ. Ч. 1. Обработка одномерных данных: учеб. пособие / Г.Б. Ходасевич. – СПб.: Изд-во СПбГУТ, 2002.
7. Ходасевич, Г.Б. Обработка экспериментальных данных на
ЭВМ. Ч. 2. Обработка многомерных данных: учеб. пособие/ Г.Б. Ходасевич. – СПб.: Изд-во СПбГУТ, 2002.
Содержание
- 151 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
СОДЕРЖАНИЕ
ВВЕДЕНИЕ............................................................................................................ 3
1. ОБЩИЕ ПОЛОЖЕНИЯ ТЕОРИИ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА........................................................................................... 5
1.1. Основные понятия ................................................................................... 5
1.2. Критерии оптимальности и типы планов ............................................ 11
2. ГРАДИЕНТНЫЕ МЕТОДЫ ОПТИМИЗАЦИИ ......................................... 14
2.1. Понятие градиента ................................................................................ 14
2.2. Способы градиентной оптимизации .................................................... 15
2.3. Особенности применения градиентной оптимизации совместно
с методами планирования экспериментов .......................................... 18
3. ПЛАНЫ ДЛЯ РЕШЕНИЯ ЗАДАЧ ОПТИМИЗАЦИИ ............................... 21
3.1. Постановка задачи оптимизации ......................................................... 21
3.2. Полный факторный эксперимент типа 2k ........................................... 23
3.3. Оценки коэффициентов функции отклика .......................................... 25
3.4. Дробный факторный эксперимент ....................................................... 27
3.5. Оценки коэффициентов функции отклика в дробном факторном
эксперименте ......................................................................................... 29
4. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА .................................... 33
4.1. Предварительная обработка ................................................................. 33
4.2. Проверка однородности дисперсии воспроизводимости .................. 34
4.3. Проверка адекватности модели............................................................ 37
4.4. Проверка значимости оценок коэффициентов модели ...................... 38
5. ПЛАНЫ ДЛЯ ОПИСАНИЯ ПОВЕРХНОСТИ ОТКЛИКА ....................... 39
5.1. Композиционные планы ....................................................................... 39
5.2. Ортогональные центральные композиционные планы...................... 41
5.3. Ротатабельные центральные композиционные планы ....................... 45
5.4. Композиционные планы типа Вn ......................................................... 49
5.5. Каталоги оптимальных планов ............................................................ 50
6. ПЛАНЫ ДЛЯ ОЦЕНКИ ВЛИЯНИЯ ФАКТОРОВ ..................................... 55
6.1. Планы на латинских квадратах ............................................................ 55
6.2. Оценка значимости фактора................................................................. 58
6.3. Оценка дифференциального эффекта уровней фактора .................... 59
7. МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ .................................... 62
7.1. Основные понятия и определения ....................................................... 62
7.1.1. Понятие статистики......................................................................... 62
7.1.2. Предмет статистики ........................................................................ 62
7.1.3. Теоретические основы статистики как науки ................................ 64
7.1.4. Метод статистики ............................................................................ 64
7.1.5. Понятие о выборочном наблюдении .................................................. 65
7.2. Характеристики выборочной и генеральной совокупности ............. 66
- 152 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.3. Основные способы формирования выборочной совокупности ........ 71
7.3.1. Собственно-случайная выборка ......................................................... 71
7.3.2. Механическая выборка ........................................................................ 75
7.3.3. Типический отбор................................................................................ 75
7.3.4. Серийный отбор .................................................................................. 78
7.3.5. Комбинированный отбор.................................................................... 78
8. ВЫБОЧНЫЕ НАБЛЮДЕНИЯ ..................................................................... 80
8.1. Определение необходимого объема выборки..................................... 80
8.2. Оценка результатов выборочного наблюдения .................................. 85
8.2.1. Прямой пересчет ................................................................................. 89
8.2.2. Способ коэффициентов ...................................................................... 90
8.3. Малая выборка....................................................................................... 93
9. МЕТОДЫ ПРОГНОЗИРОВАНИЯ В НАУЧНЫХ ИССЛЕДОВАНИЯХ ... 97
9.1. Основные положения теории прогнозирования ................................. 97
9.2. Применение методов прогнозирования для решения прикладных
задач ..................................................................................................... 101
10. МЕТОДЫ ТЕОРЕТИЧЕСКИХ ИССЛЕДОВАНИЙ ................................. 112
10.1. Цели, Задачи и стадии теоретических исследований........................ 112
10.2. Общая характеристика математических методов в научных
исследованиях....................................................................................... 114
11. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ....................................... 118
11.1. Классификация, типы и задачи эксперимента ................................... 118
11.2. Элементы теории планирования эксперимента ................................. 126
11.3. Метрологическое обеспечение экспериментальных исследований ..... 131
12. ОСНОВЫ ТЕОРИИ СЛУЧАЙНЫХ ОШИБОК И МЕТОДЫ ОЦЕНКИ
СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ В ИЗМЕРЕНИЯХ ............................ 137
12.1. Интервальная оценка с помощью доверительной вероятности ....... 138
12.2. Определение минимального количества измерений ......................... 141
Библиографический список .............................................................................. 153
- 153 -
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
У Ч Е Б Н О Е ИЗ Д АН И Е
Р.Г. Сафин, А.И. Иванов, Н.Ф. Тимербаев
ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ.
ОРГАНИЗАЦИЯ И ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТА
Редактор Л.Г. Шевчук
Лицензия № 020404 от 6.03.97 г.
Подписано в печать 15.05.13
Бумага офсетная
9,75 уч.-изд. л.
Печать Riso
Тираж 100 экз.
Формат 60×84/16
9,06 усл. печ. л.
Заказ
«С» 75
Издательство Казанского национального исследовательского
технологического университета
Офсетная лаборатория Казанского национального
исследовательского технологического университета
420015, Казань, К.Маркса, 68
- 154 -
Документ
Категория
Без категории
Просмотров
610
Размер файла
2 050 Кб
Теги
планирование, эксперимент, научный, основы, организации, исследование
1/--страниц
Пожаловаться на содержимое документа