close

Вход

Забыли?

вход по аккаунту

?

Климова Г.Н. Планирование и организация эксперимента. тексты ле

код для вставкиСкачать
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Воронежская государственная лесотехническая академия»
Г. Н. Климова
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА
Тексты лекций
Воронеж – 2014
1
УДК 656
Печатается по решению учебно-методического совета
ФГБОУ ВПО «ВГЛТА» (протокол № ... от ................... г.)
Климова, Г.Н.
Планирование и организация эксперимента [Электронный ресурс] : тексты
лекций / Г.Н. Климова; М-во образования и науки РФ, ФГБОУ ВПО «ВГЛТА»
– Воронеж, 2014. – 50 с.
ISBN .......................................
В текстах лекций обобщаются имеющиеся в литературе разрозненные материалы по
вопросам развивающегося направления в области планирования и организации
экспериментальных исследований, необходимых для реализации производственнотехнологической,
расчѐтно-проектной,
экспериментально-исследовательской,
организационно-управленческой деятельности
Тексты лекций предназначены для студентов лесотехнических вузов по направлению
подготовки 23.04.01 – Технология транспортных процессов при изучении дисциплины
«Планирование и организация эксперимента», а также для аспирантов.
ISBN ...............................
© Климова Г.Н., 2014
© ФГБОУ ВПО «Воронежская государственная
лесотехническая академия», 2014
2
СОДЕРЖАНИЕ
ЛЕКЦИЯ 1. Введение в теорию «Планирование и организация
эксперимента»
4
4
1.1. Планирование эксперимента и его задачи
10
1.2. Виды экспериментов
12
1.3. Параметры оптимизации и требования, предъявляемые к
ним
16
1.4. Факторы и требования к ним.
16
1.5. Выбор модели эксперимента
1.6. Принятие решения перед планированием
ЛЕКЦИЯ 2. Статистическая проверка статитических гипотез.
21
22
2.1. Статистические гипотезы
23
2.2. Виды ошибок при выдвижении статистических гипотез
28
2.3. Статистические критерии
28
2.4. Виды критериев согласия и области их применения
30
ЛЕКЦИЯ 3. Статистические методы анализа данных и планирование
эксперимента
36
40
3.1. Дисперсионный анализ.
46
3.2 Корреляционный анализ.
47
3.3. Регрессионный анализ.
48
Библиографический список
50
3
ЛЕКЦИЯ 1.
Введение в теорию «Планирование и организация эксперимента»
1.1. Планирование эксперимента и его задачи
1.2. Виды экспериментов
1.3. Параметры оптимизации и требования, предъявляемые к ним
1.4. Факторы и требования к ним.
1.5. Выбор модели эксперимента
1.6. Принятие решения перед планированием
1.1. Планирование эксперимента и его задачи
Мысль о том, что эксперимент можно планировать восходит к глубокой
древности. Пожалуй, как только человек взял в руки палку, он уже начал
заниматься проблемами планирования с целью выработки наиболее
оптимального способа добычи пропитания. Результатами подобных изысканий,
проводившимся в течение столетий, стали современные блага цивилизации.
Однако, первобытному человеку, да и средневековому рыцарю в том числе,
абсолютно не были знакомы понятия статистики.
Подобная теория появилась (имеется в виду статистика) в начале середине ХХ века. Вслед за развитием аппарата статистического анализа, его
положения стали применяться и в планировании эксперимента. Автором идеи
привлечения статистики в планирование являлся один из основоположников
английской школы статистики - Рональд Фишер. Именно он доказал
целесообразность использования статистических методов в проблеме поиска
оптимальных условий проведения эксперимента. Так появилась совершенно
новая наука, имеющая важное практическое значение - «Планирование и
организация эксперимента».
Так что же представляет собой планирование эксперимента? Для того
чтобы представить себе этот процесс достаточно сказать, что мы с Вами
ежедневно, ежечасно и даже ежеминутно занимаемся планированием
эксперимента, и этот эксперимент называется жизнь.
Давайте для примера представим себе одно наше утро. Просыпаясь утром
и собираясь выйти из дома, мы вспоминаем уже заранее намеченные на этот
4
день дела или же намечаем их в эту самую минуту. При этом каждый из нас,
рассматривая список предполагаемых дел, сразу проводит корректировку, что
он точно способен сделать, что вероятнее всего сделает, на что сил может не
хватить, но на всякий случай запишем это в реестр сегодняшних дел и т.д.
Таким образом, каждый из нас прикидывает условия существования в дне
сегодняшнем, чтобы данный эксперимент (мы все по-прежнему имеем ввиду жизнь) у нас удался.
Точно таким же образом проводятся и промышленные эксперименты.
С одной лишь оговоркой. При проведении различных лабораторных,
промышленных или других экспериментов существуют какие-то нормативы
точности полученных результатов. Ну, например, вес слона к концу проведения
откорма должен составлять не менее (5000 ± 150) кг. И, откармливая слона,
вполне естественно вы будете планировать свою животноводческую кампанию
с учетом требуемого конечного веса с точностью до 150 кг.
Учитывая сказанное, можно сформулировать следующее определение.
Планирование эксперимента - это процедура выбора числа и условий
проведения опытов, необходимых и достаточных для решения поставленной
задачи с требуемой точностью.
При этом, как учит нас теория, необходимо придерживаться следующих
ограничений:
1. общее число опытов должно быть по возможности минимальным;
2. необходимо одновременно изменять все переменные, определяющие
(влияющие) процесс. Причем это изменение должно происходить по
определенным правилам-алгоритмам;
3. при описании исследований необходимо использовать математический
аппарат, формализующий действия экспериментатора;
4. в процессе проведения и планирования эксперимента необходимо
придерживаться четкой стратегии, позволяющей принимать обоснованные
решения после каждой серии экспериментов.
Задачей «Планирования эксперимента» является разработка
рекомендаций или производственного процесса на основе исследования
предварительных опытных данных для дальнейшей их реализации и
построения математической модели исследуемого процесса с целью
дальнейшего прогнозирования производства. Как правило, результатами таких
5
исследований являются разработки наиболее оптимальных рекомендаций,
технологического процесса, имеющих важные экономические, технические,
технологические последствия и влекущих за собой как модернизацию
отдельного технологического процесса, так и целого производства.
1.2. Виды экспериментов
В зависимости от условий эксперименты делятся на несколько видов:
1) промышленный - это эксперимент, поставленный в условиях
предприятия с целью улучшения производства;
2) научно-исследовательский - эксперимент, поставленный в научноисследовательских лабораториях с целью исследования нового или улучшения
существующего процесса, явления;
3)
лабораторный
эксперимент,
поставленный
в
научноисследовательских лабораториях с целью изучения хорошо известного,
существующего процесса, явления;
4) оптимальный (экстремальный) - эксперимент, поставленный с целью
поиска наиболее оптимальных условий его реализации в заранее заданном
смысле. С математической точки зрения, это эксперимент по поиску
экстремумов некоторой функции, отсюда и второе название эксперимента;
5) пошаговый - эксперимент, состоящий из отдельных серий опытов.
Причем условия проведения каждой следующей серии определяются
результатами предыдущих.
6) активный - эксперимент, в ходе которого экспериментатор имеет
возможность изменять и/или поддерживать на заданном уровне сколь угодно
долго значение параметров, задающих условия проведения эксперимента;
7) пассивный - эксперимент, в ходе которого экспериментатор не имеет
возможности изменять и/или поддерживать на заданном уровне сколь угодно
долго значение параметров, задающих условия проведения эксперимента
На практике чаще всего приходится иметь дело со смешанным активнопассивным экспериментом.
Как и в любой другой науке, «Планирование и организация
эксперимента» имеет свой собственный язык, Т.е. какие-то определенные
термины, понятия. Ниже как раз и поговорим об этом.
6
1.3 Параметры оптимизации и требования, предъявляемые к ним
Прежде, чем проводить любой эксперимент, неважно научный он будет
или нет, каждый из нас четко определяет для себя, а чего собственно он ждет в
результате своей бурной деятельности? Причем желательно, особенно в случае
промышленных или научных экспериментов, чтобы этот результат выражался
количественно. В «Планировании и организации эксперимента» результат
проведения опытов называется параметром оптимизации или откликом
системы на воздействие.
Параметр оптимизации (отклик) - величина, описывающая результат
проведенного эксперимента и зависящая от факторов, влияющих на
эксперимент.
В зависимости от объекта и цели исследования параметры оптимизации
могут быть самыми разнообразными. Введем классификацию параметров
оптимизации:
1 класс - Экономические параметры оптимизации.
К данному классу относятся прибыль, себестоимость, рентабельность
(эти параметры используются при исследовании действующих промышленных
объектов), затраты на эксперимент (оценивается в любых исследованиях, в т.ч.
и научно-исследовательских).
2 класс - Технико-экономические параметры оптимизации.
Среди этих параметров наиболее распространенными являются
производительность и коэффициент полезного действия; такие параметры как
стабильность, надежность, долговечность связаны с длительными
наблюдениями и используются в основном при изучении дорогостоящих
ответственных объектов.
3 класс - Технико-технологические параметры оптимизации.
К этим параметрам оптимизации относятся физические характеристики
продукта, механические характеристики продукта, физико-химические
характеристики продукта, медико-биологические характеристики продукта,
выход продукта. Как видно из перечня, данная категория параметров
оптимизации оценивает качество выпускаемой продукции.
4 класс - Прочие.
Эта категория содержит психологические, эстетические, статистические
параметры оптимизации. Несмотря на кажущуюся простоту этой группы,
7
данные параметры являются не менее важными, чем все предыдущие. С ростом
сложности объекта растет и психологическая нагрузка на исполнителя, отчего
очень сильно может измениться качество продукции. Эстетические же
параметры, прежде всего, учитываются в вопросах повышения реализации.
В качестве примера выбора параметра оптимизации можно рассмотреть
процесс обучения студента. Оценивать успешность проходящего процесса
обучения можно различными вариантами, но наиболее оптимальным до сих
пор остается балльная оценка знаний обучающегося. Исходя из приведенной
выше классификации, данный параметр оптимизации относится, скорее всего, к
четвертому виду - прочие.
Рассмотрим требования, предъявляемые к параметрам оптимизации.
Требование N 1.
Прежде всего, параметр оптимизации должен быть количественным,
задаваться числом. Исследователь должен иметь возможность его измерять при
любом фиксированном наборе уровней факторов.
Вернемся, к оценке знаний. Не будь балльной оценки знаний,
обучающемуся трудно было бы понять насколько его уровень знаний
соответствует предъявляемым требованиям.
Множество значений, которые принимает параметр оптимизации,
называется областью его определения.
Области определения могут быть дискретными и непрерывными. На
практике, как правило, области определения дискретные.
Измерение
параметра
оптимизации
предполагает
наличие
соответствующего прибора. В случае отсутствия такового по каким-либо
причинам, приходится пользоваться приемом, называемым ранжированием:
каждому параметру оптимизации присваиваются оценки по заранее выбранной
шкале (двухбалльной, пятибалльной и т.д.), и в дальнейшем пользуются такой
шкалой ранговой оценки при исследованиях. Фактически, мы качественным
величинами присваиваем количественные значения. Яркий пример
ранжированного подхода - балльная система оценки знаний.
Требование № 2.
Параметр оптимизации должен выражаться одним числом. Не должно
возникать таких ситуаций, когда один и тот же параметр описывается разными
значениями. В противном случае возникают неясности и разночтения.
8
Примером таких разночтений может являться несоответствие в
прочтении оценок, полученных при обучении. Приведу один яркий
исторический пример. Однажды один мой знакомый рассказал, как он посещал
Царскосельский лицей и там видел табель А.С. Пушкина. «Представляешь, воскликнул мой знакомый, - а Пушкин-то был двоечником! У него в табеле
одни двойки и колы стоят!» Конечно, можно и огорчиться, какого ужасного
неуча записали в гении нации, если бы не одно «НО». В Царскосельском лицее
была принята следующая система оценок:
1 - отлично разбирается в предмете, имеет к нему склонность, желание,
использует творческий подход;
2 - неплохо разбирается в предмете, изучает без особого рвения, хотя и
имеет склонность;
3 - слабо разбирается в предмете, изучает без особого рвения, склонности
к предмету слабые;
4 - очень слабо разбирается в предмете, склонностей практически нет,
изучает по принуждению;
0 - не разбирается в предмете, склонностей не обнаружено, усвоение
предмета практически отсутствует.
Вот тебе и двоечник! К слову сказать, во всем табеле у Пушкина была
единственная плохая отметка - ноль по математике. Ну не его это был предмет.
Исходя из перечисленных требований, видно, что выбрать подходящий
параметр оптимизации является залогом успеха при дальнейшем планировании,
поскольку выбор параметра оптимизации диктует вид математической модели
эксперимента.
1.4. Факторы и требования к ним.
После того как выбран проект исследования и определѐн параметр
оптимизации, необходимо определиться с величинами, которые могут влиять
на процесс. В «Планировании и организации эксперимента» эти величины
называются «факторами». Упущенный существенный фактор ведѐт к
абсолютно неправильным прогнозами модели эксперимента, а лишний
несущественный фактор только добавит хлопот при исследовании модели.
Обычно рекомендуется использовать при планировании не более 15 факторов,
9
если же их больше - выбирать наиболее значимые, оставляя менее
значительные факторы в стороне.
Фактор - измеряемая величина описывающая влияние на объект
исследования. Каждое значение принимаемое фактором, называется уровнем
фактора.
Требования, предъявляемые к факторам.
Требование № 1.
Факторы должны быть управляемыми, т. е. экспериментатор должен
иметь возможность, выбрать нужное значение фактора, поддерживать его
постоянным на протяжении всего эксперимента.
Требование № 2.
Фактор должен быть операциональным, т.е. можно указать
последовательность действий (операций), необходимых для задания того или
иного значения фактора.
Требование № 3.
Точность замера фактора должна быть как можно выше. Степень
точности определяется диапазоном изменения факторов.
Требование № 4.
Факторы должны быть однозначны, т. е. непосредственно влиять на
объект исследования. Трудно изменять фактор, который является функцией
других факторов.
При планировании эксперимента редко рассматривается один фактор,
обычно берѐтся в рассмотрение сразу несколько факторов. Поэтому возникает
необходимость формулировать требования предъявляемые к совокупности
факторов.
Требование № 1.
Прежде всего факторы должны быть совместимы. Совместимость
факторов означает, что все их комбинации осуществимы и безопасны.
Несовместимость факторов может наблюдаться на границах областей их
определения. Избавиться от несовместимости можно, если в каждой области
брать подобласть несколько меньшего размера. Положение усложняется, если
несовместимость наблюдается внутри областей определения факторов. В этом
случае приходится производить разбиение областей определения на несколько
10
подобластей. «вырезая» кусок несовместимости, и ставить несколько планов
экспериментов.
Требование № 2.
При планировании также важна независимость факторов, т. е.
возможность установления факторов на каком-либо уровне вне зависимости от
значений уровней других факторов. Иначе это требование называют
требованием отсутствия корреляции между факторами. Если между факторами
наблюдается зависимость среднего или высокого уровня, один из двух
факторов не принимают в рассмотрение.
1.5. Выбор модели эксперимента
Нередко при построении модели приходиться принимать решение о
выборе самого объекта, а именно, какие его характеристики и поведенческие
функции следует учитывать, а какие не вписываются в рамки поставленной
задачи. В планировании эксперимента любого исследователя, прежде всего
интересует как поведѐт себя система, если на неѐ подействовать определѐнным
образом. При этом ни одного из экспериментаторов абсолютно не интересует,
что при этом «чувствует» сама система. Модели подобного рода, когда
рассматривается только влияние на объект и его ответ на это влияние без учета
внутренних процессов объекта, часто представляются так называемым черным
ящиком.
Как же найти те оптимальные условия эксперимента, которые нас
интересуют? Причѐм было бы неплохо, если бы этот поиск не требовал особых
затрат. В этом случае мы прибегаем к математической модели эксперимента, с
помощью которой можно предсказывать отклик системы в тех состояниях,
которые экспериментально не изучались. В этом случае появляется
возможность прогнозирования результатов эксперимента в точках, являющихся
оптимальными в рамках поставленной задачи. И здесь мы переходим к
пошаговому принципу.
Однако, прежде, чем приступить к моделированию, необходимо
определиться с основными требованиями к поверхности отклика, на основе
которой мы и собираемся делать прогнозы.
Требование № 1.
11
Непрерывность поверхности - если в какой-либо точке факторного
пространства функция отклика терпит разрыв, нет никакой гарантии, что при
реальном осуществлении эксперимента данное состояние, либо вообще
невозможно, либо привлечѐт к фатальным последствиям. При выборе большого
шага перебора уровней факторов можно просто не заметить этот разрыв,
«перешагнув» через него, однако вероятность попадания в эту критическую
область на практике довольно-таки велика, и результат будет самым
непредсказуемым.
Требование № 2.
Гладкость поверхности отклика (соображения те же, что и в предыдущем
пункте).
Требование № 3.
Наличие единственного оптимума. Данное требование, пожалуй, одно из
самых важных. При планировании эксперимента поиск оптимума может
вестись в разных направлениях - и вправо, и влево. Если оптимумов несколько,
да они и неравномерны, нет никакой гарантии, что наткнувшись на один из них,
мы посчитаем данный оптимум именно тем решением, который мы ищем, в то
время, как это предположение неверно. Если же оптимум будет единственным,
неважно с какой стороны мы будем к нему приближаться.
1.6. Принятие решения перед планированием
Подытоживая все выше сказанное, отмечу, что прежде чем заниматься
планированием эксперимента, необходимо определиться с некоторыми
вопросами.
1.
Во-первых, следует точно определиться с понятием объекта
исследования, дав ему точное формальное определение.
2.
Во-вторых, прежде чем приступить к эксперименту,
необходимо однозначно и непротиворечиво сформулировать
цель эксперимента, определиться с параметрами оптимизации.
Параметр оптимизации должен быть единственным, хотя он и
может принимать различные значения.
3.
В-третьих, необходимо определиться с факторами, влияющими
на ход эксперимента и с тем, какие значения принимают эти
факторы. Влияющих факторов, вообще говоря, может быть
12
сколько угодно, при этом каждый из них может принимать
бесконечное число значений. Однако не следует забывать, что в
зависимости от числа факторов и их уровней катастрофически
растѐт и число экспериментов. Выбирая, скажем, порядка
двадцати факторов, каждый из которых имеет, например, по два
уровня, мы можем обречь себя на долгие годы «мучений».
4.
В-четвѐртых, необходимо озадачитьс поиском области
проведения эксперимента. И здесь должны учитываться
следующие соображения.
а) прежде всего, необходимо оценить границы областей определения
факторов. При выборе границ учитываются ограничения нескольких типов:
принципиальные
ограничения;
технико-экономические
ограничения;
конкретные условия проведения процесса (наиболее часто встречающийся тип
ограничений).
Таким образом, выбор экспериментальной области факторного
пространства связан с тщательным анализом априорной информации.
б) на втором этапе необходимо найти локальную область для
планирования эксперимента. Данная процедура включает в себя два этапа:
выбор основного условия; выбор интервалов варьирования.
Интервалом варьирования факторов называется некоторое число (свое
для каждого фактора), прибавление которого к основному уровню дает верхний
уровень, а вычитание - нижний уровень.
5.
И, наконец, необходимо помнить, что для грамотного
исследователя является главной целью не поиск материальных
благ, приобретаемых при оптимизации процесса, а построение
математической
модели
объекта
исследования,
представляющей
собой
математическое
уравнение,
связывающее параметр оптимизации и факторы, т.е. функции
отклика. Наличие функции отклика «под рукой» поможет в
дальнейшем решать новые задачи с наименьшими затратами по
исследованию объекта.
13
ЛЕКЦИЯ 2.
Статистическая проверка статистических гипотез.
2.1. Статистические гипотезы.
2.2. Виды ошибок при выдвижении статистических гипотез.
2.3. Статистические критерии.
2.4. Виды критериев согласия и области их применения
2.1. Статистические гипотезы
Гипотеза – это научно обоснованное высказывание вероятностного
характера о сущности изучаемых явлений действительности. Гипотеза - это
всегда утверждение.
Если гипотеза подтвердилась, то ее принимают, если не подтвердилась,
то отвергают. Принятая гипотеза может в последующем при соответствующих
дополнительных доказательствах ее жизнеспособности и плодотворности
преобразоваться в теорию. Выдвинутая до эмпирического исследования
гипотеза обычно называется исследовательской или рабочей. Рабочая гипотеза
дает первый, предварительный проект решения проблемы.
В зависимости от логического пути развития гипотезы различают:
гипотезы индуктивные и дедуктивные. Первые рождаются из наблюдения за
отдельными фактами, вторые – выводятся из уже известных отношений или
теорий.
В математической статистике различают нулевую и альтернативную
(т.е. исследовательскую) гипотезы.
Нулевая гипотеза (нуль гипотеза)— гипотеза, подлежащая проверке,
гипотеза, которая проверяется на согласованность с имеющимися
выборочными (эмпирическими) данными.
Альтернативная гипотеза – каждая допустимая гипотеза, отличная от
нулевой.
Нулевую гипотезу обозначают Н0, альтернативную – Н1.
В формализованном виде данные гипотезы примут следующий вид:
Н0 : μ = μ0
Н1 : μ ≠ μ0
где μ – неизвестное среднее значение генеральной совокупности (которое
нас интересует); μ0 – заданное значение, в отношении которого проверяют
14
гипотезу; Х – среднее значение выборки (случайная величина), которое
представляет μ.
Нулевая и исследовательская гипотезы взаимно исключают друг друга.
Доказывать необходимо именно исследовательскую гипотезу, при этом, если
доказательств окажется недостаточно, то принимается нулевая гипотеза. В
процессе принятия- отвержения гипотез возможны ошибки двух родов.
Ошибка первого рода состоит в том, нулевая гипотеза отвергается, то
есть принимается гипотеза Н1 , в то время как в действительности верна
гипотеза Н0 .Т.е. ошибка первого рода: мы отклоняем гипотезу, когда она
выполняется.
Ошибка второго рода состоит в том, что принимается гипотеза Н0 , а в
действительности верна гипотеза Н1. Т.е. ошибка второго рода: мы принимаем
гипотезу, когда она не выполняется.
Для любой заданной критической области будем обозначать через
 вероятность ошибки первого рода, а через  - вероятность ошибки второго
рода. Следовательно, можно сказать, что при большом количестве выборок
доля ложных заключений равна  , если верна гипотеза Н0 , и  , если верна
гипотеза Н1. При фиксированном объѐме выборки выбор критической области
W позволяет сделать как угодно малой либо  , либо  .
Часто в качестве нулевой гипотезы Н0 выступают гипотезы об отсутствии
взаимосвязи или корреляции между исследуемыми переменными, об
отсутствии различий (однородности) в распределениях (параметрах
распределений) двух и/или более выборках. Поэтому статистическая
гипотеза – любое предположение, касающееся неизвестного распределения
случайных величин (элементов).
Примеры формулировки нескольких статистических гипотез:
1.
Результаты наблюдений имеют нормальное распределение с
нулевым математическим ожиданием.
2.
Результаты наблюдений имеют функцию распределения N(0,1).
3.
Результаты наблюдений имеют нормальное распределение.
4.
Результаты наблюдений в двух независимых выборках имеют одно
и то же нормальное распределение.
5.
Результаты наблюдений в двух независимых выборках имеют одно
и то же распределение.
15
В стандартном научном подходе проверки гипотез исследователь
пытается показать несостоятельность нулевой гипотезы, несогласованность еѐ с
имеющимися опытными данными, то есть отвергнуть гипотезу. При этом
подразумевается, что должна быть принята другая, альтернативная
(конкурирующая), исключающая нулевую, гипотеза.
Этапы проверки гипотезыН0.
1. Формулируется проверяемая гипотеза Н0
2. Выбирается критерий проверки X. Критерий – это величина, закон
распределения которой при условии справедливости проверяемой гипотезы
известен.
3. Выбирается уровень значимости и критическая область Q, так, чтобы
условная вероятность попадания критерия в Q при условии справедливости
гипотезы равнялась .
4. Выполняем эксперимент и находим экспериментальное значение
критерия Х.
5. Если критерий X не попадает в критическую область Q, гипотеза
принимается, если X Q – то отвергается.
Выбор критической области должен производиться с учетом смысла
гипотезы; следует учитывать, что если Х попадает в критическую область, то
гипотеза будет отвергнута
Методы проверки гипотез
Существует два различных метода проверки гипотез. Первый – метод
доверительных интервалов. Второй метод носит название t-тест, который
более распространен на практике, и основан на расчете t-статистики.
Проверка гипотезы заключается в сравнении двух известных величин Х и
μ0 ,
где μ – неизвестное среднее значение генеральной совокупности (которое
нас интересует);
μ0 – заданное значение, в отношении которого проверяют гипотезу;
Х – среднее значение выборки (случайная величина), которое
представляет μ.
16
Если эти значения Х и μ0 «достаточно близки» между собой (Х = μ0), то
принимается нулевая гипотеза. Если значения «сильно отличаются» друг от
друга (Х ≠ μ0), то принимается альтернативная гипотеза. «Близость» значений
определяется на основе значения стандартной ошибкой Sx.
Метод «доверительных интервалов» заключается в построении
диапазона значений на 95% уровне достоверности (см. таблицу ниже):
X - t*SХ ≤µ≤ X + t*SХ
Для среднего
Для доли
признака
Стандартная
ошибка среднего
Стандартная
ошибка доли
ρ - t*Sр ≤π ≤ ρ + t*Sр
SХ =
Sр=

n
р(1 - р)
n
σ – ст. отклонение
n - объем выборки
ρ - доля изучаемого
признака
Если значениеμ0 находится за пределами доверительного интервала, то
оно не может рассматриваться как возможное значение, т.е. равенство μ = μ0
не выполняется. Соответственно, выполняется условие
μ ≠ μ0 , т.е.
доказывается альтернативная гипотеза. В таком случае делается вывод о том,
что нулевая гипотеза отклоняется и принимается альтернативная гипотеза на
уровне достоверности 95%.
Метод «t – тест» заключается в расчете критерия Стьдента или t –
статистики, сравнении ее с табличным значением и формулировкой вывода.
Коэффициент Стьюдента или t-статистику предложил В.С. Госсет (см.
таблицу ниже):
17
Для среднего
t
Для доли признака
t
X 
Sx
 
S
Для сравнения с табличным значением используется абсолютное
значение t, т.е. «по модулю».
Критерий Стьюдента или t - статистика показывает на сколько
стандартных ошибок отличаются между собой средние значения по выборке
(Х) и генеральной совокупности (μ). Поскольку при 95% уровне достоверности
значение t =1,96, то существует эмпирическое правило, что «приt>2 нулевая
гипотеза отклоняется».
Считается, что результат проверки является статистически значимым,
если альтернативная гипотеза принимается на уровне 5%. Для описания
полученных результатов обычно пользуются следующими терминами:
Незначимый
Значимый
Высоко значимый
Очень
высоко
значимый
Отсутствие значимости на уровне 5%
Значимость на уровне 5%
Значимость на уровне 1%
Значимость на уровне 0,01%
При расчетах в Excel программа выводит р-значение, которое показывает
вероятность того, что данные соответствуют нулевой гипотезе. Обычно Н0
отклоняют, если р < 0,05. Другими словами, вероятность того, что нулевая
гипотеза истинна, не превышает 5% (что является статистически значимым).
Сравнение двух независимых выборок с применением t- критерия
Для двух несвязанных выборок(наблюдения не относятся к одной и той
же группе объектов ) возможны два варианта расчета:

когда дисперсии известны

когда дисперсии неизвестны, но равны друг другу.
18
1.
Предварительно проверяется нормальность закона распределения
по одному из критериев согласия.
2.
Рассчитывается средне арифметические значения X и Y для каждой
выборки по формуле
1 n
X   xi
n i 1
где xi – значение i-го результата наблюдения.
3.
Рассчитывается t эмп - эмпирическое значение критерия Стьюдента:
t
X Y
Sd
2
2
где S d  S x  S y , здесь S x 2 и S y 2 – оценки дисперсий.
Равночисленные выборки . В этом случае n1  n2  n
 x
S d  S x2  S y2 
 x    yi  y 
2
i
2
n  1n
В случае на равночисленных выборок n1  n2 , выражение
Sd  S  S 
2
x
2
y
 x
 x    yi  y  n1  n2
n1  n2  2
n1 n2
2
2
i
В обоих случаев подсчет числа степеней свободы осуществляется по
формулам
  df  (n1  1)  (n2  1)  n1  n2  2
При численном равенстве выборок   2n  2
4.
Эмпирическое значение t'эмп критерия Стьюдента сравнивается с
критическим значением t 'кр (по таблице 1 приложения) для данного числа
степеней свободы.
Нулевая гипотеза H 0 при заданном уровне значимости
если эмпирическое значение t 'эмп .  t кр .
19
 принимается,
Сравнение двух зависимых выборок с применением t- критерия
Под связанными выборками понимаются наблюдения для одной группы
объектов, причем все наблюдения попарно связаны с каждый объектом
исследования и характеризуют его состояние до воздействия и после
воздействия некоторого фактора.
Гипотезы
H 0 : среднее значение в выборке не отличается от нуля.
H 1 : среднее значение в выборке отличается от нуля.
Данные в выборке измерены по шкале интервалов или по шкале
отношений. Сравниваемых выборок две для оной группы объектов
наблюдения, причем имеет место парность наблюдений в выборках.
1.
Предварительно проверяется нормальность закона распределения
по одному из критериев согласия.
2.
Рассчитывается  i  xi  yi (i=1..n) – попарные разности вариант, xi и
y i результаты измерений для i-го объекта до и после воздействия некоторого
фактора. Величину  i будем считать независимой для разных объектов и
нормально распределенной
3.
Рассчитываются (лучше в табличной форме): сумма попарных
разностей
n

i 1
4.
i
2
n

и вспомогательные параметры
i 1
2
i
 n

и   i  .
 i 1 
Рассчитывается t ýěď - эмпирическое значение критерия   (n  1)
степенями свободы по формуле
n
t

i 1
n
i
n
n   i  (  i ) 2
2
i 1
i 1
n 1
где n – численность выборки.
5.Найденное
эмпирическое
значение
t 'эмп
критерия
Стьюдента
сравнивается с критическим значением t 'кр (по таблице 1 приложения) для
данного числа степеней свободы.
Нулевая гипотеза H 0 при заданном уровне значимости  принимается,
если эмпирическое значение t 'ýěď .  t ęđ .
20
Лекция № 3
Корреляционный и регрессионный анализ
Одна из наиболее распространенных задач статистического исследования
состоит в изучении связи между выборками. Обычно связь между выборками
носит не функциональный, а вероятностный (или стохастический) характер. В
этом случае нет строгой, однозначной зависимости между величинами. При
изучении стохастических зависимостей различают корреляцию и регрессию.
Понятия регрессии и корреляции непосредственно связаны между собой, но
при этом существует четкое различие между ними. В корреляционном анализе
оценивается сила стохастической связи, в регрессионном анализе ее формы.
Рассмотрим случай двух случайных переменных Y и X . В силу
неоднозначности статистической зависимости между Y и X , представляет
интерес усредненная по X схема зависимости, т.е. закономерность в измерении
условного математического ожидания M x Y  в зависимости x . Соответственно:
x - независимая переменная, объясняющая, входная, предсказывающая,
экзогенная, фактор, регрессор, факторный признак;
y - зависимая переменная, функция отклика, объясняемая, выходная,
результирующая, эндогенная переменная, результативный признак.
Таким образом, определяется зависимость случайной переменной Y от
независимой переменной X .
M x Y   f x 
Корреляционный анализ
Корреляционный анализ - метод, позволяющий обнаружить зависимость
между несколькими случайными величинами.
Корреляция — статистическая взаимосвязь двух или нескольких
случайных величин (либо величин, которые можно с некоторой допустимой
степенью точности считать таковыми). При этом изменения одной или
нескольких из этих величин приводят к систематическому изменению другой
или других величин. Мерой корреляции двух случайных величин служит
коэффициент корреляцииR.
21
Корреляционной зависимостью между двумя переменными называется
функциональная зависимость между значениями одной и средним значением
другой (условным математическим ожиданием),
M x Y   f x 
Это уравнение называется уравнением регрессии (или функцией
регрессии, а еѐ график – линией регрессии).
Для точного описания уравнения регрессии необходимо знать условный
закон распределения переменной Y при условии, что переменная X примет
значение x , X  x .
В статистической практике такой информации получить не удается, т.к.
обычно имеется выборка пар значений xi , yi  объема n .
В этом случае речь может идти о приближенном выражении,
аппроксимации по выборке функции регрессии. Такой оценкой является
выборочная линия (кривая) регрессии
^

y  f x, a, b1 , , b p

^
где y - условная средняя переменной Y при фиксированном значении
X  x,
a, b1 , , b p - параметры кривой.
При n  
регрессии f x  .
функция f x, a, b1 , , bp  должна сходиться с функции


f x, a, b1 , , b p  f ( x)
n
Поэтому регрессионная модель имеет вид:
Y  f x   
где Y - наблюдаемое значение зависимой переменной, f x  - объясненная
часть (подбираемая зависимость между Yи x), зависящая от значений
объясняющих переменных,  - случайная составляющая.
В многомерном случае, когда х – вектор, x j , где j  1, p - могут считаться
как случайными, так и детерминированными.


Y  f x1 , , x p   .
Чтобы получить достаточно достоверные и информативные данные о
распределении какой-либо случайной величины, необходимо иметь выборку еѐ
22
наблюдений достаточно большого объема. Такие выборки представляют собой
наборы значений
x , x
i1
где i  1, n - число наблюдений,
Рассмотрим
i2
p
, , xip ; yi  ,
- количество объясняющих переменных.
p  1 , т.е. парную регрессию – уравнение связи двух
переменных x, y  .
Различают линейные и нелинейные регрессии. Нелинейные регрессии
делят на два класса: регрессии, нелинейные относительно включенных
объясняющих переменных, но линейных по оцениваемым параметрам, и,
регрессии, нелинейные по оцениваемым параметрам.
Линейная: y  a  bx   ,
a  bx  f x .
Нелинейные по объясняющим параметрам:
y  a  b1 x  b2 x 2    bk x k   ,
b
x
Регрессии, нелинейные по оцениваемым параметрам:
Степенная: y  ax b  
y a
Показательная: y  ab x  
Экспоненциальная: y  ea bx  
Логарифмическая: ln y  a  b ln x  
Полулогарифмическая: y  a  b ln x  
y  a  bx c  
Обратная: y 
1

a  bx
Если у нас есть набор значений двух переменных xi и yi , i  1, n то на
плоскости XY эти значения можно отобразить точками, таким образом
получаем поле корреляции, которое изображено на рис. 1.
23
yi
  отклонение yi
от f  x 
xi
Рисунок 2. Поле корреляции
Предположим, что нашей задачей является подобрать (подогнать)
функцию f x  из параметрического семейства функций f x, a, b , наилучшим
способом описывающую зависимость y от x.
Подобрать функцию – это два шага:
1 шаг: спецификация модели
2 шаг: выбрать наилучшие значения параметров a и b .
При выполнении регрессионного анализа в качестве меры отклонения
определяемой функции f x, a, b от набора наблюдений можно вычислять:
n
1. g    yi  f xi , a, b  - метод наименьших квадратов;
2
i 1
2. g 
n
 y i  f  xi , a , b 
i 1
- метод наименьших модулей;
n
3. в общем случае: g   F  yi  f xi , a, b  ,
i 1
где F - мера, с которой отклонение yi  f xi , a, b входит в функционал
g.
Таким образом, понятие корреляции дает возможность судить о том
насколько тесно экспериментальные точки ложатся на прямую линию (линию
регрессии). Если регрессия определяет предполагаемое соотношение между
переменными, то корреляция показывает, насколько хорошо это соотношение
отражает действительность. Количественно тесноту связи между переменными
случайными величинами оценивают коэффициентом корреляции r.
24
Коэффициент корреляции — параметр, который характеризует степень
линейной взаимосвязи между двумя выборками, для парной регрессии
рассчитывается по формуле:
rxy 
( x  x ) ( y  y )
( x  x )  ( y  y )
i
i
2
i
2
i
Рассмотрим взаимосвязь коэффициента корреляции и дисперсии для
линейной многофакторной зависимости
y = b0+ b1x1+ b2x2+ ... + bnxn
полная изменчивость параметра y около среднего значения (дисперсия
S2 ) складывается из двух частей:
1.
,R2 обусловленной
линейное уравнение
изменением
переменных,
входящих
в
2.
Остатка
=(1 – R2) который не зависит от переменных xi, а
определяется действием неучтенных факторов.
Таким образом, коэффициент корреляции rхарактеризует долю полной
изменчивости (полной дисперсии) параметра у, которая вызвана действием
контролируемых переменных xi .
Чем больше r, тем теснее корреляционная связь, тем сильнее найденная
зависимость проявляется среди многообразных, случайных воздействий, тем
точнее по данным значениям xi можно предсказать значение у.
Свойства коэффициента корреляции:
1)  1  r  1 , т.к. covx, y    x y ;
2) при r  1 , корреляционная связь представляет линейную
функциональную зависимость. При этом все наблюдаемые значения
располагаются на прямой (рис.)
25
3) при r  0 линейная связь отсутствует (рис.), при этом близость к нулю
не означает отсутствия связи между признаками, она может оказаться
достаточно тесной.
Рисунок 2. Отсутствие связи
В случае парной регрессии для практических расчетов наиболее удобная
формула:
r
xy  x  y
 x y
n
n
n
i 1
i 1
i 1
n  xi y i   xi  y i

n
n
i 1
2
xi2
n
 n 
 n 
   xi   n yi2    yi 
i 1
 i 1 
 i 1 
2
т.к. по этой формуле r находится непосредственно из данных
наблюдений, и на значении r не скажутся округление данных, связанные с
расчетом средних и отклонений от них.
Задачи регрессионного анализа
С помощью уравнения регрессии y=ƒ(x1,x2,…xħ), , можно измерить
влияние отдельных факторов на зависимую переменную, что делает анализ
конкретным, существенно повышает его познавательную ценность, уравнения
регрессии также применяются в прогнозных работах.
Построение уравнения регрессии предполагает решение двух основных
задач. Первая задача заключается в выборе независимых переменных,
оказывающих существенное влияние на зависимую величину, атакже в
определении
вида
уравнения
регрессии.
Вторая задача построения уравнения регрессии – оценивание параметров
(коэффициентов) уравнения. В связи с тем, что оценки параметров уравнения
являются выборочными характеристиками, в процессе оценивания необходимо
проводить статистическую проверку существенности полученных параметров.
26
Метод наименьших квадратов
При оценке параметров уравнения регрессии применяется метод
наименьших квадратов (МНК). Смотрим применение МНК на примере
однофакторной линейной регрессии y  a  bx .
Согласно МНК поиск наилучшей аппроксимации набора наблюдений
линейной функцией сводится к минимизации функционала
n
g    yi  a  bxi  .
2
i 1
Необходимые условия экстремума:
n
g
 2  yi  a  bxi   0 ,
a
i 1
n
g
 2  yi  a  bxi xi  0 ,
b
i 1
или
n
 y
i 1
i
 a  bxi   0
i
 a  bxi xi  0
n
 y
i 1
Введем обозначения:
1 n 2
1 n
1 n
2
1 n
x   xi , y   yi , xy   xi yi , x   xi .
n i 1
n i 1
n i 1
n i 1
Обозначения:
_2
выборочной дисперсии переменной
2
x:  x
x x ;
выборочной дисперсии переменной
2
y:  y
y y ;
выборочной ковариации
2
2
_2
covx, y   yx  y  x .
В новых обозначениях система определения a и b принимает вид:
27


 x
2
a x  b x  xy 

a  bx  y
Тогда
b
x  y  xy
_2
x x

covx, y 
 x2
2
,
a  y  bx ,
при x  0 a  y , если x  0 , то указанная трактовка a не имеет смысла и,
соответственно, может не иметь экономического содержания.
Из уравнения y  a  b x для определения параметра a следует, что
 
уравнение прямой y  a  bx проходит через точку x, y .
При выполнении линейного регрессионного анализа делаются
определенные предпосылки относительно случайной составляющей 
y  a  b1 x1    b p x p   ,
где  - ненаблюдаемая величина (остаток регрессии).
После того, как произведена оценка параметров модели, рассчитывая
разности фактических и теоретических значений y , можно определить оценки
случайной составляющей
y  yтеор .
Поскольку они не являются реальными
случайными остатками, их можно считать некоторой выборочной реализацией
неизвестного остатка заданного уравнения, т.е.  i . При изменении
спецификации модели, добавлении в неѐ новых наблюдений, выборочные
оценки остатков  i могут меняться. Поэтому в задачу регрессионного анализа
входит не только построение самой модели, но и исследование случайных
отклонений  i , т.е. остатков.
До сих пор мы останавливались на формальных проверках
статистической достоверности коэффициентов регрессии и корреляции с
помощью t - критерия Стьюдента, F - критерия Фишера. Оценки параметров
регрессии должны отвечать определенным критериям. Они должны быть
несмещенными, состоятельными и эффективными.
28
Несмещенность оценки означает, что математическое ожидание
остатков равно нулю. Следовательно, при большом числе выборочных
оценивании, остатки не будут накапливаться и найденный параметр b можно
рассматривать как среднее значение из возможного большого числа
несмещенных оценок.
Эффективность оценки – оценки, характеризующиеся наименьшей
дисперсией.
Состоятельность оценок характеризует увеличение их точности с
увеличением выборки.
Указанные критерии должны учитываться при разных способах
оценивания. МНК строит оценки регрессии на основе минимизации суммы
квадратов остатков. Поэтому очень важно исследовать поведение остатков
регрессии  i .
Исследования остатков  i предполагают проверку наличия следующих
предпосылок МНК (т.е. предполагается получение несмещенных эффективных
и состоятельных оценок):
1.
случайный характер остатков
2.
нулевая средняя величина  i , не зависящая от xi
3.
гомоскедастичность – дисперсия каждого  i одинакова для всех
значений x
4.
отсутствие
автокорреляции
остатков.
Значения
остатков
i
распределены независимо друг от друга.
5.
остатки подчиняются нормальному распределению.
Оценка значимости уравнения регрессии
Проверить значимость уравнения регрессии - значит установить,
соответствует ли математическая модель, выражающая зависимость между
переменными, экспериментальным данным и достаточно ли включенных в
уравнение объясняющих переменных (одной или нескольких) для описания
зависимой переменной.
Проверка значимости уравнения регрессии производится на основе
дисперсионного анализа.
^
Обозначим через y  a  bx - теоретически вычисляемые по формуле
значения, тогда
29
^  ^


yi  y  yi  y  y i  y i   yi  y i    y i  y 

 

Введем обозначения:

TSS (totalsumofsguares) – вся дисперсия: сумма квадратов
отклонений от среднего.

RSS (regressionsumofsguares) – объясненная часть всей
дисперсии (обусловленная
регрессией), факторная, объясненная дисперсия.

ESS (errorsumofsguares) – остаточная сумма, дисперсия
остаточная.
^
^
2
Коэффициентом детерминации R , или долей объясненной дисперсии
называется
R2  1 
ESS RSS

.
TSS TSS
В силу определения R 2 : 0  R 2  1 .
Если R 2  0 , то это означает, что регрессия ничего не дает, т.е. xi не
^
улучшает качество предсказания y i , по сравнению с тривиальным y i  y .
Если R 2  1, то xi , yi  лежат на линии регрессии и между x и y существует
линейная функциональная зависимость, т.е. абсолютно точное совпадение:
^
y i  yi .
Соответственно коэффициент линейной регрессии (как парной так и
множественной)
^


y

y


i
i
RSS

 1  i 1n 
2
TSS
 yi  y
n
Rxy 


2
.
i 1
Использование F-критерия
С помощью F-критерия можно оценить качество построенной
функции y  a  bx .
Разделив каждую сумму квадратов на соответствующее ей число
степеней свободы, получим средний квадрат отклонений, или, что тоже самое,
дисперсию на одну степень свободы D
30
TSS
RSS
ESS
 Dобщ ,
 Dфакт ,
 Dостат. .
n 1
1
n2
Это приводит дисперсии к сравнимому виду. Сопоставляя факторную и
остаточные дисперсии в расчете на одну степень свободы, получим величину F
- отношения (F- критерия):
Dфакт
F
Dостат
,
где F- критерий для проверки нулевой гипотезы H 0 : Dфакт  Dост .
Если нулевая гипотеза справедлива, то Dфакт и Dост не отличаются друг
от друга. Для H 0 необходимо опровержение, то есть, чтобы факторная
дисперсия превышала остаточную в несколько раз.
Использование критерия Стьюдента
С помощью t-критерия также можно оценить качество построенной
функции y  a  bx .
Производится выборка объема n и вычисляется выборочный
коэффициент корреляции r. За статистический критерий принимается
случайная величина
t
r n2
1 r2
которая распределена по закону Стьюдента с n – 2 степенями свободы.
Отметим сначала, что все возможные значения выборочного
коэффициента корреляции r лежат в промежутке [–1;1]. Очевидно, что
относительно большие отклонения в любую сторону значений t от нуля
получаются при относительно больших, то есть близких к 1, значениях модуля
r. Близкие к 1 значения модуля r противоречат гипотезе H0, поэтому здесь
естественно рассматривать двустороннюю критическую область для критерия t.
По уровню значимости  и по числу степеней свободы n – 2 находим из
таблицы распределения Стьюдента значение tкр. Если модуль выборочного
значения критерия tв превосходит tкр, то гипотеза H0 отвергается и выборочный
коэффициент корреляции считается статистически значимым. В противном
случае, то есть если tв < tкр и принимается гипотеза H0, выборочный
коэффициент корреляции считается статистически незначимым.
31
Библиографический список
Основная литература
1. Коваленко Н. А. Научные исследования и решение инженерных задач в
сфере автомобильного транспорта [Электронный ресурс] : учебное пособие / Н. А.
Коваленко. - Минск ; М. : ИНФРА-М, 2013. - 271 с. - ЭБС «Знаниум».
Дополнительная литература
2. Климова, Г. Н. Планирование и организация эксперимента [Текст]:
методические указания к практическим занятиям по направлению подготовки
магистра 190700.68 - Технология транспортных процессов / Г. Н. Климова, А. В.
Кононова, В. П. Белокуров, Р. А. Кораблев; Министерство образования и науки РФ,
ФГБОУ ВПО «ВГЛТА». – Воронеж, 2014. – 31 с.
3. Климова, Г. Н. Планирование и организация эксперимента [Текст]:
методические указания к самостоятельной работе по направлению подготовки
магистра 190700.68 - Технология транспортных процессов / Г. Н. Климова, А. В.
Кононова, Г. А. Денисов, Н. И. Злобина; Министерство образования и науки РФ,
ФГБОУ ВПО «ВГЛТА». – Воронеж, 2014. – 97 с.
4. Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента
при поиске оптимальных условий. –М.: Наука, 1971.
5. Едронова В. Н., Малафеева М. В. Общая теория статистики [Электронный
ресурс] : учебник. - 2-е изд., перераб. и доп. - М. : Магистр, 2010. - 606 с. - ЭБС
«Знаниум».
6. Кожухар В. М. Основы научных исследований [Электронный ресурс]:
Учебное пособие / В. М. Кожухар. - М.: Издательско-торговая корпорация «Дашков
и К'», 2013, - 216 с. - ЭБС «Знаниум».
7. Автотранспортное предприятие [Текст] : отраслевой ежемес. науч.-произв.
журнал для работников автотранспорта / Минтранс России. - М. : НПП
«Транснавигация» Минтранс России. 2002 -.
32
Учебное издание
Галина Николаевна Климова
ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА
Тексты лекций
Редактор Е.А. Богданова
Подписано в печать
2014. Формат
Усл. печ. л. . Уч.-изд. л. . Тираж
. Объем п. л.
экз. Заказ
ФГБОУ ВПО «Воронежская государственная лесотехническая академия»
РИО ФГБОУ ВПО ВГЛТА. 394087, г. Воронеж, ул. Тимирязева, 8
Отпечатано в УОП ФГБОУ ВПО «ВГЛТА»
394087, г. Воронеж, ул. Докучаева, 10
33
Документ
Категория
Без категории
Просмотров
11
Размер файла
625 Кб
Теги
климово, планирование, эксперимент, организации, текст
1/--страниц
Пожаловаться на содержимое документа