close

Вход

Забыли?

вход по аккаунту

?

mu bystrstatanaliz 2016

код для вставкиСкачать
Министерство образования и науки Российской Федерации
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ПРОМЫШЛЕННЫХ ТЕХНОЛОГИЙ И ДИЗАЙНА»
БЫСТРЫЕ МЕТОДЫ
СТАТИСТИЧЕСКОГО АНАЛИЗА
Методические указания к проведению лабораторных занятий
для студентов направления подготовки
15.04.02 – Технологические машины и оборудование
Составители:
Н. А. Гренишина
Л. С. Мазин
Санкт-Петербург
2016
Утверждено
на заседании кафедры
10.12.2015 г., протокол № 9
Рецензент В. П. Соколов
Методические указания предназначены для обучения студентов быстрым
методам
статистического
анализа
результатов
экспериментальных
исследований. Тематика работ совпадает с основными разделами лекционного
курса и дополняет их. В указаниях представлены пять работ, посвященных
оценке точечных и интервальных характеристик случайных величин,
определению их дисперсий, анализу корреляционных зависимостей между
экспериментальными данными.
В приложении предложены варианты самостоятельных заданий для
каждого студента.
Оригинал-макет подготовлен составителями и издан в авторской редакции.
Подписано в печать 21.01.2016 г. Формат 60  841/16.
Усл. печ. л. 1,9.
Тираж 100 экз.
Печать трафаретная.
Заказ 54/16.
http://publish.sutd.ru
Отпечатано в типографии ФГБОУВО «СПбГУПТД»
191028, Санкт-Петербург, ул. Моховая, 26
ОГЛАВЛЕНИЕ
Введение .................................................................................................................. 4
Работа 1. Оценки точечных и интервальных характеристик случайных
величин .................................................................................................... 5
Работа 2. Обработка результатов экспериментов, не имеющих
количественных значений ..................................................................... 9
Работа 3. Сравнение средних значений экспериментальных данных ............. 12
Работа 4. Сравнение дисперсий экспериментальных данных .......................... 16
Работа 5. Корреляционная зависимость между экспериментальными
данными ................................................................................................. 18
Выводы ................................................................................................................ 22
Приложение А........................................................................................................ 23
3
ВВЕДЕНИЕ
Иногда говоря о быстрых методах анализа, думают о методах заведомо
нестрогих, связанных с более или менее произвольными допущениями. Однако
существует большое число весьма несложных по технике расчета и в то же
время достаточно строгих методов статистической обработки. Во многих
случаях они могут полностью заменить традиционные методы анализа
результатов экспериментальных исследований.
На первый взгляд в век широкого внедрения ЭВМ кажется, что экcпрессметоды становятся неактуальными, но это глубокое заблуждение. Многие из
высокоэффективных экспрессных методов требуют для выполнения расчета
меньше времени, чем ввод данных на ЭВМ, не говоря о случаях подготовки
специальных программ.
Некритическое применение ЭВМ внушает иногда студентам
своеобразные иллюзии объективности и точности, хотя нередко метод,
заложенный
в программу машинного расчета менее корректен, чем
экспрессный метод, избираемый и реализуемый самим исследователем.
В основу большинства экспрессных методов, излагаемых ниже,
положены либо оценки размаха варьирования, либо непараметрические
критерии.
Цели и задачи дисциплины
Сформировать компетенции обучающихся в области быстрых методов
статистического анализа для проведения эффективных экспериментальных
исследований.
Задачи:
– рассмотреть методы оценки точечных и интервальных характеристик
случайных величин;
– раскрыть принципы методов определения специальных характеристик и
функций;
– показать особенности экспресс-анализа результатов экспериментальных
исследований.
4
Работа 1. Оценки точечных и интервальных характеристик
случайных величин
1.1. Вычисление оценок математического
квадратического отклонения и коэффициент вариации
ожидания,
среднего
При отработке новых технологических процессов, изучения физических и
химических свойств различных веществ и других исследованиях для получения
достоверных результатов экспериментатор обычно делает n повторений
измерений одной и той же величины (например, какого-то показателя качества.
При этом результаты измерения представляют собой ряд величин
x1 ,....., xn ,
(1.1)
в общем случае отличных друг от друга.
По значениям (1.1) требуется судить об измеряемой величине. Однако
вполне возможен случай, когда некоторые (одна или две) из величин x резко
отличаются от остальных.
Существует обоснованный способ выявления выскакивающих значений
экспериментальных данных. Перед его применением следует расположить
xi , (i  1,...., n) по порядку их возрастания. При этом получается новый ряд:
z1,....., zn ,
у которого z1  xi min – наименьшее значение из (1.1), zn  xn max – наибольшее
значение из (1.1) zi  zi 1 .
Например,
x1  10,8 x2  11,5 x3  10,5 x4  10,7
ряд имеет вид
(1.2)
z1  10,5 z2  10,7 z3  10,8 z4  11,5 (n  4) .
Выявление выскакивающих экспериментальных данных основаны на
оценке различий крайних значений преобразованного ряда zi , (i  1,...., n) . В
этом случае, когда подозрение вызывает значение z n , подсчитывают отношение
z z
1  n n1 ;
(1.3)
zn  z1
если n  e и  n  1  e значения, то
z z
1  n n2 ;
(1.4)
zn  z1
если 1-у и 2-е значение, то
z z
1  3 1 и т. д.
zn  z1
Величины  i оцениваются с помощью пограничных значений
приведенных в табл. 1.1. Если неравенство (1.5) выполняется
5
 iпогр ,
 i   iпогр ,
(1.5)
то каждое подозреваемое как выскакивающее значение z s , таковым не
является. Под уровнем достоверности понимается вероятность, с которой
следует считать выполнение проверенного неравенства (в нашем (1.5))
справедливым. Уровень достоверности может быть произвольным, однако,
чаще всего в статистических таблицах он принимается равным 0,95 и 0,99.
Для примера (1.3) подозреваемым значением является z4  11,5 . Найдем
z  z 11,5  10,8
1  4 3 
 0,7 .
z4  z1 11,5  10,5
Т а б л и ц а 1.1. Критерии для исключения выскакивающих значений
Уровень достоверности
0,95
n
3
4
5
6
7
8
9
10
11
12
15
20
24
30
35
40
45
50
55
60
1погр
0,941
0,765
0,642
0,560
0,507
0,468
0,437
0,412
0,392
0,376
0,338
0,300
0,281
0,260
0,24
0,22
0,2
0,18
0,16
0,14
0,99
Пограничные значения
 2погр
1погр
1,000
0,988
0,967
0,889
0,845
0,780
0,736
0,698
0,661
0,637
0,607
0,590
0,565
0,555
0,531
0,527
0,504
0,502
0,481
0,482
0,430
0,438
0,372
0,391
0,347
0,367
0,322
0,341
0,3
0,28
0,26
0,24
0,2
0,18
 2погр
1,000
0,992
0,929
0,836
0,778
0,710
0,667
0,632
0,603
0,579
0,522
0,464
0,434
0,402
В табл. 1.1 для n  4 и уровня достоверности 0,99 указано пограничное
значение
1погр  0,889 .
6
Так как 1  1погр , взятого из табл. 1.1, то с уровнем достоверности 0,99
не имеем права считать z 4 выскакивающим значением. Если бы было 1  1погр ,
то значение z 4 следовало бы с уровнем достоверности 0,99 отбросить.
О значении измеряемой величины, судят после отбрасывания
выскакивающих значений, по оценке математического ожидания x или, что то
же самое, по среднему значению этой величины, вычисляемой по формуле
n1
x   xi n11 ,
(1.6)
i 1
где n1 – число членов ряда (1.1), оставшихся после отбрасывания
выскакивающих значений  n1  n  .
Величины xi , как правило, не равны x . Степень отличия xi (i  1,....., n) от
x , т. е. разброс результатов измерений может оцениваться средним
квадратическим отклонением  x , определяемым по формуле
n1
    xi  x   n1  1 .
2
x
2
1
(1.7)
i 1
При малом числе опытов n1  5  10 удобно для определения  x пользоваться
формулой
1
 x   zn  z1    dn1  ,
(1.8)
где z n и z1 – последнее и первое число статистического ряда (1.2) после
отбрасывания выскакивающих значений, dn1 – коэффициенты, зависящие от
числа членов n1 ряда (1.2), берутся из табл. 1.2.
Т а б л и ц а 1.2. Коэффициенты dn1
n1
dn1
2
1,13
3
1,69
4
2,06
5
2,33
6
2,53
7
2,70
8
2,85
9
2,95
10
3,08
Величина  x размерная, поэтому для сравнения разброса результатов
измерений различных показателей качества она мало удобна (невозможно
метры сравнивать, например, с килограммами). В этом случае часто пользуются
безразмерной величиной, называемой коэффициентом вариации.
V   x  x 1  100% .
(1.9)
Коэффициент вариации характеризует разброс результатов измерений по
отношению к оценке математического ожидания, измеряемой величины в
процентах.
Для примера (1.2) согласно (1.6) – (1.9) получим
10,8  11,5  10,5  10,7
x
 10,9 ;
4
7
10,8  10,9   11,5  10,9   10,7  10,9 
 
2
2
x
V
2
4 1
2
 0,19 ;
0,19
100 %  4 % .
10,9
1.2. Вычисление доверительного интервала
Следует иметь в виду, что оценка математического ожидания не является
истинным значением, т. к. может меняться от одной серии опытов к другой.
Математическое ожидание с заданным уровнем достоверности ограничено
сверху и снизу следующим образом:
x    m x  x   .
(1.10)
Величина  может быть определена из выражения
   xi max  xi min  k ,
(1.11)
где xi min и xi max – соответственно минимальные и максимальные значения
измеряемой величины x в ряде экспериментальных данных (например, данные
(1.1)) с учетом отбрасывания выскакивающих значений, согласно (1.4), (1.5);
k – коэффициент, который следует найти по табл. 1.3 для уровня
достоверности 0,99 или 0,95.
Для примера (1.2) с уровнем достоверности 0,99
  11,5  10,5   1,32  1,3 ,
9,6   xi   12,2 .
Таблица
1.3. Значения коэффициента k для расчета границ
доверительных интервалов оценок математического ожидания
Число
опытов
n
3
4
5
6
7
8
9
10
11
Число
опытов
n
12
13
14
15
16
17
18
19
20
Уровень доверительности
0,95
1,30
0,72
0,51
0,40
0,33
0,29
0,25
0,23
0,21
0,99
3,00
1,32
0,84
0,63
0,51
0,43
0,37
0,33
0,30
8
Уровень доверительности
0,95
0,19
0,18
0,13
0,16
0,15
0,14
0,14
0,13
0,13
0,99
0,28
0,26
0,24
0,22
0,21
0,20
0,19
0,18
0,17
Способ определения доверительных интервалов (1.11) отличается от
классического метода, основанного на критерии Стьюдента [1.2]. Однако он
дает более верные результаты при небольшом числе измерений, так как в нем
имеется некоторая перестраховка по отношению к классическому методу.
Задание к лабораторной работе 1
По
данным
результатов
экспериментальных
исследований
экспериментальных данных, приведенных в приложении А:
1) определить наличие выскакивающих значений экспериментальных
данных;
2)
вычислить
оценки
математического
ожидания,
среднего
квадратического отклонения и коэффициента вариации;
3) рассчитать доверительный интервал и математическое ожидание
исследуемой величины с его учетом.
Работа 2. Обработка результатов экспериментов, не имеющих
количественных значений
Определение
оценок
математического
ожидания,
среднего
квадратического отклонения измеряемой величины возможны в тех случаях,
когда имеются количественные результаты экспериментов. Однако иногда
результаты экспериментов могут носить качественный характер, часто в виде:
норма (=) больше нормы (+), меньше нормы (–). В этих случаях результаты
экспериментов для их последующего анализа удобно представлять в виде табл.
2.1.
Т а б л и ц а 2.1. Результаты анализов
Номер опыта
Оценка результатов по
отношению к норме x
–
+
=
=
…..
+
1
2
3
4
…..
f
Например, при оценке качества окраски ткани имеется прием,
называемый приемом ткани по цвету в вилку. В общем случае среди образцов,
которые даются контролеру, имеются нормально окрашенные, темнее и светлее
нормы. Принимается же ткань нормально окрашенная. Пусть в каждом случае
9
операции оценки качества окраски ткани дали результаты, соответствующие
табл. 2.2, где знак (–) соответствует образцу ткани светлее норме, знак (+)
соответствует образцу ткани темнее нормы, а образец ткани, цвет которого
соответствует норме – знак (=) (исследования проводятся, например, в связи с
тем, что химик вводит в красильный раствор некоторую добавку, от которой
ткань должна стать светлее).
Обработка результатов, представленных в табл. 2.2, производится
следующим образом:
1) случаи равенства результатов норме исключаются;
2) подсчитывается количество (–), пусть их будет n1 (для табл. 2.2
n1  11 );
3) подсчитывается количество (+), пусть их будет n2 (для табл. 2.2
n2  2 );
4) подсчитывается общее число опытов n  n1  n2 (для табл. 2.2 n  13 );
5) по табл. 2.3 для числа опытов n при уровне достоверности 0,95, либо
0,99, который выбирается исследователем произвольно, находится против n и
требуемого уровня достоверности значение критерия n3 (для табл. 2.2 с
уровнем достоверности 0,95 n3  11);
Т а б л и ц а 2.2. Оценка качества окраски ткани
Номер опыта
1
2
3
4
5
6
7
8
Цвет
–
–
–
+
=
–
+
=
Номер опыта
9
10
11
12
13
14
15
16
Цвет
=
–
–
–
–
–
–
–
6) если n1  n3 , то это значит, что добавка с выбранным уровнем
значимости привела к отрицательным по отношению к норме результатам (для
табл. 2.2 n3  11, т. е. n1  n3 , а следовательно, химик ввел в красильную ванну
добавку, от которой ткань стала светлее);
7) если n2  n3 , то добавка привела к положительным по отношению к
норме результатам – результаты выше нормы (в случае табл. 2.2 n2  n3 ), если
бы оказалось, что n2  n3 , то это означало, что добавка, сделанная химиком в
красильную ванну, не эффективна и не привела к ожидаемым результатам;
8) если n1  n3 и n2  n3 , то с выбранным уровнем достоверности
результаты опытов соответствуют норме (в случае табл. 2.2 n1  n3 и n2  n3 , то
10
это бы означало, что цвет ткани после добавки в красильную ванну, сделанную
химиком, не отличается от нормы c выбранным уровнем достоверности).
Т а б л и ц а 2.3. Пограничные значения критерия знаков n3
Общее
число
опытов
только (+)
и (–) n
6
7
8
9
10
11
12
13
14
15
16
18
19
20
21
Минимальные значения числа
опытов с однозначным
результатом, при которых
отличие от нормы достоверно
с вероятностью не менее n3
0,95
6
7
8
8
9
10
10
11
12
12
13
14
15
15
16
Общее
число
опытов
только (+)
и (–) n
0,99
–
–
8
9
10
11
11
12
13
13
14
15
16
17
17
22
23
24
25
26
27
28
29
30
31
32
34
35
36
37
Минимальные значения числа
опытов с однозначным
результатом, при которых
отличие от нормы достоверно
с вероятностью не менее n3
0,95
17
17
18
18
19
20
20
21
21
22
23
24
24
25
25
0,99
18
19
19
20
20
21
22
22
23
24
24
25
26
27
27
Таким образом, критерий знаков n3 позволяет выявить полезность какихлибо изменений условий проведения технологического процесса в случаях,
когда результаты анализов носят качественный характер.
Задание к лабораторной работе 2
Привести собственный пример обработки результатов эксперимента, не
имеющего количественных значений.
11
Работа
данных
Сравнение средних значений экспериментальных
3.
В практике экспериментирования часто приходится сравнивать между
собой результаты опытов при разных значениях технологических параметров,
их определяющих (температура, концентрация и т. д.), с точки зрения
установления равенства или отличия этих результатов друг от друга.
Пусть экспериментатором получены при различных значениях
технологических параметров (в ряде опытов серии значений какого-то
показателя качества xi  xi1 ,....., xiki , где xij – значения xi при j-ом опыте).


Значения экспериментальных данных записываются в виде табл. 3.1. В
этой же таблице приводится оценка математических ожиданий xi , которые
определяются по формуле (1.6)
Т а б л и ц а 3.1. Пример записи экспериментальных данных
Номер измерения
(опыта)
Номер групп экспериментов либо показателя качества
1
2
…
x1
x11
x12
x1k 1
x2
x21
x22
x2 k 2
xn
xn1
xn 2
xnkn
Оценки математических
ожиданий
x1
x2
xn
Для проверки равенства средних xi можно использовать критерий F –
распределение Фишера.
Он рассчитывается по формуле
2
Sфакт
(3.1)
Fнабл  2 ,
Sост
S
S
2
2
 ост – остаточная дисперсия;
 факт – факторная дисперсия; Sост
где Sфакт
P2
P1
n
Sфакт   ki  xi  x  – факторная сумма квадратов отклонения выборочных
2
i 1
групповых средних xi от общей средней x ;
n ki
n ki
 n

где x   xij   ki  1 ; Sост    xij  x  – остаточная сумма квадратов
i 1 J 1
i 1 J 1
 i 1

n
отклонения xij от x ; P1  n  1; P2   k j  n – числа степеней свободы при
j 1
вычислении Sфакт и S ост .
12
Предположение о равенстве средних значений xi справедливо, если
Fнабл  Fkр .
(3.2)
Величина
табл. 3.2 и зависит от уровня
достоверности и числа степеней свободы P1 и P2 .
В том случае, когда k1  k2  .....  kn  k т. е. число опытов в каждом
эксперименте xi одинаково, проверка предположения о равенстве средних xi
между собой аналогична вышеизложенному, за исключением Sфакт . В этом
случае
Fкр
n
представлена
в
Sфакт  k   xi  x  при 1  n  1.
2
i 1
Если n  2 , т. е. имеем два эксперимента x1 и x2 , по k1 и k 2 опытов в
каждом, то для проверки равенства x1 и x2 , имеет быть использована величина
Tнабл 
Таблица
x1  x2
 k1  1 x21   k2  1 x22
3.2. Значения
Fкр
k1  k2  k1  k2  2 
.
k1  k2
(3.3)
– критерия Фишера для уровня
достоверности 0,95
P2
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40
50
P1
1
10,1
7,7
6,6
6,0
5,6
5,3
5,1
5,0
4,8
4,6
4,5
4,4
4,4
4,3
4,2
4,1
4,1
4,0
2
9,6
6,9
5,8
5,1
4,7
4,5
4,3
4,1
3,9
3,7
3,6
3,6
3,5
3,4
3,3
3,3
3,2
3,2
3
9,3
6,6
5,4
4,8
4,4
4,1
3,0
3,7
3,5
3,3
3,2
3,2
3,1
3,0
2,9
2,9
2,8
2,8
4
9,1
6,4
5,2
4,5
4,1
3,8
3,6
3,5
3,3
3,1
3,0
2,9
2,9
2,8
2,7
2,6
2,6
2,6
5
9,0
6,3
5,1
4,4
4,0
3,7
3,5
3,3
3,1
3,0
2,9
2,8
2,7
2,6
2,5
2,5
2,4
2,4
13
6
8,9
6,2
5,0
4,3
3,9
3,6
3,4
3,2
3,0
2,9
2,7
2,7
2,6
2,5
2,4
2,4
2,3
2,3
8
8,8
6,0
4,8
4,1
3,7
3,4
3,2
3,1
2,9
2,7
2,6
2,5
2,4
2,4
2,3
2,2
2,2
2,1
12
8,7
5,9
4,7
4,0
3,6
3,3
3,1
2,9
2,7
2,5
2,4
2,3
2,3
2,2
2,1
2,0
2,0
1,9
24
8,6
5,8
4,5
3,8
3,4
3,1
2,9
2,7
2,5
2,3
2,2
2,1
2,1
2,0
1,9
1,8
1,8
1,7

8,5
5,7
4,4
3,7
3,2
2,9
2,7
2,5
2,3
2,1
2,0
1,9
1,8
1,7
1,6
1,5
1,5
1,4
Окончание табл. 3.2
P2
60
88
100
P1
1
4,0
4,0
3,9
3,0
2
3,1
3,1
3,1
3,0
3
2,8
2,7
2,7
2,6
4
2,5
2,5
2,5
2,4
5
2,4
2,3
2,3
2,2
6
2,2
2,2
2,2
1,9
8
2,1
2,0
2,0
1,9
12
1,9
1,9
1,8
1,7
24
1,7
1,6
1,6
1,5

1,4
1,3
1,3
1,5
Средние можно считать равными, если
(3.4)
Tнабл  tкр ,
где tкр – критические точки распределения Стьюдента, найденные для уровня
достоверности 0,95 или 0,99 при числе степеней свободы f  k1  k2  2 ,
приведенные в табл. 3.3.
Т а б л и ц а 3.3. Значения tкр (по Стьюденту-Фишеру)
Число степеней свободы
f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Уровень достоверности
0,95
0,99
12,71
63,66
4,3
9,92
3,18
5,84
2,78
4,60
2,57
4,03
2,45
3,71
2,36
3,50
2,31
3,36
2,26
3,25
2,23
3,17
2,20
3,11
2,18
3,06
2,16
3,01
2,14
2,98
2,13
2,95
2,12
2,92
2,11
2,90
2,10
2,88
2,09
2,86
2,09
2,84
2,08
2,83
2,07
2,82
2,07
2,81
14
Окончание табл. 3.3
Число степеней свободы
f
24
25
26
27
28
29
30
40
60
Уровень достоверности
0,95
0,99
2,06
2,80
2,06
2,79
2,06
2,78
2,05
2,77
2,05
2,76
2,04
2,76
2,04
2,75
2,02
2,70
2,00
2,66
В качестве примера рассмотрим измерение влажности образца ПВС-волокна,
обработанного в водно-этанольной ванне с модулем m  50 при температуре
T  70C в течение t  1 ч, предварительно важно подвергать сушке на воздухе
20 ч. и сушке под вакуумом 2 ч. ( t  90C , вакуум –1 атм). Результаты сводим в
табл. 3.4.
Т а б л и ц а 3.4. Результаты анализов измерения влажности
Номер
опыта
1
2
3
4
5
xi
Номера групп эксперимента
x1
x2
Спирт-вода
Спирт-вода
100:0
80:20
6,53
7,38
6,55
7,24
6,72
7,29
6,7
7,38
6,59
7,42
6,64
7,34
x3
Спирт-вода
70:30
7,65
7,94
7,72
7,36
7,61
7,66
Значение 7,36 эксперимента x3 вызывает подозрение, как выскакивающее.
Согласно (1.4) найдем
7,61  7,36
1 
 0,43 .
7,94  7,36
По табл. 1.1 1погр  0,642 , поэтому с уровнем достоверности 0,95 нельзя
значение 7,36 считать выскакивающим. Оценки математического ожидания
приведены в табл. 1.3.
15
Сравним x1 и x2 , а затем x2 с x3 . Для сравнения x1 с x2 подсчитаем
Tнабл  13,6 ; f  5  5  2  8 ; tкр  2,31 с уровнем достоверности 0,95. Таким
образом x1 и x2 , можно считать с уровнем достоверности 0,95 разными, так как
13,6 > 2,31.
Для сравнения x2 и x3 .
Tнабл  4,3 ; f  5  5  2  8 ; tкр  2,31 с уровнем достоверности 0,95, т. е. x2 и x3
можно считать разными с уровнем достоверности 0,95, так как 4,3 > 2,31.
Задание к лабораторной работе 3
Сравнить средние значения экспериментальных данных, приведенных в
приложении А для каждого студента с учетом критерия Фишера.
Работа 4. Сравнение дисперсий экспериментальных данных
При
проведении
экспериментов
важно
оценить
разброс
экспериментальных данных от одной серии опытов к другой. От этого разброса
зависит точность измерений и их воспроизводимость.
Пусть имеем серии опытов x1,......., x , причем xij (i  1,....., ; J  1,......, ni )
– результат опытов в сериях ( i – номер серии, j – номер опыта в серии),
x1  {x1i ,....., x1n } .
Вычислим по формуле (1.7) дисперсии  xi2 при числах степеней свободы
ki  ni  1. Сравним дисперсии между собой с точки зрения выявления их
равенства. В качестве критерия проверки равенства дисперсий может быть
принят критерий Бертлета Bнабл .
V
Bнабл  ,
(4.1)
G
2
1


где V  2,3  k lg G 2   ki lg  xi  , k   ki .
i 1
i 1


1  1 1
 2   ki xl2 k ; G 
     1.
3   1  i 1 ki k 
i 1
При равенстве дисперсий должно выполняться соотношение
Bнабл  f кр2 ,
(4.2)
(4.3)
где f кр2 – табличные значения f кр2 при числе степеней свободы f   1.
Значения f кр2 приведены в табл. 4.1.
16
В том случае, когда n1  n2  ......  n  n проверка равенства дисперсий
может осуществляться по критерию Кохрена
Gнабл
 


2
xi max
i
2
xi
i 1

,
где  xi2 max  i  1,.....,
(4.4)

– наибольшая из сравниваемых дисперсий. Дисперсии
можно считать равными с уровнем значимости  . если справедливо
соотношение Gнабл  Gкр , где Gкр – табличные значения распределения Кохрена
для уровня значимости  при числе степеней свободы f  n  1 и
приведенные в табл. 4.1.
-сериях,
Т а б л и ц а 4.1. Значения f кр2
k
2
3
5
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40
45
50
55
60


0,99
0,01
0,02
0,12
0,30
0,55
0,87
1,24
1,65
2,09
2,56
3,6
4,7
5,8
7,0
8,3
11,5
15,0
18,5
22,2
25,9
29,7
33,6
37,5
0,90
0,10
0,2
0,6
1,1
1,6
2,2
2,8
3,5
4,2
4,9
6,3
7,8
9,3
10,9
12,4
16,5
20,6
24,8
29,1
33,3
37,7
42,1
46,5
0,70
0,30
0,7
1,4
2,2
3,0
3,8
4,7
5,5
6,4
7,3
9,0
10,8
12,6
14,4
16,3
20,9
25,5
30,2
34,9
39,6
44,3
49,1
53,8
0,50
0,50
1,4
2,4
3,4
4,4
5,3
6,3
7,3
8,3
9,3
11,3
13,3
15,3
17,3
19,3
24,3
29,3
34,3
39,3
44,3
49,3
54,3
59,3
0,30
0,70
2,4
3,7
4,9
6,1
7,2
8,4
9,5
10,7
11,8
14,0
16,2
18,4
20,6
22,8
28,2
33,5
38,9
44,2
49,5
54,7
60,0
65,2
0,10
0,90
4,6
6,3
7,8
9,2
10,6
12,0
13,4
14,7
16,0
18,5
21,1
23,5
26,0
28,4
34,4
40,3
46,1
51,8
57,5
63,2
68,8
65,2
0,05
0,95
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
21,0
23,7
26,3
28,9
31,4
37,7
43,8
49,8
55,8
61,7
67,5
73,3
74,4
0,01
0,99
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
26,2
29,1
32,0
34,8
37,6
44,3
50,9
57,3
63,7
70,0
76,2
82,3
88,4
0,005
0,995
10,6
12,8
14,9
16,7
18,5
20,3
22,0
23,6
25,2
28,3
31,3
34,3
37,2
40,0
46,9
53,7
60,3
66,8
73,2
79,5
85,7
62,0
0,001
0,999
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
32,9
36,1
39,2
42,3
45,3
52,6
59,7
66,6
73,4
80,1
86,7
93,2
99,6
В практике часто встречаются случаи  2 , т. е. имеются 2 серии опытов
по n1 и n2 повторений каждая с оценками дисперсий  2 x1 и  2 x2 . Равенство
дисперсий может быть проверено с помощью Fкр – критерия Фишера. Для
проверки следует определить
17
 2 x1
Fнабл  2 ,
(4.5)
 x2
где  2 x1   2 x2 .
Дисперсии равны с уровнем достоверности 0,95, если
Fнабл  Fкр .
(4.6)
Значения Fкр следует брать из табл. 3.2 при числе степеней свободы
P1  n1  1, P1  n2  1.
Задание к лабораторной работе 4
Сравнить дисперсии экспериментальных данных различных серий
опытов, используя результаты экспериментов, приведенных в приложении А.
Работа
5.
Корреляционная
экспериментальными данными
зависимость
между
На практике часто проводятся эксперименты исследования зависимости
величины y от x и вид ее заранее известен. При исследовании неизвестных
зависимостей возможны как систематические, так и случайные ошибки.
Систематические связаны с выбором вида зависимости, случайные – с
процессом измерений. Для уменьшения влияния случайных ошибок измерения
применяется метод наименьших квадратов.
Пусть имеются результаты эксперимента  x1 , y1  ,  x2 , y2  ,.....,  xn , yn  и
выбран (или известен) вид функции yi    xi , a, b, c,... . Необходимо выбрать
a, b, c так, чтобы выполнялось условие
n
  y
i 1
i
   xi , a, b, c...   min .
2
(5.1)
Для отыскания значений a, b, c , обращающих левую часть уравнения (5.1)
в минимум, необходимо приравнять к нулю производные по a, b, c
n
   
 yi    xi , a, b, c...   

  0

a

 
i 1
n
   


(5.2)
y


x
,
a
,
b
,
c
...




i
 i
  b   0  ,

 
i 1
n
   


y


x
,
a
,
b
,
c
...




i
 i
  c   0 

 
i 1
Система (5.2) содержит столько уравнений, сколько имеется неизвестных
параметров a, b, c .
18
Рассмотрим два часто встречаемые на практике случая: функция 
линейна и выражается полиномом второй степени (параболой).
В первом случае по методу наименьших квадратов подбираем параметры
a и b в линейной функции y  ax  b , изображающий данную
экспериментальную зависимость
Система (5.2) имеет вид
n

 yi   axi  b   xi  0 


i 1
(5.3)
,
n
 yi   axi  b    0 


i 1
n
n
xi



i 1
 xi ;
 1; b  my  amx ; mx 
так как
;
a
b
n
  xi  mx    yi  my 
n
где a 
k xy
; k xy 
my 
n
; Dx 
i 1
y
 x  m 
i 1
i
i 1
n
i
;
2
x
(5.4)
.
Dx
n
n
Линейная зависимость, связывающая x и y ,
k
k
y  xy x  m y  xy mx .
Dx
Dx
Если функция выражается полиномом второй степени, то в этом случае
необходимо подобрать методом наименьших квадратов параметры a, b, c
параболы y  ax 2  bx  c . Система (5.2) примет вид

 bxi  c   xi2  0 
i 1

n

 yi   axi2  bxi  c   xi  0  .



i 1

n

 yi   axi2  bxi  c    0 



i 1

  y   ax
n
i
2
i
(5.5)
После преобразования получим
 4  x  a   3  x  b   2  x  c   2,1  x, y  

 3  x  a   2  x  b  1  x  c  1,1  x, y   ;

 2  x  a  1  x  b   0  x  c   0,1  x, y  
n
где  0  x   1; 1  x  
x
i 1
n
i
n
; 2  x 
x
i 1
n
19
2
i
;
n
3  x  
 xi3
i 1
n
n
; 4  x  
n
 0,1  x     y  
 yi
x
i 1
n
4
i
;
n
 xi yi
n
x
2
i i
y
; 1,1  x, y  
;  2,1  x, y  
.
n
n
n
В качестве примера рассмотрим зависимость y от x , по данным,
приведенным в табл. 5.1.
i 1
i 1
i 1
Т а б л и ц а 5.1. Зависимость y от x
y
x
4
41
8
50
10
81
14 16 20 19 23 26 30 31 36 37
104 120 139 154 180 208 241 250 269 301
Необходимо подобрать методом наименьших квадратов параметр
прямой, изображающей зависимость y от x .
В соответствии с (5.4)
mx  164,4; my  21,1; Dx  6662; k xy  826 .
Уравнение прямой имеет вид
y  0,124  x  164,4   21,1 .
Иногда при проведении экспериментальных исследований необходимо
оценить тесноту корреляционной связи зависимости друг от друга между y и
xi . Подобная оценка может быть осуществлена с помощью выборочного
коэффициента корреляции
k
R  yx ,
(5.6)
 y xi
1 k
(5.7)
  yi  y   xij  xi 
k  1 i 1
оценка корреляционного момента. y , xi , y , xi – подсчитываются согласно
где k yx 
выражений (1.6), (1.7).
Коэффициент корреляции находится в пределах 0  R  1 . Чем ближе R к
1, тем теснее корреляционная связь между y и xi (i  1,..., n) .
Коэффициент корреляции R является существенным с уровнем
значимости q , если выполняется соотношение
(5.8)
R  zq z ,
20
1
– при небольшом числе опытов k  k   5  7   z q – табличное
k 3
значение, приведенное для уровня значимости в табл. 5.2. Величина zq z –
называется критической областью.
где  z 
Т а б л и ц а 5.2. Значения z q
%
zq
100
0
99
70
60
50
40
30
0,126 0,385 0,524 0,675 0,842 1,04
20
1,64
5
1,96
1
2,58
0,1
3,2
В качестве примера оценим корреляционную зависимость между
величинами y и x1 , приведенными в табл. 5.3.
Т а б л и ц а 5.3. Результаты опытов
Величина
y
x1
1
12,1
81
2
11,6
76
3
11,9
79
Номер опыта
4
5
11,4
11,9
80
81
6
10,5
75
7
11
75
(k  7)
Согласно формулам (1.9), (1.10) получим, что
y  11,5; x  78;  y  0,6;  x1  2,74.
В этом случае из выражений (5.6) и (5.7) определим
1,5
k yx1  1,5; R 
 0,65 .
0,6  2,74
Для построения критической области вычислим
1
z 
 0,5 .
73
Согласно табл. 5.2 с уровнем зависимости q  20% , zq  1, 28 . Для того
чтобы считать y и x1 корреляционно связанными с уровнем значимости
q  20 % , необходимо иметь
R  0,5  1,28  0,64 .
Это условие выполняется, т. е. y и x1 можно считать корреляционно
связанными с уровнем значимости q  20 % .
21
Выводы
Обработка результатов пассивного эксперимента состоит из следующих
этапов:
1. Запись результатов пассивного эксперимента в виде ряда (1.1), либо
табл. 2.1. Отбрасывание выскакивающих значений экспериментальных
данных.
2. Определение числовых характеристик измеряемых величин: оценки
математического ожидания (оценки среднего квадратического отклонения
(дисперсии), коэффициента вариации, доверительного интервала.
3. Сравнение, в случае необходимости, между собой оценок дисперсий.
Целью сравнения может быть выявление различий в степени разброса
результатов измерений разных экспериментов для последующего анализа
причин этого явления и т. д.
4. Исследование
корреляционной
зависимости
между
экспериментальными данными методом наименьших квадратов или оценкой
тесноты корреляционной связи с помощью выбранного коэффициента
корреляции.
В приложении А приведены варианты заданий для пяти работ по курсу
«Быстрые методы статистического анализа» для закрепления теоретических
знаний и практических навыков по методике проведения и обработки
результатов экспериментальных исследований.
22
Приложение А
Вариант 1
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
12.1; 12,4; 11,9; 12,3; 12,8;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
3,32
3,29
3,28
3,30
3,31
X2
3,08
3,10
3,06
3,07
3,06
3) определить корреляционную зависимость
3,7
10,4
Y
X
3,2
11,0
3,4
10,8
4) подобрать методом наименьших
изображающей зависимость Y от X
4
41
Y
X
3,3
10,6
квадратов
10
79
19
140
3,6
10,5
параметры
28
195
прямой,
39
255
Вариант 2
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
52,1; 53,2; 59,4; 49,8; 52,3;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
16,0
15,5
14,8
15,8
15,1
X2
15,0
14,5
14,4
14,8
14,9
3) определить корреляционную зависимость
Y
X
16,0
84
16,2
85
16,1
83
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
7
50
10
75
23
15,8
82
квадратов
15
110
16,4
86
параметры
21
145
прямой,
Вариант 3
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
72,3; 71,5; 78,3; 70,8; 73,2;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
11,8
11,6
12,8
11,5
11,9
X2
11,5
11,3
11,8
11,7
11,4
3) определить корреляционную зависимость
10,0
42
Y
X
10,2
40
10,6
39
4) подобрать методом наименьших
изображающей зависимость Y от X
4
60
Y
X
9
105
9,8
43
квадратов
16
165
10,5
41
параметры
21
230
прямой,
29
290
Вариант 4
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
59,8; 62,3; 60,9; 66,3; 64,1;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
23,0
22,5
23,2
22,8
23,1
X2
23,2
23,4
24,0
23,1
23,05
3) определить корреляционную зависимость
Y
X
5,0
31
4,8
30
5,2
33
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
7
80
11
115
24
4,9
32
квадратов
18
195
5,4
35
параметры
20
210
прямой,
Вариант 5
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
1,3; 20,8; 19,3; 22,5;21,4;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
38,0
38,1
39,0
39,8
38,5
X2
36,5
36,8
36,7
36,4
36,9
3) определить корреляционную зависимость
17,5
21,3
Y
X
18,0
22,0
18,2
22,3
4) подобрать методом наименьших
изображающей зависимость Y от X
23
125
Y
X
18,9
23,0
квадратов
30
164
19,1
24,0
параметры
35
190
прямой,
40
220
Вариант 6
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
37,2; 36,5; 38,1; 32,3; 35,9;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
52,0
51,5
49,0
51,8
52,1
X2
50,0
50,5
50,2
50,8
51,0
3) определить корреляционную зависимость
Y
X
18
20
41
45
65
70
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
13
60
24
130
25
88
90
квадратов
33
175
100
105
параметры
37
205
прямой,
Вариант 7
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
62,1; 63,5; 60,8; 64,1; 68,1;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
31,5
32,0
33,1
32,1
31,8
X2
34,0
34,5
34,3
33,9
34,1
3) определить корреляционную зависимость
15
10
Y
X
35
22
55
35
4) подобрать методом наименьших
изображающей зависимость Y от X
15
70
Y
X
74
43
квадратов
21
108
90
55
параметры
26
139
прямой,
30
160
Вариант 8
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
17,5; 18,2; 17,1; 19,1; 17,9;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
31,0
31,2
34,1
31,8
31,5
X2
32,8
33,2
33,1
32,9
33,0
3) определить корреляционную зависимость
Y
X
15
20
30
42
36
50
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
7
55
15
100
26
62
80
квадратов
22
155
73
95
параметры
32
215
прямой,
Вариант 9
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
40,3; 39,8; 42,1; 41.5; 39,3;
2) сравнить средние значения и дисперсии экспериментальных данных
Номер
1
2
3
4
5
X1
41,0
42,2
41,8
42,5
41,6
X2
38,0
37,8
38,2
37,9
38,1
3) определить коэффициент корреляции и его существенность
13,2
72
Y
X
12,5
70
11,9
65
4) подобрать методом наименьших
изображающей зависимость Y от X
7
90
Y
X
12,3
71
квадратов
15
152
12,8
70
параметры
17
185
прямой,
26
255
Вариант 10
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
49,5; 52,3; 50,8; 51,5; 50,3;
2) сравнить средние значения и дисперсии экспериментальных данных
Номер
1
2
3
4
5
X1
12,0
11,5
11,9
11,8
12,1
X2
12,2
12,4
12,1
12,3
12,0
3) определить коэффициент корреляции и его существенность
Y
X
8,2
28
8,5
29
9,2
30
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
31
170
35
190
27
8,8
28,5
квадратов
38
209
9,0
29,1
параметры
40
220
прямой,
Вариант 11
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
81,5; 80,4; 79,8; 82,1; 82,4;
2) сравнить средние значения и дисперсии экспериментальных данных
Номер
1
2
3
4
5
X1
5,1
4,9
5,2
5,0
4,8
X2
5,3
5,2
5,1
5,4
5,2
3) определить корреляционную зависимость
2,6
51
Y
X
4,5
52
7,1
54
4) подобрать методом наименьших
изображающей зависимость Y от X
3
80
Y
X
5
105
10,2
57
квадратов
7
150
13,9
56
параметры
9
180
прямой,
12
220
Вариант 12
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
28,1; 29,3; 27,4; 28,5; 30,5;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
62,0
62,5
62,3
62,9
62,1
X2
59,0
59,5
59,1
59,8
59,7
3) определить корреляционную зависимость
Y
X
30
5
58
10
95
15
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
8
100
14
145
28
132
20
квадратов
18
190
160
25
параметры
21
210
прямой,
Вариант 13
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
85,4; 84,9; 83,5; 82,6; 80,1;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
92,0
92,5
92,3
90,0
92,4
X2
91,0
90,0
90,2
90,8
91,1
3) определить корреляционную зависимость
8,0
32
Y
X
8,2
34
8,4
35
4) подобрать методом наименьших
изображающей зависимость Y от X
7
25
Y
X
8,7
39
квадратов
13
65
9,0
42
параметры
19
100
прямой,
24
130
Вариант 14
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
49,3; 48,4; 49,6; 52,3; 47,3;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
22,0
21,5
22,1
21,8
23,0
X2
19,0
19,5
19,8
19,6
19,3
3) определить корреляционную зависимость
Y
X
8,0
22,0
8,2
22,3
8,1
22,1
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
4
90
6
115
29
7,9
21,0
квадратов
8
160
8,3
22,5
параметры
11
195
прямой,
Вариант 15
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
32,1; 34,3; 35,4; 31,9; 30,8;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
8,5
8,6
8,3
8,2
8,4
X2
10,1
9,8
10,3
11,8
10,4
3) определить корреляционную зависимость
4
5
Y
X
10
12
20
20
4) подобрать методом наименьших
изображающей зависимость Y от X
9
70
Y
X
29
28
квадратов
16
110
40
40
параметры
22
160
прямой,
31
205
Вариант 16
1) определить оценки математического ожидания, среднего квадратического
отклонения коэффициента вариации и доверительного интервала с учетом
исключения выскакивающих значений ряда экспериментальных данных
12,5; 13,1; 11,9; 13,8; 12,4;
2) сравнить средние значения экспериментальных данных
Номер
1
2
3
4
5
X1
48,0
49,0
50,0
48,5
49,2
X2
50,0
50,1
49,8
49,7
50,3
3) определить корреляционную зависимость
Y
X
11
44
15
39
19
34
4) подобрать методом наименьших
изображающей зависимость Y от X
Y
X
12
90
28
135
30
22
30
квадратов
26
175
28
25
параметры
31
205
прямой,
Документ
Категория
Без категории
Просмотров
2
Размер файла
979 Кб
Теги
bystrstatanaliz, 2016
1/--страниц
Пожаловаться на содержимое документа