close

Вход

Забыли?

вход по аккаунту

?

7954.Теория вероятностей и математическая статистика.

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Федеральное агентство по образованию
Государственное образовательное учреждение высшего
профессионального образования
«Казанский государственный технологический университет»
А. Н. Титов, Е. Р. Бадертдинова, А. С. Климова
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Учебное пособие
Казань
КГТУ
2008
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 519.2
ББК 22.17
Авторы: доц. А. Н. Титов, доц. Е. Р. Бадертдинова, ст.
преподаватель А. С. Климова.
ISBN 978-5-7882-0813-8
Теория вероятностей и математическая статистика:
учебное пособие/ А.Н. Титов, Е. Р. Бадертдинова, А. С. Климова
– Казань: Изд-во Казан. гос. технол. ун-та; 2008. – 144 с.
Рассмотрены основные сведения по теории вероятностей и
математической статистике, необходимые для технических
приложений. Приведены примеры выполнения лабораторных
работ с применением системы Scilab и табличного редактора
Excel. Учебное пособие содержит задания для аудиторной и
самостоятельной
работы
по
дисциплинам:
«Теория
вероятностей», «Математическая статистика» - для студентов
института нефти, химии и нанотехнологии (специальности
240301.65 – «Химическая технология неорганических веществ»,
240304.65
–
«Химическая
технология
тугоплавких
неметаллических и силикатных материалов»); «Теория
вероятностей и математическая статистика» - для студентов
института технологии легкой промышленности, моды и дизайна
(специальность 230201.65 – «Информационные системы и
технологии»).
Подготовлено на кафедре информатики и прикладной
математики.
Печатается по решению методической комиссии по циклу
естественнонаучных и общематематических дисциплин.
Рецензенты:
зав. лаб. ИММ КазНЦ РАН, д. т. н.,проф.
М. Х. Хайруллин;
к. ф.-м. н., с. н. с. ИММ КазНЦ РАН
Шамсиев М. Н.
ISBN 978-5-7882-0813-8
© Титов А. Н., Бадертдинова Е. Р.,
Климова А. С., 2008
© Казанский государственный
технологический университет, 2008
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1. Элементы теории вероятностей
1.1. Основные определения
Одним из основных понятий теории вероятностей (ТВ)
является понятие случайного события (СС). Случайным назовем
такое событие, которое при заданном комплексе условий может
как произойти, так и не произойти. В ТВ изучаются только такие
СС, для которых характерны непредсказуемость исхода, повторяемость опыта, устойчивость частоты события.
Пример 1.1. Подбрасывается игральная кость. Это опыт
(или эксперимент). Одно из возможных СС – появление на
верхней грани числа «6».
Для количественного сравнения между собой СС по
степени возможности их наступления вводится понятие
вероятности события. Вероятность любого события А р(А)
лежит в пределах от 0 до 1:
0≤ р(А)≤1
Событие называется невозможным, если его вероятность
равна нулю и достоверным, если его вероятность равна единице.
Существует несколько определений вероятности СС:
статистическое, классическое и геометрическое.
Пусть некоторый опыт (например, подбрасывание монеты)
производится n раз; m раз в этих опытах произошло событие А
m
(выпал герб). Отношение
называется частотой события А.
n
Говоря об устойчивости частоты, подразумевают, что частота
мало изменяется при увеличении числа опытов.
Определение. Вероятность – это число, к которому
стремится частота события А при n→∞:
m
n →∞ n
p( A) = lim
( 1.1 )
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Формула (1.1) – это статистическое (или частотное)
определение вероятности. В условиях примера 1 при числе
подбрасываний n→∞ частота события А – появления на
верхней грани «6» - стремится к 1/6.
Другое определение вероятности – классическое – связано
с понятием равновозможных событий. События называются
равновозможными, если в данной серии опытов они происходят
с равной вероятностью.
Пусть в результате опыта может произойти n
равновозможных событий. Пусть m – число исходов,
благоприятствующих
наступлению
события
А.
Тогда
m
вероятностью события А называют отношение .
n
p( A) =
m
n
( 1.2 )
Это – классическое определение вероятности.
Пример 1.2. Подбрасывается игральная кость. Возможные
исходы – появление на верхней грани 1, 2, 3, 4, 5 или 6. Всего их
шесть, то есть n=6. Все исходы – равновозможны. Пусть
событие А – появление на верхней грани четного числа очков.
Событие А произойдет, если на верхней грани появятся 2, 4 или
3 1
6, то есть m=3. Отсюда p(A)= =
6 2
Пример 1.3. В квадрат вписана окружность. Определить
вероятность события В: точка, наугад поставленная внутрь
квадрата, окажется внутри окружности.
r
p( B) =
sкр.
sквадр.
=
πr 2
4r
2
=
π
4
Эта задача на геометрическое определение вероятности.
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.2. Свойства случайных событий
Пусть в результате эксперимента могут произойти
различные СС. Если из перечисленных предполагаемых СС хотя
бы одно произойдет наверняка, то такую группу событий
называют полной группой событий.
Пример 1.4. Пусть опыт заключается в подбрасывании
игральной кости. Событие А - выпало нечетное количество
очков: А={1,3,5}. Событие В - выпало число очков, меньшее 5:
В={1,2,3,4}. Событие С - выпало число очков кратное 3:
С={3,6}.
События А, В и С образуют полную группу СС.
Случайные
события
бывают
совместными
и
несовместными. Совместные события - это такие события,
которые могут произойти одновременно в результате одного
опыта. В примере 4 это события А и В, В и С, А и С.
Если события
Ai
(i = 1, n) образуют полную группу
n
несовместных событий, то
∑p
i =1
i
= 1 . Здесь pi=p(Ai).
Два события: А и A называют противоположными, если
они образуют полную группу несовместных событий.
p(A)+p( A )=1 или
( 1.3 )
p(A)=1-p( A )
Случайные события называют элементарными, если они
обладают следующими свойствами:
1) несовместны;
2) образуют полную группу СС;
3) по любому из них можно судить о том, произошло ли
любое другое событие из числа тех, которые в
принципе могут произойти в результате опыта.
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 1.5. Бросают игральную кость. Событие Ai –
появление на верхней грани числа очков, равного i (i = 1,6) .
События Ai - элементарные. Событие В – появление на верхней
грани четного числа очков и событие С – появление на верхней
грани нечетного числа очков не являются элементарными, так
как, например, из того, что произошло событие В, нельзя судить
о том, наступило ли событие D – число очков кратно трем.
Пересечением (произведением ) событий А и В называют
событие С, состоящее в том, что в результате опыта произошло
и событие А и событие В. Обозначается это так: С=АВ.
Суммой двух событий А и В называют событие С,
состоящее в том, что произошло хотя бы одно из событий А или
В. С=А+В
События называют независимыми, если вероятность
наступления одного из них не изменяется при наступлении
другого. В противном случае события называют зависимыми.
P(AB) = P(A) ⋅ P(B/A) = P(B) ⋅ P(A/B)
(1.4)
Вероятность произведения зависимых событий равна
произведению вероятности одного из них на условную
вероятность другого. Здесь P(B/A) – вероятность события B в
предположении, что событие A произошло.
Если события А и В независимы, то
P(AB) = P(A) ⋅ P(B)
( 1.5 )
Пример 1.6. Из колоды в 36 карт случайным образом
вынимают две карты. Определить вероятность того, что обе
вытащенные карты – тузы в предположении а) вытащенная в
первый раз карта возвращается обратно в колоду; б) вытащенная
первая карта не возвращается обратно.
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пусть событие А – первая вытащенная карта – туз; событие
В – вторая вытащенная карта – туз. И в случае а) и в случае б)
нас интересует событие С=АВ. В первом случае события А и В
– независимы, поэтому P(AB) = P(A) ⋅ P(B) .
P( A) =
4 1
4 1
1 1 1
= , P( B) =
= , P( AB) = ⋅ =
36 9
36 9
9 9 81
Во втором случае события А и В – зависимы, поэтому
4 1
3
P(AB) = P(A) ⋅ P(B / A) .
P ( B / A) = ,
P ( A) =
= ,
36 9
35
1 3
1
P ( AB) = ⋅
=
9 35 105
1.3. Формула полной вероятности и формула Байеса
Определение. Пусть событие А может произойти только
совместно с одним из событий Н1, Н2,…, Нп, образующих
полную группу несовместных событий. Тогда события Н1,
Н2,…, Нп называются гипотезами.
Теорема 1. Вероятность события А, наступающего
совместно с гипотезами Н1, Н2,…, Нп, равна:
(1.6)
где p(Hi) – вероятность i- ой гипотезы, а p(A/Hi) –
вероятность события А при условии реализации этой гипотезы.
Формула (1.6) носит название формулы полной вероятности.
Доказательство.
Можно считать событие А суммой попарно несовместных
событий АН1, АН2,…, АНп. Тогда из теорем сложения и
умножения следует, что
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
что и требовалось доказать.
Пример 1.7. Имеются три одинаковые урны с шарами. В
первой из них 3 белых и 4 черных шара, во второй – 2 белых и 5
черных, в третьей – 10 черных шаров. Из случайно выбранной
урны наудачу вынут шар. Найти вероятность того, что он белый.
Решение. Будем считать гипотезами Н1, Н2 и Н3 выбор урны
с соответствующим номером. Так как по условию задачи все
гипотезы равновозможны, то
Найдем условную вероятность А при реализации каждой
гипотезы:
Тогда
Формула Байеса (теорема гипотез).
Пусть известен результат опыта, а именно то, что
произошло событие А. Этот факт может изменить априорные (то
есть известные до опыта) вероятности гипотез. Например, в
предыдущем примере извлечение из урны белого шара говорит
о том, что этой урной не могла быть третья, в которой нет белых
шаров, то есть р(Н3/А) =0. Для переоценки вероятностей гипотез
при известном результате опыта используется формула Байеса:
(1.7)
Действительно,
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
откуда следует справедливость формулы (1.7).
Пример 1.8. После двух выстрелов двух стрелков,
вероятности попаданий которых равны 0,6 и 0,7, в мишени
оказалась одна пробоина. Найти вероятность того, что попал
первый стрелок.
Решение. Пусть событие А – одно попадание при двух
выстрелах, а гипотезы: Н1 – первый попал, а второй
промахнулся, Н2 – первый промахнулся, а второй попал, Н3 –
оба попали, Н4 – оба промахнулись. Вероятности гипотез: р(Н1)
= 0,6·0,3 = 0,18, р(Н2) = 0,4·0,7 = 0,28, р(Н3) = 0,6·0,7 = 0,42,
р(Н4) = 0,4·0,3 = 0,12.
Тогда
р(А/Н1)=р(А/Н2)=1,
р(А/Н3)=р(А/Н4)=0.
Следовательно, полная вероятность р(А) = 0,18·1 + 0,28·1 +
0,42·0 + 0,12·0 = 0,46. Применяя формулу Байеса, получим:
1.4. Случайные величины
Случайной величиной X называется величина, которая в
результате опыта (или испытания) принимает какое-либо
значение, причем заранее неизвестно, какое именно.
Пример 1.9. Подбрасывается игральная кость. Число,
появляющееся на верхней грани, - случайная величина.
Случайные
величины
бывают
дискретными
и
непрерывными.
Дискретная случайная величина – это величина,
принимающая конечное (или счетное) множество значений. В
примере 1.9 случайная величина является дискретной,
принимающей шесть значений {1, 2, 3, 4, 5, 6}.
Непрерывная случайная величина – это случайная
величина, принимающая значения из интервала (конечного или
бесконечного). Время безотказной работы телевизора –
непрерывная случайная величина.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.4.1. Законы распределения дискретных случайных
величин
Пусть проводится n последовательных испытаний, в
каждом из которых может произойти некоторое случайное
событие А. Испытания независимы друг от друга. Пусть задана
вероятность наступления события А в одном испытании (опыте)
p(A)=p и она не меняется от опыта к опыту.
Пусть X – случайная величина, равная числу наступлений
события А в n опытах. Очевидно, X = 0, n .
Вероятность того, что в n опытах событие А наступит
ровно m раз, подсчитывается по формуле Бернулли:
n!
p m (1 − p) n −m
Pn ( X = m) = C nm p m (1 − p) n −m =
m!(n − m)!
( 1.8 )
Здесь n!= 1 ⋅ 2 ⋅ 3 ⋅ ⋅ ⋅ n . Так, 5!= 1 ⋅ 2 ⋅ 3 ⋅ 4 ⋅ 5 = 120 . Принято
считать, что 0!=1.
Говорят, что случайная величина X имеет биномиальное
распределение.
Вероятность того, что в n опытах событие А наступит не
более m раз, можно вычислить по формуле (1.9):
Pn ( X ≤ m) = Pn (0) + Pn (1) + Pn (2) + ... + Pn (m) ( 1.9 )
Каждое Pn (i ), i = 0 , m в ( 1.7 ) вычисляют по формуле
(1.8).
Можно доказать, что Pn (0) + Pn (1) + Pn (2) + ... + Pn (n) = 1
Если в формуле (1.8) n велико (больше 30), а p(A) - мала, то
пользоваться этой формулой становится неудобно. Доказано,
что в этом случае вероятность того, что в n испытаниях событие
A наступит ровно k раз можно подсчитать по формуле Пуассона:
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Pn (k ) =
e −λ ⋅ λk
k!
( 1.10 )
где λ = np - среднее число наступлений события A в n
опытах. В этом случае говорят, что случайная величина X имеет
распределение Пуассона.
1.4.2. Характеристики дискретных случайных величин
1. Закон или ряд распределения.
Это таблица, в верхней строке которой перечислены все
значения, которые может принять случайная величина X, а в
нижней - вероятности того, что случайная величина X примет
данное значение.
X
p
x1
p1
x2
p2
pi=P(X=хi), i = 1, n ,
x3
p3
…
…
n
∑p
i =1
i
xn
pn
=1
2. Многоугольник распределения.
Если по оси абсцисс отложить значения x1, x2, …, xn, а по
оси ординат - соответствующие вероятности p1,p2,…,pn, и
соединить
соседние
точки
отрезками,
то
получим
многоугольник распределения случайной величины X.
3. Функция распределения F(x)
Функция распределения F(x) действительной переменной x
определяется формулой
F(x)=P(X<x)
( 1.11 )
Это вероятность того, что случайная величина X примет
значение, меньше, чем х.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4. Математическое ожидание M(X)
Это число, подсчитываемое по формуле
n
M ( X ) = ∑ xk pk
k =1
( 1.12 )
Свойства математического ожидания.
1) Математическое ожидание постоянной равно самой
постоянной:
М(С) = С.
(1.13)
Доказательство. Если рассматривать С как дискретную
случайную величину, принимающую только одно значение С с
вероятностью р = 1, то М(С) = С·1 = С.
2) Постоянный множитель можно выносит за знак
математического ожидания:
M(CX)=CM(X)
(1.14)
Доказательство. Если случайная величина Х задана рядом
распределения
xi
x1
x2
…
xn
pi
p1
p2
…
pn
то ряд распределения для СХ имеет вид:
Сxi
Сx1
Сx2
…
Сxn
pi
p1
p2
…
pn
Тогда М(СХ) = Сх1р1 + Сх2р2 + … + Схпрп = С( х1р1 + х2р2 + … +
хпрп) = СМ(Х).
Определение. Две случайные величины называются
независимыми, если закон распределения одной из них не
зависит от того, какие значения приняла другая. В противном
случае случайные величины зависимы.
Определение. Назовем произведением независимых
случайных величин Х и Y случайную величину XY, возможные
значения которой равны произведениям всех возможных
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значений Х на все возможные значения Y, а соответствующие им
вероятности равны произведениям вероятностей сомножителей.
ожидание
произведения
двух
3)
Математическое
независимых случайных величин равно произведению их
математических ожиданий:
M(XY) = M(X)M(Y).
(1.15)
Доказательство. Для упрощения вычислений ограничимся
случаем, когда Х и Y принимают только по два возможных
значения:
x1
x2
xi
p1
p2
pi
у1
у2
уi
g1
g2
gi
Тогда ряд распределения для XY выглядит так:
хy
x1y1
x2y1
x1y2
x2y2
p
p1g1
p2 g1
p1g2
p2g2
Следовательно, M(XY) = x1y1·p1g1 + x2y1·p2g1 + x1y2·p1g2 +
x2y2·p2g2 = y1g1(x1p1 + x2p2) + + y2g2(x1p1 + x2p2) = (y1g1 + y2g2)
(x1p1 + x2p2) = M(X)·M(Y).
Замечание 1. Аналогично можно доказать это свойство для
большего количества возможных значений сомножителей.
Замечание 2. Свойство 3 справедливо для произведения
любого числа независимых случайных величин, что
доказывается методом математической индукции.
Определение. Определим сумму случайных величин Х и Y
как случайную величину Х + Y, возможные значения которой
равны суммам каждого возможного значения Х с каждым
возможным значением Y; вероятности таких сумм равны
произведениям вероятностей слагаемых (для зависимых
случайных величин – произведениям вероятности одного
слагаемого на условную вероятность второго).
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4) Математическое ожидание суммы двух случайных
величин (зависимых или независимых) равно сумме
математических ожиданий слагаемых:
M (X + Y) = M (X) + M (Y).
(1.16)
Доказательство.
Вновь рассмотрим случайные величины, заданные рядами
распределения, приведенными при доказательстве свойства 3.
Тогда возможными значениями X + Y являются х1 + у1, х1 + у2,
х2 + у1, х2 + у2. Обозначим их вероятности соответственно как
р11, р12, р21 и р22. Найдем М( Х +Y ) = (x1 + y1)p11 + (x1 + y2)p12 +
(x2 + y1)p21 + (x2 + y2)p22 =
= x1(p11 + p12) + x2(p21 + p22) + y1(p11 + p21) + y2(p12 + p22).
Докажем, что р11 + р22 = р1. Действительно, событие,
состоящее в том, что X + Y примет значения х1 + у1 или х1 + у2 и
вероятность которого равна р11 + р22, совпадает с событием,
заключающемся в том, что Х = х1 (его вероятность – р1).
Аналогично доказывается, что p21 + p22 = р2, p11 + p21 = g1, p12 +
p22 = g2. Значит,
M(X + Y) = x1p1 + x2p2 + y1g1 + y2g2 = M (X) + M (Y).
Замечание 3. Из свойства 4 следует, что сумма любого
числа случайных величин равна сумме математических
ожиданий слагаемых.
Пример 1.10. Найти математическое ожидание суммы
числа очков, выпавших при броске пяти игральных костей.
Найдем математическое ожидание числа очков, выпавших
при броске одной кости:
1 7
М(Х1) = (1 + 2 + 3 + 4 + 5 + 6) ⋅ =
6 2
Тому же числу равно математическое ожидание числа
очков, выпавших на любой кости. Следовательно, по свойству 4
М(Х)=5*7/2=17,5
5. Мода случайной величины X
14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Определяется как такое возможное значение случайной
величины X, вероятность которого максимальна. Так, xm - мода
случайной величины X, если
P(X = x m ) = max {P(X = x k )}
k
( 1.17 )
6. Дисперсия D(X)
Для того, чтобы иметь представление о поведении
случайной величины, недостаточно знать только ее
математическое ожидание. Рассмотрим две случайные
величины: Х и Y, заданные рядами распределения вида
Х
р
49
0,1
50
0,8
51
0,1
Y
p
0
0,5
100
0,5
Найдем М(Х) = 49·0,1 + 50·0,8 + 51·0,1 = 50, М(Y) = 0·0,5 +
100·0,5 = 50. Как видно, математические ожидания обеих
величин равны, но если для Х М(Х) хорошо описывает
поведение случайной величины, являясь ее наиболее вероятным
возможным значением (причем остальные значения ненамного
отличаются от 50), то значения Y существенно отстоят от М(Y).
Следовательно, наряду с математическим ожиданием
желательно знать, насколько значения случайной величины
отклоняются от него. Для характеристики этого показателя
служит дисперсия.
Определение.
Дисперсией
(рассеянием)
случайной
величины называется математическое ожидание квадрата ее
отклонения от ее математического ожидания:
Это неотрицательное число, подсчитываемое по формуле
n
D( X ) = M ( X − M ( X )) 2 = ∑ ( x k − M ( X )) 2 p k
k =1
( 1.18 )
Можно доказать, что
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
D( X ) = M ( X 2 ) − ( M ( X )) 2 = ∑ x k2 p k − ( M ( X )) 2
( 1.19 )
k =1
Замечание 4. В определении дисперсии оценивается не
само отклонение от среднего, а его квадрат. Это сделано для
того, чтобы отклонения разных знаков не компенсировали друг
друга.
Замечание 5. Из определения дисперсии следует, что эта
величина принимает только неотрицательные значения.
Замечание 6. Существует более удобная для расчетов
формула для вычисления дисперсии, справедливость которой
доказывается в следующей теореме:
Теорема 2.
D(X)=M(X²)–M ²(X).
Доказательство.
Используя то, что М(Х) – постоянная величина, и свойства
математического ожидания, преобразуем формулу (1.18) к виду:
D(X) = M(X – M(X))² = M(X² - 2X·M(X) + M²(X)) = M(X²) –
2M(X)·M(X) + M²(X) = M(X²) – 2M²(X) + M²(X) = M(X²) – M²(X),
что и требовалось доказать.
Пример 1.11. Вычислим дисперсии случайных величин Х и
Y, рассмотренных в начале этого раздела. D(Х) = (492·0,1 +
502·0,8 + 512·0,1) – 502 = 2500,2 – 2500 = 0,2.
D(Y) = (02·0,5 + 100²·0,5) – 50² = 5000 – 2500 = 2500. Итак,
дисперсия второй случайной величины в несколько тысяч раз
больше дисперсии первой. Таким образом, даже не зная законов
распределения этих величин, по известным значениям
дисперсии мы можем утверждать, что Х мало отклоняется от
своего математического ожидания, в то время как для Y это
отклонение весьма существенно.
Свойства дисперсии.
1) Дисперсия постоянной величины С равна нулю:
D (C) = 0.
(1.20)
16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Доказательство. D(C) =M((C – M(C))²)=M((C – C)²)=M(0) =
0.
2) Постоянный множитель можно выносить за знак
дисперсии, возведя его в квадрат:
(1.21)
D(CX) = C²D(X).
Доказательство. D(CX) = M((CX – M(CX))²) = M((CX –
CM(X))²) = M(C²(X – M(X))²) = C²D(X).
3) Дисперсия суммы двух независимых случайных величин
равна сумме их дисперсий:
D(X + Y) = D(X) + D(Y).
(1.22)
Доказательство. D(X + Y) = M(X² + 2XY + Y²) – (M(X) +
M(Y))² = M(X²) + 2M(X)M(Y) + M(Y²) – M²(X) – 2M(X)M(Y) – M²(Y)
= (M(X²) – M²(X)) + (M(Y²) – M²(Y)) = D(X) + D(Y).
Следствие 1. Дисперсия суммы нескольких взаимно
независимых случайных величин равна сумме их дисперсий.
Следствие 2. Дисперсия суммы постоянной и случайной
величин равна дисперсии случайной величины.
4) Дисперсия разности двух независимых случайных
величин равна сумме их дисперсий:
D(X– Y) = D(X) + D(Y).
(1.23)
Доказательство. D(X – Y) = D(X) + D(-Y) = D(X) + (-1)²D(Y)
= D(X) + D(X).
7. Среднеквадратическое отклонение σ ( X )
σ ( X ) = D( X )
( 1.24 )
σ ( X ) имеет размерность случайной величины. D(X) и
σ ( X ) характеризуют степень рассеивания случайной величины
относительно ее математического ожидания.
8. Начальный момент m-го порядка α m ( X ), m = 0,1,2,...
Это число
17
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
α m ( X ) = ∑ x km p k = M ( X m )
k =1
9. Центральный момент m-го порядка µ m (X )
( 1.25 )
n
µ m ( X ) = M ( X − M ( X )) m = ∑ ( x k − M ( X )) m p k
k =1
(1.26 )
10. Коэффициент асимметрии или “скошенности”
распределения β ( X )
µ (X )
β ( X ) = 33
σ (X )
( 1.27 )
11. Коэффициент эксцесса (”островершинности”)
распределения γ ( X )
γ (X ) =
µ4 (X )
σ 4 (X )
−3
( 1.28 )
Можно доказать, что если случайная величина Х
распределена по закону Бернулли, то M(X)=np, D(X)=np(1-p);
для распределения Пуассона M(X)=D(X)=λ=np. Для биномиального распределения
1− 2p
1 − 6 p(1 − p)
β (X ) =
;
γ (X ) =
np(1 − p )
np(1 − p)
1 .4.3. Непрерывные случайные величины
Если дискретная СВХ задается законом распределения, то
непрерывная случайная величина X задается функцией
распределения F(x) или плотностью распределения f(x ) .
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
F(x)=P(X<x)
Функция распределения и плотность
связаны следующими соотношениями:
распределения
f(x) = F ′(x)
или
x
F(x) = ∫ f(t)dt
−∞
Плотность
распределения
следующими свойствами:
вероятностей
( 1.29 )
обладает
∞
a)
∫ f (t )dt =1 (условие нормировки)
−∞
b)
f ( x) ≥ 0
∀x ∈ R
( 1.30)
1.4.4. Характеристики непрерывных случайных величин
1. Математическое ожидание M(X)
+∞
M(X) = ∫ xf(x)dx
−∞
( 1.31 )
2. Мода непрерывной случайной величины. Это точка
максимума плотности распределения вероятностей
3. Дисперсия D(X)
+∞
D(X) = ∫ (x − M(X)) 2 f(x)dx
−∞
( 1.32 )
можно доказать, что
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
D(x) =
+∞
∫x
2
f(x)dx-[M(X)] 2
−∞
4. Среднеквадратическое отклонение σ (X )
( 1.33 )
σ ( X ) = D( X )
( 1.34 )
5. Начальный момент m-го порядка
∞
m
α ( X ) = M ( X ) = ∫ x m f ( x ) dx
m
−∞
α (X ) :
m
( 1.35 )
6. Центральный момент m-го порядка µ ( X )
m
∞
µ ( X ) = ∫ ( x − M ( x)) m f ( x)dx = M ( X − M ( X )) m
m
−∞
(1.36 )
7. Коэффициент
асимметрии
(“скошенности”)
распределения β ( X )
µ (X )
β (X ) = 3
σ 3(X )
( 1.37 )
8. Коэффициент
эксцесса
(островершинности)
распределения γ ( X )
µ (X )
−3
γ (X ) = 4
σ 4( X )
( 1.38 )
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность того, что непрерывная величина примет
какое-то значение из отрезка [x1,x2] подсчитывается по
формуле
x2
P( x ≤ X ≤ x ) = ∫ f (t )dt = F ( x2 )− F ( x1)
( 1.39 )
1
2
x1
Квантилью порядка p (симметричной квантилью порядка
p) распределения НСВХ называется действительное число t p
)
(действительное число t p ), удовлетворяющее уравнению
)
P ( X < t p ) = p (рис.1.1) ( P( X < t p ) = p (рис.1.2)).
Критической
точкой
порядка
p
(симметричной
критической точкой порядка p) распределения НСВХ является
действительное число (æp*), удовлетворяющее уравнению P(X≥
æp)=p (рис 1.3) { P(|X|≥ æp*) =p (рис 1.4) }
Квантиль и критическая точка одного и того же
)
распределения связаны соотношениями æp = t1− p . æp* = t1− p
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок1.1.
)
tp
)
−t p
Рисунок 1.2.
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
æp
Рисунок 1.3.
æp*
æp*
Рисунок 1.4.
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Медианой НСВХ называется действительное число
hX , óäî âëåòâî ðÿþ ù åå óñëî âèþ
P( X < hX ) = P( X ≥ hX ) , то
1
есть корень уравнения FX ( x) = .
2
1.4.5. Нормальный закон распределения
СВХ называется распределенной по нормальному
(гауссовскому) закону с параметрами m ∈ R и σ > 0 , если
плотность распределения вероятностей имеет вид
(x − m )2
−
1
2
f ( x) =
e 2σ , − ∞ < x < ∞
(1.40)
σ 2π
Графики плотности распределения при различных
значениях σ и одном и том же значении m приведены на
рисунке 1.5:
Рисунок 1. 5.
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
∞
x
M (X ) = ∫
e
σ
π
2
−∞
( x − m) 2
−
2σ 2
−
∞
1
D(X ) = ∫
(x−m)2 e
− ∞ σ 2π
dx = m
(x−m)2
2σ 2
dx = σ 2 ;
( x − m) 2
−
x
2
1
F ( x) =
dx
∫ e 2σ
σ 2π − ∞
График функции распределения для m=3 и σ=1 приведен
на рисунке 1.6:
Рисунок 1. 6.
Для нормального закона мода и математическое ожидание
совпадают. Говорят, что СВХ распределена по закону N(m, σ) ,
если ее плотность вероятностей записывается в виде ( 1.40 ).
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если НСВ X распределена по закону N (0,1) , то она
называется стандартизованной нормальной величиной.
Функция распределения стандартизованной гауссовской
величины:
t2
x
−
1
Ф(x ) =
∫ е 2 dt
2π − ∞
( 1.41 )
С ее помощью можно вычислять интервальные
вероятности для нормального распределения:
x −m
x −m
) − Ф( 1
)
P( x ≤ x ≤ x ) = Ф( 2
1
2
σ
σ
( 1.42 )
Значения Ф(x) приведены в приложениях практически
всех учебников по теории вероятностей и математической
статистики (см. Приложение 1).
Для Ф(x) справедливо соотношение: Ф(-x)=1-Ф(x)
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 1. 7.
Иногда в приложениях приводятся значения следующих
функций распределения:
t2
t2
x
−
x
−
2
2 dt и Ф (x ) = 1 ∫ е 2 dt
Ф (x ) =
∫е
1
2
2π 0
2π − ∞
Нетрудно доказать, что Ф ( x) = 2Ф( x); Ф ( x) = Ф( x) − 0,5;
1
2
График функции Ф(x) приведен на рисунке 1.7.
Для
вероятности
попадания
на
симметричный
относительно математического ожидания интервал справедлива
формула:
ε
σ
P( x − M ( X ) < ε ) = 2Ф( ) − 1
( 1.43 )
Пример 1.12. СВХ распределена по нормальному закону с
m = 5,5 и σ = 1,08 . Вычислить P(2,9 ≤ x ≤ 3,9)
Решение.
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
P(2,9 ≤ x ≤ 3,9) = Ф(
3,9 − 5,5
2,9 − 5,5
) − Ф(
) = Ф(−1,48) − Ф(−2,41) =
1,08
1,08
[1 − Ф (1,48)] − [1 − Ф (2,41)] = Ф (2,41) − Ф (1,48) ≈ 0,9920 − 0,9306 = 0,0614
Для вычисления этой вероятности на EXCEL воспользуемся
статистической функцией НОРМРАСП
( x − m) 2
−
x
1
2σ 2 dx
НОРМРАСП ( x, m, σ , истина) =
∫e
σ 2π − ∞
В свободную ячейку вводим формулу:
=НОРМРАСП(3,9;5,5;1,08;истина)НОРМРАСП
(2,9;5,5;1,08;истина)
Результатом будет 0,0614
Ответ: P(2,9≤ x ≤ 3,9)=0,0614
Примеры на нормальный закон распределения.
Пример 1.13. Химзавод производит серную кислоту
номинальной плотности 1.84г/см3. В результате испытаний
обнаружено, что 99.9% всех выпускаемых реактивов имеет
плотность в интервале [1.82 1.86]. Найти вероятность того, что
кислота удовлетворяет стандарту, если для этого достаточно,
чтобы плотность отклонялась от номинала не больше, чем на
0.01 г/см3.
Решение.
1.86 − 1.84
1.82 − 1.84
P (1.82 < x < 1.86) = 0.999 ⇒ Ô (
) −Ô(
)=
0.02
0.02
σ
σ
1.999
0.02
= 0.999 2Ô (
= 0.9995 ⇒
= 3.57
) − 1 = 0.999 Ô (
)=
σ
σ
σ
2
1.85 − 1.84
1.83 − 1.84
0.01
P(1.83 < x < 1.85) = Ф(
) − Ф(
) = 2Ф(
) −1
σ
0.01
σ
σ
= 1.635 Ф (1.635) ≈ 0.9489
искомая вероятност ь p = 2 ⋅ 0.9489 − 1 = .8978
28
σ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 1.14.
P( X < 2) = 0.99; M ( X ) = 1; Найти M ( X 2 ), P( X 2 > 2)
Решение.
2 −1
1
−∞ − 1
P (−∞ < x < 2) = Ô (
) −Ô(
) = Ô ( ) = 0.99
1
σ
σ
σ
1
= 0.4292; D(X) = M ( X 2 ) − {M ( X )}2 = σ 2 ( X ) =
σ
2.33
2
= 0.4292 = 0.1842; M(X 2 ) = {M ( X )}2 + 0.1842 = 1.1842
= 2.33 ⇒ σ =
P ( X 2 > 2) = P ( X > 2) + P ( X < − 2)
P ( X > 2) = Ô (∞) − Ô (
2 −1
) = 1 − Ô (0.9651) = 1-0.83398 = .16602
0.4292
−1 − 2
) − 0 = 1 − Ô (5.61) = 1-1 = 0
0.4292
P ( X 2 > 2) = .16602
P ( X < − 2) = Ô (
Пример 1.15. Измеряемая НСВХ ~N(10,5). Найти
симметричный относительно математического ожидания
интервал, в который с вероятностью p попадет измеренное
значение
1) p=0.9974
2) p=0.9544
3) p=0.50
Решение.
ε
σ
P ( X − M ( X ) < ε ) = 2Ô ( ) − 1;
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1)
ε
5
2)
ε
5
3)
ε
5
ε
ε
1.9974
= 0.9987
2
ε
1.9544
= 0.9772
2
P ( X − 10 < ε ) = 2Ô ( ) − 1 = 0.9974; Ô ( ) =
5
5
= 3.01 ε = 15.05 − 5.05 < X < 25.05
ε
P ( X − 10 < ε ) = 2Ô ( ) − 1 = 0.9544; Ô ( ) =
5
5
= 2 ε = 10 0 < X < 20
ε
ε
1.5
P ( X − 10 < ε ) = 2Ô ( ) − 1 = 0.5; Ô ( ) =
= 0.75
5
5
2
= 0.68 ε = 3.4 6.6 < X < 13.4
)
Пример 1.16. НСВХ ~N(0,1). Найти t0.9 , t0.95 , æ0.15, æ*0.15
Решение.
P( x < t0.9 ) = 0.9 = Ô (t0.9 ) t0.9 = 1.28
)
)
)
)
P(−t0.9 < x < t0.9 ) = 2Ô (t0.9 ) − 1 = 0.95; Ô (t0.9 ) = 1.96
P(x< æ0.15)=0.85=Ф(æ0.15) æ0.15=1.04
P(|x|< æ*0.15)=0.925=Ф(æ*0.15) æ*0.15=1.44
Пример 1.17. Деталь, изготовленная автоматом, считается
годной, если отклонение Х контролируемого размера от
номинала не превышает 10 мм. Точность изготовления деталей
характеризуется стандартным отклонением σ. Считая, что для
данной технологии σ=5 мм и Х нормально распределенной,
выяснить, сколько процентов годных деталей изготовляет
автомат.
Решение.
10
P( X − M ( X ) ≤ 10) = 2Ф( ) − 1 = 2Ф(2) − 1 = 2 * 0,9772 − 1 = 0,9544
σ
Ответ: примерно 95 %
В условиях предыдущей задачи выяснить, какой должна
быть точность изготовления, чтобы процент годных деталей
повысился до 98 %.
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Решение.
P ( X − M ( X ) ≤ 10) = 2Ô (
10
σ
) − 1 = 0,98
Ô(
10
σ
)=
1, 98
= 0,99
2
10
σ
= 2,33
10
= 4, 29
2,33
Пусть X n - число успехов в n независимых испытаниях по
схеме Бернулли. Тогда при достаточно больших значениях npq
m − np
m − np
1
P(m1 ≤ X n < m2 ) = Ф( 2
) − Ф( 1
) + O(
)
npq
npq
npq
(интегральная теорема Муавра-Лапласа) и, кроме того,
σ=
x2
− m
1
1
m − np
P ( X n = m) =
e 2 + O(
), где xm =
2πnpq
npq
npq
(локальная теорема Муавра-Лапласа).
Случайная величина имеет гамма-распределение с
параметрами a>0 и b>0 {X~Г(a, b)}, если она непрерывна и ее
плотность распределения вероятностей имеет следующий вид:
0

f X ( x) =  b a a −1 −bx
 Г (a) x e

x≤0
x>0
,
∞
где Г (а) = ∫ t a−1e −t dt - гамма-функция Эйлера.
0
В частности, показательное распределение с параметром λ
является частным случаем гамма-распределения с параметрами
a=1, b= λ>0.
Непрерывная случайная величина Х распределена по
показательному (экспоненциальному) закону, если ее плотность
распределения вероятностей имеет вид:
x≤0
0
f X ( x) =  −λx
x>0
λe
31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Показательное распределение часто встречается в теории
массового обслуживания (например, Х – время ожидания при
техническом обслуживании, Х – длительность телефонных
разговоров, ежедневно регистрируемых на телефонной станции)
и в теории надежности (например, Х – срок службы
радиоэлектронной аппаратуры).
Графики
плотности
распределения
показательного
распределения для λ=2, 5 и 10 представлены на рисунке 1.8.
Рисунок 1.8.
Пример 1.18. Время безотказной работы радиоаппаратуры
является случайной величиной Х, распределенной по
показательному закону с параметром λ. Найти математическое
ожидание, дисперсию, функцию распределения и построить ее
график.
Решение.
∞
M ( X ) = ∫ λ xe − λ x dx ,
0
∞
D ( X ) = ∫ x 2 λ e − λ x dx − [ M ( X )] 2 ,
0
x
F ( x ) = ∫ λ e − λ t dt
0
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M (X ) =
1
λ
;
D( X ) =
1
λ
2
; F ( x ) = 1 − e − λx .
График представлен на рис. 1.9.
Рисунок 1.9.
Пример 1.19. Время ожидания у бензоколонки
автозаправочной станции является случайной величиной,
распределенной по показательному закону со средним временем
ожидания t 0 . Найти вероятности событий
3
t
A =  0 ≤ x ≤ t0
2
2
Решение.
1
λ
= t0 ; λ =
},
B = {x ≥ 2t 0 }
1 3t0
1 t0
− ⋅
− ⋅
1
; P( A) = [1 − e t0 2 ] − [1 − e t0 2 ] = exp(−0,5) − exp(−1,5) = 0.3834
t0
P ( B) = 1 − P ( x < 2t 0 ) = 1 − F ( 2t 0 ) = 1 − {[1 − e
33
1
− ⋅2 t 0
t0
]} = exp( −2) = 0.1353
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Другой
частный
случай
гамма-распределения
с
параметрами a=n/2 (n – натуральное число), в=1/2 называется
распределением χ 2 (n) . Распределение χ 2 (n) играет большую
роль в математической статистике. Если Х подчиняется закону
χ 2 (n) , то ее плотность распределения вероятностей
записывается в виде:
x≤0
0

n
x
−1 −

f X ( x) =  n 1
x2 e 2
x>0
 2 n
 2 Г ( 2 )
Графики плотности распределения хи-квадрат с 4 (g=2) и
10 (g=5)степенями свободы представлены на рис. 1.10.
M [ χ 2 (n)] = n, D[ χ 2 (n)] = 2n .
НСВХ подчиняется закону распределения Парето с
параметрами a > 0 è x0 > 0 , если ее функция распределения
x ≤ x0
0

вероятностей имеет вид FX ( x) =   x a
0
1−   x > x0
x
  
Ее математическое ожидание M ( X ) =
D( X ) =
a
x02 , a > 2.
(a − 1) (a − 2)
2
34
.
a
x0 , åñëè a > 1 ,
a −1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 1.10.
Ее математическое ожидание M ( X ) =
D( X ) =
a
x0 , åñëè a > 1 ,
a −1
a
x02 , a > 2.
(a − 1) 2 (a − 2)
Пример 1.20. Если годовой доход предпринимателя
превосходит установленный законом уровень x0 , то на него
действует закон о налогообложении. Считая, что годовой доход
наудачу выбранного лица, облагаемого налогом, является СВХ,
распределенной по закону Парето с параметрами а=4, x0 =1000,
найти вероятности событий:
A = {hX ≤ X < M ( X )}, B = { X − M ( X ) < σ X }
Критической точкой какого порядка для данного
распределения является математическое ожидание М(Х)?
Решение.
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
Найдем
hX
из
условия
= x = 4 2 ⋅1000 ≈ 1189.2 ; M ( X ) =
D( X ) =
1
x 
FX ( x ) = = 1 −  0  hX =
2
 x
4
4
x0 = ⋅1000 ≈ 1333.3
3
3
4 2 2 2
2
x0 = x0 ; σ ( X ) =
x0 ≈ 471.4045
9⋅2
9
3
4
4
 x 
 3x 
4
4
P( A) = P( 2 ⋅ x0 ≤ x < x0 ) = F( x0 ) − F( 4 2x0 ) = [1−  0  ] −[1−  40  ]
x 2
3
3
 4x0 
 0 
4
4
1 3
= −   ≈ 0.1836
2 4
Рисунок 1.11.
P ( B ) = P( x −
4
2
4− 2
4+ 2
4+ 2
x0 <
x0 ) = P(
x0 < x <
x0 ) = F (
x0 ) −
3
3
3
3
3
4
F(
4
4− 2
 3 
 3 
x0 ) == [1 − 
 ] − F (0.8619 x0 ) ≈ [1 − 
 ] − 0 = 0.9057
3
4+ 2
4+ 2
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
4
 3x 
4
3
P( x ≥ x0 ) = 1 − [1 −  0  ] =   = 0.3164 (рис.1.11).
3
4
 4 x0 
Распределением Стьюдента с k степенями свободы
называется распределение случайной величины T(k), равной
отношению двух независимых случайных величин U и
U
χ 2 (k ) / k , то есть T (k ) =
2
χ (k ) / k
где U~N(0,1). Плотность этого распределения fT(x)
 k + 1
k +1
Г
−

x2  2
2 
,

f T ( x) =
, −∞< x<∞
1 + 
k 
k
Г   πk 
2
∞
где Г ( а ) = ∫ t
a −1
e −t dt - гамма-функция Эйлера.
0
k
, k>2
k−2
Плотность распределения Стьюдента симметрична
относительно оси ординат, следовательно, для квантилей tp(k)
имеет место соотношение tp(k)=-t1-p(k).
При k → ∞ распределение Стьюдента стремится к
нормальному распределению с параметрами N(0,1).
Построим графики функции плотности распределения
Стьюдента при k=3 и k=10 (рис. 1.12).
При больших k (k>30)
2
1 2 u p − 12 ,
где
up
–
квантили
t p (k ) ≈u p ((1 − ) − )
4k
2k
нормального распределения с параметрами N(0,1)
Пример 1.21. Найти квантили t 0 , 05 (8) и t 0 , 90 ( 40)
По
таблице
распределения
Стьюдента
имеем
t 0, 05 (8) = −t 0,95 (8) − 1.86 и t 0,90 (40) = 1,303
M[T(k)]=0, D[T (k )] =
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 1.12.
Пример 1.21. Найти квантили t 0 , 05 (8) и t 0 , 90 ( 40)
По
таблице
распределения
Стьюдента
имеем
t 0, 05 (8) = −t 0,95 (8) − 1.86 и t 0,90 (40) = 1,303
По формуле для k=40 имеем: t0 , 90 ( 40) = 1.297 (u0.9=1.28)
C
помощью
статистической
функции
Excel
СТЬЮДРАСПОБР можно вычислить эти вероятности так:
t 0, 05 (8) = −СТЬЮДРАСПОБР(0,1;8) = −1,8595 и
t 0,90 (40) = СТЬЮДРАСПОБР(0,2;40) = 1,3030
Пояснение:
статистическая
функция
СТЬЮДРАСПОБР вычисляет такие значения t, при которых
P(| х | >t)=p, поэтому в первом случае входная вероятность равна
0,1, а во втором – 0,2.
В первом случае (t0,95(8)) дана S1=0,05, следовательно,
S=0,05+0,05=0,1.
Во
втором
случае
S2=1-0,9=0,1,
следовательно,
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
S=0,1+0,1=0,2 (S1=S2) (рис.1.13).
Рисунок 1.13.
Распределением Фишера с k1 и k2 степенями свободы
называется распределение случайной величины F(k1,k2), равной
2
отношению двух независимых случайных величин χ (k1 ) / k1 и
χ 2 (k 2 ) / k 2 , то есть
χ 2 (k1 ) / k1
F ( k1 , k 2 ) = 2
χ (k 2 ) / k 2
Оно имеет плотность fT(x)]
x≤0
0

k
 Г  k1 + k 2 
  2  k 2
f T ( x) = 
 1 
  k1   k 2   k 2 
 Г 2 Г 2 
    
1
39
k1
x2
−1
 k1 x 
1 +

k

2 
k1 + k 2
2
, x>0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построим графики функции плотности распределения
Фишера при k1=6, k2=60 и k1=6, k2=6 (рис. 1.14).
Рисунок 1.14.
Квантили распределения Фишера порядка p и 1-p связаны
следующей формулой:
Между случайными величинами, имеющими нормальное
распределение, распределение χ2, Стьюдента и Фишера, имеют
место соотношения:
χ 2 (k )
T 2 (k ) = F (1, k ), F (k , ∞) =
, χ 2 (1) = U 2
k
При k1>>1 и k2>>1 квантили распределения Фишера
можно вычислить по приближенной формуле
F p ( k1 , k 2 ) ≈
k2
2(k1 + k 2 − 2)
k2
up +
, где up
k2 − 2
k1 (k 2 − 4)
k2 − 2
соответствующий квантиль нормального распределения с N(0,1).
Пример 1.22. вычислить квантили F0.01(3,5), F0.90(4,100) и
F0.05(60,120)
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Решение.
F0.01 (3,5) =
1
1
=
= 0.035,
F0.99 (5,3) 28.24
F0.05 (60,120) =
F0.90 (4,100) =
2
χ0.9
(4)
4
=
7.78
= 1.945
4
120
2(60 + 120 − 2)
120
= 0.639
(−1.645) +
120 − 2
60(120 − 4)
120 − 2
(u0.05 = −u0.95 = −1.645)
Ï î òàáëèöå F0.05 (60,120) =
1
1
=
= 0.680
F0.95 (120, 60) 1.47
C помощью статистической функции Excel FРАСПОБР
можно вычислить эти вероятности так:
F0.01(3,5)= FРАСПОБР(0,99;3,5)=0,035
F0.90(4,100)= FРАСПОБР(0,1;4,100) =2,002
F0.05(60,120)= FРАСПОБР(0,95;60,120)=0,682
Входной вероятностью для функции FРАСПОБР является
Р=1-p, то есть используемая в Excel функция FРАСПОБР
вычисляет критические точки распределения Фишера (P(x>t)=P)
(рис 1.15).
Рисунок 1.15.
41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.5. Случайные векторы
Совокупность (X1,X2,...,Xn) случайных величин называется
n-мерным случайным вектором. Такой вектор может быть
охарактеризован своей n-мерной функцией распределения:
F ( x , x ,..., x ) = P( X < x , X < x ,..., X < x )
1 2
n
1 1 2
n
n
2
Для двумерного вектора F ( x , y ) = P ( X < x , Y < y )
Пусть задан какой-либо двумерный вектор дискретного
типа. Переменная X принимает значения x1, x2,...,xn; переменная
Y- значения y1, y2,...,ym. В общем случае n ≠ m . Перечень
возможных пар компонент ( x , y ) , i = 1, n , j = 1,m и
i j
соответствующих
каждой
точке
паре
вероятностей
 n m

p = P( X = x , Y = y ) ,  ∑ ∑ pij =1 , называется законом
ij
i
j


 i =1 j =1

распределения случайного вектора дискретного типа.
Пример 1.23. Задан закон распределения вектора (Х, Y).
Определить
1) законы распределения X и Y
2) центр рассеивания вектора (X, Y).
XY
2
4
0
0,1
0,3
1
0,2
0,1
2
0,2
0,1
Здесь СВХ принимает 3 значения: 0, 1 и 2, а СВY – два
значения: 2 и 4. 0,3 – это вероятность того, что СВХ приняла
значение 0, а случайная величина Y значение 4, т.е.
P ( x = 0, y = 4) = 0,3
Одномерные законы распределения отдельных компонент
вектора, (т.е. X и Y) можно выразить через вероятности p
ij
42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
m
P = p ( X = x ) = ∑ pij ;
i
i
j =1
m
P = p (Y = y ) = ∑ p ij
j
J
i =1
Так, в примере 1.23 законы распределения СВХ и СВY
выглядят так:
X
p
Y
p
0
0,4
2
0,5
1
0,3
2
0,3
4
0,5
Начальным моментом порядка k+s случайного вектора
(X,Y) называют число
n m
k s
α
= M ( X Y ) = ∑ ∑ xik y sj pij
k ,s
i =1 j =1
Вектор с координатами (m x , m y ) = (α 1,0 , α 0,1 ) называется
математическим ожиданием случайного вектора (X,Y) или
центром рассеивания.
Так, в примере 1.23:
m x = α 1, 0 = M ( X ) = 0 ⋅ 0,4 + 1 ⋅ 0,3 + 2 ⋅ 0,3 = 0,9
m y = α 0,1 = M (Y ) = 2 ⋅ 0,5 + 4 ⋅ 0,5 = 3
Центральным моментом порядка k+s случайного вектора
n
m
(X,Y) называется число µ k , s = ∑ ∑ ( x i − m x ) k ( y j − m y ) s p ij
i =1 j =1
Центральный момент
µ1,1 называется ковариацией и
обозначается cov( X , Y ) :
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
cov( X , Y ) = µ1,1 = M [( X − m x )(Y − m y )] =
n
m
= ∑∑ ( xi − m x )( y j − m y ) pij =M ( XY ) − m x m y
i =1 j =1
(1.44)
Если X и Y независимы, то cov( X , Y ) = 0
Пример 1.24. Найдем cov( X , Y ) для примера 23.
Запишем закон распределения случайной величины XY.
Эта величина принимает 4 значения: 0 (когда x=0, а y принимает
значения 2 или 4), 2 (когда x=1, y=2), 4 (когда x=1, y=4 или x=2,
y=2) и 8 (когда x=2 и y=4)
В соответствии с формулой (1.44)
P ( xy = 0) = P( x = 0, y = 2) + P( x = 0, y = 4)
P ( xy = 2) = P ( x = 1, y = 2)
P ( xy = 4) = P ( x = 1, y = 4) + P( x = 2, y = 2)
P ( xy = 8) = P ( x = 2, y = 4)
XY
p
0
0,4
2
0,2
4
0,3
8
0,1
M ( XY ) = 0⋅ 0 , 4 + 2⋅ 0 , 2 + 4⋅ 0 , 3 + 8⋅ 0 ,1= 2 , 4 ;
cov( X , Y ) = M ( XY ) − m x ⋅ m y = 2,4 − 0,9 ⋅ 3 = −0,3
Величина ρ x , y называется коэффициентом корреляции и
вычисляется по формуле:
ρ x, y =
cov( X , Y )
σ ( X )σ (Y )
( 1.45 )
ρ x , y ≤1 и определяет степень линейной зависимости
между X и Y. Случайные величины, для которых ρ x , y = 0 ,
44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
называют
некоррелированными.
Наилучшее
приближение регрессии Y на X имеет вид:
Y = ρ x, y
σy
σx
( x − M ( X )) + M (Y )
линейное
( 1.46)
Пример 1.25. Подсчитать коэффициент корреляции между
X и Y для примера 23.
Решение. Найдем D(X ) и D(Y )
D( X ) = M ( X 2 ) − [ M ( X )] 2 = 0 2 ⋅ 0,4 + 12 ⋅ 0,3 + 2 2 ⋅ 0,3 − 0,9 2 = 0,69 ;
σ ( X ) = D( X ) ≈ 0,83
D(Y ) = M (Y ) − [ M (Y )] 2 = 4 ⋅ 0,5 + 16 ⋅ 0,5 − 9 = 1 ;
0,3
= −0,36
σ (Y ) = 1 ; ρ x , y = −
0,83
Пример 1.26. Закон совместного распределения
случайного вектора (X,Y) задан таблицей
2
Y
-1
X
0
1
1
0,15
0,3
0,35
2
0,05
0,05
0,1
Найти законы распределения случайных величин X и Y,
вычислить ρ x, y , P(X=2,Y≥0), P(X>Y)
Решение.
P(X=2,Y≥0)=0, 15, P(X>Y)=0,45+0,2=0,65
1
0,8
Х
p
Y
p
XY
p
-2
0,05
-1
0,2
2
0,2
0
0,35
-1
0,15
0
0,35
45
1
0,45
1
0,35
2
0,1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M(X)=0,8+0,4=1,2
M(Y)=-0,2+0,45=0,25
M(XY)=0,3
cov(X,Y)=0
1.6. Задания по теории вероятностей
Задания следует оформлять в отдельной тетради, на
обложке которой кроме фамилии и номера группы должны
быть указаны следующие данные:
α= ,β= ,γ= ,θ= ,µ= ,ν= .
Здесь α и β – первая и третья цифры номера группы, γ и
θ – две последние цифры номера группы, µ и ν – две цифры
номера студента по списку.
Так, у пятого студента группы 728311 α = 7, β = 8, γ = 1, θ =
1, µ = 0, ν = 5.
В тетради должно быть записано условие задания и его
подробное решение.
Задание 1.1.
Прибор, установленный на борту самолета, может работать
в двух режимах: в условиях нормального крейсерского полета и
в условиях перегрузки при взлете и посадке. Крейсерский
режим полета осуществляется в (70+10µ+ν)% всего времени
полета. Вероятность выхода прибора из строя за время полета в
нормальном режиме равна 0,1(µ+1), в условиях перегрузки
0,1α+0,01ν. Вычислить надежность прибора за время полета.
Задание 1.2.
Прибор состоит из двух последовательно включенных
узлов. Надежность (вероятность безотказной работы в течение
времени Т) первого узла равна 0,1α+0,01(10µ+ν), второго
0,01+0,1γ. За время испытания прибора в течение времени Т
зарегистрирован отказ прибора. Найти вероятности следующих
событий:
1) А1={отказал только первый узел}
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2) A2={отказали оба узла}
Задание 1.3.
Устройство состоит из трех независимо работающих
элементов. Вероятность отказа каждого из элементов в одном
опыте равна p=(10µ+ν+θ)%. Случайная величина Х – число
отказавших элементов в одном опыте. Определить следующие
характеристики СВХ:
1) закон распределения СВХ;
2) построить многоугольник распределения СВХ;
3) F(x) и построить ее график;
4) M(X);
5) D(X) и σ(X);
6) µ 3 ( X ) и µ 4 ( X ) ;
7) β(X) – коэффициент асимметрии;
8) γ(X) – коэффициент эксцесса;
9) моду СВХ.
Определить вероятность того, что в одном опыте откажут
а) не более двух элементов
б) хотя бы один элемент.
Задание (кроме пунктов 2,3 и 9) выполнить с использованием
статистических функций EXCEL.
Пример выполнения задания 3 ( µ = 6, ν = 0, θ = 0) .
Тогда p=0,6.
1) В данном задании число “опытов” n=3. Случайная
величина X принимает 4 значения: 0, 1, 2 и 3.
Для вычисления P3(0), P3(1), P3(2) и P3(3) воспользуемся
формулой Бернулли:
P3( 0 ) = C 30 0,6 0 (1 − 0,6) 3 = 0,4 3 = 0,064
P3( 1 ) = C 31 0,61 (1 − 0,6) 2 = 0,288
P3( 2 ) = C 32 0,6 2 (1 − 0,6) 1 = 0,432
47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
P3( 3 ) = C 33 0,6 3 (1 − 0,6) 0 = 0,6 3 = 0,216
Закон распределения случайной величины X – это таблица
X
P
0
0,064
1
0,288
2
0,432
3
0,216
Покажем, как решить эту часть задачи с помощью
EXCEL.
Для того, чтобы вычислить, например, P3 (2) в какую-либо
ячейку надо ввести формулу =БИНОМРАСП(2;3;0,6;ложь).
Сделать это можно либо с помощью мастера функций (кнопка
f x на панели «стандартная»), выбрав раздел статистических
функций, либо путем непосредственного ввода в командной
строке указанной формулы. На экране дисплея результат может
выглядеть так:
2
3
4
с
d
e
f
g
X
0
1
2
3
P
0,064
0,288
0,432
0,216
В ячейки d3, e3, f3 и g3 введены значения СВХ, в ячейки
d4-g4 – соответствующие формулы. Так, в ячейку d4 введена
формула =БИНОМРАСП(0;3;0,6;ложь), в ячейку e4 формула
=БИНОМРАСП(1;3;0,6;ложь) и т.д.
2) Построим многоугольник распределения СВХ (рис. 1.16):
48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
P
0,432
0,288
0,216
0,064
0
1
2
Рисунок 1.16.
3) По определению F(x)=P(X<x)
Так как СВХ принимает значения 0, 1, 2 и 3, рассмотрим пять
случаев:
а) x≤0
x 0
Вероятность того, что случайная величина примет значение,
меньшее нуля равна нулю. То есть в этом случае F(x)=0.
в) 0<x≤1
0 x 1
Случайная величина принимает одно значение, меньшее 1.
Это значение ноль. Вероятность того, что СВХ примет значение,
равное нулю, P3 (0) = 0,064 В этом случае F(x)=0,064.
c) 1<x≤2
0
1 x 2
СВХ может принять два значения, каждое из которых меньше
двух. Это значения 0 и 1.
Поэтому F ( x) = P3 (0) + P3 (1) = 0,064 + 0,288 = 0,352
d) 2<x≤3
0
1
2
x
3
49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
F ( x) = P3 (0) + P3 (1) + P3 (2) = 0,064 + 0,288 + 0,432 = 0,784
e) x>3
0
1
2
3 x
F ( x) = P3 (0) + P3 (1) + P3 (2) + P3 (3) = 0,064 + 0,288 + 0,432 + 0,216 = 1
0
0,064

F ( x) = 0,352
0,784

1
при x ≤ 0
при 0 < x ≤ 1
при 1 < x ≤ 2
при 2 < x ≤ 3
при x > 3
F (x )
1
0.784
0.352
0.064
1
2
3
n
4) M ( X ) = ∑ x k p k
k =1
В нашем примере
М(Х)=0⋅0,064+1⋅0,288+2⋅0,432+3⋅0,216=1,8
Чтобы решить эту часть задачи в среде EXCEL, вычислим
50
x
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М(Х)= d3⋅d4+e3⋅e4+f3⋅f4+g3⋅g4. Введем в какую-либо ячейку
(например, в d6) формулу =СУММПРОИЗВЕД(d3:g3;d4:g4).
Результатом будет число 1,8.
5) D( X ) = M ( X 2 ) − [ M ( X )] 2
D(X)=02⋅0,064+12⋅0,288+22⋅0,432+32⋅0,216-1,82=0,72
Дополним таблицу на с. 46 еще одной строкой
с
X^2
5
d
0
e
1
f
4
g
9
В пятой строке каждое значение СВХ мы возвели в
квадрат.
Теперь
в
ячейке
d7
набираем
формулу
=СУММПРОИЗВЕД(d5:g5;d4:g4)-d6^2. Результатом будет 0,72.
σ ( X ) = D( X ) . σ(Х)=0,849. В ячейке d8 набираем формулу
=d7^(1/2)
n
6) µ 3 ( X ) = ∑ ( x k − M ( X )) 3 p k .
k =1
µ3(Х)=(0-1,8)3⋅0,064+(1-1,8)3⋅0,288+(2-1,8)3⋅0,432+(3-1,8)3⋅0,216=-
0,144.
Дополним таблицу
с
d
e
f
g
12
(X-М(Х))^3
-5,832
-0,512
0,008
1,728
В ячейку d12 введена формула =(d3-$d$6)^3 и затем с
помощью мыши, ухватив крестик в правом нижнем углу ячейки
d12 и, протащив его по ячейкам e12, f12 и g12, мы
распространили эту формулу на ячейки e12-g12. В ячейке d10
набираем формулу =СУММПРОИЗВЕД(d12:g12;d4:g4).
Ответ: -0,144.
n
µ 4 ( X ) = ∑ ( x k − M ( X )) 4 p k . Аналогично
k =1
13
с
(X-М(Х))^4
d
10,4976
51
e
0,4096
f
0,0016
g
2,0736
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В ячейку d13 введена формула =(d3-$d$6)^4 и
распространена на ячейки e13-g13. В ячейку d15 введем
формулу =СУММПРОИЗВЕД(d13:g13;d4:g4).
Ответ: 1,2384.
7) Коэффициент асимметрии
µ ( X ) . В одну из свободных ячеек введем формулу
β ( X ) = 33
σ (X )
=d10/d8^3.
Ответ: -0,2357.
8) Эксцесс
µ (X )
γ ( X ) = 44
− 3 . В одну из свободных ячеек вводим формулу
σ (X )
=d15/d7^2-3.
Ответ: -0,6111.
9) Мода CBX равна 2, т.к. это значение CB принимает с
наибольшей вероятностью (см. закон распределения CBX или
многоугольные распределения)
а) Не более двух элементов – это либо 0, либо 1, либо 2
элемента.
P3(x≤2)=P3(0)+P3(1)+P3(2)=1-P3(3)
В любой свободной ячейке набираем формулу
= БИНОМРАСП(2;3;0,6;истина)
Ответ: P3(x≤
≤2)=0,784
б) Хотя бы один элемент – это 1 или больше. P3(x≥1)=1-P3(0)
В любой свободной ячейке набираем формулу
=1 - БИНОМРАСП(0;3;0,6; ложь)
Ответ: P3(x≥
≥1)=0,936
Задание 1.4.
В
результате
анализа
качества
изготовляемых
предприятием изделий установлено, что в среднем брак
составляет (µ+ν)%. За смену предприятие выпускает m=100+µ+γ
изделий.
52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вычислить
1) М(Х) и D(Х) (Х – число бракованных изделий за смену)
2) Рm(θ+ν+5)
3) Pm(не более µ+ν бракованных изделий)
4) Рm(0)
Пункты 2, 3, 4 выполнить на EXCEL
Пример выполнения задания 4 (µ=0, ν=7, γ=0, θ=0).
Тогда n=100, p=(0+7)%=0,07. Поскольку n велико, а
вероятность p - мала, для решения задачи воспользуемся
e − λ ⋅ λk
формулой Пуассона: P (k ) =
, λ = np
n
k!
1) Найдем λ = np = 7 - среднее число бракованных изделий.
Это и будет M(Х) и D(Х)
Ответ: M(Х)=D(Х)=7
e − 7 12
2) P (12) =
⋅ 7 ≈ 0,02635
100
12!
В любой свободной ячейке набираем формулу:
=ПУАССОН(12;7;ложь)
Здесь первое число – это k, второе – это λ .
Ответ: P100(12)= 0,02635
3) P ( x ≤ 7) = P (0) + P (1) + K + P (7)
100
100
100
100
Воспользуемся формулой = ПУАССОН(7;7;истина)
Ответ: P100(x≤
≤7)= 0,598714
e − 7 ⋅7 0
4) P ( 0 ) =
≈ 0 , 000912
0!
100
Формула для подсчета:= ПУАССОН(0;7;ложь)
Ответ: P100(0)= 0,000912
Задание 1.5.
Плотность распределения f(x) вычисляется по формуле:
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
x < θ +ν
0

f ( x) = cx θ + ν ≤ x ≤ θ + ν + 2
0
x > θ +ν + 2

Найти
1) Константу c
2) F(x) и построить ее график
3) P (ν − 1 < x < θ + ν + 1) и P (θ + ν + 1 < x < θ + ν + 3)
4) М(Х) и D(X)
Пример выполнения задания 5.
Пусть θ = 9 ; ν = 4
x < 13
0

Тогда f ( x) = cx 13 ≤ x ≤ 15
0
x > 15

∞
1) В соответствии с (1.20)
∫ f (t )dt =1. Имеем:
−∞
15
∞
15
x 2 15
0
dx
+
cxdx
+
0
dx
=
1
или
c
xdx
=
1
.
Далее,
с
=1
∫
∫
∫
∫
2
−∞
13
15
13
13
c 2
c
1
(15 − 132 ) = 1 ; ⋅ 56 = 1 ; c ⋅ 28 = 1 c =
2
28
2
13
Ответ: c =
1
28
2) Рассмотрим 3 случая
а) x≤13
x 13
x
F ( x) = ∫ 0dt =0
−∞
54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) 13<x≤15
13 x 15
13
x 1
1
F ( x) = ∫ 0dt + ∫
tdt = ( x 2 − 169)
56
−∞
13 28
c) x>15
13
15 x
13
15 1
x
F ( x) = ∫ 0dt + ∫
tdt + ∫ 0dt = 1
−∞
13 28
15
Таким образом,
F(x)
1
13
0
1

F ( x) =  ( x 2 −169)
 56
1
x≤13
13< x≤15
x>15
3) Воспользуемся формулой ( 1.39 )
55
x
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
P (3 < x < 14) = F (14) − F (3)
1
27
F (14) = (196 − 169) =
; F (3) = 0 .
56
56
27
Таким образом, P (3 < x < 14) =
56
P (14 < x < 16) = F (16) − F (14) ; F (16) = 1 .
27 29
Итак, P (14 < x < 16) = 1 −
=
56 56
4)
13
15 1
∞
1 15 2
1
3
3
M(X) = ∫ 0dx + ∫
x 2 dx + ∫ 0dx =
∫ x dx = (15 −13 ) =
2813
84
−∞
13 28
15
3375 − 2197 1178
=
=
= 14,0238
56
84
D ( X )= M ( X 2 )−[ M ( X )]2
13
∞
1 15
1 15
1 4 15
M ( X 2 ) = ∫ 0⋅ x 2dx + ∫ x3dx + ∫ 0dx = ∫ 0⋅ x 2dx =
x
=
28
28
28
⋅
4
−∞
13
15
13
13
15 4 −13 4 50625 − 28561 22064
=
=
=
= 197
112
112
112
D ( X ) = 197 − 14,02382 = 197 − 196,667 = 0,333
Задание 1.6.
Случайная величина X распределена нормально с
параметрами: m = 0,1ν и σ = µ + 1 . Что больше, P (−0,5 < x < 0,1)
или P (0,2θ < x < 0,2θ + 2) ?
Задачу решить с использованием статистических функций
EXCEL.
56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задание 1.7.
Производится взвешивание некоторого вещества без
систематических погрешностей. Случайные погрешности
взвешивания подчинены нормальному закону распределения с
σ = (θ + µ + ν ) г. Найти вероятность того, что взвешивание
будет произведено с погрешностью, не превышающей по
модулю
µ + 1 г. Задачу решить с использованием
статистических функций EXCEL.
Указание: необходимо вычислить P( x − M ( X ) ≤ ε ) .
M (X ) = 0 , ε = µ + 1.
Можно доказать, что для нормального распределения
β ( x ) = γ ( x) = 0
Если распределение вероятностей некоторой СВХ
несимметрично, причем “длинная” часть распределения
расположена справа от центра, то β ( x) > 0 .
f (x)
β ( x) > 0
Задание 1.8.
Закон совместного распределения случайного вектора
(X,Y) задан таблицей
Y
X
ν
ν +2
57
γ +ν + 3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
продолжение таблицы
µ +1
µ+2
0 ,1+
0,2
0,2 −
Вычислить ρ
µ
µ
0,4
20
0,04
20
0,06
x, y
2. Математическая статистика
Задачи математической статистики состоят в том, чтобы на
основании знания некоторых свойств подмножества элементов,
взятых из некоторого множества, сделать какие-либо
утверждения о свойствах этого множества, называемого
генеральной совокупностью. В генеральной совокупности нас
обычно интересует некоторый признак, который обусловлен
случайностью и может иметь качественный или количественный
характер.
Под случайной выборкой объема n понимается выбор n
объектов из генеральной совокупности, причем выбор
отдельных объектов производится независимо один от другого.
Результатом случайной выборки объема n является
совокупность ( x1 , x2 ,..., xn ) значений признака.
Вариационным рядом выборки ( x1 , x2 ,..., xn ) называется
такой способ ее записи, при котором элементы упорядочиваются
по величине признака, то есть последовательность записывается
(1 ) ( 2 )
(1)
(n)
( 2)
( 3)
в виде x , x ,..., x , где x ≤ x ≤ x ≤ ... ≤
Разность между максимальным
(n)
элементами выборки
(n)
x
и
минимальным
(1)
x− x
называют размахом выборки.
58
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пусть
в
( x1 , x2 ,..., xn )
выборке
есть
одинаковые
элементы. Перепишем выборку в другом виде: z1 , z2 ,..., zk , где
k – количество различных значений признака, причем каждое
zi встречается ровно ni раз. Число ni
частотой элемента zi . Очевидно, что ∑ n = n .
значение
называется
k
i =1
i
Статистическим рядом называется последовательность пар
( z i , ni ) .
При большом объеме выборки ее элементы объединяются
в группы, представляя результаты опытов в виде
группированного статистического ряда. Для этого интервал,
содержащий все элементы выборки, разбивают на m
непересекающихся интервалов. Вычисления значительно
упрощаются, если интервалы имеют одинаковую длину. В
дальнейшем, как правило, будем рассматривать только этот
случай. После того, как частичные интервалы выбраны,
определяют частоты - количество ni элементов выборки,
попавших в i-й интервал. Наряду с частотами одновременно
i
подсчитывают
также
накопленные
частоты
∑n
j =1
относительные частоты
ni
n
j
,
и накопленные относительные
i
∑n
j =1
j
. Полученные результаты сводят в таблицу частот
n
группированной выборки.
Группировка выборки вносит погрешность в дальнейшие
вычисления.
частоты
59
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пусть имеется выборка ( x1 , x2 ,..., xn ) из генеральной
совокупности с признаком Х. Пусть распределение Х
неизвестно. Для того, чтобы получить первое представление об
этом распределении в случае количественного признака,
составляют так называемую гистограмму. Для этого разбивают
действительную ось на конечное число промежутков
∆1 ,..., ∆ m . Подсчитывают частоты ni
лежащих
в
i-м
интервале
выборочных значений,
(i = 1, m) . Над
прямоугольники, высоты которых равны
∆i
рисуют
ni , где h – ширина
nh
интервала (напоминаем, что она постоянна). Полученный
ступенчатый график называют гистограммой. Площадь
полученной фигуры равна единице.
При увеличении объема выборки и уменьшении длины
интервала гистограмма относительных частот является
статистическим аналогом плотности распределения f X (x)
генеральной совокупности.
Пример 2.1. Построить таблицу частот и гистограмму для
следующей выборки:
Границы
10 - 20 20 - 30 30 - 40 40- 50 50–60 60- 70 70 - 80
интервалов
Частота ni
1
2
7
18
12
8
2
Накопленная
частота
3
10
28
40
48
50
1
i
∑ nj
j =1
Относительная
частота ni
0,02
0,04
0,14
n
60
0,36
0,24
0,16
0,04
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
продолжение таблицы
Накопленная
относительная
i
частота
∑ nj
0,02
0,06
0,20
0,56
0,80
0,96
1
j =1
n
ni
nh
0,002 0,004 0,014 0,036 0,024 0,016 0,004
Ширина интервалов постоянна и равна h=10.
Строим гистограмму (рис. 2.1).
0,036
0,03
0,024
0,02
0,014
0,016
0,01
0
0,002
0,004
0,004
0
5
15
25Рисунок
35 2.1.
45 55
65
75
Полигон частот строят так же, как и гистограмму, но
вместо
прямоугольников
середины
верхних
сторон
прямоугольников соединяют прямыми линиями.
Если плотность распределения генеральной совокупности
является достаточно гладкой функцией, то полигон
относительных частот является более хорошим приближением
плотности, чем гистограмма.
Эмпирическая функция распределения вычисляется по
формуле
61
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Fn* ( x) =
1
ni
n z <x
∑
i
где суммируются частоты тех элементов выборки, для которых
*
выполняется неравенство zi < x . Очевидно, что Fn ( x) = 0 при
(1)
(n)
x≤ x
(1) ( n )
и Fn* (x) = 1 при x > x . На промежутке ( x , x ] Fn* ( x)
представляет собой неубывающую кусочно-постоянную
функцию.
Значение эмпирической функции распределения для
статистики определяется следующим утверждением:
Теорема Гливенко. Пусть Fn* ( x) - эмпирическая функция
распределения, построенная по выборке объема n из
генеральной совокупности с функцией распределения FX (x) .
Тогда для любого x и любого ε>0
*
lim P ( Fn ( x) − FX ( x) < ε ) = 1
n →∞
Таким образом, для любого x
Fn* ( x) сходится по
вероятности к FX (x) и, следовательно, при большом объеме
выборки может служить оценкой функции распределения
генеральной совокупности в каждой точке x.
Построим график эмпирической функции распределения
из предыдущего примера (рис.2.2).
62
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 2.2.
Так как середина первого интервала группировки x1=15, то
*
F ( x ) = 0 при х≤15.
n
2.1. Точечные оценки и их свойства
Основная задача математической статистики состоит в
нахождении распределения наблюдаемой СВ Х по данным
выборки. Во многих случаях вид распределения Х можно
считать известным, и задача сводится к получению
приближенных значений неизвестных параметров этого
распределения.
Пусть FX(x,θ) – функция распределения СВ Х, содержащая
неизвестный параметр
θ, а ( x1 , x2 ,..., xn ) – выборка
наблюдений этой СВ.
Точечной оценкой числового параметра θ называется
функция выборочных значений
63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
^
^
θ ( x1 , x2 ,..., xn ) = θ n ,
которая в определенном статистическом смысле близка к
истинному значению этого параметра.
Любую
функцию
элементов
выборки
называют
статистикой. Чтобы выяснить, какие свойства должна иметь
статистика θ ( x1 , x2 ,..., xn ) для того, чтобы ее значения могли
бы считаться хорошей в некотором смысле оценкой параметра
θ, ее рассматривают как функцию случайного вектора (Х1, Х2,…,
Хn), одной из реализаций которого является данная выборка
( x1 , x2 ,..., xn ).
Так как закон распределения каждой из СВ Хi (i=1,2,…,n)
есть FX(x,θ), являющаяся функцией параметра θ , то и
распределение статистикиθ ( x1 , x2 ,..., xn ) также зависит от
неизвестного параметра θ.
Метод максимального правдоподобия является одним из
наиболее распространенных методов нахождения неизвестных
параметров распределения генеральной совокупности.
Пусть Х – НСВ с плотностью fX(x, θ), зависящей от
неизвестного параметра θ, значение которого требуется оценить
по выборке ( x1 , x2 ,..., xn ) объема n. Плотность распределения
выборочного вектора (Х1, Х2,…, Хn) можно записать в виде
n
f X1 , X 2 ,..., X n ( x1 , x2 ,..., xn ,θ ) = ∏ f X i ( xi ,θ )
(2.1)
i =1
Функцией правдоподобия L(θ) выборки объема n
называется плотность выборочного вектора, рассматриваемая
при фиксированных значениях переменных x1 , x2 ,..., xn .
Функция
правдоподобия
является
функцией
только
неизвестного параметра θ.
64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n
L(θ ) = ∏ f X i ( xi ,θ )
(2.2)
i =1
Аналогично
определяется
функция
правдоподобия
выборки ДСВХ.
Пусть Х ДСВ, причем P(X=x)=p(x, θ) есть функция
неизвестного параметра θ. (Например, по формуле Пуассона мы
вычисляем Рn(X=k), причем эта вероятность зависит от
параметра λ). Предположим, что для оценки параметра θ
получена конкретная выборка наблюдений СВ Х объема n:
x1 , x2 ,..., xn (Бракованные изделия: в первой партии – х1, во
второй – х2 и т.д.)
Функция правдоподобия L(θ) выборки объема n равна
вероятности того, что компоненты выборочного вектора (Х1,
Х2,…, Хn) примут значения x1 , x2 ,..., xn , то есть
n
n
i =1
i =1
L(θ ) = ∏ p ( X i = xi ) = ∏ p ( xi ,θ )
(2.3)
Метод максимального правдоподобия состоит в том, что в
качестве оценки неизвестного параметра θ
принимается
)
значение θ , доставляющее максимум функции правдоподобия
(МП – оценка). В случае дискретного распределения
наблюдаемой СВ Х МП – оценка неизвестного параметра θ есть
)
такое значение θ , при котором вероятность появления данной
конкретной выборки максимальна. Параметр θ находят, решая
∂L
относительно θ уравнение
= 0. Часто вместо этого
∂θ
1 ∂L
∂ ln L
= 0 или
= 0.
уравнения решают уравнение
∂θ
L ∂θ
Пример 2.2. Найти МП – оценку параметра λ
распределения Пуассона.
65
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пусть х1, х2,…, хn – выборка наблюдений СВ Х, имеющей
распределение Пуассона с неизвестным параметром λ, то есть
λx
e −λ
x = 0,1,2,...
x!
Функция правдоподобия L(λ)
определяется по формуле (2.3).
P( X = x) =
выборки
объема
n
n
n
L (λ ) = ∏
i =1
λ
xi
xi !
e −λ =
λ
∑ xi
i =1
x1! x 2 !⋅ ⋅ ⋅ x n !
e − λn
Найдем логарифмическую функцию правдоподобия
n
ln L(λ ) = ln λ ∑ xi − λn − ln( x1! x 2 !⋅ ⋅ ⋅ x n !)
i =1
) 1 n
∂ ln L(λ ) 1 n
= ∑ xi − n = 0 ⇒ λ = ∑ xi = x
λ i =1
∂λ
n i =1
В случае нормального распределения МП – оценками
являются
) 1 n
m = ∑ xi = x
n i =1
)
σ2 =
1 n
( xi − x ) 2
∑
n i =1
Важнейшие
статистические
свойства
оценки,
определяющие ее близость к истинному значению числовой
характеристики, это свойства несмещенности, состоятельности
и эффективности.
Оценка называется несмещенной, если ее математическое
ожидание равно истинному значению числовой характеристики:
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
^
M θn =θ .
Оценка называется состоятельной, если она сходится по
вероятности к истинному значению параметра, то есть ∀ε >0
^
P( θ n − θ ≤ ε ) → 1 при n → ∞.
^
Состоятельность оценки θ n во многих случаях может
быть установлена с помощью теоремы:
^
^
^
Если M θ n → θ и D θ n → 0 при n → ∞ , то θ n состоятельная оценка параметра θ.
Оценка называется эффективной, если она имеет
минимальную дисперсию в определенном классе оценок.
Пусть ( x1 , x2 ,..., xn ) - выборка из генеральной
совокупности с конечным математическим ожиданием M(X)=m
2
и дисперсией D(X)= σ .
В качестве оценки математического ожидания возьмем
оценку:
^
−
M (X ) = x =
1 n
∑ xi
n i =1
Эта оценка – несмещенная и состоятельная оценка
математического ожидания М(Х).
Доказательство.
67
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M (x) = M (
1 n
1 n
1
x
)
=
M ( X i ) = nm = m
∑
∑
i
n i =1
n i =1
n
n
1 n
1
1
x
)
=
D
(
xi ) = 2
∑
∑
i
2
n i =1
n
n
i =1
при n → ∞.
D( x ) = D(
n
∑ D( X i ) =
i =1
1
σ2
2
σ
n
=
→0
n
n2
^
В качестве оценки дисперсии D( X ) берут либо величину
(S * ) 2 =
−
−
1 n
1 n
2
2
(
x
−
x
)
,
либо
S
=
(
x
−
x
)2 .
∑
∑
i
i
n i =1
n − 1 i =1
(S * ) 2
Оценка
является
смещенной,
а
оценка
S 2 несмещенной оценкой дисперсии σ 2 .
Для группированных данных вместо значений xi для
−
^
x и D( X ) берут середины соответствующих
подсчета
интервалов. Формулы для оценки математического ожидания и
дисперсии перепишутся в виде:
^
−
−
−
1 k
1 k
1 k
M ( X ) = x = ∑ ni zi ; ( S * ) 2 = ∑ ni ( zi − x ) 2 ; S 2 =
ni ( zi − x ) 2
∑
n i =1
n i =1
n − 1 i =1
В качестве k-го эмпирического начального момента берут
следующую функцию выборки:
^
αk =
1 n k
∑ xi
n i =1
( 2.4 )
В качестве k-го эмпирического центрального момента
^
−
1 n
(
µk =
(
x
−
x
)k
∑
i
n − 1 i =1
2.5 )
68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М(Х) – первый начальный момент, следовательно,
−
^
1 n
∑ xi
n i =1
M (X ) = x =
(
2.6 )
Дисперсия – это второй центральный момент, то есть
^
S 2 = D( X ) =
−
1 n
(
)2
x
−
x
∑
i
n − 1 i =1
(
2.7 )
Для оценки ковариации и коэффициента корреляции берут
такие оценки:
^
−
−
1 n
(
µ1,1 =
(
x
−
x
)(
y
−
y
)
∑ i
i
n − 1 i =1
2.8 )
−
n
∑ (x
^
r = ρ xy =
i =1
i =1
i
−
− x)( y i − y )
−
n
∑ (x
i
− x)
2
−
n
∑(y
i =1
i
− y)
( 2.9 )
2
Для оценки коэффициентов асимметрии и эксцесса
используются формулы
)
β (X ) =
)
µ3 ( X )
3
)
D( X ) 2
;
)
γ (X ) = ) 2
−3
D (X )
µ4 ( X )
)
Пример 2.3. В таблице приведено распределение скорости
автомобиля на одном из участков шоссе (км/час)
границы 61- 65- 69- 73- 77- 81- 85- 89- 93- 9765 69 73 77 81 85 89 93 97 101
частоты 1
4
5
8
14 9
6
1
1
1
69
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построить гистограмму по этим данным. Найти оценку
математического
ожидания,
дисперсии,
коэффициентов
асимметрии и эксцесса.
Пусть имеется две выборки объемов n1 и n2 из одной
генеральной совокупности со средним m и дисперсией σ2. Пусть
x1 è x2 , s12 , s22 - несмещенные оценки средних и дисперсий,
определенные по этим выборкам. Тогда объединенные оценки,
подсчитанные по формулам
x=
n1 x1 + n2 x2
n1 + n2
(n1 − 1) s12 + (n2 − 1) s22
s =
n1 + n2 − 2
2
будут несмещенными и состоятельными оценками m и σ2.
Для группированной выборки объема n выборочные
начальные и центральные моменты вычисляются по формулам
^
αs =
^
µs =
1 k
ni zis
∑
n i =1
−
1 k
n
(
z
−
x
)s
∑
i
i
n i =1
Статистическое описание и выборочные
характеристики двумерного случайного вектора
Пусть (хi , yi) i=1,2, … , n выборка объема n из наблюдений
случайного двумерного вектора (X, Y) . Предварительное
представление о двумерной ГС можно получить, изображая
элементы выборки точками на плоскости. Это представление
выборки называется диаграммой рассеивания.
70
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределением
двумерной
выборки
называется
распределение двумерного дискретного случайного вектора,
принимающего значения (хi , yi) i=1,2, … , n с вероятностями,
равными
1/n.
Выборочные
числовые
характеристики
вычисляются как соответствующие числовые характеристики
двумерного случайного вектора дискретного типа
α k*,s =
1 n k s
∑ xi yi
n i =1
µk*,s =
1 n
( xi − x ) k ( yi − y ) s
∑
n i =1
1 n
1 n
µ = ∑ ( xi − x )( yi − y ) = ∑ xi yi −xy
n i =1
n i =1
*
1,1
−
n
^
r = ρ xy =
−
∑ ( xi − x)( yi − y)
i =1
n
−
∑ ( xi − x)
i =1
2
−
n
∑ ( yi − y)2
i =1
Выборочная линейная регрессия Y на Х по выборке (хi , yi)
i=1,2, … , n определяется уравнением
sY*
y = a + bx = y + r * ( x − x )
sX
Коэффициенты a и b называются выборочными
коэффициентами регрессии и вычисляются по формулам
71
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b=
n
n
n
i =1
i =1
n
i =1
n∑ xi yi − ∑ xi ∑ yi
n
n∑ x − (∑ xi )
i =1
2
i
n
=
∑ x y − nxy
i
i =1
i
n
2
n
∑x
i =1
2
i
i =1
−
(∑ xi ) 2
i =1
n
a = y − bx
Аналогично определяется выборочная линейная регрессия
X на Y
x = a1 + b1 x = x + r
b1 =
s*X
( y − y)
sY*
n
n
n
i =1
i =1
n
i =1
n∑ xi yi − ∑ xi ∑ yi
n
n ∑ y − (∑ yi )
i =1
2
i
n
=
∑ x y − nxy
i
i =1
n
2
n
∑y
i =1
i
i =1
2
i
−
(∑ yi )2
i =1
n
a1 = x − b1 y
Для контроля
соотношение
правильности
расчетов
используют
bb1 = r
Прямые y=a+bx и x=a1+b1y пересекаются в точке ( x , y ) ,
которая называется центром рассеивания. При приблизительно
линейно коррелированных Х и Y при помощи этих уравнений
можно сделать наилучшее предсказание для y при данном
значении x. Коэффициент корреляции r в этом случае есть мера
силы связи между X и Y.
72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 2.4. Вычислить коэффициент корреляции и
нанести на диаграмму рассеивания прямые регрессии Y на Х и X
на Y .
8
1
X
Y
10
3
5
1
8
2
9
3
Решение.
x=
8 + 10 + 5 + 8 + 9
= 8;
5
5
∑ (x
i =1
i
5
∑(y
i =1
i =1
1+ 3 +1+ 2 + 3
=2
5
− x ) 2 = (10 − 8) 2 + (5 − 8) 2 + (9 − 8) 2 = 14
i
− y ) 2 = (1 − 2) 2 + (3 − 2) 2 + (1 − 2) 2 + (3 − 2) 2 = 4
i
− x )( y i − y ) = (8 − 8)(1 − 2) + (10 − 8)(3 − 2) + (5 − 8)(1 − 2) +
5
∑ (x
y=
(8 − 8)(2 − 2) + (9 − 8)(3 − 2) = 6
6
≈ 0,8
r=
4 ⋅ 14
5
∑ xi yi = 86;
i =1
5
∑ xi = 40;
i =1
5
∑ yi = 10;
i =1
5 ⋅ 86 − 40 ⋅ 10 30
=
≈ 0,43
70
5 ⋅ 334 − 40 2
3
10
a = 2 − ⋅ 8 = − ≈ −1,43
7
7
b=
y=-1,43+0,43x
73
5
5
i =1
i =1
∑ xi2 = 334; ∑ yi2 = 24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5 ⋅ 86 − 40 ⋅ 10 30
=
= 1,5
20
5 ⋅ 24 − 10 2
a1 = 8 − 1,5 ⋅ 2 = 5
x=5+1,5y
Пример 2.5. Вычислить коэффициент корреляции и
нанести на диаграмму рассеивания прямые регрессии Y на Х и X
на Y
10
12
5
X
9
Y
6
4
7
3
r=0,806; y=0,5+0,5x; x=2,5+1,3y
Двумерную выборку большого объема представляют в
виде корреляционной таблицы. С этой целью группируют
реализации величин X и Y по интервалам длины bx и by , а в
клетках таблицы записывают число пар исходной выборки (то
есть частоты) для каждой комбинации интервалов. Эту
процедуру можно также выполнить непосредственно по
диаграмме рассеивания, нанося на нее сетку горизонтальных и
вертикальных прямых, отстоящих друг от друга на расстоянии
bx и by соответственно. В дальнейших вычислениях используют
середины интервалов и соответствующие частоты.
Формулы для вычисления выборочных коэффициентов
ковариации, корреляции и регрессии перепишутся в виде
1 n1 n2
1 n1 n2
µ1*,1 = ∑∑ nij ( xi − x )( y j − y ) = ∑∑ nij xi y j − x y
n i =1 j =1
n i =1 j =1
b1 =
n1
n2
∑∑n x y
^
i =1 j =1
r = ρ xy =
n1
∑n
i =1
i•
ij i
−
( xi − x)
2
x=
i =1
− nx y
−
n2
∑n
n1
∑n
j
j =1
n2
•j
∑n
x
i• i
y=
n
74
j =1
( yi − y ) 2
•j
n
yj
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n1
n2
∑∑ n
i =1 j =1
b=
ij
xi y j − nx y
n1
n1
∑n
i =1
i•
xi2 −
( ∑ ni • x i ) 2
i =1
n
a = y − bx
n1
n2
∑∑ n
i =1 j =1
b1 =
ij
xi y j − nx y
n1
n2
∑n
j =1
•j
y 2j −
( ∑ n• j y j ) 2
i =1
n
a1 = x − by
Здесь
nij
–
количество
пар
(xi,
yj),
n1
n2
∑∑ n
i =1 j =1
n2
n1
j =1
i =1
ni• = ∑ nij ; n• j == ∑ nij ;
ij
= n,
n1 и n2 – количество различных
значений, которые принимают переменные x и y
соответственно.
Пример 2.6. Вычислить коэффициент корреляции и найти
уравнение прямых регрессий Y на X и X на Y по данным
корреляционной таблицы
X
40-50 50-60 60-70 70-80
Y
10-11
2
11
3
2
11-12
1
19
2
4
12-13
3
6
27
6
13-14
2
3
3
8
Ответы:
75
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
n1
n2
∑∑ n
i =1 j =1
n1
ij
xi y j − nx y = 282,16
−
∑ ni• ( xi − x) 2 = 7899,02;
i =1
−
n2
∑ n• j ( yi − y ) 2 = 93,25
j =1
r=0,33.
Пример 2.7. Вычислить коэффициент корреляции и найти
уравнение прямых регрессий Y на X и X на Y по данным
корреляционной таблицы
X
5-15 15-25 25-35 35-45 45-55 55-65
Y
10-20
5
7
0
0
0
0
20-30
0
20
23
0
0
0
30-40
0
0
30
47
2
0
40-50
0
0
10
11
20
6
50-60
0
0
0
9
7
3
Ответы: r=0,775; y=10,1+0,72x; x=5,87+0,83y
2.2. Интервальные оценки параметров распределения
2.2.1. Доверительный интервал для математического
ожидания
Интервальной называют оценку, которая определяется
двумя числами – концами интервала, накрывающего
оцениваемый параметр.
Доверительным называют интервал, который с заданной
надежностью γ накрывает заданный параметр.
Интервальной оценкой с надежностью γ математического
ожидания m нормально распределенного признака Х по
−
выборочной средней xв при известном среднеквадратическом
76
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отклонении
σ
генеральной
доверительный интервал
σ
−
xв − t
где t
σ
n
−
< m < xв + t
n
σ
n
совокупности
служит
,
(2.10)
= δ - точность оценки, n – объем выборки, t – значение
аргумента
функции
котором Ф2 (t ) =
γ
2
t
1
∫e
2π 0
Ф2 (t ) =
Лапласа
−
z2
2
dz , при
, при неизвестном σ (и объеме выборки
n<30)
−
xв − tγ
S
n
−
< m < xв + tγ
S
n
,
( 2.11 )
где S – исправленное выборочное среднее квадратическое
−
отклонение (см. формулу (2.7)), xв вычисляется по формуле
(2.6), tγ находится по таблице t –распределения, входом в
которую является γ и n-1 в случае таблиц вида P( t < tγ ) = γ
(рис.2.3),
либо
P(t ≤ tγ ) =
γ +1
γ +1
2
и
n-1
в
случае
таблиц
вида
(рис.2.4), либо 1-γ и n-1 в случае таблиц
2
P( t > tγ ) = 1 − γ (рис.2.5).
77
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 2.3.
Рисунок 2.4.
Рисунок 2.5.
Пример 2.8. Найти доверительный интервал для оценки с
надежностью γ=0.95 неизвестного математического ожидания m
нормально
распределенного
признака
Х
генеральной
−
совокупности, если σ=5, x в = 14 . Объем выборки n=25.
Решение. Требуется найти доверительный интервал
−
xв − t
σ
n
−
< m < xв + t
σ
n
.
0,95
= 0,475 .
По
2
таблицам
нормального
распределения
находим,
что
Ф2 (t ) = 0,475 при t=1,96. Подставив все величины в формулу,
получаем:
5
5
14 − 1,96
< m < 14 + 1,96
или 12,04<m<15,96.
25
25
Пример 2.9. Из генеральной совокупности извлечена
выборка объема 10.
Найдем
t из соотношения Ф2 (t ) =
Варианта xi
-2
1
2
3
4
5
частота ni
2
1
2
2
2
1
78
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценить с надежностью γ=0,95 математическое ожидание
m
нормально
распределенного
признака
генеральной
совокупности по выборочной средней при помощи
доверительного интервала.
k
−
xВ =
∑ ni x i
k
= 2,4
n
n −1
Здесь k – количество различных значений, принимаемых
вариантой х. В нашем примере k=6. По таблицам по γ=0,95 и
n-1=9 находим t γ = 2,26 . Находим доверительный интервал
Решение.
−
xв − tγ
S
n
−
< m < xв + tγ
2 − 2,26
2,4
10
S
n
i =1
= 2; S =
−
∑ ni ( xi − x в ) 2
i =1
:
< m < 2 + 2,26
2,4
или окончательно
10
0,3<m<3,7
2.2.2. Построение доверительного интервала для дисперсии.
Пусть СВ Х распределена нормально. Требуется построить
доверительный
интервал
для
дисперсии
генеральной
2
совокупности
σ либо
по
выборочной
дисперсии
n
^
−
1
D ( X ) =( S * ) 2 = ∑ ( xi − x ) 2 , либо по несмещенной оценке
n i =1
2
дисперсии S =
−
1 n
(
x
−
x
)2 .
∑
i
n − 1 i =1
Построение доверительного интервала для дисперсии
n( S * ) 2
имеет распределение
основывается на том, что величина
2
σ
79
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
χ2
с
* 2
n( S )
σ
2
n
степенями
~ χ 2 (n) ), а
свободы
(n − 1) S
σ
2
2
(записывается
это
так:
~ χ 2 (n − 1) .
Для выбранной доверительной вероятности (или
надежности) γ=1-α (если, например, γ=0,9, то α=0,1), учитывая,
(n − 1) S 2
что
~ χ 2 (n − 1) , можно записать
2
σ
P( χ 12 <
(n − 1) S 2
σ
2
< χ 22 ) = 1 − α
( 2.12 )
Далее, по таблице χ 2 - распределения выбирают такие
значения χ 12 и χ 22 , чтобы площадь, заключенная под графиком
плотности распределения χ 2 между числами χ 12 и χ 22 была
равна 1-α.
Рисунок 2.6.
Рисунок 2.7.
Как видно из рисунков 2.6 и 2.7, значения χ 12 и χ 22 можно
варьировать так, чтобы площади S1 и S2 были равны S1=S2=1-α.
χ 12 и χ 22
выбирают
такими,
чтобы
Обычно
P( χ 2 ≤ χ 12 ) = P( χ 2 ≥ χ 22 ) =
α
2
, то есть площади S1 и S2 на рисунке
80
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.8 были равны.
Рисунок 2. 8.
Имеем:
p 1 = P ( χ 2 ≤ χ 12 ) =
α
( 2 . 13 )
2
α
p 2 = P ( χ 2 ≤ χ 22 ) = 1 − α +
=1−
2
α
( 2 . 14 )
2
Зная p1 и p2 , по таблицам распределения χ 2 находим
χ 12 и χ 22 таким образом, чтобы выполнялись условия ( 2.13 ) и
(2.14).
χ 12 <
Неравенство
1
эквивалентное:
χ
(n − 1) S 2
χ 22
2
1
>
σ2
(n − 1) S
<σ <
2
(n − 1) S 2
σ
2
2
>
(n − 1) S 2
χ 12
1
χ 22
< χ 22
заменим
на
или
( 2.15 )
Пример 2.10. Несмещенная оценка дисперсии S2 =10
получена по выборке объема n=21. Найти 90% доверительный
интервал для дисперсии.
81
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Решение. α=1-γ=1-0,9=0,1.
Имеем:
α
2
α
= 0,05; 1 −
p1 = P ( χ 2 ≤ χ12 ) =
α
2
2
= 0,95. k=21-1=20.
= 0,05.
p2 = P ( χ 2 ≤ χ 22 ) = 1 −
α
2
= 0,95.
.
По
таблицам
хи-квадрат
распределения
2
2
получаем: χ 1 = 10,9; χ 2 = 31,4.
Подставляя эти значения в формулу ( 2.15 ), получаем:
(21 − 1)10
(21 − 1)10
≤σ 2 ≤
или 6,33≤σ2≤18,35
31,4
10,9
Определение. Квантилью порядка р (симметричной
квантилью порядка р) распределения непрерывной случайной
величины Х называется действительное число t p (число t *p ),
удовлетворяющее уравнению
P( x < t p ) = p
( P( x < t *p ) = p )
Критической
точкой
порядка
p
(симметричной
критической точкой порядка p) непрерывной случайной
величины Х называется действительное число æp
(æp*),
удовлетворяющее уравнению:
(P(x≥ æp*)=p)
P(x≥ æp)=p
Квантили и критическая точка одного и того же
распределения связаны соотношением:
æp = t1− p ; æp*= t1*− p
Доверительные интервалы для коэффициента корреляции ρ
Пусть выборка (xi, yi) получена из ГС, имеющей двумерное
нормальное распределение и r - выборочный коэффициент
корреляции. При достаточно больших n статистика
82
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1 1+ r
= Arth(r )
z = ln
2 1− r
имеет приближенно нормальное распределение
N ( Arth(r ),
1
)
n−3
Доверительный интервал для Arth( ρ) имеет вид:
u
Arth(r ) −
1−
α
2
n−3
u
< Arth( ρ ) < Arth(r ) +
1−
α
2
n−3
Доверительный интервал для ρ вычисляется с помощью
таблиц гиперболического тангенса ρ=th(z).
Некоторые полезные формулы. Arth(-r)=- Arth(r), если
Arth(y)=t, то y =
e 2t − 1
= th(t ) . Значения функций Arth(y) и
e 2t + 1
th(t) можно вычислить с помощью математических функций
EXCEL (atanh(y) и tanh(t) соответственно).
Пример 2.11. Выборочный коэффициент корреляции,
вычисленный по выборке объема n=10,
r=-0,64. Найти 90%
доверительный интервал для коэффициента корреляции ρ.
Решение.
Arth(-0,64)=-Arth(0,64)=-0,76; u0.95=1.645. Отсюда,
1,645
1,645
−0,76 −
< Arth( ρ ) < −0,76 +
10 − 3
10 − 3
−1,38 < Arth( ρ ) < −0,14
−0,881 < ρ < −0,139
83
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.3. Проверка статистических гипотез
На практике часто приходится на основе результатов
обследований, испытаний, наблюдений и т.д. проверять
различные предположения о характеристиках конкретного
массового явления. Приведем некоторые примеры.
Производительность труда рабочих, выполняющих
одинаковую работу в одинаковых организационно-технических
условиях, имеет нормальное распределение.
Средние размеры деталей, производимых на однотипных,
параллельно работающих станках, не различаются между собой.
Пусть Х – наблюдаемая дискретная или непрерывная
случайная величина (СВ). Статистической гипотезой Н
называется предположение относительно параметров или вида
распределения СВ Х.
Если распределение СВ Х известно и по выборке
наблюдений необходимо проверить предположения о значениях
параметров этого распределения, то такие гипотезы называются
параметрическими.
Проверяемая гипотеза называется нулевой гипотезой и
обозначается Н0. Наряду с гипотезой Н0 рассматривают одну из
альтернативных (конкурирующих) гипотез Н1.
Например, если проверяется гипотеза
о равенстве
параметра θ некоторому заданному значению θ0, то есть
Н0: θ=θ0,
то в качестве альтернативной может быть выбрана одна из
следующих гипотез:
Н1: θ>θ0,
Н1: θ<θ0,
Н1: θ≠θ0,
Н1: θ=θ1, (θ1≠θ0).
84
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор альтернативной гипотезы определяется конкретной
формулировкой задачи.
Для проверки гипотезы необходима контрольная величина
z, которой является соответствующим образом выбранная и
приспособленная к задаче функция выборки.
Проверка статистической гипотезы основывается на
принципе, согласно которому маловероятные события
считаются невозможными, а события, имеющие большую
вероятность, - достоверными.
Перед анализом выборки фиксируется некоторая малая
вероятность α, называемая уровнем значимости (чаще всего α
выбирают равным 0,05; 0,01; 0,001 и т.д.). Пусть V – множество
значений статистики z, а Vk ⊆ V - такое его подмножество, что
при условии того, что Н0 – истинна, вероятность попадания
статистики критерия в Vk равна α, то есть
P ( z ∈ Vk / H 0 ) = α
Обозначим zв выборочное значение статистики z.
Критерий формулируется следующим образом:
отклонить гипотезу Н0, если z ∈ Vk ;
принять гипотезу Н0, если z ∉ Vk .
Критерий, основанный на использовании заранее
заданного
уровня
значимости,
называется
критерием
значимости.
Множество Vk всех значений статистики критерия z, при
которых принимается решение отклонить гипотезу Н0,
называется критической областью; область V \ Vk называют
областью принятия гипотезы Н0.
Уровень значимости α определяет «размер» критической
области Vk . Положение критической области на множестве
значений статистики z зависит от формулировки альтернативной
гипотезы Н1.
85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 2.9.
Рисунок 2.10.
На рисунках 2.9 и 2.10 приведены графики функции
плотности распределения f(z) при условии, что гипотеза Н0
верна. Критерий в этом случае называют односторонним
(соответственно правосторонним и левосторонним). Если
альтернативная гипотеза Н1 формулируется как Н1: θ≠θ0, то
критическая область размещается на обоих «хвостах»
распределения z, то есть определяется совокупностью
неравенств: z<zα/2 и z>z1-α/2; в этом случае критерий называется
двусторонним (рис 2.11).
Рисунок 2. 11.
86
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При выборе критической области следует иметь в виду, что
принимая или отвергая гипотезу Н0, можно допустить ошибки
дух видов.
Ошибка первого рода состоит в том, что нулевая гипотеза
Н0 отвергается в случае, когда она верна. Вероятность этой
ошибки равна α.
Ошибка второго рода состоит в том, что Н0 принимается,
когда она не верна.
2.3.1. Проверка гипотезы о равенстве центров
распределения двух нормальных генеральных
совокупностей при известной дисперсии
Предположим, что средний результат одной серии
экспериментов заметно отличается от среднего результата
другой серии. Можно ли объяснить обнаруженное расхождение
случайными ошибками эксперимента или оно вызвано какимилибо закономерностями?
Пусть X и Y – случайные величины, каждая из которых
подчиняется нормальному закону распределения. Пусть
имеются две независимые выборки объемом n1 и n2 из
генеральных совокупностей X и Y.
H0: M(X)=M(Y)
H1: M(X)≠M(Y)
Предположим, что σ x2 и σ y2 известны. Так как M(X) и M(Y)
−
−
неизвестны, в качестве их оценок берем x и y . Известно, что
−
x
−
и
N ( M ( X ),
y имеют
σx
n1
нормальные
) и N ( M (Y ),
σy
n2
законы
) соответственно.
87
распределения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
−
−
Выборки независимы, поэтому x и y также независимы, а
−
−
случайная величина x - y имеет нормальное распределение,
причем
−
−
−
−
D ( x − y ) = D ( x) + D ( y ) =
σ x2
n1
+
Если Н0 справедлива, то
следовательно, статистика
−
z=
σ y2
n2
.
−
−
−
−
M ( x − y ) = M ( x) − M ( y ) = 0 ,
−
x− y
σ x2
n1
+
σ y2
n2
( 2.16 )
подчиняется закону N(0, 1).
Выбирается уровень значимости α. Поскольку критерий –
двусторонний, критическая область будет расположена в обоих
хвостах распределения (рис. 2.12).
Рисунок 2.22.
88
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
По
таблицам
нормального
распределения
для
t2
−
x
1
Ф2 ( x )=
∫ e 2 dt находим такое значение х, при котором
2π 0
Ф2 ( x) = 0,5 −
α
. Если полученное по формуле (2.16 ) значение
2
z>x, то гипотезу Н0 отвергают, в противном случае ее
принимают.
2.3.2.
t – критерий
Этот критерий служит для сравнения средних значений из
нормально распределенных генеральных совокупностей в
предположении, что дисперсии σ x2 и σ y2 равны, хотя и
неизвестны.
Проверяемая гипотеза Н0 утверждает, что M(X)=M(Y).
H0: M(X)=M(Y)
M ( X ) ≠ M (Y )


H 1 : M ( X ) > M (Y ) 
M ( X ) < M (Y ) 


Пусть (x1,x2,…,xn) и (y1,y2,…,ym) – независимые случайные
выборки из обеих генеральных совокупностей. В общем случае
m≠n.
В качестве контрольной используют величину
−
T=
−
x− y
(n − 1) S + (m − 1) S
2
x
2
y
nm(n + m − 2)
,
n+m
(
2.17 )
где
S x2 =
−
−
1
1
( xi − x) 2 ; S y2 =
∑
∑ ( yi − y) 2 .
n − 1 i =1
m − 1 i =1
n
m
89
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При
сделанных
предположениях
(нормальная
распределенность X и Y, равенство дисперсий) и в
удовлетворяет tпредположении, что Н0 истинна, T
распределению Стьюдента с k=n+m-2 степенями свободы.
Критическая область критерия может быть установлена
следующим
образом.
По
соответствующим
таблицам
распределения Стьюдента определяется критическое значение
t p ,k . Входом в таблицу является число степеней свободы k и
вероятность р.
Если заданы квантили распределения Стьюдента в виде
t
∫ f ( x)dx
(или P(t < t p ,k ) , что одно и то же), то входом в
−∞
таблицу при альтернативной гипотезе Н1: M(X)≠M(Y) является
вероятность p = 1 −
(рис. 2.13).
α
2
; при остальных гипотезах Н1 p = 1 − α
Рисунок 2. 13.
Если заданы критические точки распределения Стьюдента,
∞
то есть таблицы вида 2∫ f ( x)dx или q=P(|t|>tp,k) (рис. 2.14), то
t
90
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
входом в таблицу в первом случае (Н1:М(Х)≠М(Y)) является
q=α, в остальных случаях q=2α (см. Приложение 2).
Рисунок 2. 14.
Если вычисленная по (2.17) реализация Т удовлетворяет
неравенствам:
при H 1 : M ( X ) ≠ M (Y ) : T > t p ,k
при H 1 : M ( X ) > M (Y ) : T > t p ,k ,
при H 1 : M ( X ) < M (Y ) : T < −t p ,k
то гипотезу Н0 отвергают.
По
отношению
к
предпосылке
«нормальной
распределенности» t- критерий не очень чувствителен. Его
можно применять, если статистические распределения обеих
выборок не имеют нескольких вершин и не слишком
асимметричны. Предпосылка D(X)=D(Y) во многих случаях
может быть обоснована на содержательном уровне, гипотезу
D(X)=D(Y) можно проверить и по F – критерию.
Возможен случай, когда гипотеза D(X)=D(Y) отклоняется.
Тогда при сделанных выше предположениях в качестве
статистики критерия выбирается
91
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
−
T1 =
−
x− y
2
x
( 2.18 )
S y2
S
+
n
m
В предположении, что гипотеза Н0 верна, величина T1
имеет t – распределение с k степенями свободы, где
2
S x2 S y 2
( +
)
n
m
k=
( 2.19 )
S y2 2
S x2 2
( )
( )
n
+ m
n −1
m −1
Критическая
область
и
статистическое
решение
устанавливаются аналогично.
Пример 2.12. Из большой партии резисторов одного типа
и номинала случайным образом отобраны 36 штук. Выборочная
средняя величина сопротивления при этом оказалась равной 9,3
кОм. Используя двусторонний критерий при α=0,05 проверить
гипотезу о том, что выборка взята из партии с номиналом 10
кОм, если
а) дисперсия величины сопротивления известна и равна 4
2
кОм
б) дисперсия величины сопротивления неизвестна, а
выборочная дисперсия s2=6,25 кОм2.
Пример 2.13. Результаты тестового экзамена по
информатике двух групп разных факультетов дали следующие
результаты:
Первая
45 67 89 34 23 89 90 69 76 56 35 60 78 56 90 90
группа
Вторая
56 56 34 89 12 60 78 49 67 49 89 78 67 56
группа
92
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При уровне значимости α=0,05 проверить гипотезу о том,
что результаты подготовки студентов на этих факультетах
одинаковы, используя двусторонний критерий.
Решение.
n1=16, n2=14.
Ãèï î òåçà Í 0 : M ( X ) = M (Y )
H1 : M ( X ) ≠ M (Y )
x = 65, 4375;
y = 60; s12 = 503,0625; s22 = 438,3077
s12
F = 2 = 1,1477; Fα
= 3,0527. Äèñï åðñèè ðàâí û .
,n1 −1, n2 −1
s2
2
tâû á = 0,6832; têðèò = 2,0484. Ãèï î òåçà Í
0
ï ðèí èì àåòñÿ
2.3.3. F- критерий
F – критерий служит для проверки гипотезы D(X)=D(Y)
при условии, что X и Y распределены нормально.
Из каждой генеральной совокупности производятся
выборки объема n и m соответственно. В качестве контрольной
величины используют отношение эмпирических дисперсий
S y2
S x2
F = 2 (или F = 2 - большая дисперсия стоит в числителе).
Sy
Sx
Величина F удовлетворяет F – распределению с (n-1, m-1)
степенями свободы (или с m-1, n-1 степенями свободы, если
S y2 > S x2 ).
Критическая область выбирается следующим образом.
Пусть уровень значимости равен α. Для р=α/2 для
двусторонней гипотезы и р=α при односторонней и
соответствующих
степенях
свободы
выбирают
93
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значение F
p, n −1, m −1
(или
F
p, m −1, n −1
)
из соответствующих
таблиц или статистической функции FРАСПОБР(α/2(α);n-1;m-1)
Если F, вычисленное по выборке, больше, чем критическое
значение, то гипотеза о равенстве дисперсий должна быть
отклонена с вероятностью ошибки α (рис. 2.15).
Рисунок 2. 15.
2.3.4. Критерий согласия χ2
Предположим, мы хотим установить, противоречат или нет
опытные данные гипотезе о том, что СВХ распределена по
определенному закону.
Для ответа на этот вопрос пользуются так называемыми
критериями согласия, из которых мы остановимся только на
одном: критерии согласия χ2 Пирсона.
Пусть ( x1 , x2 ,..., xn ) - выборка наблюдений СВХ.
Проверяется гипотеза Н0: Х имеет функцию распределения
FX (x) . Проверка осуществляется следующим образом.
94
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1. По выборке наблюдений находят оценки параметров
предполагаемого закона распределения СВХ.
2. Область возможных значений СВХ разбивается на r
множеств ∆1, …, ∆r (например, r интервалов, если Х –
непрерывная СВ, или r групп, состоящих из отдельных
значений, если Х – дискретная СВ).
3. Пусть ni – число элементов выборки, попавших в i-й
интервал ∆i (i = 1 , r ) . Очевидно,
r
∑n
i =1
i
= n . Используя
предполагаемый закон распределения СВХ, вычисляют
вероятность попадания СВХ в интервал ∆i (i = 1 , r ) для НСВХ или вероятность того, что СВХ примет
конкретное значение – для ДСВХ.
4. Полученные результаты представляют в таблице:
Число наблюдений
∆1
Наблюдаемое
n1
Ожидаемое
np1
∆2
n2
np2
…
…
…
∆r
nr
npr
5. Выборочное значение статистики
вычисляется по формуле:
r
(n − np k ) 2
χ в2 = ∑ k
np k
k =1
Всего
n
n
критерия
χ2
(2.20 )
6. Гипотеза Н0 согласуется с результатами наблюдений на
уровне значимости α если
χ в2 < χ 12−α (r − l − 1) ,
где
χ 12−α (r − l − 1) - квантиль порядка 1-α распределения χ2 с
r-l-1 степенями свободы (то есть P( χ 2 ≥ χ 12−α ) = α ), l – число
95
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
неизвестных параметров распределения, оцениваемых по
выборке. χ 12−α (r − l − 1) = ХИ 2ОБР (α , r − l − 1)
7. Если же χ в2 ≥ χ 12−α (r − l − 1) , то гипотеза Н0 отклоняется.
Примечание. Критерий χ2 использует тот факт, что
nk − np k
случайная величина
имеет распределение, близкое к
np k
нормальному N(0, 1). Чтобы это утверждение было достаточно
точным, необходимо, чтобы для всех интервалов выполнялось
условие np k ≥ 5 . Если в некоторых интервалах это условие не
выполняется, то их следует объединить с соседними.
Пример 2.14. При 50 подбрасываниях монеты герб
появился 20 раз. Можно ли считать монету симметричной?
Уровень значимости α=0,05.
Решение.
Выдвигается гипотеза Н0: р=0,5
1. В данной задаче число оцениваемых по выборке
параметров l=0.
2. СВХ принимает 2 значения: герб и число.
3. Если бы монета была правильной, то число гербов
должно было составлять половину от 50, то есть 25.
4. Составляем таблицу
Число наблюдений
Герб
Число
Наблюдаемое
20
30
Ожидаемое
25
25
2
5. Вычисляем χ в
χ в2 =
(20 − 25) 2 (30 − 25) 2
+
=2
25
25
Найдем
χ 12−α (r − l − 1) :
Следовательно, r-l-1=1.
Здесь
96
α=0,05;
r=2;
l=0.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
χ 02,95 (1) = 3,84 .
6. Так как
χ в2 < χ 02,95 (1) , то гипотеза Н0 принимается.
Пример 2.15. Ниже приводятся данные о числе деталей,
поступающих на конвейер в течение 600 двухминутных
интервалов.
Число деталей
0
1
2
3
4
5
6
Число интервалов
400
167 29 3
0
0
1
Используя критерий χ2, проверить гипотезу Н0 о
пуассоновском распределении числа деталей при уровне
значимости α=0,05.
Решение.
Н0: Pk =
λk
k!
e−λ
1. Оценим среднее число деталей, попавших в интервал.
0 ⋅ 400 + 1 ⋅ 167 + 2 ⋅ 29 + 3 ⋅ 3 + 6 ⋅ 1 240
λ=
=
= 0,4
400 + 167 + 29 + 3 + 1
600
2. Случайная величина принимает 7 значений: 0, 1, 2, 3, 4, 5, 6.
3. Объединим 3 и 4 этапы и построим таблицу
nk
npk
k
0,4 k
pk =
k!
e − 0, 4
0
400 0,67032
402
1
167 0,26813
161
2
29
0,05363
32
3
3
0,00715
4
4
0
0,00072
0
5
0
0,00006
0
6
1
0,00000
0
Так как в последнем столбце таблицы есть числа, меньшие
пяти, объединяем значения в строках с 4 по 8:
97
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
k
nk
npk
(nk − npk ) 2
npk
0
1
400
167
33
402
161
36
0,010
0,223
0,25
≥2
2
2
Вычислим χ в : χ в =0,010+0,223+025=0,483
Так как по выборке оценивался один параметр λ, то l=1.
Число степеней свободы равно 3-1-1=1.
χ 02,95 (1) = 3,84 .
χ в2 < χ 02,95 (1) , следовательно гипотеза Н0 принимается.
Решение данной задачи на EXCEL может выглядеть
следующим образом:
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
B
240
600
0,4
C
0
1
2
3
4
5
6
D
400
167
29
3
0
0
1
0
400
1
167
>=2 33
E
0,67032
0,268128
0,053626
0,00715
0,000715
5,72E-05
3,81E-06
F
402,192
160,8768
32,17536
4,290048
0,429005
0,03432
0,002288
402
161
36
0,00995
0,223602
0,25
0,483553
3,841455
98
G
402
161
32
4
0
0
0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В ячейки c5-c11 введены значения величины k, в ячейки
d5-d11 - число двухминутных интервалов. В ячейке b6
подсчитано число n – общее количество двухминутных
интервалов.
В
ячейке
b7
подсчитано
λ:
=СУММПРОИЗВ(с5:с11;d5:d11)/b6. В ячейку e5 введена
формула
=ПУАССОН(с5;$b$7;ложь),
которая
затем
распространена на ячейки е6-е11. Это – вероятности того, что
СВХ примет значение k. В ячейку f5 введена формула =$b$6*e5
(npk), которая распространена на ячейки f6-f11. В ячейку f13
введена формула =(d13-e13)^2/e13, которая распространена на
ячейки
f14
и
=СУММ(f13:f15).
f15.
В
В
ячейке
ячейке
f19
f17
подсчитано
подсчитано
χ в2 :
χ 02,95 (1) :
=ХИ2ОБР(0,05;1). В столбце g произведено округление чисел
столбца f до целых значений. Так, в ячейку g5 введена формула
=ОКРУГ(f5;0), которая затем распространена на ячейки g6-g11.
Пример 2.16. Проверить гипотезу о нормальном
распределении выборки. Принять уровень значимости α=0,1.
xi 10-12 12-14 14-16 16-18 18-20 20-22 22-24
ni 2
4
8
12
16
10
3
2
2
2
2
(n=55, x = 17.84, σ? = s = 8.53, χ â = 0, 928, χ 0,90 = 4, 61 )
2.4. Непараметрические методы математической
статистики
2.4.1. Основные понятия. Критерий знаков
В
практике
обработки
результатов
наблюдений
распределение генеральной совокупности часто неизвестно либо
(для непрерывных случайных величин) отличается от
нормального распределения, так что применение рассмотренных
ранее методов необоснованно и может привести к ошибкам. В
99
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
этих случаях применяют методы, не зависящие (или свободные)
от распределения генеральной совокупности, называемые
непараметрическими методами.
Непараметрические методы используют не сами числовые
значения элементов выборки, а структурные свойства выборки
(например, отношения порядка между ее элементами). В связи с
этим теряется часть информации, содержащейся в выборке,
поэтому, например, мощность непараметрических критериев
меньше их аналогов из раздела 2.3. Однако непараметрические
методы могут применяться при более общих предположениях и
более просты с точки зрения выполнения вычислений.
Большая
группа
непараметрических
критериев
используется для проверки гипотезы о принадлежности двух
выборок x1,x2,…,xn и y1,y2,...,ym одной и той же генеральной
совокупности, то есть о том, что функции распределения двух
генеральных совокупностей
FX ( x )
и
FY ( y )
равны:
FX ( x ) ≡ FY ( y ) y = x Такие генеральные совокупности называются
однородными. Необходимое условие однородности состоит в
равенстве характеристик положения и (или) рассеивания у
рассматриваемых генеральных совокупностей – таких, как
средние, медианы, дисперсии и др. Используемые для этих
целей непараметрические критерии в качестве основного
предположения
используют
только
непрерывность
распределения генеральной совокупности.
Простейший критерий такого рода, критерий знаков,
применяется для проверки гипотезы Н0 об однородности
генеральных совокупностей по попарно связанным выборкам.
Такая задача возникает, например, при сравнении двух
измерительных приборов. При этом используют n объектов и
над каждым из них проводят по одному измерению с помощью
обоих приборов. Обозначим xi и yi i=1,2,…,n результаты
измерения i-го объекта, полученные соответственно
при
помощи первого и второго прибора. Если сравниваемые
100
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборки получены из однородных совокупностей, то значения xi
и yi взаимозаменяемы и, следовательно, вероятности получения
положительных и отрицательных разностей xi - yi равны.
Вероятности появления нулевых разностей равны нулю в силу
предполагаемой непрерывности распределения измеряемого
признака.
Таким
образом,
вероятности
появления
положительных и отрицательных разностей равны ½, то есть
P(xi - yi>0)= P(xi - yi<0)=1/2, i=1,2,…,l где l – число ненулевых
разностей, l≤ n. Нулевые разности могут появиться из-за
случайных погрешностей или ошибок округлений, и
соответствующие им пары исключаются из рассмотрения.
Статистикой критерия знаков является число знаков «+»
или «-» в последовательности знаков разностей парных выборок
(xi,yi) , i=1,2,…,l . В дальнейшем для определенности берется
число знаков «+». При условии, что проверяемая гипотеза Н0
верна, а пары наблюдений (xi,yi) и, следовательно, знаки
разностей xi
- yi независимы, число знаков «+» имеет
биномиальное распределение с параметрами p=1/2 и l, то есть
B(l,1/2). Задача сводится к проверке гипотезы Н0 : р=1/2 при
одной из альтернативных гипотез:
Н1(1): р>1/2, Н1(2): р<1/2, Н1(3): р≠1/2.
Пусть r – наблюдаемое число знаков «+» , а α - заданный
уровень значимости. Гипотеза Н0 отклоняется, если при Н1:
р>1/2 выполняется неравенство
l
1
C   ≤α
(2.21)
∑
2
i =r
то есть вероятность получить знаков «+» не меньше, чем r,
не превышает α
или при Н1: р<1/2
l
i
l
l
1
C li   ≤ α
∑
2
i =0
r
101
(2.22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
l
1
C li   =БИНОМРАСП(r; l; 0,5;истина)
∑
2
i =0
или при Н1: р≠1/2 выполняется одно из неравенств
r
1 α
C   ≤
∑
2
2
i =r
l
l
i
l
1 α
C li   ≤
(2.23)
∑
2
 2
i =0
Если при соответствующих альтернативных гипотезах
неравенства (2.21) - (2.23) не выполняются, то Н0 не
противоречит результатам наблюдений и принимается на уровне
значимости α.
Часто более удобно проверять гипотезу Н0, используя
статистику Фишера. Гипотезу Н0 отклоняют, если при Н1: р>1/2
выполняется неравенство
r
l
r
≥ F1−α (k1 , k2 )
l − r +1
где k1 = 2(l − r + 1), k2 = 2r .
1
Или при H1 : p <
2
l−r
≥ F1−α (k1 , k2 )
FÂ =
r +1
FÂ =
где k1 = 2( r + 1),
k2 = 2(l − r ) .
(2.24)
(2.25)
1
выполняется одно из неравенств
2
r
(2.26)
FÂ =
≥ F α (k1 , k2 )
l − r + 1 1− 2
Или при H1 : p ≠
102
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где k1 = 2(l − r + 1),
k 2 = 2r .
l−r
≥ F α (k1 , k2 )
FÂ =
r + 1 1− 2
ãäå k1 = 2(r + 1), k2 = 2(l − r ).
(2.27)
Пример 2.17. Предполагается, что один из двух приборов,
определяющих скорость автомобиля, имеет систематическую
ошибку. Для проверки этого предположения определили
скорости 10 автомобилей, причем скорость каждого
фиксировалась одновременно двумя приборами.
V1км./час 70 85 63 54 65 80 75 95 52 55
V2км./час 72 86 62 55 63 80 78 90 53 57
Позволяют ли эти результаты утверждать, что второй
прибор дает завышенные значения скорости. α=0,1.
Решение. В предположении, что скорости автомобилей не
зависят друг от друга, задачу можно решить, применяя критерий
знаков. Составим последовательность знаков разностей V1-V2 :
- - + - + 0 - + - - Ненулевых разностей l=9, число
положительных r=3.
Н0: p=1/2 (различие в показаниях приборов вызваны
случайными ошибками).
Альтернативная: показания второго прибора имеют
положительное смещение, в этом случае вероятность появления
положительных разностей должна быть меньше ½. Н1: р<1/2
k1 = 2(3 + 1) = 8; k2 = 2(9 − 3) = 12
9−3
= 1,5; F0,90 (8,12) = FРАСПОБР (0,1;8;12) = 2,24
3 +1
H0 не противоречит результатам наблюдений. Следует
считать, что различия в показаниях приборов вызваны
случайными ошибками.
FВ =
103
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 2.18. Сравнивалось действие двух экстрактов
вируса табачной мозаики. Для этого каждая половина листа
натиралась соответствующим препаратом. Число пораженных
мест приводится ниже:
Экстракт А
20 39 43 13 28
26 17 49 36
Экстракт В
31 22 45 6
21
13 17 46 31
Можно ли считать, что действие этих экстрактов различно?
Принять α=0,01.
Решение.
Составим последовательность знаков разностей:
- + - + + + 0 + +. Ненулевых разностей l=8, число
положительных r=6.
Н0: p=1/2
Н1: p≠1/2
k1 = 2(8 − 6 + 1) = 6;
FВ =
6
= 2;
8 − 6 +1
k1 = 2(6 + 1) = 14;
FВ =
8−6
= 0, 286;
6 +1
k 2 = 2 * 6 = 12
F0,995 (6,12) = FРАСПОБР (0, 005;6;12) = 5,7570
k 2 = 2(8 − 6) = 4
F0,995 (14, 4) = FРАСПОБР (0, 005;14; 4) = 20,5148
Поскольку значения Fв в обоих случаях не превосходят
соответствующих значений квантиля F – распределения, нет
оснований считать, что действие этих экстрактов различно.
Проверим эту же гипотезу по первому из приведенных
критериев.
Для этого проверим каждое из неравенств (2.23)
104
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
α
1
C   = 1 − ÁÈ Í Î Ì ÐÀÑÏ (5;8;0,5, èñò èí à ) = 0,14 ≥ = 0,005
∑
2
2
i=6
l
8
i
l
α
1
Cli   = ÁÈ Í Î Ì ÐÀÑÏ (6;8;0,5; èñò èí à ) = 0,96 ≥ = 0,005
∑
2
2
i=0
6
l
Вывод тот же: нет оснований считать, что действие этих
экстрактов различно.
Пример 2.19. Проверить предположение о том, что
предлагаемый лечебный препарат не меняет состав крови (в
частности, числа лейкоцитов), если препарат испытывался на
десяти особях, а последующий анализ крови дал следующие
результаты:
0,97; 1,05; 1,09; 0,88; 1,01; 1,14; 1,03; 1,07; 0,94; 1,02
(числа выражают отношение числа лейкоцитов в опыте к
числу лейкоцитов в норме). Принять α=0,01.
Решение. Составим последовательность знаков разностей:
- + + - + + + + - +. Ненулевых разностей l=10, число
положительных r=7.
Н0: p=1/2
Н1: p≠1/2
k1 = 2(10 − 7 + 1) = 8; k 2 = 2 ⋅ 7 = 14
7
FB =
= 1,75; F0,995(8,14)= FРАСПОБР(0,005;8;14)=4,86
10 − 7 + 1
k1 = 2(7 + 1) = 16; k 2 = 2 ⋅ (10 − 7) = 6
10 − 7
FB =
= 0,375; F0,995(16,6)=FРАСПОБР(0,005;16;6)=9,76
7 +1
Поскольку значения Fв в обоих случаях не превосходят
соответствующих значений квантиля F – распределения, нет
оснований считать, что предлагаемый лечебный препарат
меняет состав крови.
105
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Проверим эту же гипотезу по первому из приведенных
критериев.
Для этого проверим каждое из неравенств (2.23)
l
10
α
i1
C
∑
l 
 = 1 − ÁÈ Í Î Ì ÐÀÑÏ (6;10;0,5, èñò èí à) = 0,17 ≥ = 0,005
2
2
i =7
α
1
Cli   = ÁÈ Í Î Ì ÐÀÑÏ (7;10;0,5; èñò èí à ) = 0,95 ≥ = 0,005
∑
2
2
i =0
7
l
Вывод тот же: нет оснований считать, что предлагаемый
лечебный препарат меняет состав крови
2.4.2. Критерий Вилкоксона, Манна и Уитни
Критерий применяется для сравнения двух независимых
выборок объема n и m и проверяет гипотезу Н0: выборки
получены из однородных генеральных совокупностей и, в
частности, имеют равные средние и медианы. Статистика W
критерия определяется следующим образом. Расположим n+m
значений объединенной выборки в порядке возрастания, то есть
в виде вариационного ряда. Каждому элементу ряда поставим в
соответствие его номер в ряду – ранг. Если несколько элементов
ряда совпадают по величине, то каждому из них присваивается
ранг, равным среднему арифметическому их номеров.
Пусть Ri – сумма рангов i-й выборки i=1,2. Вычислим
значения w1 и w2
n(n + 1)
− R1 ,
w1 = nm +
2
m(m + 1)
w2 = nm +
− R2
2
Правильность вычислений можно проверить так: w1 +
w2=nm.
106
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выборочное значение wв статистики критерия:
wв=min{ w1,
w2}.
В таблице Приложение 4 приводятся вероятности того, что
W<wв при условии, что гипотеза Н0 верна, то есть значения
p=P(W<wв/ Н0) для выборок объема n и m (n≥ m). При
односторонней (двусторонней) гипотезе Н1 гипотеза Н0
отклоняется, если р≤α (р≤2α), где α – заданный уровень
значимости. В противном случае считается, что гипотеза Н0 не
противоречит результатам наблюдений.
Пример 2.20. Измерялось напряжение пробоя у диодов (в
вольтах), отобранных случайным образом из двух партий.
1-я партия
2-я партия
39
60
50
53
61
42
67
41
40
40
40
54
54
63
69
Можно ли считать, что у диодов из второй партии
напряжение пробоя выше, чем у диодов первой партии. α=0,1.
Решение. Воспользуемся критерием Вилкоксона. Составим
вариационный ряд, отмечая принадлежность к первой партии
звездочкой. В результате получим следующую ранжированную
последовательность:
Элемент 39*
Номер
1
Ранг
1
54*
9
9,5
54
10
9,5
40*
2
3
40*
3
3
60
11
11
40
4
3
61*
12
12
Сумма
рангов
R1=1+3+3+7+9,5+12+14=49,5
41
5
5
63
13
13
42
6
6
67*
14
14
первой
107
50*
7
7
53
8
8
69
15
15
выборки
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сумма
рангов
второй
выборки
R2=3+5+6+8+9,5+11+13+15=70,5
n=7, m=8.
w1=7*8+7*8/2-49,5=34,5
w2=7*8+8*9/2-70,5=21,5
Проверка: w1+ w2=56
Wв=min{34,5;21,5}=21,5
По таблице Приложение 4 (с интерполяцией) находим
p=P(W<21,5)=0,25
Так как предположение о том, что у диодов второй партии
напряжение пробоя выше, соответствует односторонней
альтернативной гипотезе Н1, а вероятность р=0,25 превышает
уровень значимости α=0,1, гипотеза Н0 не противоречит
результатам измерений, следовательно, результаты измерений
не дают оснований считать, что напряжение пробоя у диодов
второй партии выше, чем у диодов первой партии.
Если объем каждой выборки больше восьми, то проверку
гипотезы Н0 можно проводить, используя статистику
1
W − nm
(2.28)
2
Z=
1
nm(n + m + 1)
12
имеющую (при условии, что Н0 верна) приблизительно
нормальное распределение N(0,1). В этом случае Н0 отклоняется
на уровне значимости α, если выборочное значение статистики
Z удовлетворяет неравенству zв<uα (zв>u1-α) при левосторонней
(правосторонней) альтернативной гипотезе Н1, и |zв|>u1-α/2 при
двусторонней альтернативной гипотезе Н1.
Пример 2.21. В условиях предыдущего примера получены
результаты новой серии измерений напряжения пробоя у диодов
(в вольтах)
1-я
50 41 48 60 46 60 51 42 62 54 42 46
серия
2-я
38 40 47 51 63 50 63 57 59 51 серия
108
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имеются ли основания утверждать, что напряжение пробоя
у диодов обеих партий различно.
Решить пример, используя
а) критерий Вилкоксона
б) проверку гипотезы о равенстве средних (в
предположении, что обе выборки получены из нормально
распределенной генеральной совокупности).
Уровень значимости α=0,1.
Решение.
а) Определим ранги каждого результата.
Элемент 38 40 41* 42* 42* 46* 46* 47 48*
Номер
1 2 3
4
5
6
7
8 9
Ранг
1 2 3
4,5 4,5 6,5 6,5 8 9
Элемент
Номер
Ранг
54* 57
15 16
15 16
59
17
17
60* 60* 62* 63
63
18
19
20 21
22
18,5 18,5 20 21,5 21,5
R1=129,5; n=12; R2=123,5; m=10;
w1=12*10+12*13/2-129,5=68,5
w2=12*10+10*11/2-123,5=51,5
Wв=min{68,5;51,5}=51,5.
Так как n>8 и m>8, то для проверки гипотезы Н0
используем статистику Z.
109
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Z=
1
51,5 − *12 *10
2
≈ −0,56
1
*12 *10(12 + 10 + 1)
12
Проверяемое предположение соответствует двусторонней
альтернативной гипотезе, следовательно, значение |zв|
сравнивается с квантилью u1-α/2.
u0,95= НОРМСТОБР(1-α/2)=НОРМСТОБР(1-0,1/2)=1,645.
Таким образом, утверждение о том, что напряжение пробоя
у диодов обеих партий различно, следует отклонить.
б) Проверим гипотезу о равенстве средних. По результатам
наблюдений вычислим оценки средних и дисперсий для каждой
выборки:
x1 = 50,17; s12 = 55,06
x2 = 51,90; s22 = 76,32
Предварительно следует проверить гипотезу о равенстве
дисперсий.
H 0 : σ 12 = σ 22 ï ðè H1 : σ 12 ≠ σ 22
Для этого найдем отношение выборочных дисперсий и
сравним его с квантилью F1-α/2(m-1,n-1)= FРАСПОБР(α/2;m-1;n1) =FРАСПОБР(0,1/2;9;11)= 2,896.
s12
= 1,39 . Так как 1,39< 2,896, то гипотеза о равенстве
s22
дисперсий принимается, следовательно, проверку гипотезы о
равенстве средних можно проводить на основе статистики
Стьюдента (формула 2.17)
110
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
−
tâ =
−
x− y
(n − 1) S + (m − 1) S
2
x
nm(n + m − 2)
=
n+m
2
y
50,17 − 51,90
12 *10(12 + 10 − 2)
≈ −0,50
12 + 10
(12 − 1) * 55,06 + (10 − 1) * 76,32
t1-α/2(n+m-2)=
СТЬЮДРАСПОБР(α;n+m-2)
=СТЬЮДРАСПОБР(0,1;20)=1,725.
|tв|<1,725, следовательно, гипотеза о равенстве средних
принимается. Утверждение о том, что напряжение пробоя у
диодов обеих серий различные, следует отклонить.
Пример 2.22. По выборкам из двух партий микросхем
после операции легирования поликремния измерялось удельное
сопротивление. Результаты замеров следующие:
1-я партия
52,2
33
76
32,5
49,5
32,5
2-я партия
119
17,5
43,5
43,5
90,5
40
1-я партия
2-я партия
191,5
50
112,5
108
52,9
62,4
114,8
16,5
1-я партия
2-я партия
33,7
92,5
69,1
96
112,5
46
48,5
-
16,5
-
Можно ли утверждать, что обе партии получены из одной
генеральной совокупности? Принять уровень значимости α=0,1
Решить пример, используя
а) критерий Вилкоксона
б) проверку гипотезы о равенстве средних (в
предположении, что обе выборки получены из нормально
распределенной генеральной совокупности).
Решение.
111
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) Определим ранги каждого из результатов.
16,5 16,5* 17,5 32,5* 32,5* 33* 33,7* 40 43,5 43,5 46
1,5 1,5
3
4,5 4,5
6
7
8 9,5 9,5
11
48,5* 49,5* 50 52,2* 52,9*
62,4 69,1* 76* 90,5 92,5 96
12
17
108
13
14
15
16
18
19
20
21 22
23
112,5* 112,5* 114,8* 119 191,5*
24,5 24,5
26
27 28
R1=219,5; n=15; R2=186,5; m=13;
w1=15*13+15*16/2-219,5=95,5
w2=15*13+13*14/2-186,5=99,5
Wв=min{95,5;99,5}=95,5.
Так как n>8 и m>8, то для проверки гипотезы Н0
используем статистику Z.
Z=
1
95,5 − *15 *13
2
1
*15*13(15 + 13 + 1)
12
≈ −0,092
Проверяемое предположение соответствует двусторонней
альтернативной гипотезе, следовательно, значение |zв|
сравнивается с квантилью u1-α/2.
u0,95= НОРМСТОБР(1-α/2)=НОРМСТОБР(1-0,1/2)=1,645.
112
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б)
x1 = 68,51; x 2 = 63,49; s12 = 2159,9; s 22 = 1154,48;
s12
= 1,87; F = 2,637;
s 22
t = 0,321 t = 1,71
Таким образом, утверждение о том, обе партии получены
из одной генеральной совокупности, следует принять.
2.4.3. Критерий серий.
Критерий серий применяется для проверки гипотезы Н0,
утверждающей, что элементы выборки получены случайным
образом и независимы. Пусть x1,x2,…,xn – выборка результатов
наблюдений, h%x - выборочная медиана, определенная по этим
данным. Каждому элементу выборки поставим в соответствие
знак «+» или «-» в зависимости от того, больше или меньше
медианы его значение (нулевые значения не учитываются). Тем
самым всей выборке поставлен в соответствие набор знаков.
Обозначим n1 число знаков «+», n2 – число знаков «-» в
полученном наборе знаков. Серией в этом наборе называется
всякая последовательность, состоящая из одинаковых знаков и
ограниченная противоположными знаками, либо находящаяся в
начале или в конце набора. Например, в наборе + - + + + - - - - + + содержится пять серий: (+), (-), (+ + +), (- - - - -), (+ +), n1=6,
n2=6.
Статистикой критерия является число серий N.
Критическая область определяется неравенствами N≤N1 и N≥N2.
Значение границ критической области N1 и N2 для
соответствующего уровня значимости α приводятся в таблице
Приложения 5.
Пример 2.23. Скорости автомобилей в некоторой точке
трассы образовали следующий ряд:
113
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
31, 39, 40, 45, 27, 28, 35, 55, 21, 33, 42, 36. Можно ли
считать полученные значения случайными. α=0,05.
Решение. Найдем оценку медианы h%x .
представим данные в виде вариационного ряда.
Для
этого
35 + 36
21, 27,28,31,33,35,36,39,40,42,45,55. h%x =
= 35,5
2
Искомому
ряду
наблюдений
соответствует
последовательность знаков
- + + + - - - + - - + + . n1=6, n2=6; N=6. По таблице
Приложения 5 при α=0,05 находим: N1=3; N2=11. Так как
3≤N≤11, то гипотеза Н0 принимается: полученные значения
скорости можно считать случайными.
При больших объемах выборки, когда либо n1, либо n2,
либо оба значения больше 20, для проверки гипотезы Н0 можно
использовать статистику Z, выборочное значение zв которой
вычисляется по формуле:
2n n
1
( N − 1 2 − 1) −
n1 + n2
2
zâ =
(2.29)
2n1n2 [2n1n2 − ( n1 + n2 )]
(n1 + n2 ) 2 ( n1 + n2 − 1)
При условии, что Н0 верна, статистика Z имеет
приблизительно нормальное распределение N(0,1). В этом
случае критическая область определяется неравенствами: zв<uα/2
или zв≥u1-α/2.
Замечание. Критерий серий применяется для проверки
случайности любой выборки, элементами которой являются два
различных символа, например, 0 и 1, A и В, + и -. Статистикой
критерия является число серий в этой выборке.
Пример 2.24. Можно ли считать, что последовательность
110010001010100111011010010000101000
получена
из
совокупности случайных последовательностей. α=0,01.
114
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Решение. Число нулей n1=21, число единиц n2=15, число
серий N=22.
Так как n1>20, для проверки гипотезы Н0, утверждающей,
что данная последовательность получена из совокупности
случайных последовательностей, воспользуемся статистикой Z.
По формуле (2.29) выборочное значение zв этой статистики
равно
2 * 21*15 1
(22 −
)−
21 + 15
2
≈ 0,4848
zв =
2 * 21*15 *[2 *15 * 21 − (21 + 15)]
(21 + 15) 2 * (21 + 15 − 1)
Так как u1-α/2=u0,95=НОРМСТОБР(1-α/2)=НОРМСТОБР(10,005)= 2,575829, гипотеза Н0 принимается: можно считать, что
данная последовательность получена из совокупности
случайных последовательностей.
Пример 2.25. Глубина слоя диффузии, определенная по
выборке из партии микросхем, имеет следующие значения (в
мкм):
9,8; 9,8; 8,6; 8,6; 9,2; 9,2;9,8; 9; 10; 9,4; 9; 11,2; 10,8; 9,2; 9,4
Проверить гипотезу Н0 о том, что полученные результаты
распределены случайным образом. Принять α=0,05.
Решение.
Найдем оценку медианы h%x . Для этого представим данные
в виде вариационного ряда.
8,6 8,6 9 9 9,2 9,2 9,4 9,4 9,8 9,8 9,8 9,8 10 10,8 11,2
h%x =9,4
Искомому
ряду
наблюдений
соответствует
последовательность знаков
+ + - - - - + - + 0 - + + - 0 . n1=6, n2=7; N=8. По таблице
Приложения 5 при α=0,05 находим: N1=3; N2=12. Так как
115
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3≤N≤12, то гипотеза Н0 принимается: полученные результаты
распределены случайным образом.
Некоторые полезные статистические функции EXCEL.
Для поиска доверительного интервала для дисперсии
(раздел 2.2.2) можно воспользоваться функцией ХИ2ОБР.
Пусть, например, объем выборки n=16, γ=0,9. Количество
степеней свободы k=n-1=15. Для поиска χ 12 и χ 22 (см. рис. стр.
80 и формулу (2.12) ) воспользуемся следующими функциями:
χ 12 = ХИ2ОБР(0,95;15) = 7,26
χ 22 = ХИ2ОБР(0,05;15) = 25
Для поиска Fα (рис. стр. 93) при объемах выборок n=10 и
m=15
соответственно
и
α=0,05
Fα=FРАСПОБР(0,05;9;14)=2,6457.
−
∑ ( xi − x) 2 =КВАДРОТКЛ(диапазон)
r=КОРРЕЛ(диапазон Х; диапазон Y)
Если уравнение линейной регрессии Y на X записать в виде
y=c0+c1x, то с1=НАКЛОН(диапазон Y; диапазон Х)
Если необходимо вычислить значение y в точке х=1, можно
воспользоваться функцией ПРЕДСКАЗ:
=ПРЕДСКАЗ(1; диапазон Y; диапазон Х)
116
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.5. Пакет Scilab для решения задач по
теории вероятностей и математической статистике
^
Среднее
значение
можно оценить так:
--> x=[90 92 93 95 96 98];
--> s=mean(x)
Результат:
s =
94.
В случае статистического ряда:
)
1 k
M ( X ) = x = ∑ ni z i
n i =1
--> x=[-2 1 2 3 4 5];
--> n=[2 1 2 2 2 1];
--> t=meanf(x,n)
Результат:
t =
2.
Дисперсия оценивается так:
а) несмещенная оценка
S2 =
−
M (X ) = x =
−
1 n
(
x
−
x
)2
∑
i
n − 1 i =1
--> x=[90 92 93 95 96 98];
--> s=variance(x)
Результат:
s =
8.4
В случае статистического ряда:
1 k
S =
ni ( zi − x ) 2
∑
n − 1 i =1
2
--> x=[-2 1 2 3 4 5];
--> n=[2 1 2 2 2 1];
117
1 n
∑ xi
n i =1
по
выборке
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
--> s=variancef(x,n)
Результат:
s =
5.7777778
Среднеквадратическое отклонение
σ (X ) = S 2
--> x=[90 92 93 95 96 98];
--> s=stdev(x)
Результат:
s =
2.8982753
В случае статистического ряда:
--> x=[-2 1 2 3 4 5];
--> n=[2 1 2 2 2 1];
--> stdevf(x,n)
б) смещенная оценка
(S * ) 2 =
−
1 n
( xi − x) 2
∑
n i =1
Среднеквадратическое отклонение
--> x=[90 92 93 95 96 98];
--> s=msd(x)
Результат:
s =
2.6457513
Начальные моменты
^
αk =
1 n k
∑ xi
n i =1
moment(x,k)
--> x=[90 92 93 95 96 98];
--> s=moment(x,2)
Результат:
s =
118
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8843.
Центральные моменты
^
µk =
−
1 n
(
x
−
x
)k
∑
i
n i =1
--> x=[90 92 93 95 96 98];
--> s=cmoment(x,2)
Результат:
s =
7.
Корреляция
b=
n
n
n
i =1
i =1
n
i =1
n∑ xi yi − ∑ xi ∑ yi
n
n∑ x − (∑ xi )
i =1
2
i
n
=
∑ x y − nxy
i
i =1
n
2
n
∑x
i =1
i =1
a = y − bx
i
2
i
−
(∑ xi ) 2
i =1
n
--> x=[3 6 10 7 9 11 14];
--> y=[3 4 8 8 11 1 12];
--> c=regress(x,y)
Результат:
c =
1.8455882 //Это а
0.5680147 // Это в
sY*
Уравнение регрессии y = a + bx = y + r * ( x − x )
sX
--> xbasc()
--> x=[3 6 10 7 9 11 14];
--> y=[3 4 8 8 11 1 12];
--> c=regress(x,y)
--> plot2d(x,y,-8 )/-8 означает, что точки не соединены
линиями
119
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
--> x=3:.1:14;
--> q=c(1)+c(2)*x;
--> plot2d(x,q,5)
Результат:
12
10
8
6
4
2
0
2
4
6
8
10
12
14
Коэффициент корреляции
--> xbasc()
--> x=[3 6 10 7 9 11 14];
--> y=[3 4 8 8 11 1 12];
--> t=[];
--> for i=1:length(x)
t(i,i)=1;
end
--> c=correl(x,y,t)
Результат:
c =
0.4923679
Коэффициент корреляции для корреляционной таблицы:
X
40-50
50-60
60-70
70-80
Y
120
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
продолжение таблицы
10-11
2
11
3
2
11-12
1
19
2
4
12-13
3
6
27
6
13-14
2
3
3
8
--> x=[45 55 65 75];
--> y=[10.5 11.5 12.5 13.5];
--> fre=[2 11 3 2; 1 19 2 4;3 6 27 6;2 3 3 8];
--> r=correl(x,y,fre)
Результат:
r =
0.3287518
Вычисление ковариации
--> x=[45 55 65 75];
--> y=[10.5 11.5 12.5 13.5];
--> fre=[2 11 3 2; 1 19 2 4;3 6 27 6;2 3 3 8];
--> cov=covar(x,y,fre)
Результат:
cov =
2.7662438
Вероятность попадания СВ в интервал
cdfnor
–
функция
распределения
нормально
распределенной СВ с параметрами σ (Std) и m (Mean). Q=1-P,
X – верхний предел интегрирования.
( x − m) 2
x −
2
1
P = F ( x) =
dx
∫ e 2σ
σ 2π − ∞
Может записываться так:
--> [P,Q]=cdfnor("PQ",X,Mean,Std)
--> [X]=cdfnor("X",Mean,Std,P,Q)
--> [Mean]=cdfnor("Mean",Std,P,Q,X)
--> [Std]=cdfnor("Std",P,Q,X,Mean)
121
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример 2.26. СВ Х распределена по нормальному закону с
m = 5,5 и σ = 1,08 . Вычислить P(2,9 ≤ x ≤ 3,9)
Решение.
--> cdfnor("PQ",3.9,5.5,1.08) -cdfnor("PQ",2.9,5.5,1.08)
Результат:
ans =
0.0612060
Вероятность получить не больше х успехов по формуле
Бернулли
Вычисляется с помощью функции cdfbin, которая может
записываться так:
--> [P,Q]=cdfbin("PQ",S,Xn,Pr,Ompr)
--> [S]=cdfbin("S",Xn,Pr,Ompr,P,Q)
--> [Xn]=cdfbin("Xn",Pr,Ompr,P,Q,S)
--> [Pr,Ompr]=cdfbin("PrOmpr",P,Q,S,Xn)
Здесь S - число успехов в Xn опытах, Pr – вероятность
успеха в одном опыте, Ompr=1- Pr, Q=1 – P.
Пример 2.27. Найти вероятность того, что произойдет
отказ не более двух элементов из трех имеющихся, если
вероятность отказа одного элемента равна 0,6.
Решение. Не более двух элементов – это либо 0, либо 1,
либо 2 элемента.
P3(x≤2)=P3(0)+P3(1)+P3(2)
--> cdfbin("PQ",2,3,.6,.4)
Результат:
ans =
0.784
Вероятность того, что откажут ровно два элемента
можно вычислить так:
--> cdfbin("PQ",2,3,.6,.4)-cdfbin("PQ",1,3,.6,.4)
Результат:
ans =
0.432
122
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность получить не больше х успехов по формуле
Пуассона
--> [P,Q]=cdfpoi("PQ",S,Xlam)
--> [S]=cdfpoi("S",Xlam,P,Q)
--> [Xlam]=cdfpoi("Xlam",P,Q,S);
S – число успехов в формуле Пуассона;
Xlam - λ = np
P – вероятность того, что интересующее нас событие
произойдет не менее S раз;
Q=1-Р
Пример 2.28. Найти вероятность того что в 100
независимых испытаниях, в каждом из которых некоторое
событие А может произойти с вероятностью 0.7, событие А
произойдет не более 7 раз.
Решение.
P ( x ≤ 7) = P (0) + P (1) + K + P (7)
100
100
100
100
--> p=cdfpoi("PQ",7,7)
Результат:
p =
0.5987138
Вероятность того, что интересующее нас событие наступит
ровно 12 раз:
e − 7 12
P (12) =
⋅ 7 ≈ 0,02635
100
12!
--> p=cdfpoi("PQ",12,7)-cdfpoi("PQ",11,7)
Результат:
p =
0.0263498
Распределение Стьюдента
--> [P,Q]=cdft("PQ",T,Df)
--> [T]=cdft("T",Df,P,Q)
--> [Df]=cdft("Df",P,Q,T)
123
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
p=
T
∫ f (t )dt
−∞
Q=1-p;
T- верхний предел;
Df – число степеней свободы.
Пример 2.29. Найти 90% квантиль (k=40) и 5% (k=8)
Решение.
--> t=cdft("T",40,.9,.1)
Результат:
t =
1.3030771
--> t=cdft("T",8,.05,.95)
Результат:
t =
- 1.859548
Распределение Фишера
--> [P,Q]=cdff("PQ",F,Dfn,Dfd)
--> [F]=cdff("F",Dfn,Dfd,P,Q);
--> [Dfn]=cdff("Dfn",Dfd,P,Q,F);
--> [Dfd]=cdff("Dfd",P,Q,F,Dfn)
p=
F
∫ f (t )dt
−∞
Dfn,d – число степей свободы числителя и знаменателя
соответственно
Пример 2.30. Вычислить квантили F0.01(3,5), F0.90(4,100) и
F0.05(60,120)
Решение.
--> f=cdff("F",3,5,.01,.99)
Результат:
f =
0.0354144
--> f=cdff("F",4,100,.9,.1)
Результат:
124
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
f =
2.0019385
--> f=cdff("F",60,120,.05,.95)
Результат:
f =
0.6815394
C помощью статистической функции Excel FРАСПОБР
можно вычислить эти вероятности так:
F0.01(3,5)= FРАСПОБР(0,99;3,5)=0,035
F0.90(4,100)= FРАСПОБР(0,1;4,100) =2,002
F0.05(60,120)= FРАСПОБР(0,95;60,120)=0,682
χ 2 - распределение
p=
Х
∫ f (t )dt
−∞
--> [P,Q]=cdfchi("PQ",X,Df)
--> [X]=cdfchi("X",Df,P,Q);
--> [Df]=cdfchi("Df",P,Q,X)
Q=1-p;
Х - верхний предел;
Df – число степеней свободы.
Пример 2.31. Несмещенная оценка дисперсии S2 =10
получена по выборке объема n=21. Найти 90% доверительный
интервал для дисперсии.
Решение.
1=20.
p1 = P ( χ 2 ≤ χ12 ) =
Имеем:
α
α=1-γ=1-0,9=0,1.
2
α
2
125
α
2
= 0,05.
p2 = P ( χ 2 ≤ χ 22 ) = 1 −
--> [X]=cdfchi("X",20,.05,0.95)
= 0,05; 1 −
α
2
= 0,95.
.
= 0,95. k=21-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Результат:
X =
10.850811
--> [X]=cdfchi("X",20,.95,0.05)
Результат:
X =
31.410433
Подставляя
эти
значения
2
2
(n − 1) S
(n − 1) S
<σ2 <
, получаем:
2
2
χ2
χ1
в
формулу
(21 − 1)10
(21 − 1)10
≤σ 2 ≤
или 6,33≤σ2≤18,35
31,4
10,9
Пример 2.32. Задан закон распределения вектора (Х, Y).
Определить:
законы распределения X и Y
центр рассеивания вектора (X, Y).
XY
0
1
2
2
0,1
0,2
0,2
4
0,3
0,1
0,1
--> x=[ 0 1 2];
--> y=[2 4];
--> fre=[.1 .2 .2;.3 .1 .1];
--> x
--> p=sum(fre,1)
--> meanx=meanf(x,p)
--> y
--> p1=sum(fre,2)
--> meany=meanf(y,p1)
Результат:
x =
0. 1. 2.
p =
126
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
0.4 0.3 0.3
meanx =
0.9
y =
2. 4.
p1 =
0.5 0.5
meany =
3.
Найдем cov( X , Y )
--> x=[0 1 2];
--> y=[2 4];
--> fre=[0.1 0.2 0.2; 0.3 0.1 0.1]';
--> cov=covar(x,y,fre)
Результат:
cov =
- 0.3
Подсчитаем коэффициент корреляции между X и Y.
--> x=[0 1 2];
--> y=[2 4];
--> fre=[0.1 0.2 0.2; 0.3 0.1 0.1];
--> r=correl(x,y,fre)
Результат:
r =
- 0.3611576
2.6 Задания по математической статистике
Задания следует оформлять в отдельной тетради, на
обложке которой кроме фамилии и номера группы должны
быть указаны следующие данные:
α= ,β= ,γ= ,θ= ,µ= ,ν= .
127
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Здесь α и β – первая и третья цифры номера группы, γ и
θ – две последние цифры номера группы, µ и ν – две цифры
номера студента по списку.
Так, у пятого студента группы 728311 α = 7, β = 8, γ = 1, θ =
1, µ = 0, ν = 5.
В тетради должно быть записано условие задания и его
подробное решение.
Задание 2.1.
В результате 6 измерений толщины изделия одним
прибором (без систематических ошибок) получены следующие
результаты (в мм):
90+ν; 90+ν+2; 90+ν+3; 90+ν+5; 90+ν+6; 90+ν+8.
Найти:
1) выборочную толщину изделий
2) выборочную дисперсию ошибок прибора.
Данную задачу решить с помощью статистических
функций EXCEL.
Указание. Воспользоваться следующими функциями:
СРЗНАЧ (диапазон), ДИСП (диапазон), СТАНДОТКЛОН
(диапазон). Например, в нужную ячейку вводится формула
=СРЗНАЧ(с22:h22).
Результатом будет среднее арифметическое исходных
данных, находящихся в ячейках с22-h22, вычисленное по
формуле (2.6 ).
Задание 2.2.
Вычислить коэффициент корреляции и нанести на
диаграмму рассеивания прямые регрессии Y на Х и X на Y
ν+1
ν+4
α+6
ν+5
β+7
ν+9
ν+12
X
µ+ ν
µ+3
8
µ+7
11
µ
12
Y
128
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задание 2.3.
Вычислить коэффициент корреляции и найти уравнение
прямых регрессий Y на X и X на Y по данным корреляционной
таблицы
ν
ν+4
ν+8 ν+12 ν+16 ν+20
X
ν+4 ν+8
ν+12 ν+16 ν+20 ν+24
Y
µ – µ+2
α
ν
0
0
0
0
µ+2– µ+4
0
α+20 θ+32 0
0
0
µ+4– µ+6
0
0
ν+30 ν+47 α
0
µ+6– µ+8
0
0
10
11
µ+2 6
µ+8– µ+10
0
0
0
9
ν +5 3
Задание 2.4.
Выборка из большой партии электроламп содержит
100(θ+µ+1) ламп. Средняя продолжительность горения лампы в
выборке оказалась равной 1000 часам. Найти с надежностью
0,9 +
ν
доверительный
интервал
для
средней
100
продолжительности горения лампы всей партии, если известно,
что σ=40+ν часам.
Данную задачу решить также с помощью статистических
функций EXCEL.
−
Указание. Пусть, например, n=252, x = 1000 , γ=0,97, σ=45.
Тогда для поиска левого конца доверительного интервала в
нужную
ячейку
вводится
формула:
=1000ДОВЕРИТ(0,03;45;252). Результатом будет число 993,848. Для
правого конца =1000+ДОВЕРИТ(0,03;45;252) . Результатом
будет число 1006,152. Таким образом, 97% доверительный
интервал для m будет таким:
993,848<m<1006,152
129
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задание 2.5.
Из генеральной совокупности извлечена выборка объема
n=10.
варианта xi
ν-5
ν-3
ν
ν+1
ν+3
ν+4
частота ni
2
1
2
2
2
1
Оценить с γ=0,95 математическое ожидание m нормально
распределенного признака Х генеральной совокупности по
выборочной средней при помощи доверительного интервала.
Данную задачу решить также с помощью статистических
функций EXCEL.
Указание. Для поиска tγ в формуле ( 2.11 ) воспользоваться
функцией
=СТЬЮДРАСПОБР(1-γ, n-1).
Задачи для лабораторных занятий.
1. n=200, x = 125 , σ=20.
Построить 90%, 95%, 99%
доверительные интервалы для математического ожидания,
используя
а) таблицы нормального распределения
б) статистическую функцию ДОВЕРИТ
2. Несмещенная оценка дисперсии S2=20 получена по
выборке объема 26. Найти 80% и 98% доверительные интервалы
для дисперсии, используя
а) таблицы распределения χ2
б) статистическую функцию ХИ2ОБР
130
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3.
3
5
7
9
xi
2
ni
2
5
7
8
3
Построить 90%, 95%, 99% доверительные интервалы для
математического ожидания, используя
а) таблицы t - распределения
б) статистическую функцию СТЬЮДРАСПОБР(1-γ, n-1)
и такие же интервалы для дисперсии.
4. Первая серия измерений времени безотказной работы
электронной лампы дала следующие результаты:
n=64,
x = 480 ч ,
σ=10 ч. Повторные измерения показали
n=100 , x = 500 ч , σ=10. Найти 90% и 95% доверительные
интервалы для среднего.
Ответы: (490.91, 493.48), (490.18, 494.21)
5. Содержание углерода в единице продукта:
а) n=25, x = 18 г , S2=16 г2
б) n=9, x = 18,8 г , S2=20 г2
Ответы: (17.01, 19.41), (16.27, 20.16)
6. Найти 99 и 95% доверительные интервалы для
коэффициента корреляции
а) r=-0,65 n=12
б) r=0.14 n=300
Ответы: (-0.93, 0.09), (-0.89, -0,12)
(-0.01, 0.28) (-0.03, 0.25)
Самостоятельная работа
1. Построить 90% доверительный интервал для M(X) и 95%
доверительный интервал для D(X)
а)
xi
2
3
5
7
10
ni
2
4
7
7
5
131
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
b)
xi
ni
1
2
4
2
5
8
6
9
8
4
xi
ni
0
1
2
1
4
7
5
8
6
3
c)
2. Выборочный коэффициент корреляции, вычисленный по
выборке объема
a) n=50; r=0,687
b) n=28; r=0,71
c) n=28; r=-0,36.
Найти:
a) 95 %
b) 95 %
c) 99%
доверительный интервал для коэффициента корреляции ρ.
Ответы:
a) (0.505; 0.810)
b) (0.46; 0.86)
c) (-0.71; 0.13)
Задание 2.6.
В результате двух серий измерений с количеством
измерений n1=10(µ+2) и n2=10(µ+3) получены следующие
средние значения исследуемой величины:
−
−
x =9+0,1(ν+1) и
y =9+0,1(ν+2). Можно ли с надежностью γ=0,95 объяснить эти
расхождения случайными причинами, если известно, что
средние квадратические отклонения в обеих сериях равны
σх=σy=0,2.
132
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
68+µ
80+ν
92+ν+µ
81
70-µ
79
78
66
57+ν
76
60+ν
84
97
75+ν
69
85-ν
72
64+ν
59
70
Задание 2.7.
Через равные промежутки времени в тонком слое раствора
золота регистрировалось число частиц золота, попавших в поле
зрения микроскопа. В результате наблюдений было получено
следующее эмпирическое распределение:
xi 0
1
2
3
4
5
6
7
ni 110+ν
168 130+ν 70+µ 30+ν µ+3 µ+2 1
Здесь xi – число частиц золота, ni – частота, то есть число
интервалов времени, в течение которых в поле зрения попало
ровно xi – частиц.
Проверить с использованием критерия χ2 гипотезу о том,
что эмпирическое распределение согласуется с распределением
Пуассона, приняв уровень значимости α=0,05.
Задание 2.8.
Распределение числового признака Х в выборке
определяется следующей таблицей:
xi
3 – 3,6 3,6 – 4,2 4,2 – 4,8
4,8 – 5,4 5,4 - 6 6 – 6,6
ni
2
8
15
32+µ
40+ν
20+µ
При уровне значимости α=0,01 проверить гипотезу о
нормальности распределения Х в генеральной совокупности.
Задание 2.9.
Для 10 человек была предложена специальная диета. После
двухнедельного питания по этой диете масса их тела изменилась
следующим образом:
Масса
до
диеты
(кг)
Масса
после
диеты
(кг)
133
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) Можно ли рекомендовать эту диету для людей,
желающих похудеть?
б) Оказывает ли эта диета вообще какое-либо
существенное действие на массу тела?
Принять α=0,10.
134
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Литература
1. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее
инженерные приложения. Учебное пособие для втузов. – М.,
Высш. школа, 2000. - 480 с.
2. Теория вероятностей и математическая статистика:
Учеб. пособие для экон. спец. вузов/ В.А.Колемаев,
О.В.Староверов, В.Б.Турундаевский. – М.: Высш. шк., 1991. –
400 с.
3. Сборник задач по математике для втузов. Ч. 3. Теория
вероятностей и математическая статистика. Учеб. пособие для
втузов/Под ред. А.В.Ефимова – 2-е изд. М.: Наука, Гл. ред. физ.мат. лит., 1990. – 428 с.
135
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложения
ПРИЛОЖЕНИЕ 1
Нормальное распределение
Функция распределения нормированного нормального
распределения
x
2
1
Ф( x) =
e −t / 2 dt
∫
2π −∞
x
0
1
2
3
4
5
6
7
8
9
0,0
0,50000
50399
50798
51197
51595
51994
52392
52790
53188
53586
0,1
53983
54380
54776
55172
55567
55962
56356
56749
57142
57535
0,2
57926
58317
58706
59095
59483
59871
60257
60642
61026
61409
0,3
61791
62172
62552
62930
63307
63683
64058
64431
64803
65173
0,4
65542
65910
66276
66640
67003
67364
67724
68082
68439
68793
0,5
69146
69497
69847
70194
70540
70884
71226
71566
71904
72240
0,6
72575
72907
73237
73565
73891
74215
74537
74857
75175
75490
0,7
75804
76115
76424
76730
77035
77337
77637
77935
78230
78524
0,8
78814
79103
79389
79673
79955
80234
80511
80785
81057
81327
0,9
81594
81859
82121
82381
82639
82894
83147
83398
83646
83891
1,0
84134
84375
84614
84850
85083
85314
85543
85769
85993
86214
1,1
86433
86650
86864
87076
87286
87493
87698
87900
88100
88298
1,2
88493
88686
88877
89065
89251
89435
89617
89796
89973
90147
1,3
90320
90490
90658
90824
90988
91149
91308
91466
91621
91774
1,4
91924
92073
92220
92364
92507
92647
92786
92922
93056
93189
1,5
93319
93448
93574
93699
93822
93943
94062
94179
94295
94408
1,6
94520
94630
94738
94845
94950
95053
95154
95254
95352
95449
1,7
95543
95637
95728
95818
95907
95994
96080
96164
96246
96327
1,8
96407
96485
96562
96638
96712
96784
96856
96926
96995
97062
1,9
97128
97193
97257
97320
97381
97441
97500
97558
97615
97670
136
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
x
0
1
2
3
4
5
6
7
8
9
2,0
97725
97778
97831
97882
97932
97982
98030
98077
98124
98169
2,1
98214
98257
98300
98341
98382
98422
98461
98500
98537
98574
2,2
98610
98645
98679
98713
98745
98778
98809
98840
98870
98899
2,3
98928
98956
98983
99010
99036
99061
99086
99111
99134
99158
2,4
99180
99202
99224
99245
99266
99286
99305
99324
99343
99361
2,5
99379
99396
99413
99430
99446
99461
99477
99492
99506
99520
2,6
99534
99547
99560
99573
99585
99598
99609
99621
99632
99643
2,7
99653
99664
99674
99683
99693
99702
99711
99720
99728
99736
2,8
99744
99752
99760
99767
99774
99781
99788
99795
99801
99807
2,9
99813
99819
99825
99831
99836
99841
99846
99851
99856
99861
3,0
99865
99869
99874
99878
99882
99886
99889
99893
99896
99900
3,1
99903
99906
99910
99913
99916
99918
99921
99924
99926
99929
3,2
99931
99934
99936
99938
99940
99942
99944
99946
99948
99950
3,3
99952
99953
99955
99957
99958
99960
99961
99962
99964
99965
3,4
99966
99968
99969
99970
99971
99972
99973
99974
99975
99976
3,5
99977
99978
99978
99979
99980
99981
99981
99982
99983
99983
3,6
99984
99985
99985
99986
99986
99987
99987
99988
99988
99989
3,7
99989
99990
99990
99990
99991
99991
99992
99992
99992
99992
3,8
99993
99993
99993
99994
99994
99994
99994
99995
99995
99995
3,9
99995
99995
99996
99996
99996
99996
99996
99996
99997
99997
4,0
99997
99998
99999
99999
99999
-
-
-
-
-
137
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПРИЛОЖЕНИЕ 2
Значения
{
}
Распределение Стьюдента
t p ,k ,
соответствующие
вероятности
q = P t > t p ,k , где случайная величина t имеет распределение
Стьюдента с k степенями свободы.
q
k
1
2
3
4
5
0,2
3,08
1,89
1,64
1,53
1,48
0,1
6,31
2,92
2,35
2,13
2,02
0,05
12,71
4,30
3,18
2,78
2,57
0,02
31,82
6,96
4,54
3,75
3,36
0,01
63,66
9,92
5,84
4,60
4,03
0,005
127,32
14,09
7,45
5,60
4,77
0,002
318,3
22,33
10,21
7,17
5,89
0,001
636,61
31,60
12,92
8,61
6,87
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
1,44
1,41
1,40
1,38
1,37
1,36
1,36
1,35
1,34
1,34
1,34
1,33
1,33
1,33
1,33
1,32
1,32
1,32
1,32
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,52
2,51
2,50
2,49
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
4,32
4,03
3,83
3,69
3,58
3,50
3,43
3,37
3,33
3,29
3,25
3,22
3,2
3,17
3,15
3,14
3,12
3,10
3,09
5,21
4,79
4,50
4,30
4,14
4,02
3,93
3,85
3,79
3,73
3,69
3,65
3,61
3,58
3,55
3,53
3,51
3,48
3,47
5,96
5,41
5,04
4,78
4,59
4,44
4,32
4,22
4,14
4,07
4,02
3,97
3,92
3,88
3,85
3,82
3,79
3,77
3,75
138
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
q
k
25
26
27
28
29
30
40
60
120
∞
0,2
1,32
1,32
1,31
1,31
1,31
1,31
1,30
1,30
1,29
1,28
0,1
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,67
1,66
1,64
0,05
2,06
2,06
2,05
2,05
2,05
2,04
2,02
2,00
1,98
1,96
0,02
2,49
2,48
2,47
2,47
2,46
2,46
2,42
2,39
2,36
2,33
139
0,01
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,66
2,62
2,58
0,005
3,08
3,07
3,06
3,05
3,04
3,03
2,97
2,91
2,86
2,81
0,002
3,45
3,44
3,42
3,41
3,4
3,39
3,31
3,23
3,16
3,09
0,001
3,73
3,71
3,69
3,67
3,66
3,65
3,55
3,46
3,37
3,29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПРИЛОЖЕНИЕ 3
x
Значения
{
}
2
-распределение
x k2, p ,
соответствующие
2
p = P x 2 > x k2, p , где x имеет
вероятности
x 2 - распределение с k степенями
свободы.
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
0,99
0,0002
0,02
0,12
0,30
0,55
0,87
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,63
8,26
8,90
9,54
10,2
10,9
0,95
0,004
0,1
0,35
0,71
1,15
1,64
2,17
2,73
3,33
3,94
4,57
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,1
10,9
11,6
12,3
13,1
13,8
0,90
0,02
0,21
0,58
1,06
1,61
2,20
2,83
3,49
4,17
4,87
5,58
6,3
7,04
7,79
8,55
9,31
10,1
10,9
11,7
12,4
13,2
14,0
14,8
15,7
0,50
0,46
1,39
2,37
3,36
4,35
5,35
6,35
7,34
8,34
9,34
10,3
11,3
12,3
13,3
14,3
15,3
16,3
17,3
18,3
19,3
20,3
21,3
22,3
23,3
0,25
1,32
2,77
4,11
5,39
6,63
7,84
9,04
10,2
11,4
12,5
13,7
14,8
16,0
17,1
18,2
19,4
20,5
21,6
22,7
23,8
24,9
26,0
27,1
28,2
140
0,10
2,71
4,61
6,25
7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4
29,6
30,8
32,0
33,2
0,05
3,84
5,99
7,81
9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
32,7
33,9
35,2
36,4
Р
0,025
5,02
7,38
9,35
11,1
12,8
14,4
16,0
17,5
19,0
20,5
21,9
23,3
24,7
26,1
27,5
28,8
30,2
31,5
32,9
34,2
35,5
36,8
38,1
39,4
0,01
6,63
9,21
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
0,005
7,88
10,6
12,8
14,9
16,7
18,5
20,3
22,0
23,6
25,2
26,8
28,3
29,8
31,3
32,8
34,3
35,7
37,2
38,6
40,0
41,4
42,8
44,2
45,6
0,001
10,8
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
46,8
48,3
49,7
51,2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
k
25
26
27
28
29
30
0,99
11,5
12,2
12,9
13,6
14,3
15,0
0,95
14,6
15,4
16,2
16,9
17,7
18,5
0,90
16,5
17,3
18,1
18,9
19,8
20,6
0,50
24,3
25,3
26,3
27,3
28,3
29,3
0,25
29,3
30,4
31,5
32,6
33,7
34,8
0,10
34,4
35,6
36,7
37,9
39,1
40,3
141
0,05
37,7
38,9
40,1
41,3
42,6
43,8
Р
0,025
40,6
41,9
43,2
44,5
45,7
47,0
0,01
44,3
45,6
47,0
48,3
49,6
50,9
0,005
46,9
48,3
49,6
51,0
52,3
53,7
0,001
52,6
54,1
55,5
56,9
58,3
59,7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПРИЛОЖЕНИЕ 4
Критерий Вилкоксона, Манна и Уитли
Вероятности p=P(W<w)
(n>=m)
n=3
w/m
0
1
2
3
4
5
1
0,25
0,5
0,75
2
0,1
0,2
0,4
0,6
3
0,05
0,1
0,2
0,35
0,5
0,65
2
0,067
0,133
0,267
0,4
0,6
3
0,028
0,057
0,114
0,2
0,314
0,429
0,571
4
0,014
0,029
0,037
0,1
0,171
0,243
0,343
0,344
0,557
2
0,047
0,095
0,19
0,286
0,429
0,571
3
0,018
0,036
0,071
0,125
0,196
0,286
4
0,008
0,016
0,032
0,056
0,095
0,143
n=4
w/m
0
1
2
3
4
5
6
7
8
1
0,2
0,4
0,6
n=5
w/m
0
1
2
3
4
5
1
0,167
0,333
0,5
0,667
142
5
0,004
0,008
0,016
0,028
0,048
0,075
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
w/m
6
7
8
9
10
11
12
13
1
2
3
0,393
0,5
0,607
4
0,206
0,278
0,365
0,452
0,548
2
0,036
0,071
0,143
0,214
0,321
0,429
0,571
3
0,012
0,024
0,048
0,083
0,131
0,19
0,274
0,357
0,452
0,548
4
0,005
0,01
0,019
0,033
0,057
0,086
0,129
0,176
0,238
0,305
0,381
0,457
0,545
5
0,111
0,155
0,21
0,274
0,345
0,421
0,5
0,579
n=6
w/ m
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
0,143
0,286
0,428
0,571
143
5
0,002
0,004
0,009
0,015
0,026
0,041
0,063
0,089
0,123
0,165
0,214
0,268
0,331
0,396
0,465
0,535
6
0,001
0,002
0,004
0,008
0,013
0,021
0,032
0,047
0,066
0,09
0,12
0,155
0,197
0,242
0,294
0,35
0,409
0,469
0,531
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
144
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Продолжение
145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ПРИЛОЖЕНИЕ 5
Критические значения N1 и N2 для критерия серий при
уровне значимости α=0,05. В заголовке столбца стоит
наибольшее из чисел n1 и n2 , которые равны количествам
одинаковых знаков в последовательности знаков. Номер
строки соответствует меньшему из чисел n1 и n2.
2
3
4
5
6
7
8
9
10
11
12
5
2
9
2
10
6
2
2
9
3
10
3
11
7
2
2
3
11
3
12
3
13
8
2
3
3
11
3
12
4
13
4
14
9
2
3
3
4
13
4
14
5
14
5
15
10
2
3
3
4
13
5
14
5
15
5
16
6
16
11
2
3
4
4
13
5
14
5
15
6
16
6
17
7
17
12
2
2
3
4
4
13
5
14
6
16
6
16
7
17
7
18
7
19
13
14
15
16
17
18
19
20
146
13
2
2
3
4
5
5
15
6
16
6
17
7
18
7
19
8
19
8
20
14
2
2
3
4
5
5
15
6
16
7
17
7
18
8
19
8
20
9
20
9
21
15
2
3
3
4
5
6
15
6
16
7
18
7
18
8
19
8
20
9
21
9
22
10
22
16
2
3
4
4
5
6
6
17
7
18
8
19
8
20
9
21
9
21
10
22
10
23
11
23
17
2
3
4
4
5
6
7
17
7
18
8
19
9
20
9
21
10
22
10
23
11
23
11
24
11
25
18
2
3
4
5
5
6
7
17
8
18
8
19
9
20
9
21
10
22
10
23
11
24
11
25
12
25
12
26
19
2
3
4
5
6
6
7
17
8
18
8
20
9
21
10
22
10
23
11
23
11
24
12
25
12
26
13
26
13
27
20
2
3
4
5
6
6
7
17
8
18
9
20
9
21
10
22
10
23
11
24
12
25
12
25
13
26
13
27
13
27
14
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оглавление
1. Элементы теории вероятностей………..…………….………..
3
1.1. Основные определения ........................................................3
1.2. Свойства случайных событий............................................5
1.3. Формула полной вероятности и формула Байеса ..........7
1.4. Случайные величины ..........................................................9
1.4.1. Законы распределения дискретных случайных
величин .....................................................................................10
1.4.2. Характеристики дискретных случайных величин......11
1.4.3. Непрерывные случайные величины ............................18
1.4.4. Характеристики непрерывных случайных величин ...19
1.4.5. Нормальный закон распределения ...............................24
1.5. Случайные векторы ...........................................................42
1.6. Задания по теории вероятностей .....................................46
2. Математическая статистика .................................................. 58
2.1. Точечные оценки и их свойства ......................................63
2.2. Интервальные оценки параметров распределения .....76
2.2.1. Доверительный интервал для математического
ожидания ..................................................................................76
2.2.2. Построение доверительного интервала для дисперсии.79
2.3. Проверка статистических гипотез ..................................84
2.3.1. Проверка гипотезы о равенстве центров
распределения двух нормальных генеральных
совокупностей при известной дисперсии..............................87
2.3.2. t – критерий .................................................................89
2.3.3. F- критерий...................................................................93
2.3.4. Критерий согласия χ2 ...................................................94
2.4. Непараметрические методы математической
статистики...................................................................................99
2.4.1. Основные понятия. Критерий знаков ..........................99
2.4.2. Критерий Вилкоксона, Манна и Уитни .....................106
147
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.4.3. Критерий серий............................................................113
2.5. Пакет Scilab для решения задач по
теории вероятностей и математической статистике........117
2.6 Задания по математической статистике ......................127
Литература ................................................................................... 135
Приложения ................................................................................. 136
Оглавление .................................................................................... 147
148
Документ
Категория
Без категории
Просмотров
157
Размер файла
2 126 Кб
Теги
статистика, 7954, вероятности, математические, теория
1/--страниц
Пожаловаться на содержимое документа