close

Вход

Забыли?

вход по аккаунту

?

Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики.

код для вставкиСкачать
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
ART 15268
УДК 372.851
Жукова Галина Николаевна,
кандидат физико-математических наук, доцент кафедры прикладной
математики и моделирования систем ФГБОУ ВПО «Московский государственный университет печати имени Ивана Федорова», г. Москва
gnzh@mail.ru
Карта коэффициентов асимметрии и эксцесса
в преподавании теории вероятностей и математической статистики
Аннотация. Предлагается наглядный способ определения типа вероятностного
распределения по выборочным коэффициентам асимметрии и эксцесса. На координатной плоскости «коэффициент асимметрии – коэффициентэксцесса» отмечены
точки, линии и области, соответствующие наиболее употребительным вероятностным распределениям. Эта карта позволяет легко ориентироваться в многообразии вероятностных распределений, подбирать для анализируемых экспериментальных данных наиболее подходящие типы распределений, а также сразу исключать из рассмотрения целые семейства распределений со значениями коэффициентов асимметрии и эксцесса, далекими от выборочных.
Ключевые слова: коэффициент асимметрии, коэффициент эксцесса, дискретные
распределения, непрерывные распределения, теория вероятностей, математическая статистика.
Раздел:(01) педагогика; история педагогики и образования; теория и методика
обучения и воспитания (по предметным областям).
Изучая теорию вероятностей, студенты знакомятся с наиболее известными дискретными и непрерывными распределениями, в их число традиционно входит нормальное распределение, равномерное (непрерывное и дискретное) и некоторые другие.
В курсе математической статистики приходится решать вопрос о том, к какому
типу относится распределение данной выборки. По виду гистограммы может показаться, что распределение нормальное, а при подборе параметров по выборочным
среднему и дисперсии проверка тестом Колмогорова – Смирнова или по критерию
Пирсона даст отрицательный результат.
Для более глубокого изучения вероятностных распределений и их взаимосвязи
предлагается широко использовать такие характеристики распределений, как коэффициенты асимметрии и эксцесса (см. [1] и [2]). Сразу оговоримся, что всѐ дальнейшее изложение будет касаться только таких распределений, которые имеют конечные моменты четвертого порядка (это необходимо для существования коэффициентов асимметрии и эксцесса).
Идея идентификации типа распределения по коэффициентам асимметрии и
эксцесса восходит к работам Карла Пирсона [3], делившего вероятностные распределения на типы в зависимости от соотношения значений коэффициента эксцесса и
квадрата коэффициента асимметрии.
Выборочные коэффициенты асимметрии и эксцесса, вычисленные по экспериментальным данным, определяют точку на координатной плоскости с коэффициентами асимметрии и эксцесса в качестве координатных осей. Эта точка может оказаться в области, соответствующей какому-либо классическому распределению, может быть вблизи или же достаточно далеко от областей, соответствующих рассматриваемым в работе классическим распределениям. В последнем случае предлагаемый метод не позволяет подобрать классическое распределение.
1
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
В ситуации, когда значения коэффициентов асимметрии и эксцесса принимают
значения такие же или близкие к допустимым значениям для некоторого классического распределения, выдвигается гипотеза о том, что наблюдаемая случайная величина имеет такое распределение.
По коэффициентам асимметрии и эксцесса можно восстановить параметры
распределения (один или несколько). Если вычисленные с этими параметрами математическое ожидание и дисперсия значимо отличаются от выборочных, то производятся нормировка и сдвиг наблюдаемой случайной величины таким образом, чтобы у полученной случайной величины математическое ожидание и дисперсия оказались равными значениям, соответствующим выбранному классическому распределению с параметрами, восстановленными по коэффициентам асимметрии и эксцесса. Заметим, что у построенной с помощью линейного преобразования случайной
величины коэффициенты асимметрии и эксцесса точно такие же, как и у исходной.
Если у классического распределения лишь один параметр, его рекомендуется восстанавливать по коэффициенту асимметрии.
Пусть наблюдается случайная величина X , линейным преобразованием сдвига
и масштаба построим по ней случайную величину Y :
Y = kX + x0
.
(1)
Выразим моменты и коэффициенты асимметрии и эксцесса случайной величины Y через соответствующие характеристики случайной величины X .
 Математическое ожидание
EY = E(kX + x0 ) = kEX + x0

Дисперсия
DY = E(Y  EY)2 = E(kX + x0  (kEX + x0 ))2 = E(kX  kEX)2 = k 2 DX
 Третий центральный момент
E(Y  EY)3 = E(kX  kEX)3 = k 3 E(X  EX)3
 Четвертый центральный момент
E(Y  EY)4 = k 4 E(X  EX)4
 Коэффициент асимметрии
E(Y  EY)3
k 3 E(X  EX)3
k 3 E(X  EX)3
E(X  EX)3
γ1 =
= 2
= 3
=
3/ 2
3/ 2
3/ 2
DY 3 / 2
k E(X  EX)2
k E(X  EX)2
E(X  EX)2
 Коэффициент эксцесса
E(Y  EY)4
k 4 E(X  EX)4
E(X  EX)4
γ2 =

3
=

3
=
3
2
DY 2
DX 2
k 4 DX 
Как видно, коэффициенты асимметрии и эксцесса не изменяются при линейном
преобразовании, что позволяет подбирать вид распределения по выборочным коэффициентам асимметрии и эксцесса случайной величины X . В соответствии с подобранным распределением вычисляются математическое ожидание EY и дисперсия DY
, что дает возможность вычислить параметры сдвига и масштаба вформуле (1):
DY
k=
DX , x0 = EY  kEX .
(2)






Заметим, что по значениям выборочных коэффициентов асимметрии и эксцесса не всегда возможно подобрать хотя бы одно «классическое» распределение.
2
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
Возможна и такая ситуация, когда одному набору значений γ1 ; γ2  может соответствовать два и более известных распределений. Так, в точке 0;0 обнаруживаются все нормальные распределения N  ;  , так что получается некоторая неопре2
деленность EY = μ , DY = σ . В этом случае можно просто положить X = Y , что соответствует нулевому сдвигу и единичному масштабу, а параметры нормального распределения взять равными выборочному среднему и выборочному среднеквадратическому отклонению. Впрочем, все семейство нормальных распределений сдвигом и
масштабом сводится к стандартному нормальному распределению, так что именно к
нему будем сводить выборку со значениями коэффициентов асимметрии и эксцесса,
близкими к нулю.
Более интересен случай, когда точка γ1 ; γ2  попадает в область возможных значений бета-распределения, поскольку в ней обнаруживаются, помимо бета-распределения, еще и биномиальное, пуассоновское, отрицательное биномиальное и некоторые другие распределения. К этому вопросу мы вернемся чуть позже.
Подбор распределения по выборочным коэффициентам асимметрии и эксцесса
удобно проводить с помощью карты, на которой в общей системе координат (горизонтальная ось – коэффициент асимметрии, вертикальная – коэффициент эксцесса)
представлены области (точки, кривые, области, ограниченные кривыми), соответствующие известным распределениям. На рис. 1 изображен фрагмент такой карты.
Рис.1. Коэффициенты асимметрии и эксцесса основных распределений
Равномерное непрерывное распределение заслоняет красный кружочек полукругового распределения, а логистическое распределение попадает на красный треугольник распределения Стьюдента. На рис. 2 эти маркеры видны лучше.
3
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
Область между зеленой и красной параболами соответствует бета-распределению.
В эту область кроме бета-распределения попадают также:
 отрицательное биномиальное распределение;
 биномиальное распределение;
 распределение Пуассона (черная линия между биномиальным и отрицательным биномиальным распределением).
Заметим, что систему координат можно выбрать и иначе: вместо коэффициента
асимметрии взять его квадрат. Это позволит «превратить» параболы в прямые, вид
карты станет проще. К сожалению, при этом «склеиваются» точки, отличающиеся
только знаком коэффициента асимметрии. «Отделить» друг от друга распределения
с положительным и отрицательным коэффициентом асимметрии можно, откладывая
sign( 1 )γ12   1  1
по горизонтальной оси значения
(квадрат коэффициента асимметрии
с учетом знака). Вблизи начала координат получается примерно такая картина:
Рис.2. Основные распределения в системе координат
 
1 1
; γ2 
На рис. 2 лучше видны точки, соответствующие симметричным распределениям;параболы превратились в графики модуля.
Приведем несколько примеров расчета параметров распределения по коэффициентам асимметрии и эксцесса. При изучении характеристик распределений студентам будет полезно самостоятельно проделать соответствующие расчеты для
простых случаев.
Распределение Бернулли
Распределение Бернулли имеет один параметр p. Коэффициенты асимметрии
и эксцесса равнысоответственно
γ1 =
1 2 p
pq
6 p 2  6 p +1
γ2 =
p( 1  p) ,где q = 1  p.
и
4
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
γ12 =
1  2 p 2 = 4 p 2  4 p +1
p( 1  p)
p( 1  p) , выВозведем в квадрат коэффициент асимметрии
чтем 2 и получим коэффициент эксцесса:
1  2 p 2  2 = 4 p 2  4 p +1  2 p + 2 p 2 = 6 p 2  6 p +1 = γ .
γ12  2 =
2
p( 1  p)
p( 1  p)
p( 1  p)
2
Так что γ2 = γ1  2 (забегая вперед, заметим, что это недостижимая нижняя граница бета-распределения).
Параметр p выражается через коэффициенты асимметрии и эксцесса так:
Биномиальное распределение
У этого распределения два параметра – p и n . Коэффициенты асимметрии и

q p
1 1
1
γ1 =
γ2 = 
 6 
= nγ2 + 6
npq
n
pq
q
=
1

p
pq


эксцесса равнысоответственно
и
,
, отсюда
.
Преобразование
квадрата
коэффициента
асимметрии
к
виду
с учетом
1
1
1
2
= nγ2 + 6
γ12 = nγ2 + 6  4 = nγ2 + 2 = γ2 +
pq
n
n
n.
дает
2
2
γ2 = γ12 
n , этосемейство парабол, сдвинутых вниз на n .
Окончательно получим
Параметр p выражается так:




 1


1 
γ1 
1
 = 1±
p = 1±


2
2
4 
γ1 + 4 / n  2 

1
+

nγ12 

.
Отрицательное биномиальное распределение(распределение Паскаля)
Это распределение дискретной случайной величины, равной количеству произошедших неудач в последовательности испытаний Бернулли с вероятностью успеха p, проводимой до r-го успеха. Как обычно, обозначим q = 1  p .
Коэффициенты асимметрии и эксцесса равнысоответственно
6 p2
γ2 = +
r rq .
Заметим, что
γ12 =
γ1 =
1+ q
rq
и
1+ q 2  1  q  2  1   1  q  1   2
rq
r 
q 
r 
q 
r.
5
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
q+
Ввиду того что для положительных чисел выполняется неравенство
2
4
γ1 
γ12 
r.
r , следовательно
получаем
Придадим коэффициенту эксцесса вид
1
2
q
,
.
2

 2   12 


r

2
2
 1 

r

– семейство частей правых ветвей парабол, сдвинутых вверх на r .
Параметр p выражается так:
Гамма-распределение
Как известно, у гамма-распределения два параметра, k и  , матожидание и
2
дисперсия зависят от них обоих: EX = kθ , DX = kθ . А вот коэффициенты асиммет2
6
γ1 =
γ2 =
k ,
k . Легко видеть,
рии и эксцесса выражаются только через параметр k :
3γ12
2 , и по коэффициентам асимметрии и эксцесса можно найти параметр k :
что
4
6
k= 2 k=
γ1
γ2
,
.
Заметим, что при целых значениях параметра k гамма-распределение называ2
ется распределением Эрланга, при   2 и четных k – распределением  .
Приведем для вышеописанных и некоторых других классических распределений таблицу коэффициентов асимметрии и эксцесса, включающую также матожидание и дисперсию.
Формулы (3) и (4) выпишем отдельно ввиду их громоздкости:
γ2 =
 3
 1   2    1 
Γ 1+   3 Γ 1+  Γ 1+  + 2 Γ 1+  
k
 k   k    k 
1  
3/ 2
  2    1 2 
 Γ 1 +    Γ 1 +   
  k    k  


3
(3)
6
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
2
4
 
 
4
1 
3
1 
2
1 



Γ 1+   4 Γ 1+  Γ 1+  + 6 Γ 1+   Γ 1+   3 Γ 1+  
k
k 
k
k 
k
k 


 
 
2  
3
2 2
 



2
1
 Γ 1+    Γ 1+   
 
k  
k   

(4)
Таблица 1
Коэффициенты асимметрии и эксцесса
7
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
биномиальное, при n  1
распределение Бернулли
np
npq
q p
npq

1 1

 6 
n  pq

отрицательное
альное, при r
метрическое
Пуассона
rq
p
rq
p2
1 q
6 p2

r rq


биноми 1 гео-
rq
1
1


γ2 = γ12 
γ2 = γ12 
2
n
2
2
γ1 
r
r,
γ2 = γ12
Еще раз отметим, что одному набору значений коэффициентов асимметрии и
эксцесса могут соответствовать несколько распределений. Так, у распределения
Вейбулла с параметрами k  3 и   1 и у бета-распределения с   6.6717 и
  9.6378 одинаковый набор коэффициентов асимметрии и эксцесса(  1  0.1681 ,
 2  0.2705 ).
Сгенерированные при помощи Matlab 7.1 выборки объема 10000 были центрированы своими выборочными средними и нормированы выборочными среднеквадратическими отклонениями. Получились две выборки с одинаковыми выборочными
средними и выборочными дисперсиями, коэффициенты асимметрии и эксцесса были близки к теоретическим значениям, а значит, и друг к другу. Тест Колмогорова –
Смирнова при уровнях от 1% до 5%показал, что нет оснований считать эти выборки
представляющими разные распределения.
Полученный результат позволяет предположить, что при подборе распределения реальных данных в аналогичном случае решение может быть не единственным
(если в качестве критерия качества использовать тест Колмогорова– Смирнова).
При обработке данных о времени работы программы, реализующей сортировку
массива равномерно распределенных случайных чисел, были получены следующие
результаты.
Таблица 2
Данные о времени работы алгоритмов 1 и 2
Алгоритм
1
1
2
2
Объем массива
100
200
100
200
К-т асимметрии
-0.0317
-0.0127
0.2539
0.2328
К-т эксцесса
0.0146
-0.0229
0.2188
0.2048
JB-test
0
0
1
1
KS-test
0
0
Время работы первого алгоритма, судя по коэффициентам асимметрии и эксцесса, имеет нормальное распределение, что и подтверждается тестами Jarque – Bera и
Колмогорова – Смирнова.
Для анализа времени работы второго алгоритма рассмотрим карту коэффициентов асимметрии и эксцесса вблизи начала координат.

Файлы с данными о трудоемкости алгоритмов при фиксированных длинах входов (в элементарных
операциях) любезно предоставлены М.В. Ульяновым и получены в ходе экспериментальных исследований алгоритмов, проведенных в процессе написания книги [4].
8
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
Рис.3. Распределения вблизи начала координат в системе
 1 ; γ2 
Как видно, набору коэффициентов асимметрии и эксцесса выборок, соответствующих второму алгоритму, не соответствует никакое классическое распределение.
Ближе всего к точкам, соответствующим этим выборкам, находится линия логнормального распределения. Достаточно близки к выборочным значениям точки, соответствующие логнормальному распределению с   0 и   0,03;0,10  . Проверка тестом Колмогорова – Смирнова показала, что первая выборка (касающаяся сортировки вторым методом массива из 100 элементов) не согласуется с гипотезой о логнормальном распределении. А вот вторая выборка (массив из 200 чисел) согласуется с
гипотезой о логнормальном распределении и с параметрами   0 и   0,059 ;0,076 .
Предлагаемый способ определения типа распределения по выборочным коэффициентам асимметрии и эксцесса прост в использовании, с его помощью подбирать распределение обрабатываемых данных произвольной природы может даже
пользователь, обладающий лишь минимальными знаниями теории вероятностей и
статистики. К достоинствам метода можно отнести наглядность: карта распределений позволяет легко ориентироваться в многообразии распределений, подбирать
наиболее подходящие распределения и сразу исключать из рассмотрения семейства распределений со значениями коэффициентов асимметрии и эксцесса, далекими
от выборочных. Наглядность метода и его простота в использовании могут служить
дополнительным стимулом для студентов при изучении курса теории вероятности и
математической статистики [5,6].
Недостатком метода является то, что даже у больших (порядка 10000) последовательностей, полученных генератором случайных чисел, значения коэффициентов асимметрии и эксцесса могут значительно отличаться от теоретических.
Для использования метода на практике можно рекомендовать проверять тестомКолмогорова – Смирнова гипотезу о непрерывном распределении с параметрами, восстановленными по коэффициентам асимметрии и эксцесса. При этом нужно
подставлять значения параметров распределения, отступая на некоторую величину
от значений, вычисленных по выборке. Величина отступа зависит от распределения
и от задаваемого уровня критерия. Для дискретных распределений можно использо2
вать критерий Пирсона ( χ ).
9
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –
2015. – № 08 (август).– ART 15268. – 0,4 п. л. – URL: http://ekoncept.ru/2015/15268.htm.– ISSN 2304-120X.
Ссылки на источники
1.
2.
3.
4.
5.
6.
Лоэв М. Теория вероятностей. – М.: Изд-во иностранной литературы, 1962. – 719 с.
КрамерГ. Математическиеметодыстатистики.– М.:Мир,1975. – 648 с.
Pearson K. Mathematical Contributions to the Theory of Evolution. III. Regression, Heredity and Panmixia. Philosophical Transactions of the Royal Society of London, 1896. 187, pp. 253–318.
Петрушин В.Н., Ульянов М.В. Информационная чувствительность компьютерных алгоритмов. –
М.: ФИЗМАТЛИТ, 2010. – 224 с.
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники? // Концепт. – 2014. – № 10 (октябрь).– URL: http://e-koncept.ru/2014/14268.htm.
Жукова Г. Н. Преподавание математики студентам экономических специальностей: от практики к
теории // Концепт. – 2014. – № 07 (июль). – URL: http://e-koncept.ru/2014/14182.htm.
Galina Zhukova,
Candidate of Physics-Mathematical Sciences, Associate Professor at the chair of Applied Mathematics and
System Modeling, Moscow State University of Printing Arts, Moscow
Skewness-kurtosis map as a probability theory and mathematical statistics tool (educational aspect)
Abstract. The paper deals with a new approach to probability distributions identification, which is based on
skewness and kurtosis of some well-known distributions. These distribution’s skewness, and kurtosis determine curves, or points on the coordinate plane “skewness – kurtosis”. The sample skewness, and kurtosis
although determine a point on this plane. If this point belongs to the curve or the set of points, or places near
them, we need to verify the hypothesis that the sample belongs to the corresponding distribution. The approach proposed is adapted to educational use in probability theory and statistics.
Keywords: skewness, kurtosis, discrete distribution, continuous distribution, probability theory, statistics.
References
1. Lojev, M. (1962) Teorijaverojatnostej,Izd-voinostrannojliteratury, Moscow, 719 p. (in Russian).
2. Kramer, G. (1975) Matematicheskiemetodystatistiki, Mir, Moscow, 648 p. (in English).
3. Pearson, K. (1896) Mathematical Contributions to the Theory of Evolution. III. Regression, Heredity and
Pan-mixia. Philosophical Transactions of the Royal Society of London, 187, pp. 253–318 (in Russian).
4. Petrushin, V. N. &Ul'janov, M. V. (2010) Informacionnajachuvstvitel'nost' komp'juternyhalgoritmov, FIZMATLIT, Moscow, 224 p. (in Russian).
5. Zhukova, G. N. (2014) “Diskretnyeinepreryvnyeraspredelenija: antipodyilirodstvenniki?”,Koncept, № 10
(oktjabr').Available at: http://e-koncept.ru/2014/14268.htm (in Russian).
6. Zhukova, G. N. (2014) “Prepodavaniematematikistudentamjekonomicheskihspecial'nostej: otpraktiki k
teorii”,Koncept, № 07 (ijul').Available at: http://e-koncept.ru/2014/14182.htm (in Russian).
Рекомендованокпубликации:
ГоревымП. М., кандидатомпедагогическихнаук,
главнымредакторомжурнала«Концепт»
Поступила в редакцию
Received
Принятакпубликации
Accepted for publication
18.06.15
20.06.15
Получена положительная рецензия
Received a positivereview
Опубликована
Published
20.06.15
29.08.15
www.e-koncept.ru
© Концепт, научно-методический электронный журнал, 2015
©Жукова Г. Н., 2015
10
Документ
Категория
Без категории
Просмотров
4
Размер файла
1 575 Кб
Теги
статистика, вероятности, эксцесса, карта, математические, коэффициента, преподавании, асимметрии, теория
1/--страниц
Пожаловаться на содержимое документа