close

Вход

Забыли?

вход по аккаунту

?

Роверка однородности выборок результатов учета потребленного и поставленного ресурса при неизвестных распределениях вероятности.

код для вставкиСкачать
Управление качеством, стандартизация и метрология
УПРАВЛЕНИЕ КАЧЕСТВОМ,
СТАНДАРТИЗАЦИЯ И СЕРТИФИКАЦИЯ
УДК 531.73
ПРОВЕРКА ОДНОРОДНОСТИ ВЫБОРОК РЕЗУЛЬТАТОВ УЧЕТА
ПОТРЕБЛЕННОГО И ПОСТАВЛЕННОГО РЕСУРСА
ПРИ НЕИЗВЕСТНЫХ РАСПРЕДЕЛЕНИЯХ ВЕРОЯТНОСТИ
Д.Б. Белов
Рассматривается возможность применения статистического критерия Уилкоксона для проверки однородности выборок результатов учета потребленного и поставленного ресурса при неизвестных распределениях вероятности.
Ключевые слова: ресурс, объемы потребления и поставки, результаты учета,
однородность выборок, статистический критерий.
При коммерческом учете какого-либо ресурса (природного газа,
электрической энергии воды и т.п.) практически всегда возникают ситуации, когда потребителями учтено (и соответственно оплачено) ресурса
меньше или больше, чем фактически поставлено. Разницу между объемами
потребленного и поставленного ресурса называют разбалансом:
V разб = Vпотр − Vпост ,
(1)
где V разб — объем разбаланса ресурса; Vпотр — объем потребленного ресурса; Vпост — объем поставленного ресурса.
Из формулы (1) следует, что если зарегистрированные значения
объемов Vпотр и Vпост различаются значительно (неслучайно), то значительной будет и величина разбаланса V разб . К причинам возникновения
такой ситуации могут относиться: нелегальный отбор ресурса из сетей, его
утечки, нарушения условий учета ресурса, значительные погрешности (неопределенности) учета как поставщиком, так и потребителями и т.п.
Следовательно, чрезвычайно важной задачей при анализе причин и
значений возникающего разбаланса является проверка гипотезы об однородности связанных выборок результатов учета объемов потребленного и
347
Известия ТулГУ. Технические науки. 2014. Вып. 11. Ч. 1
поставленного ресурса, т.е. гипотезы о том, что в зарегистрированных значениях этих объемов нет значимых различий. В нашем случае ряды результатов наблюдений объемов Vпотр и Vпост представляют собой именно связанные выборки, поскольку каждому отдельному значению одного
объема соответствует значение другого объема (например, ежедневный
или ежемесячный учет ресурса, когда каждому результату учета объема
потребления соответствует значение объема поставки).
Оптимальным критерием для сравнения связанных выборок является парный критерий Стьюдента, который регламентирован [1]. Применение данного критерия для проверки гипотезы о совпадении результатов
учета поставленного и потребленного газа изложено в [2]. Однако, его использование будет корректным, в случае, если распределение разностей (в
нашем случае разбалансов) di = Vпотр i − Vпоcт i соответствует нормальному закону.
Альтернативой парного критерия Стьюдента является знаково ранговый критерий Уилкоксона, который относится к непараметрическим
критериям, т.е. к критериям, не зависящим от вида распределения. Методика применения данного критерия изложена, например, в [3, 4, 5].
Критерий Уилкоксона, как правило, используется для проверки гипотезы однородности (отсутствия различия) связанных выборок, которая
сводится к проверке симметрии функции распределения разности
d = X − Y = Vпотр − Vпоcт относительно нуля [5].
В общем случае нулевая гипотеза однородности результатов наблюдений объемов Vпотр и Vпост описывается следующим образом. Если
F (x) и G (x) — функции распределения вероятностей значений в исследуемых выборках, тогда нулевая гипотеза Н 0 однородности (совпадения)
записывается как: F ( x) = G ( x) . Альтернативная ей гипотеза Н1 имеет вид:
F ( x) = G ( x + a) (где a — сдвиг, определяемый разностью характеристик
положения распределений, a ≠ 0 ). В случае альтернативной гипотезы распределение разности d отличается сдвигом от симметричного относительно нуля [5].
Покажем построение критерия знаковых рангов Уилкоксона для
проверки нулевой гипотезы однородности связанных выборок результатов учета объемов потребленного и поставленного газа.
Сначала вычисляются абсолютные значения разностей (разбалансов) объемов потребленного и поставленного газа d i :
di = V разб i = Vпотр i − Vпост i .
(2)
Далее определяются ранги Ri величин d i в совместной ранжировке от меньшего к большему для последовательности d1 , d 2 ,…, d n .
348
Управление качеством, стандартизация и метрология
Определяются переменные-счетчики ψi , i = 1...n , при этом:
1, если d i > 0,
ψi = 
.
(3)
0, если d i < 0
Вычисляются произведения Ri ψi и определяется статистика критерия знаковых рангов, равная:
n
T + = ∑ Ri ψ i .
i =1
(4)
То есть, для определения статистики Т + необходимо просуммировать ранги положительных разностей в вариационном ряду, построенном
по абсолютным величинам всех разностей.
Для двустороннего критерия гипотеза Н 0 отклоняется (при альтернативе Н1 ( a ≠ 0 )), если:
Т + ≤ Tα / 2 или Т + ≥ T1−α / 2 ,
(5)
где Tα / 2 , T1− α / 2 — критические значения статистики Уилкоксона, определяемые в зависимости от числа n пар значений объемов Vпотр и Vпост
и уровня значимости α , которые можно найти, например, в [4].
Или, иначе, гипотеза Н 0 не отклоняется, если:
Tα / 2 < Т + < T1−α / 2 .
(6)
Принятие рассматриваемой нулевой гипотезы для нашего случая
будет означать, что исследуемые выборки можно считать однородными,
т.е. результаты учета объемов потребления и поставки в этих выборках отличаются случайно.
В работах [3, 5] отмечается, что для практического использования
статистики знаковых рангов Уилкоксона можно не обращаться к специальным таблицам, а применять асимптотические соотношения. Для этого
необходимо определить статистику Т * :
Т* =
n(n + 1)
4
.
n(n + 1)(2n + 1)
24
T+ −
(7)
При выполнении гипотезы Н 0 данная статистика имеет асимптотическое (при n → ∞ ) стандартное нормальное распределение вероятности
(математическое ожидание равно 0, а дисперсия равна 1).
Далее проверяется условие:
Т * ≤ z1+ p ,
2
349
(8)
Известия ТулГУ. Технические науки. 2014. Вып. 11. Ч. 1
где z1+ p — квантиль стандартного нормального распределения, опреде2
ляемая в зависимости от уровня доверия p (например, при p = 0,95 квантиль z0,975 = 1,96 ).
Выполнение условие (8) будет означать принятие нулевой гипотезы
однородности исследуемых выборок объемов потребленного и поставленного ресурса по критерию знаковых рангов Уилкоксона.
В работе [3] отмечается, что статистику Т * можно использовать
уже при n > 25 .
Еще одно приближение изложено в работе [6]. Данное приближение использует линейную аппроксимацию квантилей нормального распределения и распределения Стьюдента.
Для этого необходимо определить статистику Т ** :
T*
n −1
Т =
(1 +
).
2
n − (T * ) 2
Далее вычисляется величина:
**
z
+t
uα = 1−α 1−α ,
2
(9)
(10)
где z1− α — квантиль нормального распределения;
t1− α — квантиль распределения Стьюдента с f = n − 1 степенями свободы;
α — уровень значимости.
Если выполняется условие:
Т ** ≥ uα ,
(11)
то гипотеза Н 0 отвергается, а в противном случае — принимается.
В случае, когда все разности (разбалансы) di пар наблюдений объемов Vпотр i и Vпост i имеют один и тот же знак, т.е. положительны или
отрицательны, то применение критерия Уилкоксона не имеет никакого
смысла, поскольку здесь сразу очевидно нарушение симметрии функции
распределения этих разностей относительно нуля.
Следует еще раз отметить, что знаково ранговый критерий Уилкоксона является непараметрическим аналогом парного критерия Стьюдента.
Кроме того, он почти так же строго проверяет нормально распределенные
разности и его эффективность для больших и малых выборок составляет
около 95% [3].
В качестве примера рассмотрим данные по результатам ежедневного учета объемов потребленного и поставленного природного газа в одном
из районов РФ за месяц (таблица).
350
Управление качеством, стандартизация и метрология
Таблица
Данные по результатам ежедневного учета объемов потребленного
и поставленного газа (в м3) и промежуточные вычисления
для расчета критерия Уилкоксона
№
п/п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Vпотр i
Vпост i
di
di
Ri
ψi
Ri ψi
5026
5016
4972
5005
5005
5057
5065
5036
5026
4992
5033
4948
5044
4967
4981
4944
5080
4986
4992
4995
4966
5026
4980
5005
5075
5039
4959
4998
4977
4973
5016
5050
4948
5019
5020
5016
5040
5076
5070
4943
4991
4964
5026
4980
4970
4992
5068
5014
4969
4965
4999
5004
4945
5056
5030
5060
5020
4966
4917
5023
10
-34
24
-14
-15
41
25
-40
-44
49
42
-16
18
-13
11
-48
12
-28
23
30
-33
22
35
-51
45
-21
-61
32
60
-50
10
34
24
14
15
41
25
40
44
49
42
16
18
13
11
48
12
28
23
30
33
22
35
51
45
21
61
32
60
50
1
18
12
5
6
21
13
20
23
26
22
7
8
4
2
25
3
14
11
15
17
10
19
28
24
9
30
16
29
27
1
0
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
0
1
1
0
1
1
0
1
0
0
1
1
0
1
0
12
0
0
21
13
0
0
26
22
0
8
0
2
0
3
0
11
15
0
10
19
0
24
0
0
16
29
0
По формуле (4) вычислим статистику Т + рангов положительных
разностей di :
Т + = 232 .
351
Известия ТулГУ. Технические науки. 2014. Вып. 11. Ч. 1
Далее определим критические значения статистики Уилкоксона
Tα / 2 , T1−α / 2 в зависимости от числа пар значений n = 30 и выбранного
уровня значимости α = 0,05 [4]:
T0,025 = 137 ; T0,975 = 328 .
Нулевая гипотеза об однородности исследуемых выборок значений
объемов Vпотр и Vпост принимается с уровнем значимости α = 0,05 , поскольку выполняется условие (6):
T0,025 = 137 < Т + = 232 < T0,975 = 328 .
Данное обстоятельство свидетельствует о том, что между характеристиками положения, определяющими центры группирования значений
объемов Vпотр и Vпост нет какого-либо существенного сдвига, т.е. результаты учета объемов потребления и поставки в этих выборках отличаются
случайно.
Для большей убедительности используем ранее изложенное асимптотическое соотношение. Для этого по формуле (7) определим статистику
Т*:
Т* =
30(30 + 1)
4
= −0,010 .
30(30 + 1)(2 ⋅ 30 + 1)
24
232 −
Задавшись уровнем доверия р = 0,95 (этому соответствует квантиль
стандартного нормального распределения z1+ p = z0,975 = 1,96 ) проверим
2
условие (8):
Т * = − 0,010 ≤ z0,975 = 1,96 .
Выполнение данного условия подтверждает ранее сделанный вывод
о принятии нулевой гипотезы об однородности исследуемых выборок значений объемов поставки и потребления природного газа.
Теперь рассмотрим приближение, использующее линейную аппроксимацию квантилей нормального распределения и распределения
Стьюдента. Для этого по формуле (9) определим статистику Т ** :
Т ** =
− 0,010
30 − 1
(1 +
) = −0,0099 .
2
30 − (−0,010) 2
Задавшись уровнем значимости α = 0,05 определим квантиль z1−α
352
Управление качеством, стандартизация и метрология
нормального распределения и квантиль t1−α распределения Стьюдента с
f = n − 1 = 29 степенями свободы (для этого воспользуемся статистическими
функциями
пакета
Excel
НОРМСТОБР(вероятность)
и
СТЬЮДРАСПОБР(вероятность;степени_свободы)):
z0,95 = 1,645 ;
t0,95 = 2,045 .
В этом случае величина uα будет равна (формула (10)):
1,645 + 2,045
u0,05 =
= 1,845 .
2
Сравниваем условие (11):
Т ** = −0,0099 < u0,05 = 1,845 .
Это еще раз подтверждает ранее сделанный вывод о том, что исследуемые выборки являются однородными и результаты учета объемов потребления и поставки природного газа в этих выборках отличаются случайно.
В заключение следует отметить, что применение изложенной методики проверки однородности выборок результатов учета объемов потребления и поставки ресурса позволит оценить стабильность и устойчивость
процесса снабжения любым ресурсом, что, несомненно, повысит эффективность анализа и контроля данного процесса.
Список литературы
1. ГОСТ Р 50779.23-2005 (ИСО 3301:1975). Статистические методы.
Статистическое представление данных. Сравнение двух средних в парных
наблюдениях. Введ. 2005-07-01. М.: ФГУП «Стандартинформ», 2005. 6 с.
2. Протасьев В.Б., Белов Д.Б., Игнатьев А.А. Проверка статистической гипотезы о совпадении результатов учета поставленного и потребленного газа // Известия ТулГУ. Технические науки. Вып. 6: в 2 ч. Тула:
Изд-во ТулГУ. 2011. Ч 2. С. 413-419.
3. Закс Л. Статистическое оценивание / Пер. с нем. Науч. ред. Ю.П.
Адлера и В.Г. Горского. М.: Статистика, 1976. 598 с.
4. Ликеш И., Ляга Й. Основные таблицы математической статистики. М.: Финансы и статистика, 1985. 356 с.
5. Орлов А.И. Прикладная статистика. Учебник. М.: Издательство
«Экзамен», 2004. 656 с.
6. Iman R. L. Use of a t-statistic as an approximation to the exact distribution of the Wilcoxon signed rank test statistic // Commun. Statist. 1974. V. 3.
P. 795-806.
Белов Дмитрий Борисович, канд. техн. наук, доц, imsbelov@mail.ru, Россия, Тула, Тульский государственный университет
353
Известия ТулГУ. Технические науки. 2014. Вып. 11. Ч. 1
CHECK OF UNIFORMITY OF SELECTIONS OF RESULTS OF THE ACCOUNTING OF
THE CONSUMED AND PUT RESOURCE AT UNKNOWN DISTRIBUTIONS OF
PROBABILITY
D.B. Belov
Possibility of application of statistical criterion of Wilcoxon for check of uniformity
of selections of results of the accounting of the consumed and put resource at unknown distributions of probability is considered.
Key words: resource, consumption and delivery volumes, results of the account, uniformity of selections, statistical criterion.
Belov Dmitry Borisovich, candidate of tehnical science, docent, imsbelov@mail.ru,
Russia, Tula, Tula State University
УДК 531.73
ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА
ДЛЯ ИССЛЕДОВАНИЯ ПРОЦЕССА ПОСТАВКИ
И ПОТРЕБЛЕНИЯ ЭНЕРГЕТИЧЕСКОГО РЕСУРСА
Д.Б. Белов, С.И. Соловьев
Рассмотрена возможность применения регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса.
Ключевые слова: регрессионный анализ, энергетический ресурс, процесс поставки и потребления.
В процессе снабжения каким-либо энергетическим ресурсом (природным газом, электрической энергией, нефтепродуктами и др.) довольно
часто наблюдаются ситуации, когда результаты учета объемов потребления Vпотр и поставки Vпост не соответствуют друг другу [1, 2]. Такое несоответствие может быть вызвано различными причинами, начиная от несанкционированного отбора ресурса, заканчивая наличием погрешностей в
результатах измерения объемов потребленного и поставленного ресурсов.
Поэтому исследование причинно-следственных отношений между указанными объемами является важнейшей задачей при выявлении признаков,
оказывающих влияние на вариацию рассматриваемых величин.
Подходящим способом решения обозначенной выше задачи может
служить проведение регрессионного анализа, который представляет собой
статистический метод исследования влияния одной величины (факторного
354
1/--страниц
Пожаловаться на содержимое документа