close

Вход

Забыли?

вход по аккаунту

?

Об уменьшении погрешности наблюдений при оценивании зависимости доза эффект.

код для вставкиСкачать
Математическое моделирование. Оптимальное управление
Вестник Нижегородского университета им.
Лобачевского, 2012, № 3 (1), с. 170–174
М.В.Н.И.
Ярощук
170
УДК 519.2
ОБ УМЕНЬШЕНИИ ПОГРЕШНОСТИ НАБЛЮДЕНИЙ
ПРИ ОЦЕНИВАНИИ ЗАВИСИМОСТИ ДОЗА – ЭФФЕКТ
 2012 г.
М.В. Ярощук
Нижегородский госуниверситет им. Н.И. Лобачевского
marina.yaroschuk@yandex.ru
Поступила в редакцию 26.03.2012
Рассматривается математическая модель зависимости доза–эффект в случае непрямых наблюдений.
Предлагаются и исследуются способы уменьшения погрешности наблюдений для оценивания неизвестной
функции распределения.
Ключевые слова: зависимость доза–эффект, непрямые наблюдения, погрешности наблюдений, регрессия.
Введение
В работе рассматривается математическая модель зависимости доза–эффект (см. [1]) для схемы
непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а
реакция организма (эффект) идет на «чистую»
вводимую дозу. Рассмотрен случайный план эксперимента, когда вводимая доза является случайной величиной. Данная модель при наличии погрешности измерения в основном отражает
применяемую методику проведения клинических испытаний лекарственных препаратов. В
схеме непрямых наблюдений, если распределение ошибки неизвестно, устранить ее влияние в
определенных случаях можно либо при помощи
специальных ядер (см. [2]), либо используя априорные сведения о распределении ошибок.
Однако, как показали результаты численного
моделирования, указанные методы устранения
ошибок работают для оценки плотности, а для
оценки функции распределения дают неудовлетворительные результаты. Мы предлагаем и
исследуем способы уменьшения погрешности
для оценки функции распределения в некоторых случаях, имеющих важное значение для
приложений. Так, если распределение с.в. X является нормальным N(a, σ2) с неизвестными
параметрами, распределение ошибки ε также
подчиняется нормальному закону N 0,  20 с

2
0

2
0
известной дисперсией  , где дисперсия 
много меньше дисперсии σ2, мы строим оценку,
предельное распределение которой мало зависит от погрешности измерения.
В задаче доза–эффект для случайных планов
эксперимента математическая модель в схеме
непрямых наблюдений имеет следующий вид.
Измерения вводимой дозы U осуществляются с
погрешностью ε, имеющей плотность g(x), то
есть вместо с.в. U наблюдается с.в. Y. Эта
ошибка может накладываться аддитивно, тогда
Y = U + ε, при фиксированном значении U = u
распределение величины Y имеет плотность
q(y – u). В общем случае распределение ошибки
описывается условной плотностью q(y|u).
Имеем: X1, X2,…,Xn – независимые одинаково
распределенные случайные величины (н.о.р.с.в.)
с функцией распределения (ф.р.) F(x), U1,
U2,…,Un – независимые между собой и одинаково распределенные с.в., независимые от {Xi,
1 ≤ i ≤ n}, с неизвестной ф.р. G(x), Y1, Y2,…,Yn –
н.о.р.с.в. с неизвестной ф.р. Q(y). Мы наблюдаем повторную выборку Y(n) = {(Yi, Wi), 1 ≤ i ≤ n},
где Wi = I(Ui > Xi) есть индикатор события {Ui >
> Xi}, т.е. Yi – наблюдаемое значение, а реакция
организма осуществляется на величину Ui.
Определим статистики
1 n
S1*n ( x) 
K h Yi  x  ,
n i 1

S 2*n ( x ) 
1
n
n
W K
i
h
Yi  x  ,
i 1
где h  cn 1 5 , c – некоторая заданная положительная константа, функция K(x) – ядерная
1  x
функция (ядро), K h ( x )  K   .
h h
По выборке
Yi ,Wi in1
построим оценку для
F(x) как отношение статистики S 2*n ( x) к S1*n ( x)
Fn* ( x) 
S 2*n ( x)
,
S1*n ( x )
полагая Fn* ( x )  0 , если S1*n ( x)  0 .

Пусть m( x)  F ( y ) g ( x  y ) dy .
(1)
171
Об уменьшении погрешности наблюдений при оценивании завимости доза-эффект
Известно (см. [3, 4]), что при некоторых условиях регулярности оценки (1) являются состоятельными и асимптотически нормальными
оценками неизвестной функции распределения
F(x) и кроме того



d
nh S1*n ( x)  1 

N 0, K
n 
2
,

Тогда m( x)  F (t ) g ( x  t ) dt  свертка двух
нормальных распределений. Применяя теорему
Фубини [5], заключаем, что

m( x) 
(2)

 ν2

2
nh S ( x)  m( x) 
 N  m( x), K m( x)  , (3)
n
 2

2
ν

2
d
nhFn* ( x)  m( x) 

N  m( x), K σ 2 ( x)  , (4)
n
2



*
2n
d

 ( x )  m( x )1  m( x )  ,
где
2
 
2


 x K ( x)dx ,
K 2 ( x ) dx .


e
( t a) 2
2σ
2

2π σ 0

1

2
0

1

2  20   2


1
2

2 σ 20
dt 
( x  a )2
e 
( t a ) 2
2  20   2
e 
e
( x t ) 2
2 σ 20  σ 2
.

 dt   x  a

2
2
 0  




и
Результаты и их обсуждение
Мы рассмотрим задачу устранения погрешности измерений, когда:
1) погрешность ε имеет известное нормальное распределение N 0 ,  20 , распределение
случайной величины X – нормальное N(a, σ2),
параметры (a, σ2) неизвестны;
2) погрешность ε имеет известное нормальное
распределение N 0 ,  20 , функция распределения F(x) случайной величины X неизвестна;
3) погрешность ε имеет известное нормальное распределение N 0 ,  20 , распределение
случайной величины U – нормальное N(a, σ2),
параметры (a, σ2) неизвестны, распределение
случайной величины X неизвестно.
1. Если ошибка ε имеет нормальное распределение N 0,  20 , то из соотношений (2) и (3)
заключаем, что нормированные разности








*
1n



*
2n
nh S ( x)  1 и
nh S ( x )  F ( x) имеют
асимптотически нормальные распределения
 2
2
2
f ( x), F ( x ) K  соответстN 0, K
и N 
 2


2π σ
x
m( x ) 



2π σ  σ
Следовательно,

K
1

2




2
 f (t ) g ( x  t )dt 


венно.
Пусть распределение случайной величины U
имеет плотность
 x2 
1
g ( x) 
exp  2  .
2
 2 0 


Пусть с.в. X  N a, 2 , т.е. F(t) = P(X < t) =
1
 xa
 Ф
 , Ф( x) 
σ


2π
x


e

t2
2
dt .
 2
2
d
nh S 2*n ( x )  F ( x) 

N  m( x), m( x ) K  .
n 
 2

Теперь из (4) заключаем, что

d
nh m( x)  F ( x)  



n
,

2 
d


N 
m ( x ), m ( x )1  m( x)  K 
n
 2

*
S ( x)

где m( x )  Fn* ( x)  2*n
.
S1 n ( x )
Таким образом, установлено, что при нормальном распределении с.в. X N(a, σ2) и известной дисперсии σ 02 с.в. ε  N 0, σ 20 предельное
распределение оценок получилось аналогичным
тому, что и в схеме прямых наблюдений. Отличие состоит в том, что дисперсии распределений m(x) и F(x) различны.

Чтобы найти оценку m(x ) , вычислим пер

вый и второй начальные моменты 1 и  2 :
2



0
 




 x dm( x)  (1  m( x )) dx  m( x) dx  1 ,
 
0

 


2 
 x dm ( x )   2 .
 



Положим  2   2   12 . Тогда неизвестные
параметры a и σ2 найдем из системы уравнений

   2 
2 

 m( x)  1 ,
 a
 a  1  m( x),
2
2
 




 2
 2
2
2
2
2
     0 ,
     0 .
Функцию ψn(x) определим соотношением



m( x  h)  2m( x )  m( x  h)

ψ n ( x )  m( x ) 
.
h2




172
М.В. Ярощук
Заметим, что если с.в. X имеет функцию распределения F(x) и функцию времени жизни

S ( x)  1  F ( x) , то

 x dF ( x)   S ( x) dx .
0
0

2

q( y ) 


 S (u) du  dF ( x ) 

 S 2 ( x)
0  x

( y u ) 2
2 σ 20
 g (u ) ,
2π σ 0
а маргинальная плотность распределения величины Y будет равна
g ( y, u )  q ( y | u )  g (u ) 
Далее,


1

 g ( y, u) du  
e
( y  u )2

1
2 σ02
e
2π σ 0
Кривая регрессии U по Y имеет вид:


g (u ) du .

( y u )2


2
2
1
2σ02

 dS ( x)   
  1 
e
g(u) du







S (u ) du

S (u) du d 

ρ( x)
 2πσ 0

 S 2 ( x)

  S ( x) 
u( x)  E(U | Y  x) 

.
0  x
0  x


q( x)
q( x)




2


1
  S (u) du  

 S ( x)
x



0




2

S (u) du  S ( x) dx 
S ( x) x
0


2



   2 x S (u) du  2 xS( x) dx 
x
0
0

С помощью этой кривой регрессии мы будем
«исправлять» выборочные данные и использовать их для оценки распределения величины X
«без ошибки».
Представим последнее соотношение в другом виде. Для этого рассмотрим производную
q′(x). Она равна


  2  S ( x) d ( x 2 )   2  x 2 dF ( x) .


0
0

где  ( x)  u g(u)


e
( x u )2
220

du , q(x) 
20

1
1
 g(u) 

( x u ) 2
2  20
du .
2  0
Найдем условное распределение Y при условии U = u. Имеем
P (Y  y |U  u )  P (U    y | U  u ) 

e
 P (u    y |U  u )  P (  y  u ),
поэтому условная плотность Y на U равна
qY |U ( y | u )  q ( y | u ) 
1

e
( y u ) 2
2  20


Поэтому эмпирические моменты можно считать используя приведенные соотношения и
подставляя вместо теоретической функции распределения эмпирическую.


Найденные значения a и  2 подставим в
функцию распределения с.в. X и получим оценку этой функции распределения.
2. Пусть Y = U + ε – сумма независимых случайных величин U и ε, причем распределение ε –
нормально с нулевым математическим ожиданием и известной дисперсией  02 , а случайная величина U имеет неизвестную плотность g(u) > 0.
Для устранения погрешности ε мы воспользуемся следующей идеей работы Э. Надарая [6].
Кривая регрессии U по Y имеет вид:
( x )
u ( x)  E (U | Y  x ) 
,
q( x )

q ( x ) 
.
2  0
Совместная плотность пары (Y, U) будет
равна
 xu 
  2 e
2 0   0 
1
( x u ) 2
2  20
g (u ) du 
  x q( x)   ( x).
Отсюда
q ( x)
x
 ( x)
 2  2
,
q ( x)
 0  0 q ( x)
значит,
 ( x)
q ( x )
  20
 x.
q ( x)
q ( x)
Пример 1. Пусть случайная величина Y имеет нормальное распределение с неизвестным
математическим ожиданием a и неизвестной
дисперсией σ2, ее плотность равна
q( x ) 
1

e
( x a ) 2
22
.
2
Тогда
q ( x)
xa
 ln q( x)    2
q ( x)

2
2
  0
 20
q ( x)
и  02
x
x

a
.
q( x )
2
2
Поскольку a и σ2 неизвестны, то мы оценим
их по выборке y1, y2,…,yn с помощью следующих статистик:
1 n
1 n


ay
yi и  2  s 2 
( yi  y ) 2 .
n i 1
n i 1
В качестве приближения по выборочным
данным мы рассмотрим статистику
 ( x)
u n ( x )   02 n
x,
q n ( x)


1 n
K h ( yi  x)
n i 1
q ( x  h)  q n ( x  h)
 n ( x)  n
.
2h
где
q n ( x) 

и
173
Об уменьшении погрешности наблюдений при оценивании завимости доза-эффект
Имеет место следующий результат.
Теорема 1. Пусть I – произвольный конечный интервал [a, b] на прямой и выполнены следующие условия: K(x) – неотрицательная, нормированная, четная, финитная функция с ограниченной вариацией μ = V(K), nh2→∞, при n→∞,
плотность q(x) имеет до третьего порядка
непрерывные и ограниченные производные.
Тогда
sup | E ( n ( x))  q ( x ) | 
x
 sup
x

1
2h 2
sup | u n ( x)  u ( x ) |  0 .
 y  x  h
 q( y ) dy  q ( x ) 
h

x
n 
xI
Доказательство повторяет с небольшим отличием идею доказательства работы [6].
Пусть ε > 0 и V2 n  sup |  n ( x )  E ( n ( x )) | .
 K 
 K 
 sup
p
 y  x h
 q( y ) dy 
h

1
2h 2
1
( q( x  ( z  1) h) 
2h

q( x  ( z  1)h)) K ( z ) dz  q ( x ) 
x
 sup
Имеем:
x
1
h2 z
2( z 2  2) 3
(2hq( x) 
q( x) 
h 
2h
2
6

V2n  sup| ρn ( x)  E(ρn ( x))| 
x
sup
x
qn ( x  h)  qn (x  h)  qn ( x  h)  qn ( x  h) 
E
 
2h
2h


1
2h 2
 sup
x
1
u  x  h
K
 dFn (u ) 
2
h
2h


1
u xh
 u  x  h
K
 dF(u)  2 K
 dF(u) 
2h
 h 
 h 


1
 2
2h

u  x  h
K
 dFn (u) 
h



 (q(1 )  q( 2 ))K ( z ) dz q( x) 
Поэтому при n ≥ N1(ε)
x
x
2
1 
 q( x) |  ε)  C1 e β1nh , где 1    .
2
Обозначим
(ln q( x ))  V ( x ),
и
xI


ρ ( x)
P  sup n
 V ( x)  ε  
 xI q ( x)

n


 P (sup | ρ n ( x)  V ( x ) qn ( x) | 


xI
 ε (β1  ε ))  P (sup | qn ( x)  q( x) |  ε ) 
xI
 P (sup | ρ n ( x)  V ( x ) qn ( x) | 
xI
 ε (β1  ε ))  P (sup | qn ( x)  q( x) |  ε ) 
x
xI
 P (sup | ρ n ( x)  q( x) |  sup |V ( x) (qn ( x)  q( x)) | 
xI
xI
 P (sup | ρ n ( x)  q( x ) |  ε (η1  ε ) / 2) 
xI
 P (sup | q n ( x)  q ( x ) |  ε ) 
xI
 P ( sup | ( qn ( x )  q( x)) |  ε ( η1  ε) /( 2η 2 )) 
xI

2
h
 P(sup Fn ( x )  F ( x)  ε )  C1e  4βnh ,
x
μ
2
x
xI
 ε (μ1  ε ))  P (sup | qn ( x)  q( x) |  ε) 
x

где   2  .

Ввиду того, что плотность q(x) имеет непрерывные и ограниченные производные до
третьего порядка включительно, причем
sup | q ( x ) |  L3 ,
xI
Тогда
1
u xh
( Fn (u )  F (u )) dK 

2h
h


ф.р. с.в. X, а Fn(x) – эмпирическая ф.р. с.в. X.
Как показано в [7], для n ≥ N0 существует такая
универсальная константа C1, что
2

λ 
  C1e 2 λ .
P Dn 
n

Принимая во внимание эти неравенства, заключаем, что для ε > 0,
P (sup | ρ n ( x)  E (ρ n ( x )) |  ε ) 
пусть
1  min q( x)  0 ,  2  max | V ( x) | .
1
u xh
( Fn (u )  F (u )) dK 

2h
h



 sup Fn ( x)  F ( x) 
.
x
2h
Пусть Dn ( x)  sup Fn ( x)  F ( x) , где F(x) –

P (sup | ρ n ( x) 
2

 sup
( 2  2) L3 2
h .
3
 C4 e
  1 nh 2
 e 
2
2 nh
2
 e
3 nh
2
,
1  (1  ) 
 ,  3   2 /  22 .
где  2  
8


По условию теоремы nh2→∞, поэтому
p
sup | u n ( x )  u ( x) |  0 .
xI
n 
Теорема доказана.
174
М.В. Ярощук
3. Рассмотрим случай, когда имеются наблюдения Y = U + ε; U, ε независимы и имеют
нормальные распределения соответственно N(a,
σ2) и N (0, σ 02 ) , σ 20 известна. Здесь условная
плотность распределения q(u|y) имеет нормальное
распределение
N (1 ( y ), 12 ) ,
где
Поскольку a и σ2 неизвестны, то возьмем их


оценки: a  y , σ 2  s 2 . Поэтому
a 02
 2  20
y 2
2



,
, т.е.
1
 02   2
 20   2  20   2
 xa
стве оценки Ф 
 в точке x.
 σ 
σ2
Если условие 02  1 не выполнено, то v*
σ
найдем из уравнения
1 ( y) 
2
x
1  u  μ1 ( y ) 
1 2
 , где φ ( x) 
q (u | y )  φ 
e .
ρ1 
ρ1
2π

1 n
1 n
yi , s 2 
( yi  y) 2 .
n i 1
n i 1
Предположим, что случайная величина Z
имеет нормальное распределение N(μ,ρ2) с
функцией распределения Ф((x – μ)/ρ, Ф ( x) 

Пусть y 

 02
s2

y

x

(
x

y
)
.
s 2   20
s 2   02

Значение Fn (v  ) будем использовать в качеv  x
3

2 
v   1  2 0 2  (x  y)  y ,

s  0 


где x – заданная точка функции распределения
F(x).

x

 φ (t) dt .
Список литературы


При n → ∞ последовательность {Fn (v), n  1}
сходится к среднему
v
 u  μ  1  u  μ 1 (v ) 
 du 
 φ 
R(v)  Ф 
ρ
ρ
ρ


1

1



 μ (v )  μ 
.
 Ф 1
 ρ2  ρ2 
1 

σ 20
 1 , то заменим
σ2
потребуем, чтобы
Если
1
 02
на 1 и
2
 aσ 02

vσ 2
 2
 2
a 
2
2
σ0  σ
 xa 
 σ σ

Ф 0
  Ф σ  .
σ








a 02
v 2

 x,
Отсюда
значит,
 20   2  20   2
v  x
 20   2
a.
2
1. Тихов М.С. PC-оценки функции распределения в модели доза–эффект по случайным планам
эксперимента // Вестник Нижегородского университета. 2012. Вып.1(1). С. 138–143.
2. Fan J., Truong Y. Nonparametric regression with
errors in variables // The Annals of Statistics. 1993. V. 21,
№ 4. P. 1900–1925.
3. Тихов М.С., Ярощук М.В. Статистическое
оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений
// Нелинейный мир. 2007. Т. 5, №1. 2. С. 4–8.
4. Ярощук М.В. Имитационное моделирование
зависимости доза–эффект и статистический анализ
оценок функции эффективности // Обозрение прикл.
и пром. математики. 2009. Т. 16. В. 6. С. 1148–1150.
5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука,
1976. 542 с.
6. Надарая Э.А. О непараметрических оценках
плотности вероятности и регрессии // Теория вероятн. и ее примен. 1965. Т. 10. В.1. С. 199–203.
7. Dvoretzky A., Kiefer J. and Wolfowitz J. Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator // Annals
of Mathematical Statistics. 1956. V. 27. P. 642–669.
ON REDUCTION OF OBSERVATION ERRORS IN ESTIMATING
THE DOSE-EFFECT DEPENDENCE
M.V. Yaroshchuk
A mathematical model of doze-effect dependence in case of indirect observations is considered. The ways to reduce observational errors for the estimation of an unknown distribution function are proposed and studied.
Keywords: dose-effect dependence, indirect observations, observation errors, regression.
Документ
Категория
Без категории
Просмотров
4
Размер файла
308 Кб
Теги
оценивания, уменьшении, зависимости, погрешности, наблюдения, дозах, эффекты
1/--страниц
Пожаловаться на содержимое документа