close

Вход

Забыли?

вход по аккаунту

?

Тpубников Б.А. Трубникова О.Б. - Пять великих распределений вероятностей

код для вставкиСкачать
№ 11, 2004 г.
Б.А.Тpубников, О.Б.Трубникова
Пять
великих распределений
вероятностей
© “Природа”
Использование и распространение этого материала
в коммерческих целях
возможно лишь с разрешения редакции
Сетевая образовательная библиотека “VIVOS VOCO!”
(грант РФФИ 03-07-90415)
vivovoco.nns.ru
vivovoco.rsl.ru
www.ibmh.msk.su/vivovoco
________11-04.qxd 22.10.04 18:23 Page 13
СТАТИСТИКА
Пять великих распределений
вероятностей
Б.А.Тpубников, О.Б.Трубникова
«К
ажется, дождь собира ется, кажется, дождь
с о б и р а е т с я » , — п р иговаривал Пятачок, стараясь
отогнать пчел от улья, куда хо тел добраться Винни-Пух, что бы полакомиться медом. Так
Пятачок хотел передать пчелам
информацию о том, что вероят ность дождя велика. С понятием
вероятности, хотя бы на быто вом уровне, сталкивались все
читатели нашего журнала, на п р и м е р и г р а я в « о р л а » и « р е шку». Однако теория вероятнос т е й — весьма точная наука,
имеющая несколько замеча т е л ь н ы х д о с т и ж е н и й , с к о т о р ым и м ы и хотим познакомить
читателей.
Борис Андреевич Трубников , д о к т о р ф и з и ко-математических наук, профессор, глав ный научный сотрудник Института ядеpно го синтеза РНЦ «Куpчатовский институт».
Область научных интересов — теория плазмы, гидродинамика, происхождение кос мических лучей. Неоднократно публиковался в журнале «Природа».
Оксана Борисовна Трубникова , младший
научный сотрудник лаборатории экспери ментальной эмбриологии им.Д.П.Филатова
Института
биологии
развития
РАН
им.Н.К.Кольцова. Изучает временны˜е зави симости процессов деления клеток.
Азбука теории
Основные положения тео рии вероятностей достаточно
просты. Если могут случиться
два неких события «1» и «2» с вероятностями w(1) и w(2), при чем эти события независимы
(«в о г о р о д е б у з и н а , а в К и е в е
дядька»), то выполняются следу ющие соотношения:
— вероятность того, что
произойдут оба независимых
события, равна произведению
w 1,2 = w ( 1 ) w ( 2 ) ;
© Тpубников Б.А., Трубникова О.Б.,
2004
ПРИРОДА • №11 • 2004
— вероятность того, что произойдет либо первое, либо второе
событие, равна сумме w(1 + 2) = w(1) + w(2);
— вероятность того, что произойдет какое-либо одно событие из
полного набора N всех возможных независимых событий, равная
сумме всех вероятностей W N = w(1) + w (2) + w(3) + … + w(N ), состав ляет единицу (или 100%, если вероятности исчисляются в процентах).
В качестве примера используем эти простые формулы для ана л и з а д в и ж е н и я м о л е к у л г а з а . П у с т ь w ( E 1) е с т ь в е р о я т н о с т ь т о г о , ч т о
м о л е к у л а о б л а д а е т п о л н о й э н е р г и е й E 1 , и w (E 2 ) е с т ь в е р о я т н о с т ь т о г о , ч т о д р у г а я м о л е к у л а о б л а д а е т э н е р г и е й E 2. Т о г д а п р о и з в е д е н и е
w ( E 1 ) w ( E 2) = = w ( E 1 + E 2 ) б у д е т в е р о я т н о с т ь ю т о г о , ч т о и м е ю т м е с т о
13
________11-04.qxd 22.10.04 18:23 Page 14
СТАТИСТИКА
Рис.1. Пример нормированного на единицу распределения
Гаусса с параметрами B = 4 и <x> = 0.5.
сразу оба события.
Решением этого функционального уравнения,
к о т о р о е и м е е т в и д F (x + y) = F ( x ) F( y ) , я в л я е т с я
экспонента
w (E ) = e x p ( a – b E ),
(1)
где a и b — постоянные, и полученную формулу
называют распределением Максвелла—Больцмана. Если пренебречь потенциальной энергией,
обусловленной силой тяжести, то полная энергия
молекулы сводится к ее кинетической энергии
E к и н = m v 2 / 2 , и т о г д а ф о р м у л а w = a e x p ( – βv 2 ) , г д е
β = b m /2, описывает распределение молекул по
скоростям.
Для простоты рассмотрим случай, когда моле кулы газа движутся вдоль оси x со средней скоро с т ь ю т е ч е н и я < v > . Т о г д а ч и с л о м о л е к у л d N, у ко торых скорость v заключена в интервале от v до
v + dv, будет равно
d N = a e x p [ – β( v – < v > ) 2]d v ,
(2)
где a — множитель нормировки.
Забыв про молекулы, запишем сходную общую
формулу вида
d N = A e x p [ – B (x – < x > ) 2 ]d x ,
(3)
г д е A, B — п о с т о я н н ы е .
Эту функцию (рис. 1) называют распределением вероятностей Гаусса , и она имеет много раз личных применений.
Если, например, мы много раз измерим как
м о ж н о т о ч н е е н е к у ю в е л и ч и н у x , то н а й д е м , ч т о
в среднем она равна < x>. Но каждый раз наблюда ется некоторое отклонение x – < x > от среднего
значения, и тогда d N — это число попыток,
п р и к о т о р ы х и з м е р е н н о е з н а ч е н и е л е ж и т в и нтервале от x до x + dx.
А теперь займемся решением квартирного во проса, который, по словам Булгакова, так испор тил москвичей.
В село въехали гусары…
Предположим, что полк гусар, участвуя в маневрах, въехал в большое село, и N гусар надо посе 14
лить на постой в K квартир. Спрашивается: каким
числом способов C это может сделать начальникквартирмейстер (теперь их называют «риэлтера ми», т.е. реализаторами квартирных возможнос тей).
Для наглядности можно изображать людей N
точками в круге-доме, разделенном перегородка ми на K секторов. При расчете вероятностей воз можны три разных варианта.
Одного человека можно поселить в одну из K
к в а р т и р , о ч е в и д н о , K с п о с о б а м и , а N ч е л о в е к — KN
способами. Но среди этих способов есть тождест венные, отличающиеся лишь перестановками лю дей; их мы считаем равноправными. Число таких
п е р е с т а н о в о к р а в н о ф а к т о р и а л у N!, и е с л и и х и с к л ю ч и т ь , т о в с е г о п о л у ч а е т с я C 1 = K N/N ! с п о с о б о в
размещения.
Теперь усложним задачу, считая, что это не
просто поход гусар, а штабные учения, на кото рые съехались N генералов и их надо разместить
по K квартирам. Но генералы не могут жить вмес те, и к а ж д о м у г е н е р а л у н у ж н а о т д е л ь н а я к в а р т и р а .
Для такой возможности число квартир K должно
превышать число людей N , так что K – N квартир
останутся пустыми. Нетрудно сообразить, что
в этом случае число возможных способов рассе ления будет равно биномиальному коэффициенту
C 2 = K! / ( K – N ) !N ! , п о с к о л ь к у K ! — э т о ч и с л о п е р е становок квартир, N! — число перестановок гене р а л о в , а ( K – N) ! — ч и с л о п е р е с т а н о в о к п у с т ы х
квартир.
Наконец, рассмотрим вариант, когда квартир
мало, и гусары согласились на то, что в одну квар тиру квартирмейстер может поселить сколько
угодно людей. Возвращаясь к наглядному образу
круга, в котором есть K секторов с K перегородками между ними и N точек (людей), всего имеем
N + K «субъектов и объектов». Полное число воз можных перестановок и тех и других, очевидно,
р а в н о ф а к т о р и а л у ( K + N) ! . Н о , в о - п е р в ы х , с р е д и
н и х е с т ь K! в з а и м н ы х п е р е с т а н о в о к т о л ь к о п е р е городок, и, во-вторых, N ! взаимных перестановок
только людей не меняют общую схему расселе ния. И если исключить такие перестановки,
то число возможных способов расселения в э т о м
третьем случае будет равно дроби C3 = (K +
+ N )!/K !N !.
Полезно отметить: если число квартир значи тельно превышает число людей ( K >>N ), послед ние два варианта сводятся к первому. Это легко
увидеть, если во втором случае приближенно по л о ж и т ь K ! ≈ (K – N ) !K N, а в т р е т ь е м — (K + N )! ≈
K !K N, ч т о и п р и в е д е т к п е р в о м у с л у ч а ю р а с с е л е н и я
гусар.
П о я с н и м т а к ж е , ч т о о т л и ч и е ч и с е л C 2,3 о т C 1
здесь получено в результате простой игры в перестановки N точек и K перегородок в круге. На самом деле и сама игра, и три варианта понадоби лись нам, чтобы учесть фундаментальное свойст во тождественности элементарных частиц мате ПРИРОДА • №11 • 2004
________11-04.qxd 22.10.04 18:23 Page 15
СТАТИСТИКА
рии — фермионов и бозонов. Это чисто квантовое
свойство трудно передать на «языке гусар», по скольку никакой квартирмейстер не будет учитывать число возможных перестановок пустых квар тир, а для наших дальнейших целей их важно при нять во внимание.
Формула Стирлинга
и квазиэнтропия
Будем считать числа N и K большими и для
ф а к т о р и а л о в и с п о л ь з о в а т ь и з в е с т н у ю п р и б л иженную формулу Стирлинга. Она получается, ес ли сначала записать логарифм факториала в виде
суммы lnM ! = ln1 + ln2 +… + ln M , а затем заменить
сумму на интеграл, что приближенно дает M! ≈
≈ ( M /e ) M , г д е e = 2 . 7 1 8 2 8 1 8 2 8 … — о с н о в а н и е н а т у ральных логарифмов.
Тогда найденные выше три числа Ci (i = 1,2,3)
можно записать в виде приближенных единооб разных формул
C i ≅ f i –K, f 1 = (
(4)
n
) n, f 2 = n n( 1 – n) 1 –n, f 3 =
e
nn
(n + 1)
.
n+ 1
З д е с ь м ы в в е л и а р г у м е н т n = N /K , к о т о р ы й в о в с е х
трех случаях означает среднее число людей (час тиц), приходящихся на одну квартиру (состо яние).
Поскольку числа Ci велики, удобнее опериро вать с их натуральными логарифмами Si = ln Ci =
= – K ln f i. В с т а т и с т и ч е с к о й ф и з и к е л о г а р и ф м ч и с ла способов распределения частиц по состояни ям («квартирам») принято называть энтропией
(от греч. entropia — переворот, перестановка,
п р е в р а щ е н и е — в в е д е н о Р . К л а у з и у с о м в 1 8 6 5 г.).
Мы здесь условимся вместо термина «энтропия»
применять более общий термин «квазиэнтро пия», т.е. логарифм большого числа способов
распределения множества каких-либо объектов
(или субъектов) по каким-либо определенным
признакам. Например, слов по частоте их встре чаемости в тексте и пр.
Очевидно, что для свободы выбора квартир мейстер-риэлтер хотел бы иметь в своем распоря жении как можно большее число способов разме щения людей по квартирам, максимальную «ква зиэнтропию». Распределение, для которого число
способов реализации максимально, действитель но самое интересное — оно будет наиболее веро ятным. Но при поиске максимума Ci следует учи тывать ряд ограничений.
Не числом единым
Далее будем считать, что квартиры различают ся своим качеством, которое будем обозначать
ПРИРОДА • №11 • 2004
буквой ε (от англ. excellent — превосходный), по лагая, для конкретности, что оно характеризует
бытовые удобства в данной квартире (в первую
очередь число комнат, а также наличие телефона,
в а н н ы , х о л о д и л ь н и к а , к о н д и ц и о н е р а и п р . — п р исутствие каждого из перечисленных удобств до б а в л я е т л и ш н и й б а л л к к а ч е с т в у ε) . Р а з у м н о с ч и тать, что введенное выше среднее число людей
в о д н о й к в а р т и р е з а в и с и т о т а р г у м е н т а ε, т а к ч т о
n = N /K = n( ε) ( п о с к о л ь к у х о р о ш и е к в а р т и р ы д о рого стоят и доступны немногим).
Ранее мы рассматривали примеры с опреде л е н н ы м н а б о р о м л ю д е й и к в а р т и р ( N m, K m) . Э т у с о вокупность назовем малым набором и, присвоив
ему индекс m , запишем его квазиэнтропию в виде
S m = –K ml nf (m) . Д а л е е р а с с м о т р и м б о л ь ш о й н а б о р ,
состоящий из множества малых m -наборов. Оче в и д н о , в б о л ь ш о м н а б о р е т е п е р ь б у д е т N = ΣN m =
= Σn mK m л ю д е й ( ч а с т и ц ) , и м ы б у д е м с ч и т а т ь ф и к сированным их полное число N.
Большой набор необходимо ввести в рассмотрение по той причине, что теперь мы условились
учитывать не только количество, но и качество
к в а р т и р εm ( ч и с л о и х б ы т о в ы х у д о б с т в ) . И с у м м а р ное число бытовых удобств по всему большому
н а б о р у E = Σε mN m = Σε mn mK m м ы т а к ж е б у д е м с ч и тать заданным. В статистической физике частиц
качеству εm к в а р т и р ы с о о т в е т с т в у е т э н е р г и я m состояния, а nm приобретает смысл среднего чис ла частиц в m -состоянии. Таким образом, задание
фиксированного полного числа бытовых удобств
соответствует в физике частиц постоянству их
суммарной полной энергии.
Далее замечаем, что число способов C реализации большого набора равно произведению чисел
способов реализации всех малых наборов. Поэто му наша логарифмическая квазиэнтропия S = lnC
большого набора равна сумме квазиэнтропий
всех малых наборов:
S = ΣS m = –ΣK ml n f ( m).
(5)
И мы хотели бы найти максимум этой величины
при двух дополнительных ограничительных усло виях — при постоянстве полного числа людей
(частиц) и постоянстве суммарного числа всех
бытовых удобств (в физике — полной энергии
большого набора), т.е. при условиях
(6)
N = Σn mK m = c o n s t , E = Σε mn mK m = c o n s t .
Путем Лагранжа —
к трем распределениям
Максимум некоторой функции при двух до полнительных условиях можно найти, пользуясь
так называемым методом неопределенных мно жителей Лагранжа. Для этого составляем комби нацию (здесь i = 1,2,3)
Φ = S + |α | N – | β| E = –ΣK m(ln f i + σ mn m),
(7)
15
________11-04.qxd 22.10.04 18:23 Page 16
СТАТИСТИКА
тические закономерности, свойственные боль шим множествам.
Поэтому в качестве большого множества рас смотрим некую страну с населением N человек,
проживающих в K городах разного типа. Предпо ложим, что в некотором городке проживает m л юд е й и в с т р а н е и м е е т с я nm г о р о д к о в с т а к и м ж е
числом жителей. Тогда, очевидно, имеют место
выражения с суммами
K = Σn m = c o n s t , N = Σm n m = c o n s t .
Рис.2 . Распределения: n 1 (s) — Максвелла—
Больцмана; n 2(s ) — Ферми—Дирака и n 3 (s) —
Бозе—Эйнштейна.
г д е д л я к р а т к о с т и о б о з н а ч е н о σ m = |β| ε m – | α| . И д а лее по рецепту Лагранжа решаем уравнения
– ∂ Φ/∂ n m = 0 . О п у с к а я д л я п р о с т о т ы и н д е к с m , з а пишем эти уравнения в виде
( l n f i ) ′n= –σ, ( i = 1 , 2 , 3 ) ,
(8)
где штрих означает производную по n. Нетрудно
проверить (предоставим это читателю), что под ставляя сюда три выражения (4) для трех функций
f 1 , 2 , 3(n ) и в ы ч и с л я я п р о и з в о д н ы е и х л о г а р и ф м о в ,
найдем три распределения (рис.2)
n1 =
1
1
1
,n =
,n =
,
eσ 2 eσ + 1 3 eσ – 1
(9)
г д е σ = |β |ε – | α|, |β | > 0 и |α | > 0 — п о л о ж и т е л ь н ы е
параметры и ε — качество квартиры.
В квантовой статистической физике величина
nm и н т е р п р е т и р у е т с я к а к с р е д н е е ч и с л о ч а с т и ц г а з а в m - с о с т о я н и и , о б л а д а ю щ е м э н е р г и е й ε m, а к о мб и н а ц и я σ з а п и с ы в а е т с я в в и д е σ = ( ε – µ) /k T , где
µ — химический потенциал газа, k — постоянная
Больцмана и T — температура в градусах Кельвина.
Формулу для n1 называют распределением
Максвелла—Больцмана, для n 2 — распределением
Ф е р м и — Д и р а к а д л я ф е р м и о н о в , а д л я n3 — р а с пределением Бозе—Эйнштейна для бозонов. Име ются в виду распределения газов из классических
ч а с т и ц ( n 1) и к в а н т о в ы х ф е р м и - ( n 2 ) и л и б о з е - ч а с т и ц (n 3 ) п о с о с т о я н и я м с р а з н ы м и э н е р г и я м и ε.
При больших энергиях и температурах все три
распределения совпадают (рис.2).
(10)
Эти суммы весьма похожи на два дополнительных
условия (6), встречавшихся в трех ранее рассмот ренных распределениях квартир по их качеству
(или же элементарных частиц материи, где требо валось сохранение полного числа частиц N и их
с у м м а р н о й э н е р г и и E ).
Сравнение пар уравнений (10) и (6) показывает, что показателем качества εm города следует
считать просто число его жителей m . И если людей не расселяет по городам начальник-квартир мейстер, то сами люди, как правило, стремятся пе ребраться из мелких городов в более крупные, где
больше возможностей найти работу и дать детям
хорошее образование.
Лишенные разума молекулы газа как бы сами
(но под «руководством» теории вероятностей)
«стремятся» создать наиболее хаотическое рас пределение по энергиям с наибольшим числом
возможных способов C его воплощения и, тем са мым, с наибольшей энтропией S = ln C. Таким же
правилом руководствуется и квартирмейстер-риэлтер, стремящийся иметь как можно более высо кую квазиэнтропию, т.е. логарифм числа возможных способов расселения N людей по K квартирам с учетом показателя их качества.
И н а о б о р о т , р а з у м н о с ч и т а т ь , ч т о N = Σm n m л ю д е й , р а с с е л я я с ь п о K = Σn m р а з н ы м г о р о д а м , в о т личие от «глупых» молекул сами (как бы даже бес сознательно, поскольку не знают наших формул)
стремятся создать наименее хаотическое, но наиболее удобное для них распределение по городам.
Число возможных способов его реализации
д о л ж н о и м е т ь в и д д р о б и C = k 0 /k 1 k 2, г д е ч и с л и т е л ь ,
очевидно, равен k0 = N ! — числу всех возможных
взаимных перестановок местами проживания
всех людей страны. При этом, однако, надо ис ключить случаи, когда m жителей одного города
меняются местами, не покидая этот город. Число
т а к и х п е р е с т а н о в о к р а в н о ф а к т о р и а л у m !, а по с к о л ь к у ч и с л о г о р о д о в с m ж и т е л я м и р а в н о n m, ра зумно считать, что первый множитель в знаменат е л е р а в е н п р о и з в е д е н и ю k 1 = Π(m ! ) n .
Второй множитель k2 в знаменателе можно по лучить из следующих, столь же очевидных сооб ражений. Выше мы уже заметили, что показателем
престижности города служит само число m его
ж и т е л е й . Д а л е е з а м е ч а е м , ч т о m nm е с т ь ч и с л о ж и телей всех городов m -ого типа, т.е. городов с населением m . Число взаимных перестановок таких
m
Какие города лучше?
Штабные учения с несколькими десятками ге нералов и даже полк гусар в несколько сотен са бель — все же не слишком большие множества,
и в них могут не проявиться характерные статис 16
ПРИРОДА • №11 • 2004
________11-04.qxd 22.10.04 18:23 Page 17
СТАТИСТИКА
жителей городов m -ого типа, очевидно, равно
ф а к т о р и а л у (m n m)!, а д л я в с е х г о р о д о в с р а з н ы м и
m число перестановок всех жителей страны рав н о п р о и з в е д е н и ю ф а к т о р и а л о в k 2 = Π( m nm)!.
Ему и следует приравнять второй множитель
в знаменателе, чтобы исключить перестановки
людей, живущих в равноценных городах и, следо вательно, не имеющих причин, желания и времени заниматься переездами именно такого рода.
Таким образом, для обсуждаемой здесь проблемы
«кто где живет» число возможных способов рас п р е д е л е н и я N = Σm n m л ю д е й п о K = Σn m г о р о д а м
следует считать равным
С =
N!
k0
=
.
k 1k 2 Π[( m !) n ( m n m)!]
m
(11)
Конкурентная борьба
Если число городов ограничено, люди явно на чинают конкурировать друг с другом, и их можно
назвать конкурентами по проблеме переездов
в более крупные города. Используя формулу
Стирлинга, перепишем формулу (11) для числа
способов в приближенном виде
С ≈
( N /e ) N
,
Π(m 2 n m/e 2) m n
m
(12)
и далее найдем квазиэнтропию, т.е. логарифм это го числа способов
S ≈ Σm n m( 1 + l n N – 2 l n m – ln n m).
(13)
г д е σ = a + b m н е з а в и с и т о т n m. И т о г д а н е т р у д н о
проверить (предоставим это читателю), что урав н е н и я Л а г р а н ж а Φ ′n = 0 п р и в о д я т к с о о т н о ш е н и ю
ln( m 2n m) = b + l n N + ( a /m ) . И з н е г о м ы с р а з у п о л у чим для числа городов с населением m
m
nm =
A
a
exp
,
m
m2
(15)
где A = Ne b — постоянная нормировки. Часто
представляет интерес так называемый интеграль ный спектр, т.е. число городов с населением боль ше данного:
mmax
N ( m ) = ∫m
A
a
a
n md m = a ( e x p m – e x p m
).
max
(16)
Мы пришли к так называемому распределению
конкурентов, характерному для объектов, кото рые соревнуются между собой за обладание не к и м о г р а н и ч е н н ы м р е с у р с о м [ 1 ] . В п р е д е л е a →0
это распределение переходит в чисто гиперболи ческое
1
1
N (m ) = A(m – m
).
max
(17)
В качестве иллюстрации формулы (17) на рис. 3
приведены распределения городов США по их на селенности, выявленные за 140 лет общего роста
населения страны. С хорошей точностью они сле дуют гиперболическому закону с зависящим от
в р е м е н и t к о э ф ф и ц и е н т о м N ( m ) = A ( t )/ m .
Для некоторых других множеств «конкурен -
При этом мы учли, что число людей выражается
ф о р м у л о й N = Σm n n.
Как уже пояснялось ранее, в отличие от пове дения «глупых» молекул с максимальной хаотизацией их энергетических состояний, у сообщества
всех разумных живых существ — не только людей,
но и ж и в о т н ы х и даже бактерий океанского
планктона — можно ожидать стремления к минимуму такой квазиэнтропии. По-видимому, это
можно рассматривать как закон жизни сообществ
живых существ — биоценозов: их организация не
может быть хаотической, а должна быть макси мально упорядоченной и построенной по строго
иерархическим, но естественным принципам.
С а н а л о г и ч н о й с и т у а ц и е й м ы с т а л к и в а е м с я в к ибернетике, где информация рассматривается как
отрицательная энтропия и считается, что полный
хаос лишен информации.
Минимум квазиэнтропии (экстремум, как
и максимум) должен достигаться при выполнении
двух дополнительных условий (10). Поэтому по
рецепту Лагранжа вновь составляем комбинацию
с неопределенными множителями a и b:
Φ = S + aK + bN =
= Σn m[m ( 1 + l n N – 2 l n m – l n n m) + σ],
ПРИРОДА • №11 • 2004
(14)
Рис.3. Интегральные спектры распределения числа
городов США по числу их жителей с 1790 по 1930 г.
через каждые 10 лет.
17
________11-04.qxd 22.10.04 18:23 Page 18
СТАТИСТИКА
Рис.4. Три примера интегральных спектров общего
распределения конкурентов, построенных по формуле
(16). Выбрана нормировка A = 10 4 . Параметр a
определяет левый конец спектра, параметр mm a x —
правый конец. Показаны
варианты a = 5 (1); 0.1 (2); –5 (3) и завал
правого конца при mm a x = 10 3 . 5.
Рис.5. Интегральный спектр распределения слов
по частоте их встречаемости в тексте из 1 056 382 слов.
1 — в, 2 — 4, 3 — не, 4 — на, 5 — а, 6 — как, 7 — каждый,
8 — огромный, 9 — красота.
тов» истинные (наблюдаемые) интегральные спе ктры могут несколько отличаться от чисто гипер болических. В этих случаях для сравнения наблю даемых спектров с предсказываемыми «теорией
конкурентов» следует пользоваться полной фор м у л о й ( 1 6 ) , с о д е р ж а щ е й т р и п а р а м е т р а A , a и m m a x.
Подбором параметра a можно подправить левый
конец спектра, а п о д б о р о м п а р а м е т р а m max — п р а вый конец, как это показано на рис. 4.
Формулы (15—16) применимы не только к го родам, но и к другим множествам «конкурентов»,
частные случаи которых рассматривались и ранее
многими авторами. Так, гиперболическое распре деление слов по частоте их встречаемости в тексте обычно называют законом Эсту—Ципфа—Ман д е л ь б р о т а ( р и с .5 ) . Р а с п р е д е л е н и е б о г а ч е й п о и х
богатствам в древних государствах (да и в современных) принято называть законом Парето. Рас пределение ученых по числу опубликованных
ими статей — законом Альфреда Лотки. Чтобы не
замыкаться на человеческой деятельности, про иллюстрируем указанную зависимость картинка ми для океанического биоценоза (рис. 6) и малых
космических тел (рис.7). Около 500 различных
примеров гиперболических распределений при ведено в книге [2]. Поэтому распределение конку рентов вполне заслуженно можно поставить
в один ряд с четырьмя великими распределения ми. Обычно обсуждаются лишь эмпирические за кономерности конкретных множеств конкурен -
тов, хотя попытки теоретического обоснования
распределения конкурентов также предпринима лись и ранее. Краткий обзор этих усилий приве ден, в частности, в [3]. Но, по нашему мнению,
многие из этих попыток не были столь последова тельны, как изложенный выше подход, основан ный, по существу, на полной аналогии с термодинамикой частиц, достигнутой путем введения об щего понятия качества и квазиэнтропии мно жеств конкурентов. Ряд примеров множеств кон курентов приведен в наших работах [1, 3, 4], где
рассмотрено около 20 примеров таких распреде лений.
Отметим, что такие множества должны состо ять из достаточно большого числа объектов,
и (следуя А.В.Бялко [5]) их удобно называть «ши рокими распределениями», в отличие от сравни тельно «узких» распределений гауссовского типа.
В них по существу отсутствует понятие среднего
значения, вокруг которого группировалась бы ос новная масса объектов. Этим свойством множест ва конкурентов резко отличаются от множеств,
подчиняющихся нормальному распределению
Гаусса n m ~ e x p [ – a (m – < m > ) 2 ]. В ч и с т о г и п е р б о л и ческом распределении (при a → 0) полная «масса»
множества
равна
интегралу
M = ∫ m n md m =
= A l n (m m a x/m m i n) . К а к в и д и м , о н а о д и н а к о в ы м л о г а рифмическим образом определяется и верхним,
и нижним пределами спектра. Эта слабая лога рифмическая зависимость от обоих пределов ука -
18
ПРИРОДА • №11 • 2004
________11-04.qxd 22.10.04 18:23 Page 19
СТАТИСТИКА
Рис. 6. Распределение обитателей Мирового океана по размерам (данные канадских ученых). По вертикальной оси
указана концентрация «живого вещества» с размерами из данного интервала (размер оценивается по диаметру шара,
равного по объему рассматриваемой особи). Все организмы распределены так, что на каждый десятичный интервал
приходится практически одинаковый суммарный вес. Это соответствует гиперболическому распределению (17).
сумма всех финансов и число владельцев; число
всех выбранных для анализа ученых и массив статей; число всех рыб (на кубометр воды) и число
рыб с определенным весом в стандартных логарифмических интервалах; число всех космичес ких тел, отобранных для анализа (число видов тел
здесь не учитывалось, что соответствует пределу
a → 0 в формулах).
Во что играет природа?
Рис. 7. Интегральный спектр распределения малых
космических тел по их массам, различающимся
на 30 порядков. N — число данных тел в 1 см 3 .
зывает на устойчивость таких распределений. По добное свойство оказывается особенно важным
для различных социально-экономических про блем, в целом называемых «макроэкономикой»
(распределение доходов, структура различных
фирм и пр.).
Во всех случаях можно указать пару дополни тельных условий, при которых вычисляется экс тремум квазиэнтропии. Для перечисленных при меров ими будут: длина текста и длина словаря;
ПРИРОДА • №11 • 2004
Конечно, к формуле (16), содержащей три па раметра, можно относиться и просто как к удоб ной аппроксимационной формуле (как говорит ся — не более того). Однако полезно подчеркнуть,
что и все четыре «главных» для неживой природы
распределения также содержат по три параметра.
Для распределения Гаусса — это коэффициент
н о р м и р о в к и , с р е д н е е з н а ч е н и е < x > и 1 /β — с р е д неквадратичное отклонение (полуширина кривой
Г а у с с а ) . Д л я р а с п р е д е л е н и й n1,2,3 — э т о п а р а м е т р ы
α, β и к о э ф ф и ц и е н т н о р м и р о в к и .
Заметим также, что все три главных для физи к и ч а с т и ц р а с п р е д е л е н и я n 1 , 2 , 3, в с у щ н о с т и , п о л у чаются из «игры в перестановки» всего лишь
с д в у м я ч и с л а м и N и K, т о ч н е е с о с л а г а ю щ и м и и х
ч а с т я м и n m, к о м б и н и р у е м ы м и т р е м я р а з н ы м и
способами. Образно можно сказать, что именно
простота и естественность их трех комбинаций
с перестановками приводят к столь фундамен тальной роли этих трех распределений в неживой
природе. Аналогично этому и четвертое распре деление — распределение конкурентов — получается из «игры в перестановки» с теми же двумя
ч и с л а м и и т е м и ж е с о с т а в л я ю щ и м и и х ч а с т я м и n m.
По нашему мнению, это позволяет считать по 19
________11-04.qxd 22.10.04 18:23 Page 20
СТАТИСТИКА
следнее столь же основополагающим для приро ды, как и три первых распределения. По-видимо му, природа (или теория вероятностей) просто не
может «придумать» какую-либо еще одну новую
«игру в перестановки» с теми же числами N , K и их
ч а с т я м и n m.
Здесь, конечно, имеется в виду новая «игра»,
которая имела бы какой-нибудь разумный смысл.
Например, простая принудительная (не обосно ванная разумными соображениями) перестановка
числителей со знаменателями во всех трех фунда м е н т а л ь н ы х с л у ч а я х n 1,2,3 н е и з м е н и т и х о к о н ч а тельных результатов, поскольку это привело бы
лишь к изменению знаков логарифмических чле нов в знтропии, но ее экстремум (с заменой мак симума на минимум) дал бы те же распределения
n 1 , 2 , 3. ( Б ы т ь м о ж е т , н а ш и ч и т а т е л и с а м и п о п р о б у ю т
изобрести новую игру в перестановки с теми же
ч и с л а м и n m?)
Именно указанная фундаментальность рас пределения конкурентов (как результат игры
больших чисел), по-видимому, и приводит к не-
обычайно широкой его распространенности как
в живой, так и в неживой природе. С этой точки
зрения, например, часто используемое так назы ваемое логнормальное распределение (распреде ление Гаусса с логарифмическими аргументами)
можно рассматривать лишь как удачную аппрок симацию, поскольку оно не выводится из какихлибо общих положений, подобных использован ным нами. Иногда считают (см., например [6]),
что распределение Гаусса (3) описывает ситуа ц и ю с м н о ж е с т в а м и а д д и т и в н ы х в е л и ч и н ( с с у ммой вероятностей), а логнормальное распределе ние относится к множествам мультипликативных
величин. Но ведь в логнормальном распределе нии фигурируют не просто логарифмы, а квадраты логарифмов в экспоненте, и эти логарифмы
введены искусственно, просто для «охвата» ши роких интервалов аргументов. Поэтому в логнормальное распределение нельзя разумным обра зом ввести учет двух дополнительных условий (6)
и (10), составленных из сумм. Так что мы вполне
справедливо поставили в ряд со знаменитыми
Литература
1.
2.
3.
4.
5.
6.
Трубников Б.А. Закон распределения конкурентов // Природа. 1993. №11. C.3—13.
К у д р и н Б . И . В в е д е н и е в технетику. Томск, 1993.
Т р у б н и к о в Б . А . , Р у м ы н с к и й И . А . // Докл. АН СССР. 1991. Т.321. №2. C.270.
Трубников Б.А. О законе распределения конкурентов // Природа. 1995. №11. C.48—50.
Бялко А.В. Конструктивность закона конкуренции // Природа. 1993. №11. C.14—19.
Карасев Б.В. Логарифмически-нормальное распределение // Природа. 1995. №11. С.41—48.
Космические
исследования
Солнце вредит
спутникам
4 ноября 2003 г. на Солнце
произошла мощная вспышка,
вызвавшая сильнейший поток
частиц высокой энергии. Она
была завершающей в серии ей
подобных, происходивших в
д в у х ч р е з в ы ч а й н о а к т и в н ы х о бл а с т я х С о л н ц а 1. Э т и я в л е н и я
з а м е т н о п о в л и я л и н а ф и з и ч е скую обстановку в окрестностях
Земли, что зафиксировали, в
частности, приборы на борту
с п у т н и к а « G O E S » . П о т о к и в ы с окоэнергетичных частиц были
настолько интенсивными, что
бортовые приборы ИСЗ «ACE»
1
Что случилось с Солнцем? // Природа. 2004. №10. С.80.
20
(«Advanced Composition Explo rer»), предназначенного для
изучения химического состава
околоземной среды, на время
зашкалило, и измерения прервались.
Из Японии пришли сооб щения, что с ее спутником
« A D E O S- 2» была прервана связь;
временно она была нарушена
и с японским спутником «Coda ma», используемым для ретран сляции солнечно-геомагнитн ы х д а н н ы х с других ИСЗ. Ана л о г и ч н ы е т р у д н о с т и и с п ы т ывало оборудование спутника
«SMART» («Small Missions for
Advanced Research in Techno logy»), запущенного на пере ходную орбиту Европейским
космическим агентством.
У ряда коммерческих геостационарных спутников-ре-
трансляторов телевизионных
сигналов снизилось энергопитание из-за повреждения сол н е ч н ы х б а т а р е й ч а с т и ц а м и в ысоких энергий.
Earth System Monitor. 2003. V.14. №1.
P.3 (США).
Следить за «погодой»
на Солнце
Европейское космическое
агентство намерено в начале
2 0 0 6 г . в ы в е с т и н а о к о л о з е мную
орбиту
миниатюрный
с п у т н и к « P R O B A- 2» («Project
for On-board Autonomy» —
«Проект бортовой автономии»), которому предстоит
стать родоначальником спут ников, способных автономно
п р и н и м а т ь р е ш е н и я в з а в и с имости от обстановки в окружа-
ПРИРОДА • №11 • 2004
Документ
Категория
Без категории
Просмотров
20
Размер файла
294 Кб
Теги
пять, трубникова, вероятности, тpубников, великий, распределение
1/--страниц
Пожаловаться на содержимое документа