close

Вход

Забыли?

вход по аккаунту

?

BlaynsteinKryk

код для вставкиСкачать
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное
образовательное учреждение высшего образования
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ
Н. Ш. Блаунштейн, Е. А. Крук, М. Б. Сергеев
ОПТИЧЕСКАЯ СВЯЗЬ:
ОПТОВОЛОКОННАЯ,
АТМОСФЕРНАЯ
Монография
Санкт-Петербург
2016
УДК 621.39.029
ББК 32.884
Б68
Рецензенты:
доктор технических наук, профессор Карпов Юрий Глебович;
кандидат технических наук, доцент Лесман Михаил Яковлевич
Утверждено
редакционно-издательским советом университета
в качестве монографии
Блаунштейн, Н. Ш.
Б68Оптическая связь: оптоволоконная, атмосферная: монография / Н. Ш. Блаунштейн, Е. А. Крук, М. Б. Сергеев. СПб.:
ГУАП, 2016. – 286 с.
ISBN 978-5-8088-1157-7
Настоящая монография является работой, концептуально объединяющей большинство элементов и фундаментальных аспектов оптической связи.
В монографии последовательно излагаются основы и математические модели распространения оптических волн в материальных средах, волноводных структурах, рассматриваются вопросы модуляции
и кодирования информации в оптических каналах связи, источники
и детекторы оптического излучения различных диапазонов.
Отдельно рассматриваются вопросы распространения оптического излучения в атмосфере и тропосфере, влияние на него таких неоднородностей как гидрометеоры и турбулентность.
Материал в главах иллюстрирован, что позволяет читателю быстрее и легче его усваивать, наиболее полно понимая суть проблем
оптической проводной и беспроводной связи.
Монография ориентирована как на инженеров, занимающихся
разработкой оптических устройств и систем, так и на широкий круг
читателей: магистрантов, аспирантов и исследователей в области оптической связи – беспроводной и оптоволоконной.
УДК 621.39.029
ББК 32.884
©
©
Блаунштейн Н. Ш., Крук Е. А.,
Сергеев М. Б., 2016
Санкт-Петербургский государственный
университет аэрокосмического
приборостроения, 2016
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И СИМВОЛЫ
εr =εr′ + iεr′′′ – комплексная относительная диэлектрическая
проницаемость; εr′ =ε′ / ε0 – ее реальная часть; εr′′′ =ε′′ / ε0 – ее
мнимая часть;
n= n′ + in′′′ – комплексный относительный коэффициент рефракции, n′= εr′ – его реальная часть, n′′= εr′′ – его мнимая
часть;
1
ε0 = 10−9 (Ô/ì) – диэлектрическая проницаемость сво36π
бодного пространства;
γ = α + iβ – параметр распространения волны в маиериальной
среде; α – параметр затухания волны в среде; β – скорость изменения фазы волны;
fD – Допплеровский сдвиг частоты несущего сигнала;
PDF (x) – плотность полной функции вероятности случайной переменной х;
CDF (X) – полная функция вероятности вероятности случайной переменной х;
τd – среднеквадратичное уширение сигнала запаздывания
по времени;
Bc – полоса когерентности канала связи;
Tc – полоса Допплеровского уширения частоты;
Tc – время когерентности;
К – параметр фединга Райса;
SNR ≡ S / N – отношение сигнала к шуму;
С – ёмкость канала цифровой связи;
Bω – полоса частот канала связи;
C = C./ Bω – спектральная эффективность канала связи;
ДСК – двоичный сммметричный канал;
АБГШ – аддитивный белый Гауссовый шум;
C ÀÁÃØ – пропускная способность АБГШ-канала;
РС-коды – коды Рида-Соломона;
БЧХ-коды – циклические коды;
BER – частота ошибок в информационных битах;
λ c,nm – критические длины волн оптических мод;
fc,nm – критические частоты оптических мод;
γnm – параметр распространения волноводных оптических
мод;
М – фактор дисперсии материала оптоволокна;
3
τ
∆   – уширение импульса сигнала на один км длины оптоl
волокна;
α(λ) – концентрация аэрозолей в атмосфере как функция
высоты z;
α(λ) – коэффициент рассеяния оптического сигнала;
L0 – внешний (макроскопический) масштаб турбулентной
структуры;
l0 – внутренний (микроскопический) масштаб турбулентной
структуры;
CV2 - структурная постоянная флуктуаций скорости турбулентного потока;
Cn2 – структурный параметр флуктуаций индекса рефракции;
CT2 – структурный параметр флуктуаций температуры среды;
Cε2 – структурный параметр флуктуаций диэлектрической
проницаемости;
N = (n − 1) ⋅ 106 – рефрактивность (в N-единицах);
σ2I – индекс сцинтилляции по интенсивности оптического
сигнала;
Nadd – мощность аддитивного Гаусового шума;
Nmult – мощность мультипликативного шума;
Bω - полоса частот аддитивного шума;
BΩ - полоса частот мультипликативного шума;
CNRZ – полная ёмкость оптического канала для невозвратных к нулю кодов;
CRZ – полная ёмкость оптического канала для возвратных к
нулю кодов
4
Часть I
ФУНДАМЕНТАЛЬНЫЕ АСПЕКТЫ
СИСТЕМ ОПТИЧЕСКОЙ СВЯЗИ
ГЛАВА 1. ОСНОВНЫЕ ЭЛЕМЕНТЫ ОПТИЧЕСКОЙ СВЯЗИ
1.1. Частотный спектр оптических волн
Оптическая система, проводная и беспроводная, передает
аналоговую и дискретную информацию от источника оптических волн к приемнику, от одного приемника к другому приёмнику, используя несущие частоты, простирающиеся в диапазоне от 100 ТГц до 1000 ТГц в видимой оптической и инфракрасной областях электромагнитного спектра [1–15]. Как следует из
рис. 1.1, все микроволновые частоты расположены в спектре на
пять порядков ниже (от 1 до 10 ГГц) нежели оптические частоты
(от 100 до 1000 ТГц).
Верхняя часть оптического спектра, изображенная на
рис. 1.1, содержит ультрафиолетовую (УФ) область, видимую
область и ближнюю инфракрасную (ИК) область. Последняя область включена нами в рассмотрение, так как большинство оптоволоконных линий связи используют несущую частоту волны
в этом диапазоне, имеющем наименьшие потери во внутренней
стеклянной поверхности оплетки оптического волокна [8–10].
Существуют также линии оптической связи в видимом оптическом и инфракрасном диапазонах, основанные на использовании пластиковой внутренней поверхности оплетки волокна,
имеющие большие потери в энергии. Поэтому, такие оптоволокна применяют для коротких линий связи. Так, оптоволоконная
система с пластиковой внутренней поверхностью оплетки, оперирующая в полосе длин волн от 650 нм до 670 нм, имеет потери
1 нм
1 мм
1м
3 х 10 5
Длинные
радиоволны
1 мкм
Средние
радиоволны
Инфракрасный
1 пм
Микроволны
λ
Х лучи
Видимый
Y лучи
11
8
3 х 1014 3 х 10 3 х 10
3 х 1017
Ультрафиолет
19
f 3 х 10
f, Гц
Очень
низкочастотные
радио волны
(ОНЧ)
λ, м
1 км
Рис. 1.1. Электромагнитный спектр,
включающий в себя оптический спектр
7
1015
Оптические усилители
БС, (бит/с)·км
1012
Световые волны
109
106
10
1
3
Микроволны
Коаксиальный кабель
Телефон
Телеграф
1850
1900 Год
1950
2000
Рис. 1.2. Эволюция радио и оптической связи
в зависимости от скорости передачи информации
в битах на секунду и на километр
при распространении оптической волны от 120 до 160 дБ на км,
тогда как в полосе частот от 800 до 900 нм потери составляют
3–5 дБ на км, а в полосе частот от 1250 до 1350 нм – от 0,5 до
0,25 дБ на км, соответственно.
Известно, что длина волны (λ) и частота (f) связаны соотношением: λ = c/f, где с – скорость света в свободном пространстве (т. е.
в вакууме). Так, длина волны λ = 1,5 мкм соответствует частоте
f = 2⋅1014 Гц = 2⋅102 ТГц, и соответствующий этой частоте период
колебаний оптической волны, T = 1/f, равен T = 0,5⋅10–14 c.
Достаточно широкая полоса пропускания оптического канала связи позволила увеличить скорость передачи битов информации в секунду (БС), приведенную к расстоянию, за последние
приблизительно 150 лет с ∼102 до ∼1015 бит в секунду на км (бит/скм) (смотри кривую на рис. 1.2, построенную на основе данных,
взятых из работ [7, 12, 14]).
1.2. Развитие оптической связи в исторической перспективе
Существуют пять генераций оптических систем связи (см.
рис. 1.3), которые отличаются друг от друга полосой пропускания по частоте, скоростью передачи информации (в Мегабит
в секунду) и расстоянием между оптическими терминалами,
передатчиком и приемником оптических сигналов [7, 12, 14].
8
1,000,000
Оптические решения
100,000
10,000
БС, (бит/с)·км
1000
100
10
Оптические
усилители
Когерентное
детектирование
1.55-мкм
одномодовый лазер
1.3-мкм
одна-мода
0.8-мкм
мульти-мода
1
0,1
1974 1976
1978
1980
1982
1984
1986
1988
1990
1992
1996
Год
Рис. 1.3. Эволюция оптических средств связи по скорости
передачи данных на километр по годам
Первая Генерация:
– Стартовала в 1980 году;
– Длина волны – 800 нм;
– Скорость передачи битов – 45 мегабит в секунду (Мбит/с);
– Расстояние между оптическими терминалами – 10 км.
Вторая Генерация:
– Стартовала в течение 1980-х годов;
– Длина волны – 1300 нм;
– Скорость передачи битов – 4,5 гигабит в секунду (Гбит/с);
– Волоконно-оптическая структура с одной модой распространения;
– Расстояние между оптическими терминалами – 20–30 км.
Третья Генерация:
– Стартовала в 1990 году;
– Длина волны – 1550 нм;
– Скорость передачи битов – 2,5 гигабит в секунду (Гбит/с);
– Волоконно-оптическая структура с одной модой распространения;
– Волоконно-оптическая структура с дисперсией и смещением частоты;
– Расстояние между оптическими терминалами – 60–70 км.
Четвертая Генерация:
– Стартовала в 1996–1997 годах;
– Скорость передачи битов –5–10 гигабит в секунду (Гбит/с);
– Характерна наличием оптических усилителей;
– Мультиплексирование за счет деления по длине волны (по
частоте);
9
– Расстояние между оптическими терминалами – 60–80 км.
Пятая Генерация:
– Стартовала в конце девяностых-начале двухтысячных;
– Скорость передачи битов – более 10 гигабит в секунду
(Гбит/с);
– Характерно наличие солитонов;
– Плотное мультиплексирование за счет деления по длинам
волн (по частоте);
– Компенсация дисперсии по частоте;
– Расстояние между оптическими терминалами – до 100 км.
1.3. Представление канала оптической связи
Дадим теперь определение оптоволоконного канала связи,
как проводного канала связи, и атмосферного канала связи, как
беспроводного канала связи.
Оптическую связь, осуществляемую посредством оптоволокна можно рассматривать как завершенную оптическую систему, содержащую передатчик, канал оптоволоконной связи и
приемник, как это показано на рис. 1.4 согласно работам [7–12].
Информация, проходящая через такую линию, представлена
в электронном виде, зачастую в форме волны тока. Передатчиком является источник световых волн, который после соответствующей модуляции переносит информацию по оптоволокну
(все детали смотрите в последующих главах).
Что касается дискретного сигнала информации, то здесь световой луч включается электронным способом для получения
бита, имеющего значение единица (1), и выключается электронным образом – для получения бита, имеющего значение ноль (0).
При этом оптический луч выступает как носитель дискретной
информации. В качестве источника оптического луча обычно
используют световые диоды – эмиттеры или лазерные диоды
Оптоволокно
Передатчик
Приёмник
Рис. 1.4. Схема оптической проводной системы связи
посредством оптоволоконной линии
10
(все определения будут даны в гл. 6), чьи характеристики определяют поведение распространяющихся оптических волн [1–6].
Промодулированный световой луч, а именно, информация вместе с переносчиком световой волны, затем распространяется
вдоль оптического волокна на нужные расстояния от источника
к приемнику.
Таким образом, любая оптическая система связи, будь то проводная или беспроводная, содержит в себе три основных компонента (или блока):
а) передатчик,
б) канал связи,
в) приемник,
как это показано на рис. 1.5.
На вход передатчика поступает электронный сигнал, дискретный носитель информации в виде битов, а на его выходе
создается промодулированный оптический сигнал. Другими
словами, электронный сигнал преобразуется в оптический (Э/Опреобразование), созданный световым диодом-эмиттером (ЛЭД)
или лазером [6, 12] (см. гл. 6). Этот сигнал и является переносчиком дискретной информации по каналу связи, как это видно
из рис. 1.5. В приемном устройстве оптический сигнал преобразуется в электронный (О/Э – преобразование) и через дискретный детектор (Д.Д.) передается в виде последовательности битов
информации.
Передающее устройство включает в себя модулятор, драйвер,
источник световых волн и оптику (рис. 1.6). Модулятор преобраПередатчик
Биты
Э/О
Приемник
Канал
О/ Э
Д .Д
Биты
Рис. 1.5. Схема оптической системы связи,
проводной или беспроводной
Передающее устройство
Данные
в битах
Модулятор
Драйвер
Лазер
Световой
Оптическая поток
система
Рис. 1.6. Схема передатчика световых волн
11
зует биты информации в аналоговый сигнал, который и переносит поток символов. В зависимости от вида аналогового сигнала,
поступающего на драйвер, последний подает этот аналоговый
(токовый) сигнал на вход источника световых волн. Источником света выступает либо световой эмиттерный диод (СЭД) либо
лазер, являющийся некогерентным и когерентным источником
света, соответственно. Источник преобразует электронный сигнал в оптический сигнал [6, 12] (см. гл. 6). Оптика фокусирует и
направляет световой луч (волну) от выхода источника в направление на приемник через оптический канал связи.
Выход канала связи соединен с входом приемного устройства, который принимает оптический сигнал из канала связи
с помощью фотодетектора, согласованного с выходным сопротивлением линии связи (во избежание дополнительных помех),
усиливает его, конвертирует в электронный сигнал, а затем демодулирует этот сигнал (выбирает информацию из промодулированного сигнала).
Приемник включает в себя оптику, фильтр, поляризатор, детектор, усилитель, часовой механизм для синхронизации по времени поступающих на вход сигналов и устройство принятия решений (см. рис. 1.7). Оптика концентрирует мощность принимаемого сигнала и передает на фильтр, который пропускает на поляризатор оптические сигналы только требуемой длины волны.
Выходные
биты
данных Устройство
принятия
решений
Приемник
Аналоговоцифровой
преобразователь (АЦП)
Приемный
фильтр
Временной
синхронизатор
Свет
Оптическая
система
Фильтр
Фотодиод
Рис. 1.7. Схема приемного устройства
12
ИУ
Канал
Фотоны
Рассеяние
Поглощение
Рис. 1.8. Атмосферный оптический канал
Поляризатор, в свою очередь, пропускает на детектор только световые волны требуемой поляризации. Приемник, в большинстве случаев представляющий собой полупроводниковое
устройство в виде положительного-внутреннего-отрицательного
(ПВО) фотодиода, преобразует оптический сигнал в электронный сигнал тока (смотри детали в гл. 6).
Импедансный усилитель (ИУ) усиливает электронный сигнал, полученный от детектора. Часовой механизм синхронизирует сигналы для дальнейшего анализа на устройстве принятия решений, основываясь на сигнале, поступающем от выхода
усилителя ИУ. Устройство принятия решения оценивает полученную информацию, основываясь на совпадении электронного
сигнала (от ИУ) и синхронизирующего сигнала, поступающего
от часового механизма через сэмплер.
Атмосферный канал беспроводной связи обычно ослабляет оптический сигнал, уменьшает его мощность, уширяет его
в пространстве и времени, сдвигает его по углу прихода в азимутальной плоскости, а также приводит к изменению поляризации оптической волны [13, 15].
Потери мощности сигнала и затухание, уширение и рассеяние оптического луча являются стохастическими процессами,
которые являются результатом взаимодействия световой волны
с атмосферными газами, аэрозолями или в результате влияния
турбулентности среды. Атмосферные газы в основном поглощают
свет, тогда как аэрозоли поглощают и рассеивают свет (рис. 1.8).
Турбулентность среды вызывает как когерентную (конструктивную), так и некогерентную (деструктивную) интерференцию, которая вызывает флуктуации интенсивности принимаемого оптического сигнала, сцинтилляцию его амплитуды и фазы, а также
уширение и сдвиги лазерного луча в плоскости приемника – процессы, которые будут подробно описаны в гл. 10.
13
Литература
1. Jenkis F. A., White H. E. Fundamentals of optics, New York:
McGraw-Hill, 1953..
2. Born M., Wolf E. Principles in optics, New York: Pergamon
Press, 1964.
3. Файн В. М., Ханин Я. И. Квантовая радиофизика. – М: Советское радио, 1965.
4. Ахманов С. А., Хохлов Р. В. M: Физматгиз, 1965.
5. Lipson S. G., Lipson H. Optical physics, Cambridge: University
Press, 1969.
6. Akhamov S. A., Khohlov R. V., Sukhorukov A. P. Laser
Handbook, North Holland: Elsevier, 1972.
7. Marcuse O. Light transmission optics, New York: Van
Nostrand-Reinhold Publisher, 1972.
8. Kapany N. S., Burke J. J. Optical waveguides, Chapter 3, New
York: Academic press, 1972.
9. Fowles G. R. Introduction in modern optics, New York: Holt,
Rinehart and Winston Publishers, 1975.
10. Midwinter J. E. Optical fibers for transmission, New York:
Wiley, 1979.
11. Hecht E. Optics, MA: Addison-Wesley, Reading, 1987.
12. Optical fiber sensors: Principles and components. Ed. by
J. Dakin and B. Culshaw, Boston-London: Arthech House, 1988.
13. Kopeika N. S. A System engineering approach to imaging,
Washington: SPIE Optical Engineering Press, 1998.
14. Handbook: Engineering electromagnetics applications, Ed.
by R. Bansal, New York: Taylor & Francis Group, 2006.
15. Blaunstein N., Arnon Sh., Zilberman A., Kopeika N. Applied
aspects of optical communication and LIDAR, New York: CRC
Press, Taylor & Francis Group, 2010.
14
ГЛАВА 2. ОСНОВЫ РАСПРОСТРАНЕНИЯ
ОПТИЧЕСКИХ ВОЛН
2.1. Единая электромагнитная природа оптических волн
и радиоволн
Основы электромагнетизма и электродинамики играют ключевую роль в современных системах коммуникации, радио и оптических, включая оптические телекоммуникационные системы [1–9]. Поэтому, электомагнитные явления, описываемые математически с помощью единой теории Максвелла, полностью
применимы для понимания процессов, происходящих в оптических и лазерных системах коммуникации [1–3, 10–14], и на
которой мы детально остановимся при дальнейшем изложении
данной главы.
Сразу же отметим, что оптическая связь стала быстро развиваться только после появления в 60-х годах 20-го столетия оптических приемо-передающих устройств – лазеров, о которых
речь пойдет в гл. 6. Атмосферное распространение оптических
волн началось параллельно с улучшением качества и рабочих
характеристик лазеров и с более глубоким пониманием процессов, происходящих в пространстве и во времени с оптическими
волнами. Так, проблемы влияния погодных условий, условий
прямой и непрямой видимости, изменения траектории оптического луча, его уширения за счет влияния различных атмосферных газовых и водных структур (аэрозолей. тумана, турбулентности, дождя, снега, облаков, и т. д.) полностью перевернули
представление об основных проблемах оптической беспроводной связи в сравнении с обычной оптической связью в свободном
пространстве.
В тоже время в середине 60-х прошлого столетия было предложено направленное распространение оптических волн посредством оптоволокон, как стратегическая основа обхождения
многих проблем атмосферной оптической беспроводной коммуникации и, прежде всего, явлений многократного отражения,
рассеяния, дифракции, рефракции и фединга, вызванных неоднородными атмосфнрными структурами, упомянутыми выше.
Но только в 70-х годах прошлого столетия было создано высокопрозрачное стеклянное волокно, составляющее основу современного оптоволоконного канала проводной саязи.
15
x
y
E
V
H
z
Рис. 2.1. Представление оптической волна,
как электромагнитной волны, с электрической E
и магнитной H компонентой, их формы
и направления распространения,
определяемое вектором волны k
Ввиду того, что оптические волны имеют ту же природу, что
и любые иные виды электромагнитных волн, составляя лишь
небольшую часть спектра частот (или длин волн, смотрите
рис. 1.1, гл. 1), мы можем обьяснить природу оптических волн,
следуя единой теории Максвелла, охватывающей весь спектр
электромагнитных волн [1, 2, 10–13]. Согласно этой теории,
электромагнитное поле произвольного излучения можно представить в виде электромагнитной волны, представляющей собой связанные в пространстве и во времени поля, электическое
и магнитное, как это схематически представлено на рис. 2.1.
Из данного рисунка следует, что элентромагнитная волна распространяется в направлении, перпендикулярном обеим компонентам, электрической (E) и магнитной (H), электромагнитного поля волны. На рисунке это направление определено осью
oz в Декартовой системе координат и направлением волнового
вектора k. Вдоль ортогональных осей оy и ox соответствующие
колеблющиеся магнитная и электрическая компоненты поля
повторяют свою волновую форму на расстояниях в одну длину
волны, как это видно из рис. 2.1.
Обе компоненты электромагнитной волны колеблются синфазно по времени, но с разными фазами в пространстве [1, 2,
16
10–13]. При этом магнитная компонента волны связана с электрической компонентой волны, создавая в совокупности единую
мощность волны, описываемую и переносимую вдоль оси oz вектором Умова-Пойнтинга (смотрите все определения ниже).
В тоже время, используя известный из электродинамики
прицип Гюйгенса [10–13], можно показать, что электромагнитные волны распостраняются от источника излучения только
прямолинейно, аналогично лучам света с минимальными потерями энергии и минимальными затратами по времени. Этот
постулат соответствует Принципу Ферма из Оптики [2, 7, 15],
согласно которому луч света распространяется в безграничном
свободном пространстве вдоль траектории, вдоль которой он затрачивает минимальное количество световой энергии и время
своего прохождения, т. е., распространяется вдоль прямой линии.
Тогда можно представить Принцип Гюйгенса в виде, как это
показано на рис. 2.2, согласно которому луч из каждой точки
свободного пространства распространяется во всех направлениях вперед и формирует множество элементарных сферических
волновых фронтов, названных Гюйгенсом элементарные сферические волны (или – элементарные фронты).
Огибающая этих элементарных фронтов формирует новые
волновые фронты. Другими словами, каждая точка на фронте
Новый
волновой
фронт
Старый волновой фронт
Рис. 2.2. Схематическое представление принципа
Гюйгенса для доказательства тождественности
электромагнитной волны и оптического луча
17
электромагнитной волны ведет себя как источник вторичных
элементарных сферических волн, описанных с помощью функции Грина, как функции точечного источника (см. [10–13]). Эти
элементарные волны создают новые фронты элементарных волн,
распространяющихся в направлении прямолинейного распространения исходной волны. Как это было показано математически Кирхгофом, следуя теории Максвелла, каждый такой фронт
волны лежит в плоскости, нормальной к волновому вектору k,
определяющему перенос энергии исходной электромагнитной
волной. Перейдем теперь к рассмотрению всех этих явлений распространения, отмеченных выше на качественном уровне, к их
колличественному описанию, следуя единой теории Максвелла.
2.2. Базовые аспекты распространенмя оптических волн
Теоретический анализ распространения оптических волн,
являющихся составной частью всего электромагнитного спектра [1–6] (смотрите также рис. 1.1, гл. 1), основан на уравнениях
Максвелла [10–14]. В векторном представлении в системе единиц СИ, уравнения Максвелла можно записать в следующем
унифицированном виде [1–6]:
∂
B(r ,t),
∂t
(2.1а)
∂
D(r ,t) + j(r ,t),
∂t
(2.1б)
∇ × E(r ,t) = −
∇ ×=
H(r ,t)
∇ ⋅ B(r ,t) = 0, (2.1г)
∇ ⋅ D(r ,t) = ρ(r ,t). (2.1д)
Здесь E(r,t) – вектор напряженности электрического поля (в
вольтах на метр, В/м); H(r,t) – вектор напряженности магнитного поля (в амперах на метр, А/м); D(r,t) – вектор индукции
электрического поля (в кулонах на квадратный метр, К/м2);
B(r,t) – вектор индукции магнитного поля (в веберах на квадратный метр, В/м2); j(r,t) – вектор плотности электрического тока (в
амперах на квадратный метр, А/ м2); ρ(r,t) – плотность электрического заряда (в кулонах на кубический метр, К/м3). Оператор
«ротор», rot≡∇×, является мерой вращения поля, а оператор «дивергенция», div≡∇, является мерой излучения поля (или потока
18
энергии) в заданной точке, где ∇ – это известный из векторного
анализа оператор «набла».
Следует отметить, что для изменяющегося во времени электромагнитного (ЭМ) поля уравнения (2.1г) и (2.1д) могут быть
получены из уравнений (2.1а) и (2.1б). Действительно, взяв дивергенцию от уравнения (2.1а), используя оператор ∇, можно
сразу же получить уравнение (2.1г). Подобным же образом, взяв
дивергенцию от уравнения (2.1б), используя оператор ∇, и используя известное уравнение непрерывности [1–3, 10–13]
∇ ⋅ j(r ,t) +
∂ρ(r ,t)
= 0, ∂t
(2.2)
можно сразу же получить уравнение (2.1д). Поэтому, только
два уравнения системы (2.1), а именно, уравнения (2.1а) и (2.1б),
являются независимыми. В электростатике и магнитостатике,
когда ∂/∂t = 0, электрическое и магнитное поля перестают быть
взаимосвязанными, и уравнение (2.1д) описывает известный закон Кулона, указывающий на порождение потока электрического поля, определяемого вектором D, зарядом плотностью r, содержащимся в среде. Подобный результат постулирует уравнение (2.1г), указывая на реальное отсутствие свободных магнитных зарядов в среде и на сохранение магнитного потока в среде,
который известен также, как закон Гаусса для магнитостатики
[1, 2].
Отметим также, что уравнение (2.1а) соответствует известному закону Фарадея, и указывает на порождение вращающегося электрического поля изменяющимся во времени потоком
магнитного поля. Уравнение (2.1б) в отсутствии члена ∂D/∂t,
описывающего токи смещения в среде [10–13], соответствует известному закону Ампера, согласно которому ток j(r,t) порождает
вращающееся магнитное поле.
Наличие только двух независимых уравнений, (2.1а) и (2.1б),
при четырех неизвестных векторах, E, D, H, B, требует введение
ещё трёх уравнений, связывающих векторы E и D, H и B, j и E,
известных в электродинамике, как уравнения среды, влияющие
на распространение электромагнитных волн через характерные
параметры среды, а именно [10–13]:
B = µ(r )H; (2.3а)
19
D = ε(r )E; (2.3б)
j = σ(r )E.
(2.3г)
Эта связь для неоднородной анизотропной среды обеспечивается тремя скалярными характеристиками среды, являющимися линейной функцией от вектора произвольной точки среды
r, а именно: диэлектрической проницаемостью, ε(r), магнитной
проницаемостью, µ(r), и проводимостью, σ(r). В однородной изотропной среде эти функции трансформируются в обычные скалярные величины, ε, µ и σ, которые однако в дисперсирнной
среде (такой, как плазма) являются также функцией частоты
волны, w, то есть
ε = ε(ω), µ = µ(ω), σ = σ(ω). (2.4)
Ниже речь пойдет об однородной изотропной недисперсной
среде, свободной от внешних источников. В свободном пространстве эти величины и вовсе постоянны, и равны: ε0 = 8,854⋅10–12
Фарад/метр, µ0 = 4π⋅10–7 Генри/метр, дающие универсальную
физическую величину – скорость света в свободном пространстве (в вакууме), равную
=
c
1
ε0 µ 0
≈ 3 ⋅ 108 ì/ñ. (2.5)
Полагая теперь, что поля волны яаляются комплексными
векторами, гармоническими во времени, ∼e–iωt, их можно представить через их реальную часть в виде [10–13]:
A(r,t) = Re A(r)e−iωt  , 

(2.6)
Здесь i = √–1, w – угловая частота (в радианах в секунду),
w = 2pf, f – частота излучения волны (в Герцах, Гц = с–1), и A(r,t) –
один из комплексных векторов E, D, H, B или j.
Применяя выражение (2.6) к системе (2.1) и замненяя ∂/∂t на
–iw, получаем соответственно
∇ × E(r) = iωB(r); (2.7а)
∇ × H(r) = −iωD(r) + j(r); ∇ ⋅ B(r) =0; (2.7б)
(2.7г)
∇ ⋅ D(r) = ρ(r). (2.7д)
20
Если использовать гармоническую зависимость от времени,
∼eiωt, тогда в системе уравнений Максвелла (2.7) надо заменить
i на -i, и -i на i во всех соответствующих членах уравнений (2.7).
Отметим, что все векторы и функции в системе (2.7) являются
преобразованиями Фурье искомых функций и векторов системы (2.1) во временном диапазоне и являются функциями частоты. Их обычно называют фазорами, как рещения соответствующих уравнений (2.1) в частотном диапазоне. Во многих задачах
электродинамики и оптики зачастую вместо системы (2.1) используют систему (2.7) ввиду отсутствия в ней временной зависимости и производных по времени от соответствующих векторов и функций электромагнитного поля волны.
2.3. Распространение оптических волн
в свободном пространстве
Фактически, для описания процесса распространения оптических волн применяют на практике как векторную, так и скалярную форму презентации соответствующих волновых уравнений. В случае свободного пространства, то есть изотропного
однородного безграничного пространства, уравнения Максвелла можно представить в гармонической форме через фазоры соответствующих компонент электромагнитного поля [10–13]:
∇ × µ −1 (r)∇ × E(r) − ω2ε(r)E(r) = iωj(r) − ∇ × µ −1 (r)M(r),
∇ × ε −1 (r)∇ × H(r) − ω2µ(r)H(r) = iωM(r) − ∇ × ε −1 (r)j(r).
(2.8)
Так как большинство задач распространения оптических
волн имееют дело со свободным пространством, свободным от
источников тока j(r) и магнитного поля M(r) то систему (2.8)
можно записать в более простой форме, а именно, используя
соотношения (2.3a)–(2.3д) и учитывая постоянство параметров
среды, то есть ε(r)≡ε, µ(r)≡µ, σ(r)≡σ. В итоге получим [10–13]:
∇ × ∇ × E(r) − ω2εµE(r) = 0,
∇ × ∇ × H(r) − ω2εµH(r) = 0.
(2.9)
Так как оба уравнения в (2.9) симметричны, и магнитное
поле легко выражается через известное электическое поле введением импеданса свободного пространства, равного η0 = 377 Ом,
то можно изначально использовать только первое уравнение
21
системы (2.9) и, учитывая известное соотношение из векторной
алгебры ∇×∇×E = ∇(∇⋅E)–∇2E, при ∇⋅E = 0, получить окончательно
уравнение вида:
∇2E(r) + k2E(r) =
0, (2.10)
2
2
где k = ω εµ. Можно легко показать, что для вектора магнитного
поля, да и для других векторов электромагнитного поля волны,
можно получить аналогичное уравнение, определяемое как волновое уравнение поля в свободном пространстве.
Более того, учитывая, что каждый вектор можно выразить через
его компоненты, скажем в Декартовой системе координат с единичными векторами вдоль осей ox, oy, oz, обозначенными x0, y0,
z0 соответственно, получим в итоге, что E(r) = Exx0+Eyy0+Ezz0.
Поэтому векторное уравнение (2.10) вырождается в три скалярные уравнения типа
∇2 Ψ (r) + k2 Ψ (r) =0, (2.11)
где Ψ(r) может быть либо Ex, Ey либо Ez. Данное уравнение полностью описывает распространение оптической волны в свободном пространстве.
2.4. Распространение оптической волны
через границу двух сред
2.4.1. Граничные условия
Простейшим примером распространения оптической волны
через границу двух сред является случай плоской идеально проводящей границы. Для такой границы полный вектор электрического поля волны равен нулю, то есть E = 0 [1–3,10–13]. В этом
случае тангенциальная (к поверхности границы) составляющая
электического поля на такой идеальной границе равна нулю,
т. е.
Eτ = 0. (2.12)
Соответственно, следуя уравнению Максвелла, ∇×E(r) = iωH(r)
(при µr = 1 и B≡H), получаем в случае идеально проводящей границы равенство нулю нормальной (к поверхности границы) составляющей магнитного поля, т. е.
22
Hn = 0. (2.13)
Вводя снова Декартовую систему координат с осями ox и oy –
вдоль поверхности границы, и с осью oz – нормальной к границе, получим в итоге для идеально проводящей гладкой границы,
вместо условий (2.12), (2.13), общее граничное условие в виде:
Ex (x, y,=
z 0=
) Ey (x, y,=
z 0=
) Hz (x, y,=
z 0=
) 0. (2.14)
2.4.2. Представление коэффициентов отражения
и рефракции
Как было указано в работах [1–3], влияние плоской поверхности раздела двух сред сводится к явлениям, определяемым
как отражение и рефракция падающей волны. Рассмотрим оптическую волну с волновым вектором k0 и частотой ω = 2πf, падающую на границу раздела двух сред, как это представлено
на рис. 2.3. Среды эти обладают разными диэлектрическими,
магнитными и диэлектрическими свойствами, которые определяются параметрами (ε1, µ1, σ1) и (ε2, µ2, σ2) соответственно, для
каждой среды в отдельности.
Отраженная и рефрагированная волны будут тогда соответствовать волновым векторам k1 и k2, соответственно. Вектор n
на рис. 2.3. является единичным вектором, нормальным к границе двух сред, направленным из среды с коэффициентом рефракции n1 в среду с коэффициентом рефракции n2.
z
k1
n
среда1
n1
θ0
θ1
k0
x
среда2
n2
θ0 = θ1
θ2
k2
Рис. 2.3. Отражение и рефракция оптической волны
на границе двух сред
23
Отметим, что в оптике и в различных областях ее применимости зачастую используют немагнитные материалы. В этом
случае можно положить для обеих сред нормализованную магнитную проницаемость равную единице, то есть, µ 1 =µ1 / µ0 =1
и µ 2 =µ2 / µ0 =1. Более того, вместо нормализованных диэлектрических постоянных двух сред, ε1 =ε1 / ε0 и ε 2 =ε2 / ε0 , в оптике обычно используют соответствующие индексы рефракции,
n1 и n2 и, равные n1= ε1 и n2= ε 2 .
Тогда на основе этих параметров среды можно ввести два основных закона классической оптики, называемых в литературе
законами Снеллиуса. Действительно, исходя из законов Максвелла, граничных условий и геометрии, представленной на
рис. 2.3, волновые векторы волн связаны следующими выражениями:
| k0 =| | k1 |≡ k=
ω
ω
n1, | k2 |≡ k2 =
n2 . c
c
(2.15)
Согласно граничным условиям (2.12)-(2.14), можно легко получить условия равенства фаз для каждой волны, падающей,
отраженной и рефрагированной, в плоскости z = 0:
(k0 ⋅ x)z 0=
=
(k1 ⋅ x)z 0=
=
(k2 ⋅ x)z 0 , =
(2.16)
которые не зависят от природы граничных условий. Равенство
(2.16) описывает условие нахождения всех трех векторов в одной
и той же плоскости. Из этого соотношения следует, что
k0 sin=
θ0 k1 sin=
θ1 k2 sin θ2 . (2.17)
Это соотношение есть аналог второго закона Снеллиуса:
n1 sin=
θ0 n2 sin θ2 . (2.18)
Более того, так как |k0| = |k1|, получаем θ0 = θ1 то есть угол падения равен углу отражения. Это и есть первый закон Снеллиуса.
Введем теперь понятия и соответствующие формулы для
коэффициентов отражения и рефракции. Физический смысл
коэффициента отражения следующий: он определяет отношение отраженной компоненты электрического поля оптической
волны к ее компоненте, падающей на границу раздела сред.
Аналогично, коэффициент рефракции определяет отношение
24
рефрагированной компоненты электрического поля оптической
волны, т. е. проникающей из первой среды во вторую, к ее компоненте, падающей на границу раздела двух сред.
Обычно в работах, описывающих распространение оптических волн в различных средах, рассматривают волны с вертикальной и горизонтальной поляризацией в зависимости от ориентации вектора электрического поля волны E относительно
плоскости распространения волны, определяемой вектором k
(см. рис. 2.1). Так, если вектор электрического поля E перпендикулярен плоскости распространения, то волна определена, как
волна c вертикальной поляризацией, и если вектор электрического поля E лежит в плоскости распространения, то волна эта –
волна c горизонтальной поляризацией.
Не входя в детали расчетов (смотрите подробности в работах
[1–3, 10–13]), введем теперь формулы для комплексных коэффициентов отражения (R) и рефракции (T) для оптической волны
с вертикальной (обозначаемой индексом V) и с горизонтальной
(обозначаемой индексом H) поляризацией, соответственно.
Так, для вертикальной поляризации:
RV =
TV =
n1 cos θ0 − n22 − n12 sin2 θ0
n1 cos θ0 + n22 − n12 sin2 θ0
2n1 cos θ0
n1 cos θ0 + n22 − n12 sin2 θ0
;
(2.19a)
.
(2.19б)
Для горизонтальной поляризации:
RH =
−n22 cos θ0 + n1 n22 − n12 sin2 θ0
TH =
n22 cos θ0 + n1 n22 − n12 sin2 θ0
2n1n2 cos θ0
n22 cos θ0
− n1 n22 − n12 sin2 θ0
.
;
(2.20a)
(2.20б)
Зависимость коэффициента отражения от угла падения волны на границу двух сред представлена на рис. 2.4 для двух типов
поляризации волны, вертикальной (RV) и горизрнтальной (RH).
В случае волны с вертикальной поляризацией, зачастую вводят критический угол, при котором отсутствует отраженная
25
Коэффициент отражения
1.0
0.5
RV
0
0
10
20
30
40
50 60 70
Угол падения (градусы)
RH
80
90
Рис. 2.4. Коэффициенты отражения для двух типов поляризации волны, вертикальной (RV) и горизрнтальной (RH) в зависимости
от угла падения волны на границу двух сред
волна, определяемый, как угол Брюстера. Как следует из формулы (2.19a) для RV при условии µ1 = µ2, взятом без нарушения
общности изложения предмета, этот критический угол равен
n 
θ0 ≡ θBr =tan −1  2 .  n1 
(2.21)
Другое интересное явление, называемое полным отражением волны от границы раздела двух сред, происходит при выполнении неравенства n1>>n2, то есть когда θ1>>θ0.
Соответственно, при выполнении условия θ0>>θc, угол отражения будет равен θ1 = π/2, и тогда критический угол, при котором происходит это явление, будет определяться следующим
образом:
n 
sin −1  2 . θc =
 n1 
(2.22)
Другими словами, если угол падения равен критическому
углу полного отражения, т. е., когда θ0 ≡ θc, рефракция падающей волны отсутствует, и нет проникновения энергии волны
через границу из первой (верхней) среды во вторую (нижнюю,
см. рис. 2.3), и волна полностью распространяется в верхней
среде. Это явление называют полным внутренним отражением
26
(ПВО), играющем важную роль в распространении оптических
волн в оптоволокнах и других направляющих волновых структурах (см. гл. 8). При этом угол падения, определяемый равенством θ0≡θc, и будет согласно (2.22) определять явление полного
внутреннего отражения (ПВО).
2.5. Полное внутреннее отражение в оптике
Перепишем снова второй закон Снеллиуса, введенный выше,
для случая θ0 = θ1. Тогда согласно [1–6], имеем:
n1 sin=
θ1 n2 sin θ2 (2.23)
или
sin θ0 ≡ sin=
θ1
n2
sin θ2 . n1
(2.24)
Если первая (верхняя) среда оптически более плотная по
сравнению со второй средой (нижней, см. рис. 2.3), то есть, выполняется условие n1>n2, тогда из равенства (2.24) следует, что
n
sin θ0 > 2 n1
(2.25а)
n1
sin θ0 > 1. n2
(2.25b)
или
Если ввести снова критический угол согласно равенству
(2.22) и переписать его, следуя [1–3], то мы получим следующее
его определение:
n
sin θc = 2 . n1
(2.26)
Итак, для всех углов падения с θ0 > θc. световая волна полностью отразится от границы раздела двух сред и создаст эффект,
определенный выше, как полное внутреннее отражение (ПВО).
Рис. 2.5, полученный согласно расчетам, приведенным в работе
[15], иллюстрирует полное внутреннее отражение при θ0 > θc.
27
Коэффициент отражения
1.0
0.5
RV
0
0
10
20
RH
30
40
50 60 70
Угол падения (градусы)
80
90
Рис. 2.5. Иллюстрация полного отражения при угле падения θ0,
превышающем критический угол в θc≈41°
В оптической связи часто вводят другой важный параметр, эффективный индекс рефракции neff, определяемый
как: neff ≡n1sinθ0 [6–15]. Тогда при угле падения оптического
луча в θ0 = 90°, получим neff ≡n1, а при θ0 = θc, получим из (2.26)
neff ≡n2.
Согласно цитируемым работам [4–15] можно объяснить явление полного внутреннего отражения (ПВО) с другой точки зрения. Так, при явлении ПВО электрическое поле оптической волны во второй среде (см. рис. 2.3) должно полностью отсутствовать. Однако, это не совсем так. Точное решение задачи, с учетом
равентства электрических полей волны на границе двух сред
(см. п. 2.1), указывает на наличие двух волн различного типа.
В первой (верней) среде за счет взаимодействия (интерференции)
прямой и отраженной от границы волн создается в среде стоячая волна. Во второй (нижней) среде электрическое поле волны
затухает экспоненциально в направлении от границы в нижнюю среду, как это показано на рис. 2.6, согласно [15, 16]. Эту
волну называют затухающей или эвансцентной (см. рис. 2.6).
Затухание этой волны описывается следующим образом:
E ∝ exp{−αz}, где фактор затухания определяется как [15, 16]
28
=
α
2π 2
n1 sin2 θ0 − n22 . λ
(2.27)
(2.28)
n1
Е
n2
e−αz
Затухающая волна
Z
Стоячая волна
Рис. 2.6. Электрическая компонента оптической волны
на границе двух сред (при z = 0) , формирующая стоячую волну
за счет отражения от границы и эвансцентную волну,
заиухающую по закону ∼e–azза счет рефракции
Из раветства (2.26) следует, что при критическом угле, т. е.
при θ0 = θc, фактор затухания α→0. Однако, затухание увеличивается при превышении углом падения критического угла,
определяемого равенством (2.26). Так как параметр α мал при
θ0→θc, эвансцентное поле глубоко проникает во вторую среду, но
это проникновение становится все меньшим и меньшим при увеличении угла падения относительно критического угла, то есть
при θ0 > θc.
При этом основные формулы (2.19)–(2.20) зависят от граничных условий. Так, согласно уравнениям Максвелла и граничным условиям, приведенным выше, чтобы поля были непрерывными при пересечении волной границы двух сред, относительно небольшое возмущение поля волны должно быть во второй
среде. Для анализа степени возмущенности поля во второй среде
(нижней, см. рис. 2.3), необходимо воспользоваться формулами
Френеля, представленными выражениями (2.19)–(2.20).
Действительно, если записать известное из тригонометрии
равенство cosθ2 = (1 – sin2θ2)1/2, то при θ2 > θc можно представить
sinθ2, используя дополнительную функцию sinθ2 = coshγ, которая может превысить единицу. Тогда можно записать следующее тригонометрическое соотношение cosθ2 = j(cosh2γ – 1)1/2 = = ±jsinhγ. Это позволяет представить компоненту поля оптической волны во второй среде (для немагнитных материалов
с µ2 = µ1 = µ0) в виде
29
 
x cosh γ − jz sinh γ  
exp  jω t − n2
 c

 
(2.29a)
 
x cosh γ  
 ωn z sinh γ 
exp  − 2
 .  exp  jω t − n2
c
c



 
(2.29b)
или
Данная формула представляет оптическую волну, распространяющуюся в направлении оси z во вторую среду от границы
z = 0 (см. рис. 2.6). скорость затухания амплитуды волны пропорциональна пройденному волной расстоянию z и определяется
выражением
 2πz sinh γ 
exp  −
, λ2


(2.30)
где λ2 = λ0/n2 – длина оптической волны во второй среде. Как
было определено выше, эту экспоненциально затухающую волну в литературе называют эвансцентной волной [15, 16]. Как это
следует из рис. 2.6 и из приведенных формул, данная волна затухает значительно (~e–1) на критическом расстоянии dкр порядка λ2 . Более точное выражение для dкр было получено в работе
[15], учитывая углы падения θ0 оптической волны на границе
двух сред с показателями преломления n1 и n2, соответственно:
dêð =
(
λ2
2π n12 sin2 θ0 − n22
)
1/2
.
(2.31)
Отметим здесь, что данный критический параметр dкр подобен скин слою, обычно применяемому в электродинамике и радиофизике [1–4, 11–13].
В заключении отметим, что картина стоячей и затухающей
волн (см. рис. 2.6) корректна лишь в том случае, когда параметр
рефракции в первой среде превышает параметр рефракции во
второй среде, то есть, n1>n2. Также это корректно, когда имеет
место полное внутреннее отражение, т. е., для углов падения
волны θ0, превышающих критический угол θc, определяемый
равенством (2.26).
30
Чтобы понять рассуждения, приведённые выше, рассмотрим
следуюший характерный пример:
Задана граница между стеклом и воздухом. Свет падает на
стекло под углом в 60°. Необходимо определить фактор затухания на длине волны в λ0 = 1 мкм. Коэффициенты рефракции равны n1 = 1,5 и n2 = 1,0 для стекла и воздуха, соответственно. При
этом n1>n2, а sinhγ = 1,64.
Решение
1) Определим θc = sin–1(1/1,5) = 41,8°.
Итак θ0 = 60°>θc = 41,8°.
2) При z≡λ2 = λ0/n2 = 10–6 м/1 = 10–6 м, получаем согласно (2.30)
 6,28 ⋅ 10−6 ⋅ 1,64 
 2πz sinh γ 
exp  −
exp  −
5,4 ⋅ 10−3.
=
=
−6


λ
10
2




Видно, что энергия оптического луча на расстоянии в 1 мкм
уменьшится более, чем в 24 дБ, проходя границу из стекла в воздух и полоностью затухает в воздухе на одной длине оптической
волны. Другими словами, имеем полное отражение луча обратно в стекло, называемое полным внутренним отражением
(ПВО), используемом эффективно в оптоволокнах, заполненных
стеклом, не позволяющем утечки энергии в воздух, окружающий стекловолокно. При этом вся энергия остается в волокне, не
проникая наружу в воздух.
Представленный пример иллюстрирует тот факт, что в оптоволоконных структурах наблюдается волноводный эффект
канализации оптической энергии, основанный на полном внутреннем отражении (ПВО) оптической волны внутрь оптического волновода без проникновения за границу между материалом
волновода и воздухом. Однако, наличие даже слабого проникновения из более плотной оптической среды в менее плотную среду, приводит к отражению не на самой границе между средами,
а на небольшом расстоянии (∼λ2) от неё – внутри внешней среды, как это следует из рис. 2.7, на котором представлен плоский
оптический волновод, в котором предусмотрен эффект полного
внутреннего отражения (ПВО).
Согласно данному эффекту, известному, как эффект ГоосаХанчина [4], происходит смещение точки ПВО на определенное
расстояние, вынуждая лучи проходить более длинные пути при
31
2
~λ 2
Внутренняя граница
1
Смещение Гооса-Ханчина
Падающий луч
Луч ПВО
Рис. 2.7. Смещение точки ПВО, вызывнные дисперсионными
свойствами материала – заполнителя оптического волновода
прохождении вдоль оптического волновода и к изменению самого эффекта ПВО.
Это происходит ввиду двух факторов: 1) дисперсионных
свойств многомодового распространения оптической волны
вдоль оптического волновода, и 2) за счет дисперсионных свойств
самого материала, которым заполнен данный волновод. Все эти
эффекты будут рассмотрены в гл. 8.
2.6. Распространение оптических волн
в материальных средах
2.6.1. Основные характеристики оптических волн
в материальных средах
Как было проказано выше, каждую компоненту электрического поля волны можно предстравить в виде плоской волны
(например, компоненту вдоль оси ox) в следующем виде
=
E x Ae−γz + Be+γz . (2.32)
Здесь A и B – постоянные, определяемые из соответствующих
задаче граничных условий. Параметр распространения является комплексным и может быть определен через коэффициент
затухания амплитуды волны, α, и через параметр изменения
фазы волны β, а именно
γ = α + jβ. (2.33)
На рис. 2.8 в виде примера приведено затухание волны для
двух разных значений β (то есть, для двух времен t1 и t2). Полное
описание их свойств будет дано позднее, следуя анализу, приведенному в работах [13–15].
32
Электрическое поле
1.0
Пики
амплитуды
t1
t2
0.5
λ
0
Нормализованное
расстояние
–0.5
–1.0
0
1
2
3
4
Нормализованное расстояние
5
Рис. 2.8. Затухание оптической волны в материальной среде
для двух времен t1 и t2
Компоненту магнитного поля вдоль оси oy можно представить в аналогичном виде, используя связь между компонентами волны через внутренний комплексный импеданс среды η, а
именно:
1

=
H
( Ae−γz − Be+γz ). y
η
(2.34)
Ниже мы не будем искать решения соответствующих уравнений (2.32) и (2.34) через конкретные граничные условия. Наша
цель – показать читателю, как свойства материальной среды
меняют условия распространения оптической волны. Для этих
целей рассмотрим параметр распространения γ и его составные
характеристики α и β согласно (2.33), а также скорость изменения фазы vph, длину волны в среде λ и собственный внутренний
импеданс среды η.
Можно показать, следуя работам [11–13], что α и β при
µr = µ/µ0 = 1 можно записать в следующем виде :
1/2
2


ω 2ε 
 σ 

1+ 
1
=
α
−


2 
 ωε 


2


ω 2ε 
 σ 

=
β
1+ 
+
1


2 
 ωε 


;
(2.35a)
. (2.35b)
1/2
33
При этом, скорость изменения фазы vph обратно пропорциональна параметру изменения фазы β, определенном формулой
(2.35б), что в итоге дает :
−1/2
2


2
ω
 σ 
= 1 + 
+ 1
v ph =
.
(2.36)


β
ε
 ωε 


Дисперсионные свойства среды следуют из зависимости фазовой скорости волны от частоты vph = vph(ω). Это проявляется
в том, что волны с различной частотой ω = 2πf распространяются
с различной фазовой скоростью.
Аналогично, длина волны в среде λ обратно пропорциональна
параметру изменения фазы β, определенном формулой (2.35b),
что в итоге приводит к обратной зависимости λ от частоты излучения оптической волны:
2


2π
2 
 σ 

1+ 
1
=
λ
=
+


β f ε
 ωε 


−1/2
.
(2.37)
Учитывая затухание при распространении волны вдоль оси
oz, как это представлено на рис. 2.8, получаем, что вариации
поля волны с расстоянием не являются чисто синусоидальными, как это наблюдается с волной в свободном простраистве.
Другими словами, длина волны в материальной среде не равна
точно расстоянию между двумя соседними положительными
(или отрицательными) экстремумами, а равна расстоянию между двумя пересечениями горизонтальной оси в соседних нулевых точках (см. рис. 2.8).
Собственный внутренний импеданс среды η, как это следует
из формул (2.32) и (2.34), равен отношению амплитуды фазора
электического поля (смотри Параграф 2.2) к фазору магнитного
поля волны, то есть,
E x  η, íàïðàâëåíèå â ïîëîæèòåëüíóþ ñòîðîíó (+)
=
. (2.38)

H
y  −η, íàïðàâëåíèå â îòðèöàòåëüíóþ ñòîðîíó (−)
Теперь представим формулы (2.35) и (2.37), включив в рассмотрение общую презентацию диэлектрической проницаемости среды ε через её комплексную форму, ε = ε′–jε′′. При этом получим
34
где теперь
и
γ2 = (α + jβ)2 = jωµ ( σ + jωε′′ ) − ω2µε′, (2.39)
1/2
2


ω 2ε′ 
 σ + ωε′′ 

=
α
1+ 
−
1


2 
 ωε′ 


(2.40)
1/2
2


ω 2ε′ 
 σ + ωε′′ 
=
β
1+ 
+ 1 . (2.41)


2 
 ωε′ 


Из общих формул (2.39)–(2.41) следут частные случаи для
различных типов материальных сред.
Неидеальная Диэлектрическая Среда. Данная среда характеризуется следующими условиями: σ≠0, но σ/ωε<<1. Используя
известное разложение в полиномиальный ряд
n(n − 1) 2
(1 + x)n =+
1 nx +
x + ...
2!
можно легко получить из (2.40) и (2.41), что
α≈
1 ωε′′
;
ε′ 2

ε′′2 
β ≈ ω ε′  1 + 2 . 
8ε′ 

(2.42a)
(2.42б)
Учитывая факт, отмеченный выше о том, что в оптике обычно оперируют с комплексным параметром рефракции n = n′–jn′′,
в вышеприведенных формулах вместо диэлектрической проницаемости среды ε введем n′ = ε′ / ε0 и n′′ = ε′′ / ε0 согласно работам [5, 6]. В итоге получим для диэлектрика с малыми потерями (или неидеального), что
α≈

ω
n′′2 
ωn′′
ε′′
n′  1 +
, β≈
 и n′′ ≈ n′ . 2


ñ
c
2ε′
8n′ 

(2.43)
Хорошо Проводящая Среда. Хорошие проводники характеризуются следующим условием: σ/ωε>>1, то есть обратным
к условию для неидеального диэлектрика. В этом случае токи
35
проводимости в среде превышают токи смещения, то есть:
| jc |~ σE x >>| jd |~ ωεE x . Тогда из формул (2.40) и (2.41), записав
их через n′ = ε′ / ε0 и n′′ = ε′′ / ε0 , получаем в итоге:
α≈
ωn′′
σω
σ
≈
и n′′ ≈
c
2
2ωε′′
(2.44)
Приведём характерный пример: Заданы коэффициент затухания стекла α = 1,8 см–1 и длина оптической волны в стекле
λ = 10 мкм. Необходимо найти мнимую часть индекса рефракции n″.
Решение
1) Из равенства (2.44) α≈ωn′′/c≡(2π/λ)n′′
получаем
2) n′′ ≈
λ
10−5 ì ⋅ 1,8 ⋅ 102 ì −1
=
α
= 2,9 ⋅ 10−4.
2π
2π
2.6.2. Распространение лазерного луча
в материальной среде
Наиболее встречающимся на практике источником волн
в оптических каналах связи является лазер с Гауссовым распределением интенсивности внутри луча [15, 16]:
{
2
}
=
I I0 exp −2 ( (r / w ) , (2.45)
где w – начальная ширина кругового пятна светового луча и I0 –
выходная начальная интенсивность лазера, r = r / w – нормализованный (к ширине луча) радиус освещённого пятна. Распределение интенсивности луча лазера в плоскости, нормальной
к направлению распространения луча (то есть, в радиальной по
лучу плоскости), представлено на рис. 2.9 согласно работе [16],
используя введенные выше обозначения.
Так как r – это радиальное расстояние, отсчитываемое от
центра луча, параметр w обычно называют размером пятна.
Тогда становится понятным, что при r = w, интенсивность луча I
уменьшается с фактором e–2, то есть, I/I0 = e–2 при r = w. Вдали от
36
I
I0 1.0
0.5
0
–1.5 –1.0
–0.5
0
0.5
r
w
1.0
Рис. 2.9. Зависимость нормированной (к максимуму)
интенсивности Гауссового лазерного пучка
от нормированного радиального расстояния r/w
источника электрическое поле Гауссового пучка в одномерном
случае (вдоль оси z ) можно представить следующей формулой:
2
− r /w
E = E0 e ( ) e−αz e j (ωt −kz) . (2.46)
Тогда интенсивность луча запишется в следующем виде
2
−2 r /w
I =E ⋅ E* =E02e ( ) e−2αz , (2.47)
где E* – это напряженность поля, комплексно сопряженная величине поля E, а E20 – это максимум интенсивности пучка в его
центре (при r = 0, z = 0).
Из формулы (2.47) следует, что максимум интенсивности
в центре пучка лазера для любого расстояния вдоль оси z (вдоль
2
−2 r /w )
.
пути распространения луча) будет ~ E02e (
Литература
1. Jenkis F. A., White H. E. Fundamentals of optics, New York:
McGraw-Hill, 1953.
2. Born M., Wolf E. Principles in optics, New York: Pergamon
Press, 1964.
3. Файн В. М., Ханин Я. И. Квантовая радиофизика. М: Советское радио, 1965.
4. Ахманов С. А., Хохлов Р. В. M: Физматгиз, 1965.
5. Lipson S. G., Lipson H. Optical physics, Cambridge: University
Press, 1969.
37
6. Akhamov S. A., Khohlov R. V., Sukhorukov A. P. Laser
Handbook, North Holland: Elsevier, 1972.
7. Marcuse O. Light Transmission optics, New York: Van
Nostrand-Reinhold Publisher, 1972.
8. Kapany N. S., Burke J. J. Optical waveguides, Chapter 3, New
York: Academic press, 1972.
9. Fowles G. R. Introduction in modern optics, New York: Holt,
Rinehart and Winston Publishers, 1975.
10. Grant I. S., Phillips W. R. Electromagnetism, New York: John
Wiley & Sons, 1975.
11. Plonus M. A. Applied electromagnetics, New York: McGrawHill, 1978.
12. Kong J. A. Electromagnetic wave theory, New York: John
Wiley & Sons, 1986.
13. Elliott R. S. Electromanetics: history, theory, and
applications, New York: IEEE Press, 1993.
14. Kopeika N. S. A System engineering approach to imaging,
Washington: SPIE Optical Engineering Press, 1998.
15. Optical fiber sensors: principles and components, Handbook,
Ed. By J. Dakin and B. Culshaw, Vol. 1, Boston-London: Artech
House, 1988.
16. Palais J. C. Optical communications, in Handbook:
Engineering electromagnetics applications, Ed. by R. Bansal, New
York: Taylor & Francis Group, 2006.
38
Часть II
ОСНОВЫ ПРОВОДНОЙ
И БЕСПРОВОДНОЙ СВЯЗИ
ГЛАВА 3. ТИПЫ СИГНАЛОВ
В ОПТИЧЕСКИХ КАНАЛАХ СВЯЗИ
3.1. Классификация оптических сигналов
В оптических проводных и беспроводных каналах связи формируются такие же сигналы, которые формируются и в радиоканалах, проводных и беспроводных, а именно, непрерывные и
дискретные, то есть, импульсные. Поэтому, тот же математический аппарат применяется в обоих этих случаях, и применим
для описания обоих типов сигналов. В данном параграфе мы
кратко представим математическое описание обоих типов сигналов. Обычно в системах связи, радио или оптической, исследователи и дизайнеры разделяют сигналы по их представлению
в частотном и временном диапазонах.
Так, если имеют дело с непрерывным сигналом (или волной), записанным в гармоническом виде по времени, например, в виде x(t) = A(t)cosωt, охватывающий широкий временной
диапазон, то преобразование Фурье F[x(t)] этого сигнала трансформирует его в сигнал F[x(t)] = Y(f), занимающий в частотном
диапазоне довольно узкую полосу. И, наоборот, если имеют дело
с импульсным сигналом, который охватывает довольно узкий
временной диапазон (называемый периодом импульса), то преобразование Фурье F[x(t)] этого сигнала трансформирует его
в сигнал F[x(t)] = Y(f), занимаюший в частотном диапазоне довольно широкую полосу частот. Поэтому, используя часто применяющуюся в радио и оптической связи терминологию, будем
соответственно называть непрерывный сигнал – узкополосным,
а импульсный сигнал – широкополосным. При дальнейшем изложении материала мы будем пользоваться обоими терминами,
существующими в цитируемой литературе [1–10].
Узкополосные Сигналы. Непрерывный промодулированный
оптический сигнал, распространяющийся по каналу связи с несущей частотой fc, занимает довольно узкий диапазон частот и
может быть представлен в следуюшем виде [1, 4–10]:
=
x(t) A (t)cos [2πfc t + ϕ(t)], (3.1)
где A(t) – огибающая сигнала (то есть медленно меняющаяся амплитуда сигнала) и ϕ(t) – фаза сигнала. Так как вся информация
заложена в амплитуде и фазе сигнала (см. гл. 4), то альтернатив41
ной формой этого сигнала будет комплексный сигнал y(t), несущий информацию, заложенную в исходном сигнале x(t) , то есть
[1, 4–10]:
=
y(t) A (t)exp{ jϕ(t)}. (3.2)
Сравнивая обе формы представления сигналов, замечаем,
что между ними устанавливается связь следующего вида:
(3.3)
=
x(t) Re  y(t)exp ( j2πfc t )  .
Связь между этими узкополосными сигналами, реальным
x(t) с несущей частотой fc, и комплексным y(t), включающим
в себя несущую информацию, в частотном диапазоне представлена на рис. 3.1.
Видно, что комплексный информационный сигнал – это смещенная по частоте fc версия реального сигнала той же формы
для спектральной функции, но центрированная не вокруг несущей частоты fc, а вокруг нулевой частоты [6–10]. Здесь X(f) и Y(f)
являются преобразованиями Фурье от x(t) и y(t), соответствен
x(f)
Δf
Δf
0
-f с
Реальный сигнал
y(f)
+fс
Реальный сигнал
f
Мнимая часть
Реальная часть
0
Комплексный
информационный сигнал
f
Рис. 3.1. Сравнение между реальным сигналом (верхняя панель)
и комплексным информационным сигналом (нижняя панель)
42
но, и могут быть представлены согласно работам [1–3, 12–14] следующим образом:
∞
− j2πft
dt
∫ y(t)e=
=
Y (f )
Re [ Y (f ) ] + j Im [ Y (f ) ];
−∞
и
∞
=
X(f )
− j2πft
dt
∫ x(t)e=
(3.4)
Re [ X(f ) ] + j Im [ X(f ) ]. (3.5)
−∞
Подставляя x(t) в интеграл (3.5) из (3.3) получим:
∞
X(f ) =
∫ Re y(t)e
j2πfct  − j2πft
e

dt. (3.6)
−∞
Используя теперь правило, известное из теории комплексных
переменных о том, что реальная часть любого комплексной переменной w можно представить через эту переменную и ее комплексное сопряжение w* в виде
Re[=
w]
1
w + w* 


2
мы можем теперь переписать соотношение (3.6) в следующей
форме:
X(f )=
1
2
∞
∫ y(t)e
j2πfct
+ y* (t)e− j2πfct  ⋅ e− j2πft dt. 
(3.7)
−∞
Сравнивая (3.4) и (3.7), получаем, что
X
=
(f )
1
Y (f − fc ) + Y * (−f − fc )  . 
2
(3.8)
Другими словами, спектральная функция реального сигнала x(t) может быть представлена спектральной функцией комплексного информационного сигнала y(t) путем сдвига в частотном диапазоне на ±fc вдоль оси частот. Сам же спектр комплексного сигнала с информацией сконцентрирован вокруг нулевой
частоты, как это видно из предствленных на рис. 3.1 иллюстраций.
43
В итоге получаем, что средняя мощность информационного
сигнала y(t) дает тот же результат, что и среднеквадратичная величина реального сигнала x(t), то есть,
2
y(t)
y(t)y* (t)
=
Py (t)
=
≡ Px (t) . (3.9)
2
2
Комплексную огибающую узкополосного сигнала y(t) на входе оптического детектора (в качестве приемного устройства) после прохождения многолучевого канала связи, проводного или
беспроводного, можно представить в виде суммы амплитуд и
фаз N комплексных информационных сигналов, поступающих на детектор с соответствующими временами задержки τi,
i = 0,1,2,…, N–1 [6–10]:
=
y(t)
N −1
N −1
∑ u=
i (t) ∑ Ai (t)exp [ jϕi (t, τi ) ]. (3.10)
=i 0=i 0
Так как y(t) в (3.10) представляет собой сумму по случайным
фазам всех многолучевых компонент сигнала, в результате получаем глубокие замирания узкополосного сигнала, то есть,
фединг, типы которого будут рассмотрены в гл. 4. Как было показано в работах [1, 4–10], среднюю мощность результирующего сигнала на входе приемного устройства можно представить
в следующем виде:
PCW ≈
N −1
∑
=i 0
N −1
Ai2 + 2 ∑
∑
=i 0 i,j ≠ i
Ai Aj
cos ϕi − ϕ j 
(3.11)
представляющем сумму средних мощностей каждой индивидуальной компоненты результирующего сигнала и суммы функций корреляции между амплитудой и фазой двух независимых
индивидуальных компонент сигнала, с номерами i и j, (i ≠j), соответственно.
Широкополосные Сигналы. Типичный широкополосный или
импульсный сигнал, распространяющийся через многолучевой
канал связи, схематически представлен на рис. 3.2, следуя работам [4–10].
При разделении результирующего сигнала на сегменты, как
это показано на рис. 3.2, б, мы представляем каждую временную компоненту сигнала с помощью вертикальных векторов
44
~
а) P, дБ
τ, мкс
~
б) P, дБ
τ, мкс
1 2 3 4 5 6 7 8 9 10 11
Рис. 3.2. Типичный импульсный сигнал,
проходящий многолучевой канал связи (а); использование сегментов
для уширяющегося многолучевого импульсного сигнала (б)
или дельта-функций δ(t) для каждого времени запаздывания
τi(t). В этом случае меняющийся дискретно по времени отклик
импульсного сигнала после прохождения многолучевого канала
можно представить в виде [4–10]:
 N −1

h(t, τ)  ∑ Ai (t, τ)exp [ − j2πfc τi (t) ]δ ( τ − τi (t) )  exp [ − jϕ(t, τ) ]. (3.12)
=
 i =0

Если отклик многолучевого канала связи инвариантен по
времени или стационарен в пределах короткого по времени интервала работы детектора или источника оптического излучения, то отклик импульса (3.12) можно представить в упрощенном виде, а именно:
=
h(t, τ)
N −1
∑ Ai (τ)exp[ − jθi ]δ ( τ − τi ), (3.13)
i =0
где θi = 2πfcτi+ϕ(τ). Если это так, то среднюю мощность импульсного сигнала с запаздываниями можно представить в виде суммы средних мощностей каждого индивидуального импульса,
поступившего на детектор со своим временем запаздывания τi,
со своей случайной амплитудой Ai(τi) и фазой θi, а именно:
=
Ppulse
N −1
∑ { Ai (τi ) exp[ − jθi ] }
2
≈
N −1
∑
=i 0=i 0
Ai2 .
(3.14)
45
Сравнение между презентацией узкополосного (непрерывного) сигнала (3.11) и широкополосного (импульсного) сигнала
(3.14) указывает на следующее:
Когда две независимые компоненты результирующего сигнала не коррелированы либо по амплитуде, то есть 〈Ai Aj〉 = 0, либо
по фазе, то есть 〈cos[ϕi–ϕj]〉 = 0, либо одновременно по амплитуде
и фазе, то средние мощности непрерывного и импульсного сигналов являются эквивалентными и равны
N −1
∑
i =0
Ai2 .
Если это имеет место, каждая компонента сигнала будет
в итоге независима друг от друга, как по амплитуде, так и по
фазе. Это свойство полностью корректно для оптического диапазона волн, когда многолучевые компоненты проходят разные
траектории, длины которых составляют сотни и даже тысячи
длин волн оптического диапазона. При этом их фазы и углы
прихода на вход детектора равномерно и однородно распределены в угловом диапазоне от нуля до 2π [6–10], что будет учтено
ниже при математическом описании обоих типов сигналов.
3.2. Математическое описание узкополосных сигналов
Ввиду идентичности описания радио и оптических волн (лучей), о чем речь шла в гл. 2, мы можем также утверждать, что
математическое описание радиосигналов применимо также и
при описании оптических сигналов. Ниже будут представлены
две статистические модели, двумерная и трехмерная, которую
обычно используют для описания сигналов в системах беспроводной связи [2–13].
Двумерная (2-Д) Модель Кларка. Данная модель является
наиболее аппробированной для достаточно удовлетворительного описания явления многолучевости в канале связи, в котором
передающее и приемное устройства расположены на низких высотах, достаточных для того, чтобы игнорировать распределение лучей в вертикальной плоскости [2].
Данная модель предполагает наличие фиксированного стационарного источника и движущегося приемного устройства –
детектора. Полный сигнал на приемнике представляет собой
суперпозицию N горизонтально-распространяющихся лучей,
46
z
Подвижный детектор
x
αi
i-й путь
y
в хy-плоскости
Рис. 3.3. Геометрическое представление
двумерной (2-М) модели Кларка
каждый из которых имеет одинаковую амплитуду Ai и статистически независимое распределение в азимутальной плоскости
по углам прихода лучей (αi) и по фазам (ϕi).
Предположение об одинаковости средней амплитуды i-го сигнала основано на отсутствии прямой видимости между терминалами и соответствующей компоненты прямой видимости по
сравнению с компонентами многократного рассеяния на входе
приемника. Более того, распределение по фазовым углам предполагается однородным и регулярным в интервале [0, 2π], то есть,
функция распределения по фазовым углам равна P(ϕi) = (2π)–1.
Типичная волна под номером i , приходящая на движущийся
приемник под углом αi к оси ox, представлена на рис. 3.3.
Приемник движется со скоростью v в направлении x согласно
геометрии, представленной на рис. 3.3, так что Допплеровский
сдвиг можно переписать в виде
=
fD
v
cos α i . λ
(3.15)
Среднеквадратичная величина интенсивность амплитуды A2i
таких однородно распределенных индивидуальных лучей при
этом является постоянной величиной, т. е.,
E02
E{ Ai2 } ≡ Ai2 =
,
(3.16)
N
так как N = const, и реальная амплитуда локально-усредненного
поля E0 также предполагается постоянной.
Рассмотрим теперь плоские оптические волны, приходящие
на движущейся приемник, которые обычно имеют компоненту
47
электрического Ez и две компоненты магнитного поля, Hx и Hy
(см. гл. 2). Без потери общности изложения предмета, так как
для каждой из компонент применима аналогичная математическая трактовка, мы рассмотрим только компоненту электрического поля Ez и представим ее в точке приема в виде [2]
N
=
Ez E0 ∑ Ai cos(ωc t + θi ). (3.17)
i =1
Здесь, как и выше, ωc = 2πfc, fc – несущая частота, θi = ωit+ϕi –
случайная фаза приходящего луча с номером i, где ωi = 2πfi представляет доплеровский сдвиг для i-го индивидуального луча.
Амплитуды всех трех компонент электромагнитного поля нормализованы таким образом, чтобы усреднение по ансамблю амплитуд Ai сводилось к выражению
N
∑ < Ai2 >= 1 [2].
i =1
Так как доплеровский сдвиг мал по сравнению с несущей
частотой, все компоненты полного поля можно считать узкополосными случайными процессами и можно аппроксимировать
Гауссовыми переменными при N→∞ c однородным распределением фазы индивидуальных лучей в интервале углов [0, 2π].
Если это так, то компоненту электрического поля можно будет
представить согласно работе [2] в следующей форме:
=
Ez C(t)cos(ωc t) − S(t)sin(ωc t), (3.18)
где C(t) и S(t) – это компоненты в фазе и в противофазе с изначальным стгналом, которые можно детектировать приемником,
и которые представляются в виде:
=
C(t)
=
S(t)
N
∑ Ai cos(ωit + θi ),
i =1
N
(3.19)
∑ Ai sin(ωit + θi ).
i =1
Согласно представлению (3.19) обе эти компоненты являются
независимыми центрированными (с нулевым средним значением) Гауссовыми случайными переменными, то есть,
48
< S >=< C >=< Ez >= 0 (3.20a)
с равными вариациями σ2 (то есть с равной средней мощностью
сигнала), определенными как
σ2 ≡<| Ez |2 >=< S2 >=< C2 >= E02 / 2. (3.20б)
Огибающая принимаемой компоненты электрического поля
оптической волны при этом равна
E(t) =
S2 (t) + C2 (t) = r (t). (3.21)
иш
с ед
но ш
ме ая
ро во
м лн
i а
Так как компоненты C(t) и S(t) являются независимыми и
некоррелированными Гауссовыми случайными переменными,
удовлетворяющими равенствам (3.20a) и (3.20б), то огибающая
случайного принимаемого сигнала r(t) подчиняется распределению Рэлея [4–14] . Следовательно, используя очень простую 2-Д
модель, предложенную Кларком [2], можно показать, что в этом
случае можно оперировать известными распределениями Рэлея
и Райса для описания быстрого фединга, обычно наблюдаемого
в подвижных каналах оптической и радио связи [1–14], о чём
речь пойдет в гл. 4.
Трехмерная (3-Д) Модель Аулина [3]. Модель Кларка была
обобщена Аулином путем введения угла прихода βi i-го луча
в вертикальной плоскости, который не был учтен Кларком (см.
рис. 3.3). Таким образом, Аулин учел распределение лучей прихода в 3-Д случае, когда угол αi представляет проекцию i-го луча
на плоскость XY, как это представлено на рис. 3.4. Как и в мо-
Пр
z
βi
αi
x
y
Рис. 3.4. Геометрическое представление трехмерной
(3-М) модели Аулина
49
дели Кларка, Аулин предположил, что теперь оба угла, βi и αi,
однородно и независимо распределены в угловых промежутках
[0, π/2] и [0, 2π], соответственно. Такое же распределение было
предложено Аулином и для фазы i-го луча ϕi.
В трехмерном случае, вместо формулы (3.17) для каждой
компоненты электрического поля парциальной волны (луча)
с номером i, получаем, согласно работе [3], следующую общую
формулу:
E=
i (t) Ai cos [ ωc t − k ×
× ( x0 cos α i cos βi + y0 sin α i cos βi + z0 sin βi ) + ϕi  .
(3.22)
Тогда результирующая компонента электрического поля волны на входе приемника за счет многолучевости в канале оптической связи дается следующей формулой
N
E(t) = ∑ Ei (t). (3.23)
i =1
Здесь k = 2π/λ – волновое число, где λ – это длина волны.
В случае компоненты электрического поля, направленной
вдоль оси z, формула (3.22) упрощается и приводится к виду [3]:
=
E
zi (t) Ai cos  ωc t − k ( x0 cos α i + y0 sin α i ) + ϕi  . (3.24)
Аналогичные формулы можно получить и для магнитных
компонент поля каждой парциальной волны с номером i. Их, лежащих в плоскости XY, можно представить в двумерном случае
согласно работе [3] в следующем виде:
Ai
cos ωc t − k sin α i ( x0 cos α i + y0 sin α i ) + ϕi  ,
120π
Ai
=
cos ωc t − k cos α i ( x0 cos α i + y0 sin α i ) + ϕi  . (3.25)
Hyi (t)
120π
Hxi (t) = −
Результирующие компоненты магнитного поля волны можно
представить в таком же виде, как и электрическую компоненту,
согласно формуле (3.23), а именно,
=
Hx (t)
50
N
N
Hxi (t); Hy (t) ∑ Hyi (t). ∑=
=i 1=i 1
(3.26)
Формулы (3.23)–(3.26) определяют полное электромагнитное
поле оптической волны и соответствует обоим типам поляризации волны, вертикальному и горизонтальному. Как это следует
из формул (3.23)–(3.26), и как было показано в работах [4–9], все
три компоненты поля волны независимы и случайно распределены вдоль соответствующих осей координат в пространстве.
Более того, за счет случайного суммирования каждой парциальной волны (луча) со своей случайной фазой ϕi и своим индивидуальным углом прихода αi, все три компоненты поля волны
являются взаимно некоррелированными.
Предполагая, как и в случае модели Кларка, что приемник
движется со скоростью v в плоскости XY, имеющей угол γ с осью
x, то по прошествии определенного времени координатами приемника будут {vcosγ, vsinγ, z0}, и Допплеровский сдвиг по частоте
для каждой i-й компоненты E-поля или H-поля можно будет записать следующим образом [3]
fDi
=
ωi v
=
cos(γ − α i )cos βi . 2π λ
(3.27)
В трехмерном случае все три компоненты поля волны могут
быть представлены согласно формуле (3.19) через те же синфазную S(t) и противофазную (то есть, квадратурную) C(t) компоненту, но при этом заменяя в них параметры ωi и θi на:
=
ωi
2πv
cos(γ − α i )cos βi ; λ
(3.28)
2πz0
sin βi + ϕi .
λ
(3.29)
=
θi
Выражения (3.28)–(3.29) можно привести к соответствующим выражениям в модели Кларка [2], если компоненты волны
будут лежать в плоскости XY, то есть, угол βi будет равен нулю.
При этом рис. 3.4 трансформируется в рис. 3.3.
Плотность Распределения в Модели Аулина. Если, как и
в модели Кларка, предположить что все лучи в многолучевом
канале приходят с одной и той же вероятностью на приемник со
всех азимутальных направлений в плоскости XY , то можно получить плотность функции распределения (или плотность пол51
ной функции вероятности, PDF) по углам прихода α и β в следующем виде [3]:
1
PDF (α) = ; 2π
cos β
,
2 sin βm
PDF (β)=0
=
PDF (β)
(3.30а)
π
2
â äðóãèõ ñëó÷àÿõ
| β |≤| βm |≤
(3.30б)
Формулу (3.30б) можно упростить для так называемого «квази-трехмерного случая», когда большинство приходящих волн
распространяются в вертикальной плоскости вблизи горизонтального направления, то есть под малыми углами βi, имеющими среднее значение, равное 0°. Этот случай соответствует реальной подвижной беспроводной наземной связи, когда высоты
передатчика и приемника много меньше высот препятствий, их
окружающих. Тогда получим
=
PDF (β)
π β
π
cos  ⋅
4 | βm |
 2 βm
PDF (β)=0

,

| β |≤| βm |≤
π
2
(3.31)
â äðóãèõ ñëó÷àÿõ
Как следует из формулы (3.30б) в трехмерном случае существует резкий скачек (разрыв) в точке β = ±βm, результат, который не является реалистичным, кроме очень малых величин βm
порядка нескольких градусов. Поэтому, более реалистичным
является плотность вероятности согласно (3.31), где PDF стремится к ±βm непрерывно.
Спектральная Мощность Узкополосного Сигнала. В каналах
узкополосной связи большая часть энергии сконцентрирована
вокруг несущей частоты fc, и спектральная мощность определяется спектром реального несущего сигнала – радио или оптического. В тоже время реальный несущий сигнал можно конвертировать в комплексный сигнал информации, энергия которого
сосредоточена вокруг нулевой частоты, как это видно из рис. 3.1.
Ниже мы опишем спектр узкополосного многолучёвого канала через распределение спектра мощности информационного
комплексного сигнала. Для этих целей введем функцию корреляции многолучевого сигнала в временном диапазоне, т. е.,
52
K(t,t+τ) = 〈E(t)⋅E(t+τ)〉 [4–7,9–14]. Это можно сделать, используя,
например, E-компоненту электрического поля через времена запаздывания τ, а именно [3, 6, 9, 13],
E(t) ⋅ E(t +=
τ)
C(t) ⋅ C(t + τ) cos ωc τ − S(t) ⋅ S(t + τ) sin ω
=
cτ
= c(τ)cos ωc τ − s(τ)sin ωc τ.
(3.32)
Здесь 〈⋅〉 – это оператор, который, как и выше, описывает процедуру усреднения. Тогда можно записать среднеквадратичную
величину амплитуды Ai, введенную ранее с помощью формулы
(3.24), в виде E[A2i]≡〈A2i〉 = E0/N. Согласно (3.32), корреляционные
свойства многолучёвого сигнала можно полностью описать с помощью функций c(τ) и s(τ) [3,6,9,13]:
=
c(τ)
E0
E0
cos ωc τ =
, s(τ)
sin ωc τ . 2
2
(3.33)
Полагая однородность в распределении по углам прихода
и по фазам приходящих лучей можно сразу же получить для
трехмерной (3-Д) Аулина [3], полагая, что s(τ) = 0, следующее выражение для c(τ)
c(τ)
=
E0
2
+π
∫ I0 (2πfm τ cos β )PDF(β)dβ, (3.34)
−π
где, как и выше, I0(w) – функция Бесселя нулевого порядка первого рода, PDF(β) – плотность вероятности, описываемая формулами (3.30) и (3.31), и fm – максимальный сдвиг Допплеровской частоты, fm = v/λ. В частном случае двумерной (2-Д) модели
Кларка, которой соответствует PDF(β) – в виде дельта-функции,
получаем, что
=
c0 (τ)
E0
I0 (2πfm τ). 2
(3.35)
Как известно [10], спектральная мощность результирующего
сигнала может быть получена путем использования преобразования Фурье к временной корреляционной функции вида (3.35).
В итоге, для двумерной модели Кларка получаем в частотном
диапазоне для спектра комплексного оптического сигнала с информацией следующую формулу:
53
=
W0 (f )
E0
4πfm
1
2
 f 
1− 
 fm 
| f |≤ fm ;
,
=
, f < −fm , f > fm . W0 (f ) 0,
(3.36)
Как следует из иллюстраций, представленных на рис. 3.5,
двумерный спектр мощности (представленный на рисунке непрерывной кривой) четко ограничен по частоте в диапазоне |f| ≤ fm, и стремится к бесконечности при f = ±fm. Из модели Аулина
в 3-Д случае получается более сложная спектральная плотность
мощности сигнала, аналитическое выражение для которой может быть получено только в квази-трехмерном случае, используя формулы (3.31) и (3.34), и обозначая ее, согласно работе [3],
через W1(f):
W1=
(f ) 0, |f |> fm ;
E0
=
W1 (f )
, fm cos βm ≤| f |≤ fm ;
4 sin βm fm
2
2
π
−1 2 cos βm − 1 − (f / fm )
 − sin
 , | f |< fm cos βm . (3.37)
1 − (f / fm )2
 2

Вид данного квази-трехмерного спектра мощности W1(f)
представлена также на рис. 3.5 для случая βm = 45° в ввиде штри-
W1 (f ) =
E0
fm
W (f )
Wmax
1
1
2
f
−fDm
fDm
1 - 2-Д модель Кларка
2 - 3-Д модель Аулина
Рис. 3.5. Сравнение между 2-Д моделью Кларка
(непрерывная кривая) и 3-Д моделью Аулина (штриховая кривая)
54
ховой кривой. Видно, что хотя оба спектра плотности мощности
строго ограничены в диапазоне частот |f| ≤ fm, однако в 3-Д случае
спектр мощности всегда будет постоянной величиной, то есть, он
не стремится к бесконечности, как это наблюдается в 2-Д случае.
Видно также, что спектральная мощность W1(f) из (3.37) постоянна в диапазоне fm cosβm ≤ |f| ≤ fm.
Теперь покажем и сравним спектры мощности всех трех компонент поля волны, так как выше был представлен спектр мощности только Ez-компоненты поля информационного сигнала,
описываемый согласно 2-М модели Кларка [2] формулой (3.36).
Аналогичный анализ, как и выше, для двух других компонент
магнитного поля Hx и Hy волны, приводит к спектральным
плотностям, обозначенным, как и ранее, через W0(f) , согласно
модели Кларка в виде:
=
W0 (f )
2
E0
 f 
1 −   , äëÿ Hx ;
4πfm
 fm 
2
W0 (f ) =
E0
4πfm
 f 
f 
 m
2
 f 
1− 
 fm 
, äëÿ Hy . (3.38)
Вид спектров мощности всех трех компонент реального
сигнала, как функций излучаемой частоты, представлен на
рис. 3.6, для их относительного сравнения между собой. Как
W E,H
WEz
WHx
WHy
f c – fm
fc
f c + fm
f
Рис. 3.6. Спектры трех компонент реальной волны
согласно модели Кларка
55
следует из представленных иллюстраций компонента Ez, также как и компонента Hx, имеют минимум на несущей частоте
fc, и обе они строго ограничены в диапазоне ±fm вокруг несущей
частоты, тогда как компонента Hy имеет максимум и стремится
к нулю при f = ±fm.
Можно заключить, поэтому, что спектр информационного
сигнала и реального результирующего сигнала строго ограничены при f = ±fm в диапазоне ±fm вокруг несущей частоты fc. Внутри этого диапазона спектральная плотность мощности зависит
от плотности функции распределения, PDF, ассоциированной
с пространственными углами прихода α и β. Допплеровский
сдвиг может быть довольно высоким и приводит к случайной
интерференции информационного сигнала, то есть, к федингу
сигнала, рассмотренному в следующей главе.
3.3. Математическое описание широкополосного сигнала
Широкополосный или импульсный отклик коммуникационного канала, проводного и беспроводного, схематически представлен на рис. 3.2, а. Разделив горизонтальную ось времени
на сегменты, называемые в литературе бинами [4–7, 13], как
это показано на рис. 3.2, б, получаем определенное количество
принимаемых сигналов – один на один бин. Каждый парциальный сигнал соответствует различным траекториям и его время
прихода соответствует времени бина. Пример таких парциальных сигналов представлен на рис. 3.2, б, используя векторное
представление с помощью дельта-функции [1–4], сосредоточенной в каждом бине. Этот дискретный по времени импульсный
отклик широполосного канала описывается общей формулой
(3.12) или в специфическом случае – формулой (3.13).
Основным фактором такого отклика оптического канала
является многолучевость в канале за счет многократного рассеяния, отражения и диффракции лучей (парциальных волн)
от различных препятствий естественного и искусственного
происхождения [1–4, 9–13]. В процессе движения приемника
или источника излучения, приходящие лучи, и их число, меняются в процессе передачи и приема информационных сигналов случайным образом. Также время прихода каждого луча
на вход приемного устройства будет случайной величиной и
определяется запаздыванием соответствующего луча относительно времени луча прямой видимости между приемником и
56
передатчиком, то есть, луча, не подверженного влиянию препятствий.
Случайные вариации длин траекторий лучей и их времен запаздывания приводят, к случайным вариациям амплитуды и
фазы результирующего оптического сигнала. В то же время движение приемника или передатчика в произвольном направлении приводит к доплеровскому смещению частоты начального
излучения. Данный эффект зависит от разницы между направлениями лучей от отражателей или рассеивателей, и направлением на движущийся источник.
Учитывая сказанное выше, определим полуширину спектра
мощности W(ω) импульсного (то есть, широкополосного) сигнала следующим образом:
Ω < ωc , (3.39)
где ωc = 2πfc – это несущая частота излучения в спектре сигнала.
Согласно условию (3.39) можно исключить различия в доплеровском смещении, ωdn, для всех спектральных компонент и полагать, что сигнал в n-м луче имеет то же смещение и соответствует той же несущей частоте ωc (вместо специфической частоты
ωn для каждого луча с номером n). При таком предположении
получаем доплеровское смещение n-го луча в следующем виде:
v
ωdn =
ω0 cos ϕn .
c
Более того полагаем, что длины траекторий каждого луча
в результирующем многолучевом оптическом сигнале намного
превышают длину оптической волны для типичных каналов
связи в десятки или сотни метров. В этом случае кроме неравенства (3.39) можно ввести следующие дополнительные условия:
ωdn tn << π,
Ωtn << π (3.40)
и пренебречь соответствующими вариациями фазы результирующего сигнала. Действительно, широкополосный сигнал, удовлетворяющий условию (3.40), можно рассматривать как случайный стационарный сигнал, чей энергетический спектр ограничен на ширине частот Ω±∆ω [11, 12]. Временную зависимость
комплексной амплитуды такого спектра можно определить по57
средством корреляционной функции сигнала по времени, записанной в следующей виде:
σ2
,  |τ|
exp  − 
 τn 
Ks (τ) =
(3.41)
где τn – время корреляции.
Энергетический спектр случайного процесса As(t), соответствующий функции вида (3.41), можно определить, используя обратное преобразование Фурье, а именно,
2σ2 / τn
Ws (ω) =
, 2
1 + ( τn ω)
(3.42)
где σ2 = 〈(τ–<τ>)2〉, τn = t2n–t1n – время жизни оптического импульса с номером n, и <τn> – средняя величина τn. Полученный результат полностью определяет сигнал X(t), как случайный стационарный процесс, имеющий место в широкополосном многолучевом канале связи, как в оптическом, так и в радио, когда
длины траекторий луча и распространяющего результирующего сигнала превышают длину волны (см. гл. 1).
При рассмотрении доплеровского смещения по частоте предполагают, что все препятствия для оптических сигналов равномерно и однородно распределены по углам прихода в угловом
интервале [0, 2π], т. е., их функция распределения вероятности
пропорциональна sin–1(ϕn). Однако случайные расположения
рассеивателей по углам прихода приводят к специфической
асимметричной форме энергетического спектра многократно
рассеяного результирующего оптического сигнала. Эта форма отлична от классической его формы, представленной на
рис. 3.5 непрерывной кривой с бесконечной плотностью вероятности (PDF) на границах частотного диапазона шириной
в 2ωdn = 2ωc(v/c).
Кроме того, при однородном и регулярном распределении
углов прихода лучей ϕn в интервале углов [0, 2π], функция
плотности вероятности (PDF) для доплеровского смещения,
ωdn, когда источник и детектор не затемнены друг от друга препятствиями, с большой долей вероятности описывается форму58
лой, пропорциональной формуле, полученной в модели Кларка, то есть [2]:
 v 2

~  ω0  − ω2 
c


−1/2
.
(3.43)
В заключении данного параграфа отметим, что функция
плотности вероятности (PDF) для доплеровского смещения, ωdn,
будет отличаться от симметричого распределения (3.38), приобретая ассиметричную форму с тем же максимумом на границах
частотного диапазона [–ωmin, ωmax], как это следует из трехмерной (3-М) модели Аулина [3, 13].
Литература
1. Marcuse O. Light transmission optics, New York: Van
Nostrand-Reinhold Publisher, 1972
2. Clarke R. H. A statistical theory of mobile-radio reception,
Bell Systems Technical Journal, vol. 47, 1968, pp. 957–1000.
3. Aulin T. A modified model for the fading signals at a mobile
radio channel. IEEE Trans. Veh. Technol., vol. 28, No. 3, 1979, pp.
182–203.
4. Jakes W. C. Microwave mobile communications. New Jersey:
IEEE Press, 1974.
5. Lee W. Y. C. Mobile communication engineering. New York:
McGraw Hill Publications, 1985.
6. Saunders S. R. Antennas and propagation for wireless
communication systems, New York: John Wiley & Sons, 1999.
7. Feuerstein M. L., Rappaport T. S. Wireless personal
communication, Boston-London: Artech House, 1992.
8. Steele R. Mobile Radio communication. New Jersey: IEEE
Press, 1992.
9. Rappaport T. S. Wireless communications. New York: Prentice
Hall PTR, 1996.
10. Proakis J. G. Digital communications. New York: McGraw
Hill, 1995.
11. Leon-Garcia A. Probability and random processes for e
electrical engineering. New York: Addison-Wesley Publishing
Company, 1994.
59
12. Stark H., Woods J. W. Probability, random processes, and
estimation theory for engineers, New Jersey: Prentice Hall, 1994.
13. Blaunstein N. Chapter 12, Wireless communication systems,
Hanbook of Engineering electromagnetics, Edited by Rajeev
Bansal, New York: Marcel Dekker, 2004.
14. Modulation
and
coding
techniques
in
wireless
communications, Ed. by Krouk, E., and S. Semionov, Chichester,
England: John Wiley & Sons, 2011.
60
ГЛАВА 4. ФЕДИНГ В ОПТИЧЕСКИХ КАНАЛАХ СВЯЗИ
Как было отмечено в гл. 1, в оптоволоконных проводных
каналах связи и в беспроводных атмосферных каналах связи
оптический сигнал подвержен существенным вариациям его
амплитуды и фазы. В оптоволоконных системах это происходит за счет неоднородности материала, наполняющего оптоволокно и многолучевой интерференции внутри самой волноводной системы, приводящие к дисперсии, то есть, к зависимости
параметров сигнала от несущей частоты оптической волны и
к дополнительным глубоким замираниям амплитуды принимаемого оптического сигнала [1, 2] (см. гл. 8). В атмосферном беспроводном канале на прохождение оптического сигнала влияют
различные помехи (например, аэрозоли, дождь, снег, облака,
турбулентности) на пути прямой видимости между излучателем
(в качестве передатчика) и детектором (в качестве приемника)
[3, 4]. Эти помехи вызывают кроме явления затухания сигнала, также явление многолучевости исходной оптической волны
за счет многократного рассеяния, отражения и диффракции от
этих помех (см. гл. 9 и 10), и, как следствие – случайные замирания самого оптического сигнала, называемые в научной литературе федингом [5–10].
Как будут показано ниже, в зависимости от скорости и глубины этих замираний, фединг разделяют на медленный (протяженный во времени) и быстрый (короткий во времени) при
измерениях, проводимых во временном диапазоне, или же как
мелкомасштабный и крупномасштабный – при измерениях
в пространстве вдоль траектории распространения оптического
сигнала, несущего информацию от передатчика к приемнику
[5–10]. Такое соответствие между понятиями взаимозаменяемо, так как огибающая результирующего оптического сигнала
и его фаза являются случайными переменными в пространстве
и во времени, причем согласно эргодической теореме из теории
связи, характер и форма фединга, происходящего во времени и
в постранстве, полностью идентичны [13, 14].
Поэтому, использование обоих терминов фединга, либо в пространстве, либо во времени, а также их взаимозаменяемость при
описании явления фединга, полностью обоснованы [11–14]. На
рис. 4.1. приведен типичный пример того, как вариации огибающей амплитуды реального узкополосного сигнала можно схе61
Амплитуда сигнала (дБ)
Быстрый фединг r(t)
Медленный фединг m(t)
Время(t)
Рис. 4.1. Типичное разложение вариаций огибающей
узкополосного сигнала на медленный и быстрый фединг
матически разложить на оба типа фединга – медленный и быстрый.
Ниже, следуя подобию и идентичности типов фединга и предложенной в литературе терминологии, мы в изложении предмета будем говорить о медленном и быстром фединге и рассмотрим
статистические параметры, описывающие процессы и явления,
происходящие в каналах оптической связи и вызывающие фединг. Затем определим согласно этим параметрам типы фединга
и дадим математическое описание каждого из них на основе введения соответствующей функции распределения вероятностей
(CDF) и связанной с ней функции плотности вероятности (PDF),
основанных на законах рассматриваемых стохастических процессов, известных из статистической теории связи [15–17].
4.1. Параметры и типы фединга в оптических каналах связи
4.1.1. Параметры временной дисперсии
канала оптической связи
Рассмотрим широкополосный канал связи с проходящим
через него импульсным потоком информационных оптических
сигналов (смотри определения в гл. 3). Основными параметрами
процессов, происходящих в многолучевом канале с федингом
являются: среднее время запаздывания парциальных волн в сигнале, уширение сигнала запаздывания, и средне-квадратичное
уширение сигнала запаздывания, определяемые по заранее известному предельному энергетическому уровню сигнала X (в
62
дБ), который еще может быть пропущен данным каналом связи. Все эти параметры могут быть определены по запаздыванию
результирующего сигнала, состоящего из многочисленных его
компонентов, приходящих со своим собственным временами запаздывания,
Cреднее время запаздывания N парциальных сигналов, каждого со своим номером i (см. рис. 3.2, а и 3.2, б, гл. 3), определяется из теории вероятностей первым моментом времени запаздывания через измеренные амплитуды Ai или мощности P(τi)
каждого сигнала со своим временем запаздывания τi [5–7, 10]
N −1
N −1
∑ Ai2 τi
∑
P ( τi ) τi
=i 0=i 0
=
τ
= N −1
.
N −1
2
Ai
P ( τi )
=i 0=i 0
∑
(4.1)
∑
Второй момент запишется аналогичным образом, а именно
[5–7, 10]
N −1
∑
Ai2 τ2i
N −1
∑ P(τi )τ2i
i 0=i 0
=
=
τ2
= N −1
N −1
Ai2
P ( τi )
=i 0=i 0
∑
∑
.
(4.2)
Тогда среднеквадратичное уширение сигнала запаздывания
будет являться вторым центральным моментом профиля запаз-
τd
T
Рис. 4.2. Схематическое представление реального
результирующего сигнала и его дискретизация
на бины с периодом T
63
дывания результирующего импульсного сигнала (см. рис. 4.2)
по его мощности, то есть
τd =
< τ2 > − < τ >2 . (4.3)
Все эти параметры запаздывания, как это следует из рис. 4.2,
измеряются относительно первого импульса многоимпульсного
результирующего сигнала, поступающего на оптический детектор в момент τ0 = 0 [5–7, 10, 14].
Чтобы экстраполировать формулы (4.1)–(4.3) на непрерывные (узкополосные) сигналы, представляют среднеквадратичную величину уширения времен запаздывания сигнала через
интеграл от плотности вероятности функции распределения по
временам запаздывания, PDF(τ), используя знания, полученные
из теории вероятности, а именно:
∞
τd =
∫ τ ⋅ PDF(τ)dτ, (4.4)
0
где PDF(τ) определяется либо по экспоненциальному закону
 τ 
1
PDF (τ) = exp   τd
 τd 
(4.5а)
либо по регулярному однородному закону
 1

PDF (τ) = 2τd
 0

0 ≤ τ ≤ 2τd
τ > 2τd
.
(4.5б)
Формулы (4.1)–(4.3) для импульсных сигналов и формулы
(4.4)–(4.5) для непрерывных сигналов позволяют в итоге определить временную дисперсию многолучевого канала связи с федингом, как узкополосного, так и широкополосного.
4.1.2. Частотная полоса когерентности
Известно, что профиль мощности сигнала по временам запаздывания во временном диапазоне связан с спектральной мощностью сигнала в частотном диапазоне посредством преобразования Фурье (см. гл. 3). Поэтому, для полного описания многолучевого оптического канала наряду с уширением по временам
64
запаздывания во временном диапазоне вводят полосу когерентности в частотном диапазоне. Полоса когерентности является
статистической величиной, определяющей полосу частот, на
которой все спектральные компоненты многолучевого результирующего сигнала поступают в канал связи с одинаковыми
амплитудами (мощностями) и со строго коррелированными
линейными фазами. При этом канал считается «плоским» или
«частотно-независимым». Другими словами [6, 10, 14]:
Полоса когерентности – это полоса частот, в которой два
сигнала с частотами fi и fj, i≠j, строго коррелированы по амплитуде и/или по фазе.
Данное правило обычно описывает дисперсионную по времени природу оптического канала связи в небольшой по размеру
(локальной) области расположения приемника и передатчика.
Понятие локальности полностью применимо к оптическому
диапазону волн, в котором длина волны намного меньше расстояния между оптическими терминалами, передатчиком и приемником (см. гл. 1).
В зависимости от того, какой параметр сигнала, подверженного федингу, измеряется – амплитуда или фаза, существуют
две формулы определения полосы когерентности. Приведем их
для функции когерентности между различными спектральными компонентами сигнала, равной |RT(W)| = 0,5 (или 50%).
В первом случае, полоса когерентности для двух принимаемых сигналов с федингом, обеспечивающая два идентичных по
аплитуде сигнала, равна:
=
Bc
1
0,16
.
≈
τd
2πτd
(4.6)
Во втором случае, полоса когерентности для двух принимаемых сигналов с федингом, обеспечивающая две идентичные их
фазы, равна:
=
Bc
1
0,08
.
≈
τd
4πτd
(4.7)
Необходимо отметить, что нет точных формул, связывающих
полосу когерентности с уширением времен запаздывания, и обе
формулы (4.6) и (4.7) являются приближенными. Для получения строгих, а не оценочных эмпирически формул, необходимо
65
использовать специальный спектральный анализ и более строгие модели каналов оптической связи с федингом [5–12].
4.1.3. Допплеровский сдвиг и время когерентности
Выше мы рассмотрели два параметра, уширение времени запаздывания и полоса когерентности, описывающие дисперсию
во времени многолучевого оптического канала связи в локальной области между передатчиком и приемником. В случае динамических каналов связи, когда либо передатчик, либо приемник перемещаются в пространстве, проявляется частотная
дисперсия канала, определяемая двумя другими параметрами
фединга сигнала: доплеровским сдвигом по частоте, введённым
в гл. 3, и временем когерентности, введенным для описания изменяющегося во времени явления распространения сигналов
в локальных оптических каналах связи.
Допплеровский сдвиг по частоте BD – величина, определяющая частотный диапазон, внутри которого доплеровский спектр
мощности сигнала отличен от нуля (см. гл. 3) . Этот сдвиг показывает уширение несущей частоты сигнала, вызванное скоростью
и изменением во времени подвижного источника или детектора
(или отражателей, расположенных вокруг них), которые определим одним словом – объект. Как показано в работах [5–7, 10],
частотный диапазон доплеровского сдвига BD равен удвоенной
частоте доплеровского сдвига fD, введенной в гл. 3, и которую
мы представим еще раз для большей наглядности
=
fD
v
cos α. λ
(4.8)
Видно, что доплеровский сдвиг определяется скоростью объекта v, длиной волны λ (или несущей частотой сигнала fc = c/λ),
а также углом α между направлением движения объекта и направлением прихода оптических сигналов на приемное устройство после рассеяния, отражения и диффракции лучей от препятствий вокруг терминалов. Понятно, что если полоса пропускания комплексного информационного сигнала (см. гл. 3)
превышает полосу доплеровского сдвига BD, то эффект Доплера
незначителен и его можно не учитывать при приеме сигналов,
считая оптический канал стационарным.
66
Время когерентности Tc во временном диапазоне является
прообразом Фурье от доплеровского уширения частоты и определяет изменяющиеся по времени характеристики канала связи, который при этом не является дисперсионным – ни по частоте, ни по времени. Таким же образом, как и для частоты когерентности, определим время когерентности согласно работам
[6, 10, 14] следующим образом:
Время когерентности – это продолжительность времени,
в течение которого две компоненты многолучевого сигнала являются коррелированными по амплитуде, то есть, идентичными.
Существует классическая связь между временем когерентности и доплеровским сдвигом частоты
Tc ≈
λ
1
=
.
fDìàêñ v
(4.9)
В дальнейшем были даны два уточнения этой формулы. Первое уточнение было получено для функции когерентности между различными спектральными компонентами сигнала, равной
|RT(W)| = 0.5 (или 50%), которая приводит к [5–7]:
Tc ≈
λ
9
9λ
==
0,18 . 16πfDìàêñ 16πv
v
(4.10)
Как было показано в работах [10, 14], это определение приближенное и может быть уточнено для современных каналов
связи, оптических и радио, путем комбинации формул (4.9) и
(4.10) в виде их средней геометрической величины, а именно,
Tc ≈
λ
0,423
=
0,423 . fDìàêñ
v
(4.11)
Неоднозначное определение времени когерентности указывает на то, что на два сигнала, поступающих на приемное устройство, и разделенных по времени, превышающем Tc, было поразному оказано воздействие со стороны канала связи, то есть,
среды. Поэтому, эти два сигнала в итоге будут характеризоваться различным типом фединга.
4.2. Типы мелкомасштабного фединга
67
Из анализа параметров канала, представленного выше, становится понятным, что тип фединга оптического сигнала с информацией в многолучевом канале связи, проводном и беспроводном, зависит от соотношения между параметрами канала,
определёнными выше, и параметрами сигнала. А это период
информационного сигнала, TS, и частотная полоса, Bs, занимаемая информацией вокруг несущей частоты fc. Другими словами,
в зависимости от соотношения между параметрами передающего оптического сигнала, Bs и TS, и параметрами канала, Bc и τb,
BD и Tc, различные передающиеся сигналы будут подвержены
различным типам фединга. Как было впервые показано в работе [8], существуют четыре возможных типа фединга в зависимости от механизма временной и частотной дисперсии канала связи и в зависимости от соотношения между параметрами канала
и параметрами передающегося сигнала.
Так, многолучевое уширение по времени запаздывания приводит к временной дисперсии канала и к частотно-селективному федингу, тогда как доплеровское уширение сигнала приводит к частотной дисперсии канала и к селективному по времени
федингу. Что это означает? Дело в том, что, как известно, белый
или Гауссовый шум, вызванный федингом, не зависящим от частоты и времени (табл. 4.1), равномерно и регулярно распределен
по полосе частот результирующего сигнала. В это же время, чаТаблица 4.1
Типы мелкомасштабного Фединга
Общие типы
Фединга
Типы Фединга
Тип канала связи
(1) Мелкомасштабный фединг
(Основан на уширении по времени
запаздывания)
(1.1) Фединг, не зависящий
от частоты
(1.2): Частотно-селективный фединг
Широкополосный
(1.1.1): Bs<<Bc
(1.1.2): Ts >>τd
Узкополосный
(1.2.1): Bs>Bc
(1.2.2): Ts <τd
(2) Мелкомасштабный фединг
(Основан на доплеровском уширении частоты)
(2.1): Селективный по времени фединг (быстрый)
(2.2): Фединг, не зависящий
от частоты (медленный)
Узкополосный
(2.1.1): Bs<BD
(2.1.2): Ts >Tc
Широкополосный
(2.2.1): Bs>>BD
(2.2.2): Ts <<Tc
68
стотно-селективный фединг (табл. 4.1), который сильно зависит
от частоты сигнала, может проявиться в полосе частот сигнала
в любом его месте по спектру, и, поэтому, вызывает шум, обычно называемым в литературе мультипликативным шумом. Все
четыре вида фединга относятся к мелкомасштабным, так как
беспроводные оптические каналы связи в основном используются для передачи информации на расстояния между пользователями, не превыщающими 0,1–0,5 км, а сами сигналы распространяются в пространстве по законам геометрической оптики,
так как длина оптической длины волны много меньше длины
даже непротяженного (локального) канала. Разделение между
четырьмя типами мелкомасштабного фединга в соответствии
с импульсным откликом многолучевого канала представлено
в табл. 4.1 согласно работам [6, 10].
1. Фединг, основанный на уширении по времени запаздывания. Временная дисперсия, вызванная многолучевостью, порождает мелкомасштабный фединг, зависящий или не зависящий от частоты.
1.1. При мелкомасштабном фединге многолучевый оптический канал имеет постоянный по амплитуде и линейный по
фазе импульсный отклик в полосе частот, превышающей полосу
частот сигнала, т. е., когда Bs<<Bc. В то же время, промежуток
времени оптического сигнала намного превышает временное
ущирение сигнала за счет временной дисперсии, имеющей место в оптических каналах связи с федингом, т. е., когда Ts>>τd.
При этом информационный сигнал фактически не изменяется
за счет наличия фединга в данном канале.
1.2. В обратном случае, когда многолучевость канала приводит к обратному условию, то есть, когда Ts<<τd, в канале связи
имеет место частотно-селективный фадинг за счет временной
дисперсии канала и сильного уширения временного промежутка посланного через канал оптического сигнала. При этом,
частотная ширина сигнала превышает частоту когерентности
канала, то есть, Bs>Bc, а временой период информационного импульсного сигнала превышает временное ущирение сигнала, то
есть, когда Ts<<τd. Другими словами, на сигнал сильное воздействие оказывает многолучевость канала и, поэтому, возникает
мультипликативный шум, сильно искажающий искомый информационный сигнал.
69
2. Фединг, основанный на доплеровском уширении частоты.
Частотная дисперсия, вызванная подвижностью передатчика
или приемника, приводит к мелкомасштабному федингу, зависящему от частоты (или быстрому) и не зависящему от частоты
(или медленному).
2.1. Оптический канал, пропускающий импульсные информационные сигналы, и в котором полоса доплеровского уширения частоты сигнала превышает полосу частот самого сигнала, (т. е. Bs<BD), а временной период импульсов превышает
время когерентности канала (т. е. Ts>Tc), подвержен селективному по времени или быстрому федингу. Последний вызывает
достаточно сильный мультипликационный шум, существенно
искажающий информационный сигнал. Другими словами, импульсный отклик канала быстро меняется в течении периода
информационного сигнала. Поэтому такой фединг, проявляющийся во времени, назван быстрым или селективным по времени [6, 10]. Более того, быстрый фединг вызывает также частотную дисперсию по частоте за счет доплеровского уширения
несущей частоты импульсных сигналов, распространяющихся
в таком канале оптической связи. Поэтому данный фединг строго привязан к динамическому каналу связи, т. е., содержащему
движущиеся источники или приемники связи.
2.2. Импульсный канал связи, в котором импульсный отклик
канала изменяется во времени существенно медленнее периода
информационного сигнала, подвержен медленному федингу.
В этом случае, время когерентности канала намного превышает
период самого информационного сигнала, т. е. Ts<<Tc. При этом
доплеровское уширение частоты за счет динамики канала становится несущественным, и имеет место обратное неравенство,
указанное выше в п. 2.1, т. е. Bs>>BD. Оба неравенства, записанные для временного и частотного диапазонов канала импульсного сигнала, представлены в нижней части табл. 4.1.
Таким образом, в табл. 4.1 просуммированы всевозможные
соотношения между параметрами канала, статического и динамического, и типами фединга, вызывающими мультипликативный шум в канале. Данный шум, который в полной мере
зависит от частоты оптического сигнала, с различной степенью
влияния искажает информационные сигналы, распространяющиеся в многолучевых оптических каналах связи с федингом.
70
4.3. Математическое описание быстрого Фединга
Как ясно из результатов, просуммированных в табл. 4.1, быстрый фединг может проявиться как в стационарном канале,
при наличии многолучевости за счет многократных переотражений и рассеяний от помех (см. гл. 3), так и в динамическом
канале, при движении передатчика или приемника, либо самих
препятствий. В обеих ситуациях проявляется частотная или
временная дисперсия канала связи, приводящяя к существенному мультипликативному шуму, искажающему информацию
внутри несущего оптического сигнала.
Чтобы надежно предвидеть и предсказать ситуацию в различных оптических каналах связи с федингом, необходимо создание надежной статистической модели, описывающей наблюдаемые вариации огибающей результирующего сигнала и его
фазы. К сожалению, необходимо констатировать, что до настоящего времени не была создана универсальная стохастическая
модель, которая бы охватывала математическое описание всех
видов фединга и различных откликов канала на распространение сигналов -оптических и радио.
Был создан ряд удовлетворительных моделей и приведены
созданные ими различные функции распределения вероятности
и плотности вероятности для различных каналов связи с федингом. Так, в гл. 3 была рассмотрена двумерная (2-Д) модель Кларка [11], основанная на интерференции прямого (приходящего на
движущийся приемник) луча и лучей, рассеяных и отраженных помехами, окружающими передатчик и приемник. Затем
эта модель была экстраполирована на трехмерный (3-Д) случай
Аулином [12] (см. гл. 3).
Как было отмечено в гл. 1, и как будет показано в гл. 9 и 10,
в атмосферных беспроводных каналах связи ситуация намного сложнее. Даже при наличии прямой видимости между приемником и передатчиком, присутствие в воздухе различных
рассеивателей в виде аэрозолей, пыли, дождя снега и облаков,
вызывает многолучевость в канале связи и, как следствие, существенный быстрый, селективный по времени или по частоте,
фединг.
Поэтому, в зависимости от типа фединга и степени его воздействия на сигнал, были разработаны статистические модели и на
их основе – соответствующие функции распределения вероят71
ности (CDF) и их плотности вероятности (PDF), которые описывают быстрый фединг в беспроводных атмосферных многолучевых каналах связи, и на которых мы кратко остановимся ниже.
Следует также отметить, что те же функции применимы и при
описании природы многолучевости, имеющей место и в оптоволоконных каналах связи за счет дисперсионных свойств материалов оплетки волокна (см. гл. 8).
Математическое описание быстрого фединга начнем с наиболее сложного случая отсутствия в канале лучей прямой видимости и при наличии только многолучевой интерференционной
картины на приемном устройстве, созданной за счет многократного рассеяния оптических лучей. Данный случай наиболее
точно описывается с использованием модели Рэлея и его CDF и
PDF [10–14].
PDF и CDF Рэлея. Данная модель обычно используется для
описания мелкомасштабного в пространстве или быстрого по
времени фединга, имеющего место как в радио, так и в оптических каналах связи – стационарных и динамических [10- 14],
Как показано в гл. 3, распределение Рэлея можно получить математически для огибающей результирующего сигнала x(t) через сумму двух квадратурных компонент сигнала Гауссового
шума в предположении, что углы прихода многократно рассеяных сигналов и их случайные фазы равномерно и однородно
распределены в интервале [0, 2π], а средняя величина 〈x〉 случайных вариаций огибающей амплитуды сигнала x равна нулю.
При таких допущениях PDF Рэлея можно представить в следующем виде:
PDF
=
(x)
2
 x 
exp
−
, x ≥ 0, 
2
σ2
 2σ 
x
(4.12)
где σ – это стандартное отклонение огибающей амплитуды сигнала x. Из формулы (4.12) следует, что максимальное значение,
PDF(x) = exp(–0,5)/σ = 0,6065/σ, соответствует случайной переменной x = σ. Согласно определению полной вероятности и ее
плотности, отношение между CDF и PDF легко можно получить
следующим образом:
72
X
 X2 
CDF (X) =
Pr(x ≤ X) =∫ PDF (x)dx =−
1 exp − 2 . (4.13)
 2σ 
0
При общем представлении распределения Рэлея обычно оперируют с тремя важными параметрами, а именно, средней величиной огибающей амплитуды сигнала x, обозначаемой через
xсредн, его ожидаемой средней величиной xожид = E[x], а также
среднеквадратичной величиной огибающей амплитуды сигнала
x, обозначаемой через rms.
Cредняя величиной огибающей амплитуды или напряжения
реального оптического сигнала определяется из условия, что
полная вероятность события равна 50%, или:
1
=
2
xmedian
∫
PDF (x)dx (4.14)
0
из которой, после простых вычислений интеграла с учетом формулы (4.12) получаем
x=
ñðåä 1,177σ. (4.15)
Ожидаемая средняя величина огибающей амплитуды или
напряжения сигнала определяется классически из теории вероятностей с использованием формулы (4.12) следующим образом:
∞
xîæèä ≡ E[x] = ∫ x ⋅ PDF (x)dx = σ ⋅ π ≈ 1,253σ. 2
(4.16)
0
В то же время, из теории вероятностей следует классическое
определение вариации σ2x огибающей сигнала x или его средней
мощности через ее второй E[x2] и первый E[x] статистические
моменты:
∞
2
σ2x ≡ E[x2 ] − E2 [x] =
∫ x ⋅ PDF(x)dx −
0
πσ2
=
2
(4.17)
π

=
σ2  2 −  ≈ 0,429σ2 .
2

rms
=
(4.18)
Cреднеквадратичная величина огибающей сигнала x определяется через параметр вариации огибающей сигнала x следующим образом:
2 ⋅ σ ≈ 1,414σ. 73
Как следует из представленных формул, разница между
средней и средней ожидаемой величиной огибающей сигнала x
порядка ~0,07σ, а различие их PDF для этой огибающей в мощностном эквиваленте составляет всего 0,55 dB. Отличие от rms
у этих двух величин более значительное. Отметим, что на практике при прогнозировании и создании оптических каналов беспроводной связи используют среднюю величину огибающей амплитуды или напряжения реального оптического сигнала, так
как данные фединга обычно измеряют или регистрируют по
реальным вариациям поля оптической волны, приходящей на
вход приемного устройства в реальном времени.
PDF и CDF Райса. Как было указано в гл. 3 и упомянуто
выше, кроме многолучевой компоненты результирующего сигнала, приходящей на вход приемника за счет влияния помех на
пути распространения сигнала, зачастую в оптических и радио
каналах связи необходимо учитывать и компоненту прямой видимости между приемником и передатчиком, которая не подвержена влиянию помех. Последняя компонента называется
в литературе доминантной или компонентой прямой видимости (LOS-компонентой) [6, 10–14], так как распространяется по
прямому кратчайшему пути между терминалами канала связи
(смотри определения в гл. 1). Такая доминантная компонента,
если она присутствует в результирующем сигнале, может существенно уменьшить глубину случайных замираний в результирующей интерференционной картине, как в пространственном,
так и в временном диапазонах, и которая, согласно эргодической теореме, адекватно представляет регистрируемый сигнал
на входе приемника.
Итак, плотность функции распределения вероятности (PDF)
по Райсу, описывающая совместное распределение случайной
огибающей амплитуды (или напряжения) многолучевого сигнала x, и доминантной компоненты прямой видимости A, может
быть представлена согласно работам [10–14] следующим образом:
2
2
 Ax 
x
 x + A 
⋅I
PDF (x) = exp −
,
2
2  0 2 
σ
2σ
σ 


при A > 0, x ≥ 0, 74
(4.19)
где I0(⋅)– это модифицированная функция Бесселя первого рода
нулевого порядка. Зачастую, чтобы физически более наглядно
представить эффекты фединга за счет многолучевости результирующего сигнала, вводят параметр фединга K, названного в литературе параметром Райса, указывающего на степень влияния
доминантной компоненты огибающей сигнала A на результирующий сигнала, а именно, ее отношение к среднеквадратичной
компоненте огибающей многолучевого сигнала определяемой
формулой (4.18) :
K=
или в децибелах:
A2
2σ2
K = 10 log
A2
2σ2
(4.20)
, дБ. (4.21)
Тогда формулу (4.19) можно переписать следующим образом:
PDF=
(x)
 x2 
x

exp
K − 2  ⋅ exp ( − K ) ⋅ I0 
2
σ

σ
 2σ 
x
(4.22)
из которой следует тот факт, что распределение Райса является
более общим распределением, охватывающим оба других распределения, Рэйли и Гаусса.
Действительно, как следует из формулы (4.22), при K→0 имеем exp(–K) = 1 и I0(0) = 1, то есть, формула (4.22) трансформируется в формулу (4.12), описывающую канал Рэйли с сильным
многолучевом федингом и отсутствием компоненты прямой
видимости. В обратном предельном случае, когда доминантная
компонента значительно превышает многолучевую компоненту, т. е., когда K→∞, имеет место прямая видимость. При этом
канал Райса трансформируется в идеальный канал Гаусса, где
огибающая сигнала полностью описывается его доминантной
компонентой, а PDF Райса имеет форму дельта-функции (или
функции Дирака), соответствующую PDF Гаусса, рассмотренной в гл. 3 и которую мы представим ниже при математическом
описании медленного фединга.
Так как PDF Райса имеет более сложный вид, чем PDF Рэйли,
то и функция распределения Райса также будет иметь более сложный вид, отличный от формул (4.19) или (4.22), за счет суммиро75
вания по бесконечному числу произведений модифицированных
функций Бесселя Im(⋅) первого рода m-го порядка, а именно,
 
x2  
CDF (X) =−
1 exp −  K + 2   ×

2σr  
 
∞ 
 x ⋅ 2K 
σ 2K 
×∑ r
⋅ Im 

. 

r
 σr 

m =0 
(4.23)
Отметим вновь, что из формулы (4.23) получаем CDF Рейли,
описываемой формулой (4.13) при стремлении параметра фединга K к нулю, и получаем CDF Гаусса при K→∞, описанной ниже.
Для практических
целей использования формулы (4.23) учиты∞
вают в ряде ∑ ( ∗) только тот последний член, чей вклад в сумm =0
му составляет всего 0,1%.
Как было показано в работе [9], CDF Райса с K = 2 в канале
с быстрым федингом, составляющим 14 дБ, указывает на вероятность такого события порядка 10–2. В работе [14], вместо
сложной формулы (4.23), была получена квадратурная формула, которая позволила вычислить среднюю величину и среднеквадратичную оптического сигнала в канале Райса через параметр фединга K. Так, на основе определений средней величины
и вариации случайной переменной, введенных в работах [3, 6],
в работе [14] была получена средняя величина
∞
xñðåä (K) =
∫ x ⋅ PDF(x)dx =
(
0
)
(1 + K) I0 2Kx + KI1 ( K / 2 )  =


и вариация сигнала, подверженного быстрому федингу
σ2x (K) =
∞
∫x
2
⋅ PDF (x)dx = 2 ⋅ (1 + K) − µ2r (4.24)
(4.25)
0
в обозначениях, введенных в данной главе. Здесь, как и выше,
I1(⋅) – это модифицированная функция Бесселя первого рода
первого порядка, µ2r – отклонение в мощности сигнала после прохождения им канала связи с федингом.
С практической точки зрения, конечно надо дифференцировать в сложной формуле (4.23) случаи, когда надо учитывать
многолучевую некогерентную компоненту результирующего
76
сигнала (при K<2) и когда считать ее слабой добавкой к доминантной (когерентной) составляющей результирующего сигнала (при K ≥ 2). Так, при K<2, согласно работе [14], получаем для
средней величины фединга результирующего сигнала в канале
Райса (с учетом введенных нами обозначений) следующую формулу:
xñðåä (K) =
π ∞ 2 (−1)n
+∑ ⋅
Kn , 2 n =1 π (2n − 1)!
(4.26a)
тогда, как при K ≥ 2, получаем:
xñðåä (K
=
)
1
1 

2K  1 −
+
. 4
K
K2 

(4.26б)
Такие же приближенные формулы можно получить для вариации результирующего сигнала в канале Райса с федингом, следуя работе [14], но вводя наши обозначения, а именно, при K<2:
 K
π

σ2r (K) =1 −  − 1  ⋅ exp −
, 2

 2
(4.27a)
тогда, как при K ≥ 2, получаем:
σ2r (K) =1 −
1 
1
1 
 1 + − 2 .
4K 
K K 
(4.27б)
Таким образом, если известен параметр K фединга в канале
Райса, то можно достаточно точно оценить распределение огибающей результирующего сигнала (т. е. его PDF и CDF), и, следовательно, степень влияния фединга на распространение сигналов
в реальных оптических каналах беспроводной связи.
Распределение Гамма-Гамма. Данное распределение является наиболее общим и хорошо известным, используемым при
прогнозировании флуктуаций оптического излучения в атмосферных беспроводных каналах связи, которое охватывает также распространение промодулированных оптических волн в атмосфере [15–17]. Гамма-Гамма распределение может быть получено посредством анализа модуляционного процесса, при котором двойное стохастическое экспоненциальное распределение
вероятности напрямую связано с атмосферными параметрами.
77
Эта связь происходит за счет использования простых Гамма
распределений, описывающих мелкомасштабные и крупномасштабные помехи (турбулентности), случайным образом распределенные вдоль траектории распространения оптической волны
[15–17]:
=
px (x)
=
py (y)
α(αx)α−1
exp(−αx), ïðè
Γ(α)
β(βy)β−1
exp(−β y), ïðè
Γ(β)
x > 0, α > 0; (4.28a)
y > 0, β > 0,
(4.28б)
где x и y – средние величины интенсивности излучения волны,
т. е. x = y = 〈I〉, и являются случайными параметрами, а I – это искомая нормализованная интенсивность излучения. В формулах
(4.28) Г[•] – Гамма-функция, а параметры α и β соответствуют
слабым и сильным флуктуациям, соответственно. Фиксируя теперь x и записывая y = I/x, мы получаем условную и полную PDF,
соответственно:
=
py (I | x)
(
β β⋅I / x
xΓ(β)
)
β−1
exp(−β I / x), ïðè I > 0; (4.29)
∞
=
p(I)
py (I | x) px (x)dx
∫=
0
2(αβ)(α+β)/2 [(α+β)/2]−1
I
Kα−β 2(αβI)1/2  ,


Γ(α)Γ(β)
(4.30)
ïðè I > 0,
где Kα–β[•] представляет функцию Бесселя второго рода и (α–β)го порядка.
Данное распределение описывает два режима фединга оптических сигналов в зависимости от рассматриваемых параметров α
и β, где α представляет эффективное число крупномасштабных
случайных флуктуаций сигнала (то есть, крупномасштабный
фединг), а параметр β представляет эффективное число мелкомасштабных случайных флуктуаций сигнала (т. е., мелкомасштабный фединг). Анализ этих параметров на процессы распространения оптических сигналов в случайно-неоднородной
78
турбулентной атмосфере и на соответствующее поведение этих
параметров и на степень влияния фединга, будут даны в гл. 9 и
10, следуя работам [15–17].
Распределение вероятности Гамма-Гамма считается отрицательным экспоненциальным распределением вероятности проявления фединга в атмосферном беспроводном канале связи
[15–17]. Мелкомасштабный и крупномасштабный параметры
воздействия фединга можно представить в следующем виде:
=
α
1
σ2x
=
, β
1
σ2y
,
(4.31)
где σ2x и σ2y – нормализованные вариации параметров x и y, соответственно.
Тогда полный индекс вариаций интенсивности оптического
сигнала (мы поговорим о нем подробней в гл. 9 и 10 при рассмотрении распространения оптических сигналов в беспроводных
каналах связи, проходящих через турбулентную атмосферу) будет определяться следующим образом:
σ2I =
1 1 1
+ +
.
α β αβ
(4.32)
Кроме того, данное распределение будет использовано для
анализа влияния фединга на прохождение потоков импульсной
информации через беспроводные атмосферные каналы связи
(см. гл. 10) и затем, а гл. 11 будет дана связь между параметрами
Гамма-Гамма распределения и параметром фединга K в распределении Райса.
4.4. Математическое описание медленного Фединга
Как было отмечено в работах [5–8, 10–14], случайные эффекты от затенений прямой видимости, созданных помехами на пути
распространения оптической волны (луча), приводят к медленному (по времени) и крупномасштабному (в пространстве) федингу. Данный тип фединга описывается распределением Гаусса,
оперирующим сигналами, измеряемыми в децибелах (дБ), или
же нормально-логарифмическим распределением, оперирующим
сигналами, измеряемыми в ваттах (Вт). Так как оба распределения являются идентичной формой представления медленного фе79
динга, остановимся ниже на Гауссовой функции распределения
вероятности (CDF) и ее плотности вероятности (PDF).
Гауссова PDF и CDF. Согласно Работ [10, 14] определим плотность вероятности (т. е., фрунции распределения) огибающей
случайной переменной x (например, амплитуды или напряжения оптического сигнала на входе приемника) следующим образом:
=
PDF (x)
 ( x − x )2 


exp −
. 2
σ 2π
2σ


1
(4.33)
Здесь x ≡ x – средняя величина огибающего сигнала, σ – среднеквадратичная величина вариаций амплитуды
или напряжения сигнала относительно средней величины,
σ2= x2 − x 2 – вариация усредненной по времени мощности
огибающей принимаемого сигнала (здесь, как и выше, 〈w〉 – значок усреднения переменной w). Для равномерного распределения фаз дифрагированных случайным образом компонент результирующего сигнала в угловом промежутке [0, 2π], вводят
распределение с нулевым средним значением, т. е., при x = 0 и
σ2 = 〈x2〉 в формуле (4.33).
Необходимо отметить, что максимум PDF равен
1
. При x = σ из формулы (4.33) следует, что
PDF (0) =
σ 2π
1
, где e≈2,71.
PDF (σ) =
σ 2πe
В общем случае, используя связь между функцией распределения вероятности (CDF) и ее плотностью PDF и учитывая, что
CDF описывает вероятность события, что огибающая амплитуды или напряжения случайного принимаемого сигнала не превышает передельную величину фединга X в системе связи, т. е.,
CDF (X)= Pr(x ≤ X)=
X
∫ PDF(x)dx=
0
80
2
X

X − x 
1
 (x − x)  1 1
=∫ exp −
+ erf 
=
, 2
2
2
σ 2π −∞
2σ
 2σ 


(4.34)
где функция ошибок определяется выражением
erf ( w )
=
2
w
∫ exp ( −y
π0
2
)dy. (4.35)
Величине x = 0 соответствует CDF = 1/2, которая затем стремится к единице при x >> 1. Используя функции распределения (4.33) и (4.34) и получая в ходе экспериментов информацию
о средней величине x (если она не равна нулю), и о вариации
σ2 = 〈x2〉 принимаемого сигнала, можно легко предсказать Гауссовый медленный по времени и крупномасштабный в пространстве фединг. Данный тип фединга, как указывалось выше, является источником, вызывающим мультипликативный шум, а
также все связанные с ним эффекты искажения информационных сигналов в оптических каналах связи.
Литература
1. Marcuse O. Light transmission optics, New York: Van
Nostrand-Reinhold Publisher, 1972.
2. Midwinter J. E. Optical fibers for transmission, New York:
John Wiley & Sons, 1979.
3. Djuknic G. M., Freidenfelds J., Okunev Y. «Establishing
wireless communication services via high-altitude aeronautical
platforms: a concept whose time has come?», IEEE Communication
Magazine, pp. 128–135, 1997.
4. Hase Y., Miura R., Ohmori S. «A novel broadband all-wireless
access network using stratospheric radio platform», VTC’98 (48th
Vehicular Technology Conference), Ottawa, Canada, May 1998.
5. Lee W. Y. C. Mobile communication engineering, New York:
McGraw Hill Publications, 1985.
6. Rappaport T. S. Wireless communications, New York: Prentice
Hall PTR, 1996.
7. Stremler F. G. Introduction to communication systems,
Addison-Wesley Reading, 1982.
8. Biglieri E., Proakis J., Shamai S. «Fading channels:
information, theoretic and communication aspects», IEEE Trans.
Information Theory, vol. 44, No. 6, pp. 2619–2692, 1998.
9. Nielsen T. H. «IPv6 for Wireless Networks», J. Wireless
Personal Communications, 2001, vol. 17, pp. 237–247.
81
10. Blaunstein N., Christodoulou Ch. Radio propagation and
adaptive antennas for wireless communication links: terrestrial,
atmospheric and ionospheric, Wiley InterScience, New Jersey,
2007.
11. Clarke R. H. «A statistical theory of mobile-radio reception»,
Bell Systems Technical Journal, vol. 47, 1968, pp. 957–1000.
12. Aulin T. «A modified model for the fading signal at a mobile
radio channel», IEEE Trans. Veh. Technol., vol. 28, No. 3, 1979, pp.
182–203.
13. Blaunstein N. Chapter 12, Wireless communication systems,
Hanbook of Engineering Electromagnetics, Edited by Rajeev
Bansal, Marcel Dekker, NY, 2004.
14. Modulation
and
coding
techniques
in
wireless
communications, Ed. by Krouk, E., and S. Semionov. Chichester,
England: John Wiley & Sons, 2011.
82
ГЛАВА 5. МОДУЛЯЦИЯ СИГНАЛОВ
В ОПТИЧЕСКИХ КАНАЛАХ СВЯЗИ
Как было показано в гл. 3, разделяют два типа сигналов, распространяющиеся в оптических проводных и беспроводных
каналах связи: непрерывные по времени (или аналоговые), и
дискретные по времени (или цифровые) [1–5]. Поэтому к этим
сигналам применяют соответствующие виды модуляции – аналоговую и дискретную. Определим вначале – что означает процесс модуляции и демодуляции.
Модуляция – процесс, при котором посылаемая информация
добавляется к несущему оптическому сигналу. Другими словами, модуляция – это процесс кодирования потока информации, находящейся в передающем источнике информации в той
форме, которая приемлема для того или иного способа передачи
информации. Таким образом, данный процесс включает перевод информационного сигнала, как источника, в несуший оптический сигнал на частоте, которая намного превышает частоту
информационного сигнала (смотри определения типов сигналов
в гл. 3). Информационный сигнал зачастую называют модулирующим сигналом, а несущий результирующий оптический
сигнал, содержащий в себе информационный сигнал, называют
промодулированным сигналом [3–10].
Модуляция происходит при изменении во времени амплитуды, фазы или частоты высокочастотного несущего сигнала
в унисон соответствующих изменений модулирующего сигнала.
Аналоговая модуляция была применена в первых генерациях
проводной и беспроводной связи, и в настоящее время применяется в оптических локационных системах (ЛИДАРах) и в системах изображения информации. В последующих генерациях
оптической связи (см. гл. 1) стали применяться различные видц
цифровой модуляции.
Демодуляция – это процесс извлечения в приемном устройстве информационного сигнала из результирующего оптического сигнала путем исключения из последнего несущий сигнал
[1–3].
Ниже будут кратко рассмотрены оба вида модуляции – аналоговой и цифровой для обоих типов каналов, узкополосного и
широкополосного.
83
5.1. Аналоговая модуляция – типы и принципы
Каждый аналоговый сигнал содержит три изменяющихся во
времени характеристики: амплитуду сигнала a(t), его фазу ϕ(t)
и угловую частоту ω(t) = 2πf(t), где f(t) – несущая частота сигнала. Связь между этими параметрами заложена в гармонической
презентации фазы самого аналового сигнала, ϕ(t) = ω(t)⋅t+ϕ0, где
ϕ0 – начальная фаза сигнала при t = 0. Другими словами любой
аналоговый гармонический сигнал можно представить через
эти три параметра следующим образом
=
x(t) a=
(t)e jϕ(t) a(t)e j [ω(t)⋅t +ϕ0 ] . (5.1)
Соответственно, существуют три типа модуляции такого сигнала, зависящие от того, какая из временных характеристик
задействована для модуляции в модулируемом сигнале (то есть
в информационном сигнале): амплитудная (АМ), фазовая (ФМ),
или частотная (ЧМ) модуляция.
5.1.1. Аналоговая амплитудная модуляция
При использовании амплитудной модуляции (АМ) амплитуда высокочастотного несущего сигнала меняется во времени
согласно медленно меняющейся амплитуде модулирующего информационного сигнала. АМ-сигнал может быть представлен
через несущий сигнал и модулирующий информационный сигнал следующим образом
s AM (t) =+
Ac [1 m(t)]cos(2πfc t), (5.2)
где xс (t) = Accos(2πfct) – несущий сигнал с амплитудой Ac и с высокой несущей частотой fc, m(t) = (Am/Ac)cos(2πfmt) – синусоидальный модулирующий сигнал с амплитудой Am и с низкой частотой fm. Обычно вводится индекс модуляции km = (Am/Ac), который выражается в процентах и поэтому назван процентным
параметром амплитудной модуляции.
Рис. 5.1 представляет синусоидальный модулирующий информационный сигнал m(t) и соответственный AM-сигнал
SAM(t) для случая km = (Am/Ac) = 0,5 (50%). Такой сигнал определяют как пятидесяти-процентный промодулированный сигнал.
Отметим, что если km(%)>100%, информационный сигнал
будет полностью искажен на входе приемного устройства, регистрирующего огибающую результирующего промодулирован84
1
0.5
m(t) 0
-0.5
-1
0
0.5
1
время
1.5
2
1/fc
1/fm
1
0.5
SAM (t) 0
0
- .5
-1
1
время
2
Рис. 5.1. Амплитудно-модулирующий сигнал (верхняя панель) и промодулированный сигнал (нижняя панель) при индексе модуляции
km = 0.5
ного сигнала. Уравнение (5.2) может быть переписано в следующем виде:
=
s AM (t) Re[g(t)exp( j2πfc t)], (5.3)
где g(t) – комплексная огибающая AM-сигнала, заданная согласно (5.2) в виде
=
g(t) Ac [1 + m(t)]. (5.4)
Соответствующий спектр такого AM сигнала может быть
предсчтавлен согласно работам [1–4] как
S AM (=
f)
1
Ac [ δ(f − fc ) + SM (f − fc ) + δ(f + fc ) + SM (f + fc ) ]. (5.5)
2
85
Здеcь δ(•) – единичная импульсная функция (дельта-функция), и SAM(t) SM (f ) – спектр информационного сигнала. Полоса пропускания AM сигнала равна BAM = 2fm , где fm – максимальная частота модулирующего информационного сигнала.
Полная мощность AM-сигнала равна [1–4]
PAM
=
(t)
1
Ac 1 + 2 < m(t) > + < m2 (t) >  

2
(5.6)
где < m(t) > представляет среднюю величину информационного
сигнала.
Используя выражение для информационного сигнала через
индекс модуляции, приведенного выше, можно упростить выражение (5.6) и представить его в виде
PAM (t) =
 k2 
1
Ac [1 + Pm ] = Pc 1 + m  , 2
2 

(5.7)
1 2
Ac – мощность несущего сигнала и Pm =
< m2 (t) > –
2
мощность модулирующего сигнала информации. Можно показать, что
где Pc =
 1  k2 
k2
1
1
[ PAM − Pc ]=  Pc + Pc m − Pc =  Pc m =
2
2 
2
2 
 2 
2 
1  Ac2 Am
1 2 1
=
=
Am
Pm

 =
2  2 2 Ac2  8
4
(5.8)
из чего следует, что [ PAM − Pc ] =
Pm / 2.
5.1.2. Аналоговая угловая модуляция –
частотная и фазовая
Частотная модуляция (ЧМ) является составной частью
угловой модуляции, где несущие частота fc (t) меняется линейно
с волновым профилем информационного сигнала m(t), то есть,
86
fc (t=
) fc + kf m(t), (5.9)
где kf – параметр изменения частоты в модулированном сигнале, измеряемый в «герцах-на-вольт» (Гц/В), m(t) – сигнал, несущий информацию, то есть, низкочастотный информационный
сигнал.
В сигнале с частотной модуляцией (ЧМ) фаза θ(t) несушего
сигнала с частотой fc будет промодулирована следующим образом:
t
t


θ(t) =2π∫ fc (t′)dt′ =2π fc t + kf ∫ m(t′)dt′ . 

0
0
(5.10)
Если это так, то реальный сигнал, содержащий в себе несущий сигнал и информационный сигнал, можно представить
в следующей форме:
t



s=
(
t
)
Re[
g
(
t
)exp(
j
2
=
π
f
t
)]
A
cos
2
π
f
t
+
2
π
k
c
c
c
f ∫ m(t′)dt′  . (5.11)
×Ì


0
Здесь огибающая сигнала g(t) является комплексным низкочастотным сигналом, несущем информацию в промодулированном сигнале:
t


=
g(t) Ac exp 2πkf ∫ m(t′)dt′ , 

0
(5.12)
где, как и ранее в тексте, Re[w] – реальная часть произвольной
функции w.
Процесс частотной модуляции изображен схематически на
рис. 5.2.
Отметим, что при частотной модуляции амплитуда огибающей реального сигнала остается неизменной и меняется только
частота. Такой подход позволяет эффективно использовать частотную модуляцию для нелинейного усиления приемного сигнала в нелинейных оптических усилителях
Так например, если модулирующий низкочастотный информационный сигнал синусоидален как по амплитуде, так и по
частоте, то промодулированный реальный сигнал может быть
представлен следующим образом:
kf Am


s×Ì
=
(t) Ac cos 2πfc t +
sin(2πfm t)  . fm


(5.13)
87
m(t)
Информационный
сигнал
fc+∆f
fi(t)
fc
fc–∆f
Ac
–Ac
s(t)
Частота
модуляции
ЧМ-сигнал
Рис. 5.2. Модулирующий информационный
низкочастотный сигнал (верхний график),
изменяющаяся во времени частота модуляции (средний график),
и частотно-промодулированный сигнал (нижний график)
При фазовой модуляции (ФМ), промодулированный по фазе
θ(t) несущий сигнал согласно (5.10) также можно представить
аналогично ЧМ-сигналу в следующем виде:
sÔÌ
=
(t) Ac cos [2πfc t + kθm(t) ] (5.14)
В выражении (5.14) kθ – коэффициент модуляции по фазе,
показывающий на сколько по времени меняется фаза несущего
сигнала в зависимости от вида информации m(t). Его измеряют
в «радианах-на-вольт» (Р/В).
Из выражений (5.11) и (5.14) следует, что ЧМ-сигнал можно
считать ФМ-сигналом, в котором модулирующий низкочастотный сигнал проинтегрирован перед процессом модуляции. И
наоборот, из (5.11) и (5.14) следует, что ФМ-сигнал можно считать ЧМ-сигналом, в котором взята производная по времени от
модулирующего низкочастотного сигнала перед процессом модуляции.
Другими словами, ЧМ-сигнал можно генерировать интегрируя вначале m(t), а затем используя результат интегрирования
на входе фазового модулятора, и, наоборот, вначале дифферен88
цируя m(t), а затем использовать результат дифференцирования
на входе частотного модулятора.
Индекс частотной модуляции определяется посредством
пика амплитуды сигнала информации Am , полосой пропускания Bf переданного информационного сигнала и коэффициентом частотной модуляции kf , введенным выше, а именно,
=
βf
kf Am ∆f
=
, Bf
Bf
(5.15)
где ∆f – это максимум изменения частоты модулирующего сигнала. Отметим, что обычно Bf соответствует наиболее высокой
частоте fm , присутствующей в модулирующем информационном сигнале, и тогда можно просто записать формулу (5.15), как
βf =∆f / fm . Индекс фазовой модуляции можно определить аналогичным образом в следующем виде:
βθ = kθ Am = ∆θ, (5.16)
где ∆θ – это максимум изменения фазы модулирующего сигнала в передающем устройстве.
5.1.3. Спектральная мощность
и полоса пропускания ЧМ и ФМ сигналов
Как было отмечено выше, ЧМ- и ФМ-сигналы имеют подобные формы представления модулированного сигнала. Поэтому,
не нарушая общности изложения обсуждаемого предмета, мы
остановимся в дальнейшем на описании характеристик частотно-модулированного сигнала. Так как ЧМ-сигнал является нелинейной функцией модулируюшего сигнала m(t), спектральные характеристики результирующего промодулированного
сигнала s(t) невозможно получить напрямую через спектральные характеристики модулируюшего сигнала m(t). При этом
полоса пропускания сигнала s(t) зависит от индекса частотной
модуляции βf =∆f / fm . Если βf < 1, то генерируется узкополосный ЧМ-сигнал. Если βf >> 1, то генерируется широкополосный
ЧМ-сигнал со спектральной шириной сигнала s(t), которая немного превышает полосу частот 2∆f. Для произвольного индекса модуляции приближенная полоса частот ЧМ-сигнала, BT ,
которая определяется по 98% концентрации мощности резуль89
тирующего промодулированного сигнала внутри этой полосы,
ограничена как снизу, так и сверху следующими границами, согласно условию, определённому Карсоном [3–5]


1
2∆f  1 +

β

f

BT = 

1

2∆f  1 + β
f



 ≈ 2(βf + 1)fm , βf < 1;


βf >> 1.
 ≈ 2∆f,

(5.17)
Это ограничение носит в литературе название правила Карсона [3–5]. Оно гласит, что для верхней границы спектр ЧМсигнала ограничен несущей частотой fc оптического сигнала
и одной из пар полосы вокруг нее, то есть, fc ± fm . Для нижней
границы спектр ЧМ-сигнала немного превышает или равен полосе частот 2∆f.
Существуют два варианта генерирования ЧМ-сигналов, прямой и обратный, а также много методов и техник его демодуляции, используя различные виды оптических детекторов. Этот
специфический вопрос остается вне рамок данной главы, и, поэтому, мы отсылаем читателя к специальной литературе [1–5].
5.1.4. Связь между полосой пропускания
и отношением сигнала к шуму для АМ и ЧМ сигналов
В оптических системах с угловой модуляцией, частотной или
фазовой, отношением сигнала к шуму (обозначаемое в литературе SNR) перед детектированием является функцией промежуточной частоты фильтров приемника [3–5]. При этом SNR на
входе приемного устройства определяется следующим образом
[3–5]
(SNR)âõ =
Ac2 / 2
.
2N0 (βf + 1) BF
(5.18)
Здесь Ac – амплитуда несущего сигнала, N0 – спектральная
плотность белого или Гауссового шума, рассмотренного в гл. 3 и
4, и BF – эквивалентная полоса частот фильтра, пропускающего реальный сигнал с информацией через приемник. Отметим,
что (SNR)âõ использует полосу пропускания несущего сигнала
согласно правила Карсона, представленного формулой (5.17).
90
После детектирования в приемном устройстве, SNR является функцией максимальной частоты fm информационного сигнала, индексов модуляции βf или βθ , и SNR, заданной на входе
приемного устройства перед детектированием принимаемого
сигнала (SNR)âõ . Например, согласно работе [5], выходное отношение сигнала к шуму зависит от индекса модуляции следующим образом
2
 m(t) 
(SNR)âûõ = 6 ( βf + 1) β2f 

 Vp 


(SNR)âõ , (5.19)
где Vp – отношение напряжения модулирующего сигнала m(t)
на его пике к его нулевому значению.
Для сравнения, приведем согласно работе [3] (SNR)âõ для АМсигнала, которое согласно определению входного сигнала для
конвенционального АМ приемника с полосой пропускания
2BF , , равено
(SNR)âõAM
=
Pc
Ac2
. =
N 2N0 BF
(5.20)
Тогда при
=
m(t) Am sin 2πfm t из формулы (5.19) получаем
(SNR)âûõ.×Ì = 3 ( βf + 1) β2f (SNR)âõ.×Ì , (5.21)
тогда как для АМ сигнала имеем [3]
(SNR)âûõ.ÀÌ = 3β2f (SNR)âõ.AM . (5.22)
Отметим, что выражения (5.18)–(5.22) верны, если поступающий на вход сигнал с шумом превышает порог чувствительности ЧМ или АМ детектора. Так, минимальное значение величины (SNR)âõ на входе приемника, необходимой для превышения
порога чувствительности, должно быть около 10 дБ [3]. Ниже
этого порога демодулированный сигнал становится полностью
шумовым, и вся информация растворена в шуме.
Уравнение (5.21) показывает, что на выходе ЧМ приемного
устройства отношение сигнал-шум (SNR) может быть увеличе91
но с увеличением индекса модуляции βf передающего сигнала. В тоже время, увеличение индекса модуляции βf приводит
к увеличению полосы частот и заполнения спектра энергией
приемного сигнала. Действительно, для больших значений правило Карсона указывает на полосу частот в 2βf fm .
Из формул (5.21) и (5.22) также следует, что на выходе ЧМ детектора SNR в (βf + 1) раза превышает SNR на выходе АМ детектора при одной и той же полосе частот. Более того, (SNR)âûõ.×Ì
при частотной модуляции намного превышает (при βf > 1)
(SNR)âûõ.ÀÌ при амплитудной модуляции.
И, наконец необходимо отметить, что, как следует из формулы (5.21) (SNR)âûõ.×Ì увеличивается по кубическому закону с увеличением полосы частот информационного сигнала.
Данный факт является хорошей иллюстрацией того, почему
ЧМ детекторы предоставляют хорошую защиту от сигналов
с быстрым федингом в сравнении с АМ детекторами. Сколько
времени (SNR)âõ.×Ì превышает предел чувствительности приемника, столько времени (SNR)âûõ.×Ì будет намного превышать (SNR)âûõ.ÀÌ . Метод, называемый превышением порога
чувствительности, обычно используется в ЧМ демодуляторах
для улучщения чувствительности детектирования до уровня порядка (SNR)âõ.×Ì = 6dB [5].
5.2. Цифровая модуляция оптических сигналов
Как было показано выше, процесс модуляции сводится к смешиванию сигнала с информацией (названному информационным) с сигналом, распространяющимся по каналу с несущей
частотой для передачи этой информации (названным несущим).
При цифровой модуляции поток битов информации, как элементарных ее носителей, передается посредством несущего непрерывного сигнала, то есть, конвертируется в аналоговый непрерывный сигнал определённого типа (согласно формуле (5.1)),
несущего в себе поток цифровых битов в виде заданной информации. При этом, аналоговый сигнал согласно формуле (5.1) содержит амплитуду, фазу и частоту. Изменяя во времени каждую
из этих трех характеристик формируем три вида цифровой модуляции, а именно [3–10]:
92
– Ключевое изменение по амплитуде (ASK) при постоянстве
фазы и частоты несущего сигнала.
– Ключевое изменение по частоте (FSK) при постоянстве фазы
и амплитуды несущего сигнала.
– Ключевое изменение по фазе (PSK) при постоянстве частоты и амплитуды несущего сигнала.
Комбинация из этих трех типов модуляции обычно называют гибридной модуляцией. Так, при постоянной частоте, но изменяющихся амплитуде и фазе, имеют дело с квадратурной амплитудной модуляцией (QAM). При этом ряд методов являются
линейными, например, бинарное изменение по фазе (BPSK),
квадратурное изменение по фазе (QPSK), включая π / 4 − QPSK,
DQPSK и π / 4 − DQPSK (один из таких видов будет рассмотрен
в качестве примера ниже), и так далее. В то же время, FSK, а
также минимальное ключевое изменение (MSK) и Гауссовое минимальное ключевое изменение (GMSK) являются примерами
видов нелинейной цифровой модуляции (смотри детали в работах [3–10]).
Благодаря тому, что цифровая модуляция имеет многочисленные преимущества по сравнению с аналоговой молуляцией,
ее и используют в различных системах беспроводной оптической
и радио связи. Приведем ряд ключевых преимуществ. Это сильная помехозащищенность, возможность комбинировать различную по форме и содержанию информацию, их объединение
при передаче информации (например, звуковой, видео и аудио),
возможность добавлять, повторять и дублировать информацию
в любом месте потока цифровых битов, защитить информацию
g(t)
t
Рис. 5.3. Представление огибающей g(t)
информационного сигнала в виде потока
прямоугодьных импульсов
93
от проникновения внешних помех, и так далее. Более того,
цифровая передача данных может содержать коды контроля
за ошибками, которые выявляют и корректируют переданные
ошибки и поддерживают комплексныую обработку сигналов и
другие виды выявления нужных и ненужных кодов (см. гл. 7).
При цифровой передаче информации в различных проводных и беспроводных линиях связи, промодулированный информационный сигнал может быть представлен в виде последовательности символов или импульсов прямоугольной формы,
где каждый символ имеет конечиое число статусов m, как это
иллюстрируется на рис. 5.3 (подробности смотрите в гл. 7).
Каждый символ представляет n битов информации, где
n = log2 m битов на один символ.
5.2.1. Основные параметры цифровой модуляции
Эффективность по мощности и по частотной полосе. Эффективность каждого метода или техники цифровой модуляции
зависит от многих факторов. Основаная цель такой модуляции
в обеспечении в любых внешних условиях для каналов с федингом и многолучевостью минимальной ошибки при передаче
битов информации (так называемой ошибки в скорости передачи информации, BER) при низком отношении сигнала к шуму
(SNR), а также в обеспечении минимального заполнения полосы
частот, и так далее.
Создание схем модуляции базируется также на таких параметрах, как эффективность по мощности и по заполнению полосы частот. В цифровых системах связи для увеличения иммунитета от различного рода шумов необходимо увеличивать
мощность сигнала. При этом может увеличиться и присутствие
шума в канале связи. Вероятность ошибки при этом зависит от
вида применяемой модуляции, о чем будет указано ниже.
Эффективность по мощности, η p , в системе цифровой модуляции обычно определяется отношением мощности полезного
сигнала Es (то есть, сигнала с информацией) к мощности шумового сигнала, определяемого произведением спектральной плотности шума N0 на полосу пропускания канала или системы
Bω , т. е., η p = Es / (N0 ⋅ Bω ) на входе приемного устройства. При
этом η p должна обеспечивать ошибку в приеме информации
с вероятностью, не превышающей 10−5.
94
Эффективность использования полосы частот, ηB , определяется способностью схемы модуляции в системе цифровой
модуляции пропустить поток данных через лимитированную
полосу частот, установленную для конкретной системы связи.
Обычно, увеличение скорости передачи информации приводит к уменьшению ширины импульса, определяющего цифровой символ, который в свою очередь увеличивает полосу частот
сигнала. Эффективность полосы частот отражает способность
эффективно утилизовать полосу частот и определяется отношением максимальной скоростью передачи информации, измеряемой в битах на секунду (бит/с) и на заданную полосу частот
(в Герцах) и окончательно измеряется в бит/c/Гц. Если обозначить скорость передачи информации через R, бит/c и через Bw,
Гц – полосу частот системы, пропускающей поток данных, то
эффективность использования полосы частот, названной в литературе спектральной эффективностью, определяют следующим образом:
R
ηB = , áèò/ñ/Ãö. Bω
(5.23)
Тогда емкость системы цифровой связи C [бит/c] напрямую
связана с спектральной эффективностью через полосу пропускания этой системы, то есть,

S 
=
C Bω log2  1 +
. N0 Bω 

(5.24)
Эта формула фактически определяет максимальнуу скорость
передачи информации, а соответствующая ей максимальная
спектральная эффективность системы тогда будет определяться
следующим образом: ηBì =
C / Bω .
Итак, в формуле (5.24) C – это емкость или пропускная способность канала (в бит/c), Bw – полоса пропускания канала связи
(в Гц), N0 – спектральная плотность мощности шумового сигнаS
S
ла (в Ватт/Гц) и
= – отнощение сигнала к шуму.
N0 Bω N
Предел максимального использования заданной полосы пропускания канала связи, определенный формулой (5.24), а также
соответствие с регистрируемым на входе приемника отношени95
ем информационного сигнала к шуму, устанавливает теорема
кодирования Шеннона-Хартри [6]. Она была введена в 1947 году
Шенноном, и определяет фундаментальный смысл передачи закодированной информации через произвольный канал связи,
оптический или радио, проводной или беспроводной. Эта теорема устанавливает следующий факт:
Для произвольной вероятности ошибки при передаче кодов,
максимально возможная спектральная эффективность канала связи ограничена белым или Гауссовым шумом в канале.
Данный шум описывается соответствующими PDF и CDF,
введенными в гл. 4, а данное ограничение по пропускной способности передачи информации заложено в формуде (5.24).
Полоса пропускания и спектральная плотность. Определение полосы частот сигнала меняется согласно контекста, и нет
общего определения, описывающего все применения в теории
связи [6]. Определяет эти все изменения при определении полосы пропускания специальная характеристика, спектральная
плотность мощности (СПМ) сигнала. Так, СПМ случайного сигнала x(t) определяется таким образом [7]:
 | X (f ) |2
T
Px (t) = lim 
T
T →∞ 


, 


(5.25)
где значек • обозначает усреднение по ансамблю огибающих
сигнала x(t), XT (f ) – Фурье преобразование периодической,
с периодом T, функции xT (t), являющейся периодической версией огибающей реального сигнала x(t), и которая определяется, как
−T / 2 < t < T / 2
x(t)
xT (t) = 
.
 0 t âñþäó âíå èíòåðâàëà (5.26)
Отметим еще раз, что существует связь между спектральной
плотностью по мощности промодулированного несущего сигнала и спектральной плотностью по мощности информационного
комплексного сигнала, определенная в гл. 4. Мы приведем ее
еще раз для наглядности последующего изложения материала.
Так, если несущий сигнал s(t) представлен в виде
96
=
s(t) Re[g(t)exp( j2πfc t)], (5.27)
где g(t) – это комплексная огибающая информационного сигнала, то СПМ промодулированного сигнала, несущего эту информацию запишется согласно работам [3–10] так:
P
=
s (f )
1
 Pg (f + fc ) + Pg (−f − fc )  , 4
(5.28)
где Pg (f ) – это СПМ сигнала g(t). Сравнивая формулы (5.5) и
(5.28) видно, что спектральная плотность аналового (т. е. непрерывного) и цифрового (т. е. дискретного) несущего сигнала после его модуляции имеет ту же форму представления через СПМ
огибающей комплексного информационного сигнала g(t).
Абсолютную полосу частот сигнала определяют как частотный диапазон, внутри которого сигнал имеет ненулевую спектральную плотность мощности. Для символа, представленного
импульсами прямоугольной формы (смотри параграф ниже), его
СПМ имеет профиль вида (sin f )2 / f 2 (называемого в литературе
словом «синк»), который расширяется на бесконечную по частоте полосу. Наиболее просто и широко представлена в литературе
величина полосы частот, определяемая по первому пересечению
оси абсцисс частотной зависимостью СПМ, то есть, так называемый промежуток («ноль-к-нулю»), который фактически совпадает с шириной главного лепестка профиля СПМ вида (sin f )2 / f 2 .
Очень часто используют величину, определяемую по спаду
формы первого лепестка на 3 дБ от своего максимального значения, называемую в литературе полосой частот по половине
мошности сигнала или полосой в 3 дБ .
5.2.2. Представление цифровых кодов
в оптическом канале связи
Цифровой сигнал, закодированный в результате модуляции,
обычно строется с помощью линейных кодов (смотри подробную
информацию в гл. 7). Наиболее общие коды, используемые в линиях беспроводной связи – это возвратные к нулю (ВН) коды (см.
рис. 5.4, б), невозвратные к нулю (НВН) коды (см. рис. 5.4, а)
и так называемые «Манчестерские» коды (см. рис. 5.4, в). Все
эти коды по форме своей могут быть либо униполярными
(с уровнем напряжения, равным либо 0 либо V), как это следует
97
V
a)
0
0
1
t
Tb
0
t
Tb
+V
в)
1
0
V
б)
1
0
t
–V
Tb
Рис. 5.4. Представление во времени: а – униполярного невозвратного
к нулю (НВН) кода; б – униполярного возвратного к нулю (ВН) кода;
в – биполярного Манчестерского возвратного к нулю кода
из рис. 5.4, а, б, либо биполярными (с напряжением равным по
уровню либо –V, либо V) (см. рис. 5.4, в).
Униполярный возвратный к нулю код указывает на то, что
пульс возвращается внутри периода Tb каждого бита информации. Это приводит к уширению спектральной полосы сигнала,
но при этом улучшает синхронизацию кодов во времени.
Униполярные невозвратные коды не возвращаются к нулю
в течении периода каждого бита информации, то есть, сигнал
сохраняет постоянную амплитуду внутри каждого бита. НВН
коды имеют более эффективную спектральную характеристику
по сравнению с ВН кодами, но проявляют более слабую способность к синхронизации кодов.
«Манчестерский» код является специальной версией линейного ВН кода, который идеально подходит к сигналам, что должны распространяться через каналы телефонной связи и другие
цепи связи, так как не содержат компоненты постоянного тока
и, поэтому, требуют достаточно простую синхронизацию кодов.
5.2.3. Геометрическое представление цифрового
промодулированного сигнала
Основные принципы представления закодированных (т. е.
дискретных) сигналов будут даны в гл. 7. Здесь же кратко ука98
жем основу их геометрического представления, чтобы было понятно в дальнейшем геометрическое представление произвольно-промодулированного сигнала, рассмотренное ниже. При схеме цифровой модуляции комплексная огибающая информационного сигнала g(t) в течении k-го промежутка, kT ≤ t ≤ (k + 1)T,
присоединяют к конечной последовательности уже существующих подобных огибающих сигналов gi (t), i = 1, 2,..., M. Другими словами, процедура цифровой модуляции заключается
в нахождении необходимого частного сигнала ri (t) из конечной
последовательности символов-сигналов, основываясь на битах
информации, применяемых в модуляторе.
Если существует конечная последовательность, состоящая
из M возможных огибающих сигналов, то эта последовательность модуляционных сигналов может быть представлена
в виде M-мерного вектора, то есть, в виде N точек в векторном
пространстве [5–11]
g i = {gi1, gi2 , gi3 ,......, giN }, i = 1, 2,...., M. (5.29)
Параметр N определяет размерность векторного пространства, необходимую для представления конечной последовательности огибающих сигналов.
Соответственно, огибающие сигналов { gi } |iM
=1 можно предстаM
вить в терминах последовательности базовых функций {ϕi } |i=
1,
которые определены на промежутке [0,T ] и являются независимыми одна от другой, то есть, ортогональными, а именно,
T
δij . ∫ ϕi (t)ϕj (t)dt =
(5.30)
0
Здесь δij – дельта-функция Дирака, определяемая, как
δij =∞, i =j и δij= 0, i ≠ j. Эта конечная последовательность дискретных сигналов представляет модуляционные сигналы gi (t)
в векторном пространстве в виде линейной комбинации базисM
ных сигналов {ϕi } |i=
1 таким образом, что
N
gi (t) = ∑ gij ϕ j (t), i = 1, 2,..., M, (5.31)
j =1
99
0
а)
1
М=2
00
01
б)
10
11
М=4
в)
000
001
011
110
010
111
101
100
М =8
Рис. 5.5. Геометрическое представление комбинации битов «0» и «1»
в векторном пространстве, соответственно,
при M = 2 (а), M = 4 (б), и M = 8 (в)
где
=
gij
T
*
∫ gi (t)ϕj (t)dt. (5.32)
0
Здесь ϕ*j (t) – комплексное сопряжение функции ϕ j (t). При
этом каждый базисный сигнал является нормированным, чтобы иметь единичную энергию, то есть,
T
2
W=
1. ∫ ϕi (t)dt =
(5.33)
0
Базисные сигналы формируют координатную систему в векторном пространстве. Как было показано в работах [3–11], процедура ортогонализации согласно правилу Грамма-Шмидта
предлагает систематизированный путь для получения базовых
сигналов для любой заданной последовательности огибающих
сигналов. Примеры линейно модулированных цифровых сигналов, представленны геометрически соответственно сверху вниз
на рис. 5.5 для M = 2, 4, 8.
Символам, содержащим три бита информации, «1» и «0», соответствуют 8 точек на диаграме констелляции.
5.2.4. Линейная цифровая модуляция
Так как существует огромное число литературы, посвященной цифровой модуляции, мы остановимся на нескольких при100
Униполярный сигнал
m(t )
1
0
1
0
1
0
S(t )
ООК
Рис. 5.6. Информационный униполярный
сигнал m(t) (верхний рисунок)
и промодулированный OOK-сигнал,
несущий информацию (нижний рисунок)
мерах линейной и нелинейной модуляции, рекомендуя читателю достаточно полную по этому вопросу библиографию [4–10]
Линейная Модуляция – модуляция, при которой амплитуда
передаваемого сигнала с информацией изменяется линейно во
времени с изменением модулирующего цифрового сигнала m(t)
согласно следующего закона:
s(t)= Re [ A ⋅ m(t)exp( j2πfc t) ]=
= A [mR (t)cos(2πfc t) − mI (t)sin(2πfc t) ].
(5.34)
m(t) mR (t) + jmI (t).
При этом: =
Этот вид модуляции имеет эффективную спектральную характеристику, однако линейный усилитель в такой модулирующей системе имеет слабую эффективность по мощности (эти
параметры введены выше согласно Работ [3–10]). Также генерируются боковые липестки (экстремумы), увеличивая присутствие интерференции за счет других каналов связи и уменьшая
преимущества, возникающие за счет линейной модуляции.
Модуляция при Изменении Амплитуды (ASK). Здесь происходит передача синусоидального несущего сигнала при входя101
щем бите вида «1» и отсутствие сигнала – при входящем бите
вида «0» (называемого в литературе «On-Off-Keying-OOK» [3,
5, 10]). Данный тип модуляции изображен схематически на
рис. 5.6.
Бинарная Фазовая Модуляция (BPSK). Промодулированные
за счет BPSK сигналы g1 (t) и g2 (t) задаются следующим образом
=
g1 (t)
2Wb
cos(2πfc t), 0 ≤ t ≤ Tb ; Tb
(5.35a)
и
g2 (t) =−
2Wb
cos(2πfc t), 0 ≤ t ≤ Tb , Tb
(5.35б)
где Wb – энергия одного бита, Tb – период одного бита, и предполагаемая форма представления прямоугольного импульса
p(t) =
Π ( (t − Tb / 2) / Tb ).
Базовые функции, ϕi , i = 1, 2, для таких сигналов в двумерном
(2-Д) векторном пространстве в итоге содержат простую единую
форму представления ϕ1, где
ϕ
=
1 (t)
2
cos(2πfc t), 0 ≤ t ≤ T. Tb
(5.36)
Результат такого вида линейной модуляции представлен на
рис. 5.7.
Как следует из рис. 5.7, при изменении бита 1 на бит 0 поступающего модулирующего сигнала, скачкообразно меняется
фаза промодулированного сигнала несущего информацию. Используя базисные функции вида (5.36), 2-Д последовательность
1
0
1
0
1
Рис. 5.7. Представление BPSK-сигнала
102
0
BPSK – сигнала (то есть, двумерный вектор) может быть представлена в следующем виде
g iBPSK =
{
}
Wb ϕ1 (t), − Wb ϕ1 (t) . (5.37)
Такое математическое представление двумерного вектора,
содержащего два сигнала, соответствует двум точкам на так называемой диаграмме констелляции, примеры которой для различных размерностей М представлены на рис. 5.5.
Данная диаграмма в векторном пространстве с размерностью М устанавливает графический статус огибающей промодулированного сигнала для каждого символа, поступающего на
вход системы модуляции. Расстояние между точками (то есть
символами) на диаграмме канстелляции указывает на степень
различия промодулированных сигналов, что позволяет в итоге
приемному устройству различать всевозможные поступающие
символы на фоне случайных помех и шумов.
Необходимо отметить, что число базовых функций может
быть меньше или равно, но не больше, числу сигналов в последовательноси. Именно количество базовых функций, полностью
представляющих промодулированную последовательность сигналов, определяет размерность векторного пространства. Как
указано выше в приведенном примере эта последовательность
двумерна. При большом колличестве базисных сигналов в модуляционном сигнале, все они должны быть ортогональными, то
есть независимыми, согласно правилу (5.30).
Q
Q
Es
I
2Es
I
Рис. 5.8. Констелляционная диаграмма QPSK
и π / 4 − QPSK промодулированных сигналов
103
Квадратурная Фазовая Модуляция (QPSK). Сигнал с QPSK
модуляцией имеет преимущество перед предыдушим бинарным
методом модуляции тем, что имеет вдвое большую частотную
эффективность, то есть содержит два бита в одно и то же время,
а именно (рис. 5.8):
2Es
π

(t)
cos 2πf=
sQPSK
=
ct + i 
Ts
2


=
2Es
2Es
 π
 π
cos  i  cos(2πfc t) −
sin  i  sin(2πfc t),
Ts
2
T
 
 2
s
0 ≤ t ≤ Ts , i =
0,1,2,3.
(5.38)
Последовательность таких сигналов представлена геометрически
на рис. 5.8, где диаграмма слева – это прямая квадра
турная фазовая модуляция (QPSK), а диаграмма справа – это
смещенные на π / 4 точки (сигналы) промодулированной последовательности сигналов. Такая модуляция определяется, как
π / 4 − QPSK модуляция со смещением на π / 4.
1.1.6. Нелинейная цифровая модуляция
Как было указано в начале этого параграфа, промодулированные по частоте сигналы являются примером нелинейной
цифровой модуляции, которую мы кратко представим ниже
(подробности смотрите в гл. 7).
Частотная цифровая модуляция (FSK). Частотно-промодулированные сигналы будут соответствовать смещению частоты
несущего сигнала в отрицательную сторону (т. е. с понижением
несущей частоты, fc − ∆f ) при поступлении на вход модулятора
бита «0». Их смещение в положительную сторону (т. е. с увеличением несущей частоты, fc + ∆f ), произойдет при поступлении
на вход модулятора бита «1». Результат такой модуляции представлен схематически на рис. 5.9.
1
0
1
0
1
0
Рис. 5.9. FSK – промодулированный сигнал
104
Заключая данную главу следует отметить, что использование того или иного вида модуляции зависит от условий распространения потока сигналов с информацией в оптическом канале
связи, влияния эффекта фединга внутри каждого индивидуального канала, а также от типов детекторов и фильтров, используемых в системе связи (см. гл. 7). Все эти аспекты читатель найдет в предлагаемой цитируемой литературе [1–10], где все эти
вопросы полно освещены.
Литература
1. Jakes W. C. Microwave mobile communications. New Jersey:
IEEE Press, 1974.
2. Steele R. Mobile radio communication. New Jersey: IEEE
Press, 1992.
3. Rappaport T. S. Wireless communications. New York: Prentice
Hall PTR, 1996.
4. Stuber G. L. Principles of mobile communication. BostonLondon: Kluwert Academic Publishers, 1996.
5. Couch L. W. Digital and analog communication systems. New
York: Macmillan Publishing Co., 1993.
6. Lusignan B. B. «Single-sideband transmission for land mobile
radio», IEEE Spectrum, July 1978, pp. 33–37.
7. Ziemer R. E., Peterson R. L. Introduction to digital
communications, New York: Macmillan Publishing Co., 1992.
8. Saunders S. R. Antennas and propagation for wireless
communication systems, New York: John Wiley & Sons, 1999.
9. Proakis J. G. Digital communications. New York: McGrawHill, 1989.
10. Modulation
and
coding
techniques
in
wireless
communications. Ed. by Krouk, E., and S. Semionov, Chichester,
England: John Wiley & Sons, 2011.
105
ГЛАВА 6. ОПТИЧЕСКИЕ ИСТОЧНИКИ И ДЕТЕКТОРЫ
6.1. Эмиссия и поглощение оптических волн
Рассматривая процессы эмиссии и поглощения световых
волн атомами вещества, мы будем следовать описанию соответствующих процессов в терминах корпускулярной теории света,
используя дуализм волна-частица, известный из принципов
квантовой теории поля [1–14].
Как следует из классической физики, атом устроен так, что
содержит в себе резонансные частоты, соответствующие частотам электромагнитных волн, которые атом излучает в ходе
колебаний при его возбуждении. И наоборот, когда световая
радиация на произвольной из этих частот попадает на атом, последний поглащает энергию данного излучения резонансно, как
это делают все классические резонансные системы, приводящие
к взаимодействию сил.
В то же время, теории, вытекающие из классической физики,
не могут объяснить ряд наблюдаемых особенностей, например,
разряд газа, где ряд частот, испускаемых газом, не поглощаются
им при определенных условиях. Или же при наблюдении фотоэлектрических эффектов, когда электроны излучаются из атомов
благодаря их взаимодействию с излучением света. Было показано, что энергия излучения электронов не зависит от интенсивности света, а только от его частоты.
Объяснение этих фактов возможно только с использованием
квантовой теории, согласно которой атомы и молекулы могут находиться только в дискретных энергетических состояниях – на
конкретных энергетических уровнях. Эти уровни распределены
последовательно согласно дискретным значениям энергии: E0,
E1, E2, … En. В условиях термодинамического равновесия число
атомов, имеющих энергию Ei, связано с числом атомов с энергией Ej соотношением Больцмана
 Ei − Ej 
Ei
=
exp −
, Ej
 kBT 
(6.1)
где kB = 1,38⋅10–23 Дж⋅К–1 – постоянная Больцмана и T – абсолютная температура (в Кельвинах, К). Согласно квантовой те106
ории, свет может быть поглащен атомной системой, когда ее частота n соответствует хотя бы одной из величин nji, где
hn ji = Ej − Ei , j > i. I= qhn. (6.2)
Здесь мы будем обозначать частоту символом, принятым
в квантовой электродинамике, чтобы отличать эту величину от
классической f = ω/2π, обычно принятой в классической электородинамике, и которую мы использовали в предыдущих главах. В формуле (6.2) h – квантовая постоянная Планка, равная
6,625⋅10–34 Дж⋅с.
Формула (6.2) показывает, что один квант света, названный
фотоном, с энергией hnji при поглощении его атомом, изменяет его энергию из одного равновесного состояния с энергией Ei
в другое равновесное состояние с энергией Ej. Соответственно,
фотон будет испускаться, когда происходит переход из более
верхнего в более низкое равновесное состояние атомной системы, то есть из Ej в Ei, и при этом фотон будет иметь ту же частоту
nji. При таком квантовом подходе можно представить излучение
света, описанное в предыдущих главах электромагнитной волной, в виде потока фотонов, т. е. квантов света. В этом и заключается волновой-корпускулярный дуализм квантовой теории
света, и в дальнейшем мы будем его придерживаться не разрушая наши представления о свете, как о электромагнитной волне
определенного спектра частот (см. гл. 1).
Итак, если существует поток из числа q фотонов, движущихся поперек единичной поверхности в единицу времени, то интенсивность данного потока фотонов можно представить следующим выражением:
(6.3)
Аналогично, любая другая физическая величина, определенная в волновой теории света, также имеет свой аналог при
использовании корпускулярной теории, и здесь нет никакого
противоречия. Поэтому, в нашем дальнейшем изложении, мы
будем использовать одновременно как волновое, так и корпускулярное (в виде частиц) представление света.
При таком подходе, каждый атом или молекула любого материала имеет семейство энергетических уровней, так что частоты
света, поглощенные или испускаемые атомами и молекулами,
сами являются характеристиками рассматриваемого материала
107
или вещества. Когда возбужденная система возвращается в свое
более низкое равновесное состояние, некоторые из путей перехода являются более вероятными, чем другие, и эти вероятности
перехода сами по себе являются характеристиками рассматриваемых нами ниже конкретных атомов и молекул.
Другими словами, электромагнитная волна должна описываться функцией вероятности, определяющей вероятность нахождения фотона в произвольной точке пространства. Согласно
предложенному дуализму волна-частица эмиссионный или поглощающий спектр любого материала может быть использован
для его идентификации и определения его количества. Данный
аспект является предметом оптической квантовой спектроскопии и выходит за рамки предмета обсуждения данной книги.
Мы перейдем к описанию конкретных источиков и приемников
световой волны, составляющих основу проводной и беспроводной оптической связи.
6.2. Лазеры
Лазер является специфическим и специальным источником
света, открытие которого состоялось в 1960 году Т. Х. Майманом
[1], который привнес в оптическую коммуникацию создание оптоволокон и других оптических элементов связи. Слово лазер
расшифровывается как оптическое усиление стимулированной
эмиссии излучения (английская абвиатура – light amplification
by stimulated emission of radiation), и мы вкратце опишем процессы, от которых зависит работа лазера, как источника светового излучения.
Как было сказано выше, фотон может вызвать изменение статуса атомной системы при ее переходе из одного равновесного состояния в другое согласно процессу, описанному формулой (6.2),
которая, в частности, описывает переход системы из более низкого энергетического уровня в более высокий энергетический
уровень с j > i. Однако, если система уже находилась на более
высоком уровне (то есть была уже возбуждена), тогда эмиссия
фотона приводит к переходу системы на более низкий энергетический уровень согласно правилу, установленному формулой
(6.2), но уже с j < i. Данный процесс называют стимулированной
эмиссией, так как эффект приводит к излучению фотона света
с энергией hnji, соответствующей энергии, потерянной системой.
Итак, мы имеем дело с двумя видами фотонов – воздействую108
а)
б)
быстрый
Е 1(метастабильный)
Е1
hν10
Е2 (нестабильный)
hν21
hν10
hν20
медленный
Е0
hν10
Е0
Рис. 6.1. Элементарные процессы эмиссии и поглощения фотонов
света
щим на систему фотоном и излучаемым фотоном в результате
эмиссии. Именно процесс эмиссии является критичным при работе лазера.
Кроме того, нельзя не отметить, что система, находящаяся
не в нижнем энергетическом состоянии, не является стабильно
равновесной. При любых взаимодействиях с окружающей средой состояние такой системы переходит на низший уровень –
равновесный уровень для данной системы. Так, в рассматриваемом выше случае атомная система из состояния с энергией Ei
спонтанно переходит в более низкий энергетический уровень (в
состояние) с энергией Ej, даже без стимулирования во времени
фотоном с энергией Ei. Фотон, испущенный при таком переходе,
соответствует так называемой спонтанной эмиссии.
Чтобы понять, как работает лазер, рассмотрим двухуровневую атомную систему с энергетическими уровнями (состояниями) E0 и E1 (см. рис. 6.1, а).
Допустим, что мы облучаем эту систему электромагнитным
излучением с частотой n10 = (E1–E0)/h. Изначально, если система была в термодинамическом равновессии при температуре T,
относительное число атомов на двух этих уровнях будет равно,
согласно уравнения (6.1), следующему
 E − E0 
N1
=
exp − 1
. N0
 kBT 
(6.4)
Согласно уравнению (6.4), если E1>E0, то N1<N0. Предположим теперь, что интенсивность излучения на частоте n10 спонтанно возрасла по сравнению с нулевым уровнем. Если предположить, что вероятность перехода атомов одинакова для обоих
направлений перехода, больше атомов будут переходить из ниж109
него уровня на верхний уровень, так как согласно (6.4) больше
атомов находилось изначально на нижнем уровне.
При увеличении интенсивности число переходов на нижние
уровни (стимулированных или спонтанных) увеличится при
обеспечении заселенности верхних уровней, что приведет к состоянию насыщения при условии, что заселенность двух уровней и скорость переходов в оба направления изначально считались быть равноправными.
Рассматривая трехуровневую систему, представленную на
рис. 6.1, б, мы имеем низший уровень, определенный энергией
E0, метастабильный уровень E1 и нестабильный уровень E2. Если
данная система, будучи изначально термически равновесной,
подвергнется световому излучению с частотой n20 = (E2–E0)/h,
то эффект будет заключаться в обеспечении переноса большого
числа атомов из состояния с энергией E0 в состояние с энергией
E2. За счет только спонтанной эмиссии происходит уменьшение
энергии до уровня E1 (так как частота входящего света не соответствует данному переходу), а затем происходит медленный переход из этого метастабильного (долгоживущего) уровня назад
к основному низшему уровню. Согласно такому процессу перехода, большее количество атомов может находиться долго в состоянии с E1, чем в состоянии с E0. Так как это не соответствует
распределению Больцмана, то такой процесс заселения носит
название инверсной популяции [2].
Предположим теперь, что вторичный луч света падает на
эту инверсную популяцию на частоте n10 = (E1–E0)/h. Такой свет
соответствует ситуации, при которой он способствует более частому переходу за счет стимуляционной эмиссии из уровня E1
к уровню E0, нежели возбуждению атомов для перехода из состояния с энергией E0 в состояние с энергией E1. Поэтому больше стимулированных фотонов производится, нежели поглощается на возбуждение, и такой луч получает дополнительное усиление от облучающегося материала или среды. Среда при этом
считается возбужденной первым лучем для усиления вторичного луча. В итоге мы и получаем усиление света за счет стимулированной эмиссии излучения, то есть получаем в итоге лазер,
согласно его определению, данному выше [3–12].
Если теперь эту среду внести в трубу, как это представлено
на рис. 6.2, содержащую два параллельных плоских зеркала, то
стимулированные фотоны смогут двигаться между зеркалами,
110
“ 100 %-е зеркало”
Частичное зеркало
Среда
лазера
Выход
лазера
Мощность накачки
Рис. 6.2. Простейшая схема работы лазера
стимулируя в среде дополнительные фотоны. Таким образом мы
получаем усилитель с положительной обратной связью, работающий также как осциллятор.
Если одно из двух зеркал только частично отражает фотоны,
то некоторая осциллирующая световая энергия может просачиваться из трубки. Эта энергия будет иметь форму световой волны с частотой v10 = (E1–E0)/h, которую можно точно определить,
если энергетические уровни резкие и достаточно разделены. Что
касается относительно большой интенсивности света, она зависит от геометрии трубки, ее длины и объема, от поперечника –
малого или большого, а также от мощности накачки – большой
или малой. При этом, при достаточной фокусировке, свет получает усиление только внутри трубки. Если свет, курсируя между двумя зеркалами, начинает осциллировать с той же фазой,
что и стимулированные фотоны, то в итоге мы имеем монохроматическую (с узкой полосой частот), когерентную (с известной
определенной фазой), и хорошо сфокусированную световую волну. Другими словами, мы получаем световой луч лазера.
Рассмотрим наличие ансамбля, состоящего из n атомов и обозначим через p вероятность испускания одним из атомов фотона
в течение времени τ. Тогда среднее число фотонов, регистрируемых в течение этого времени, будет np, а реальное число фотонов
r будет меняться статистически вокруг этого среднего значения
согласно закону Пуассона с вероятностью [9]:
=
Pr exp(−np)
(np)r
.
r!
(6.5)
111
Откуда следует, что вероятность зарегистрировать нулевое
количество протонов (т. е. ничего не зарегистрировать) равно
exp(–np), а вероятность зарегистрировать два фотона равна
exp(–np)⋅(np)2/2!, и так далее.
Мы можем связать среднее число фотонов np, регистрируемых во время τ, со средней мощностью светового потока Pm, регистрируемого на приемном устройстве (детекторе), а именно
Pm = np
hn
. τ
(6.6)
Тогда это среднее значение при распределении Пуассона равно [9]
=
np
Pm τ
Pm
, =
hn hnBω
(6.7)
где Bω полоса пропускания детектора. Вариации вокруг среднего числа фотонов определяются тогда известной величиной, называемой стандартной девиацией или вариацией σ2n . Согласно
распределению Пуассона, эта величина равна самой средней величине фотонов, то есть, σ2n =
np.
Фактически мы получили вариацию в качестве величины, которая определяет «шум», распределенный в сигнале. Этот шум
называют квантовым или дробовым, и его мощность равна:
1/2
 P 
N ≡ σn = m 
 hnBω 
.
(6.8)
Соответственно, отношение сигнала к шуму (SNR) будет
определяться следующей формулой [9]
1/2
=
SNR
Pm 1  Pm 
⋅ = 

Bωhn N  hnBω 
. (6.9)
Этот результат очень важен, так как он указывает на возможный предел точности, с которой световая мощность может быть
измерена. Из формулы (6.9) следует, что точность измерений
улучшается пропорционально (Pm)1/2, и для низкой мощности
сигнала точность измерений будет очень плохой. Соответственно, с увеличением частоты v при заданной мощности сигнала
точность становится очень низкой. И в заключении стоит отме112
тить, что эти свойства проявляются и могут быть применимы
при низкой вероятности эмиссии фотонов, и что это допущение
перестает быть верным для интенсивных лазерных лучей с плотностью мощности, превышающей W ≥ 106Wm–2. Такие лучи подчиняются так называемой «не-Пуассоновской» статистике [9].
6.3. Источники – эмиттеры света и детекторы
Наиболее часто используемыми в оптической связи источниками света являются световые эмиссионные диоды (СЭД) и лазерные диоды (ЛД) [6–15].
6.3.1. Световые эмиссионные диоды p-n типа
Световые эмиссионные диоды (СЭД) – полупроводниковые
устройства с положительным-отрицательным (p-n) переходом.
В этом световом эмиссионном диоде переход создается за счет
использования полупроводников p-типа и n-типа, разделенных
дырочной зоной (или зоной обеднения) с энергией W (как это следует из рис. 6.3, а).
В p-n переходе равновесное состояние наступает за счет диффузии основных носителей зарядов – дырок (+) и электронов (–)
соответственно, поперек физического перехода. Этот процесс
v0
а)
р-типа Зона обеднения
n -типа
W
Оптическая
мощность
б)
z
Рис. 6.3. Cхематическое представление полупроводника p-n типа (a),
и распределение оптической мощности вдоль расстояния
внутри полупроводника (б)
113
установления происходит до тех пор, пока не наступит равновессие между силой внутреннего (би-полярного) электрического
поля (за счет разделения и поляризации зарядов) и тенденцией
зарядов диффундировать в этом поле. Если приложить теперь
внешнее электрическое поле к p-n переходу в противоположном
направлении к внутреннему поляризационному полю (названному противоположным по полю [9–14]), то в результате происходит рекомбинация электронов и дырок, проводящая к преобретению фотонами энергии достаточной, чтобы преодолеть этот
барьер. Энергия, полученная фотонами называется работой выхода данного полупроводника.
Следовательно, в детекторах типа ЛЭД свободные заряды,
электроны и дырки, инжектируются в p-n переход хаотически и
спонтанно, где рекомбинируют с последующей эмиссией высвобожденной при рекомбинации энергии в оптическое излучение,
то есть в оптическую волну. Наиболее известными из всех полупроводников являются арсенид галлия (GaAs) с работой выхода
Wg = 1,4 эВ, (т. е. энергией для преодоления зоны обеднения), оперирующий на длине волны в 0,89 мкм, и галлий-арсенид-фосфат (GaInP) с работой выхода Wg = 1,82–1,94 эВ, оперирующий на
длине волны в 0,64–0,68 мкм. Для получения более детальной
информации о различных видах полупроводников, используемых в эмиссионных световых диодах, мы отсылаем читателя
к соответствующей библиографии [4–9,14]. Электронная схема и
выходные характеристики детектора типа LED представлены на
рис. 6.4.
Р
а)
б)
Р
I
-
+
I
V0
Рис. 6.4. Электронная схема (а)
и оптическая мощность P как функция протекающего тока I
в LED-детекторе (б)
114
В идеальном случае выходная оптическая мощность увеличивается с увеличением входного тока, протекающего в детекторе. Так, оптическая мощность P является отображением (репликой) текущего по детектору току I, то есть,
P = Ai I. (6.10)
Выходная длина волны определится через энергию обедненной области Wg в полупропроводниковом материале. В частности, выходная длина волны оптического излучения дается следующей формулой [14]
1,24
λ=
. Wg
(6.11)
В формуле (6.11) длина волны измеряется в микрометрах
(микронах, мкм) а работа выхода переходной зоны измеряется
в электрон-вольтах (эВ), где 1эВ = 1,6⋅10–19 Дж.
Важной характеристикой, используемой при описании световых источников, основанных на LED и используемых в волоконно-оптической связи, является ширина спектра, которая
определяет полосу частот (или длин волн), посредством которой эмиттируется значительная часть световой мощности. Более точно эту характеристику определили в работе [5], согласно которой полоса частот, определяемая по уровню затухания
в 3 дБ, обратно пропорциональна среднему времени τ передачи
электронов и дырок во время их диффузии, как это следует из
рис. 6.7, представленного ниже, то есть,
0,44
(6.12)
.
τ
В идеале, световой источник, основанный на LED должен
быть монохроматичным, то есть, эмиттирующим на единственной длине волны (или частоте). На практике таких световых
источников, основанных на LED, не существует. Полоса частот
порядка от 20 до 100 нанометров (1 нм = 10–9 м). Когерентность
таких источников устанавливается слудующим образом: как
близко излучение источника к идеальной единственной частоте
(или его длина волны к единственной длине волны). При этом:
Чем меньше спектральная ширина источника, тем более когерентным считается источник.
f
3dB
=
115
6.3.2. Лазерные диоды p-n типа
Лазерный диод (LD) имеет ряд характеристик, подобных
тем, которыми располагает эмиттерный детектор LED. Он также представляет собой полупроводник, имеющий p-n переход и
эмиттирующий свет при прямом переходе запрещенной зоны.
Усиление света происходит при стимуляции фотонами свободных зарядов в области перехода для последующей рекомбинации и эмиссии. Световой луч при прохождении через среду, усиливающую его мощность (скажем, газ) за счет переотражений от
каждой стороны p-n перехода. Усиление за счет обратной связи
при переотражениях приводит к осцилляции эмиттирующего
излучения на соответствующих оптических частотах.
Стимулированная рекомбинация приводит к более когерентному излучению, чем это происходит при спонтанной рекомбинации и эмиссии, имеющей место в диодах типа LED. Поэтому,
спектральная полоса лазерных диодов типа LD более узкая и составляет ширину от 1 до 5 нанометров (нм) и даже более узкую.
Протекающий ток и выходные характеристики представлены
схематически на рис. 6.5.
Мы должны отметить, что выходная мощность не увеличивается до тех пор, пока входной ток в лазерном диоде не превысит пороговую величину ITh, которая может достичь от нескольких до нескольких десятков миллиампер (мА) при напряжении
в несколько вольт (В). При этом выходная мощность составит
несколько милливатт (мВт). Материал, используемый при изготовлении лазерных диодов подобен тому, который используется
а)
Р
Лазерный
диод
б) Р
I
-
+
V0
I Th
Рис. 6.5. Электронная схема (а) и
оптическая мощность P как функция протекающего тока I
(б) в лазерном диоде. ITH – предельная (пороговая)
величина тока эмиссии
116
I
в эимссионных лазерных диодах типа LED. Мы однако не входим в детальный анализ конструкции обоих типов диодов, так
как это выходит за рамки тематики, излагаемой в данной книге,
и отсылаем читателя к соответствующей литературе [3–9, 15].
6.3.3. Фотодиоды
Точность измерения выходной световой мощности зависит
напрямую от взаимодействия фотонов с материалом полупроводника, что приводит к созданию свободных электронов, формирующих напрямую электрический ток.
Вернемся, поэтому к p-n переходу, представленному на
рис. 6.3, а. Рассматривая при этом процесс, было указано, что
физический контакт между этими двумя типами полупроводников, p и n типа, приводит к диффузии основных переносчиков
зарядов черех переход, электронов и дырок, что в итоге приводит к уравниванию концентрации зарядов на каждой стороне
перехода. В результате должно создаться поляризационное (внутреннее) электрическое поле, как результат поляризации зарядов.
Предположим, что фотон попадает в область полупроводника
управляемую этим полем. Если этот фотон обладает достаточной энергией для создания пары электрон-дырка, эти два новых
носителя зарядов быстро разбегутся в противоположные стороны поперек перехода, что приводит к созданию электрического
тока, который затем можно измерить. Этот процесс сопровождается приложением внешнего электрического поля, проивоположного по направлению к внутреннему полю. Такой процесс
дает возможность создать новый тип детекторов, названных
фотодетекторами (PD).
В таких детекторах, во первых, фотон для создания пары
электон-дырка, должен обладать энергией, первышающей энергетическую зону перехода материала полупроводника, то есть,
hn>Wg. Однако, если частота фотона v достаточно высока, все
фотоны будут поглощаться в тонком слое и не будут эффективно собираться переходом. Поэтому существует частотная зависимость процесса создания электрон-дырочных пар и спектр
каждого типа фотодиода должен быть подобран в соответствии
с спектром света, который и надо детектировать.
Во-вторых, нужно положить, что ожидаемая мощность света, которую надо детектировать, равна P и соответствует ча117
стоте света n. Это означает, что на детектор приходят в секунду
P/hn фотонов. Полагаем теперь, что часть этих фотонов η создает
пары электрон-дырка. Тогда число носителей зарядов каждого
знака (электронов и дырок), генерируемых в секунду, пропорционально ηP/hn. Если это так, то все собранные на переходе
электроны и дырки создадут наблюдаемый и измеряемый ток,
определяемый следующим образом
I=
eηP / hn. (6.13)
Итак, ток, пртикающий в фотодиоде пропорционален оптической мощности. Но тогда электрическая мощность будет пропорциональна квадрату оптической мощности. Данное отношение между электрической и оптической мощностями определяет
отношение сигнала к шуму в фотодиодах, что является важным
параметром их эффективной работы.
6.4. Принципы прямого детектирования и модуляции
Прямое детектирование интенсивности света и её модуляция
являются базовыми принципами современных систем оптической связи, проводной и беспроводной. Лазерные диоды (LD) и
световые эмиссионные диоды (LED), описанные выше, являются источниками света, оперирующими сигналами модулированными по интенсивности за счет модуляции протекающего
в них тока I, и фототока Iph, которые прямо пропорциональны
мощности, генерируемой в детекторе. Кроме того, операционные
принципы обоих типов диодов не очень отличаются и зависят от
их внутренней структуры, которая характеризуется шириной
зоны обеднения зарядов, требуемой для создания фототоков.
Поэтому, в наших последующих рассуждениях при описании
оптических приемников различного типа, мы не будем различать операционные характеристики различных типов детекторов.
6.4.1. Операционные принципы различных фотодиодов
Начнем с описания простейших диодов, называемых в литературе PiN-диоды. В этих диодах, в отличие от диодов, указанных выше, присутствует между дырками (p-область) и электронами (n-область) внутренняя разделительная зона (i-область),
как это показано на рис. 6.6. Поэтому этот вид фотодиодов назван положительным-внутренним-отрицательным (positive118
hν
р
i
n
E
W
Расстояние
Рис. 6.6. Схема PiN-детектора (верхний рисунок)
и пространственное распределение его внутреннего
электрического поля (нижний рисунок)
intrinsic-negative, PiN) диодом. Внутренняя зона используется
в нем для поглощения фотонов и создания оптической мощности. Размер этой внутренней зоны выбирается из соотношения
между чувствительностью и времением реакции диода на излучение.
Процесс прямого детектирования такого диода иллюстритуется на рис. 6.7. Фотоны с энергией, первышающей энергетическую запретную зону с энергией Wg ≡ W (показанной на рис. 6.7),
проникают в полупроводник и способны возбуждать валентные
электроны, которые обладают достаточной энергией, чтобы
пройти через запретную зону из зоны валентной в зону проводимости. Если электроны и дырки достигают переход или создаются в зоне обеднения, как это следует из рис. 6.7, то они могут
Зона
проводимости
Дрейф
hν
Р
Валентная
зона
n
Зона обеднения
W
Диффузия
Рис. 6.7. Детальная схема диффузии дырок
в валентную зону и дрейф электронов из зоны проводимости
через зону обеднения в диоде p-n
119
протекать через диод и генерировать фототок. Глубина области,
на которую распространяется оптическое поглощение фотонов,
характеризуется и определяется посредством коэффициента поглощения α = α(hn), который важен, так как определяет толщину материала полупроводника, требуемую для эффективного
поглощения оптического излучения.
Оптическую интенсивность Φ(x) внутри материала на глубине x можно оценить через коэффициент поглощения фотонов материалом, как
Φ(x) = Φ(0)exp{−αx}. (6.14)
Так, например, при x = 2/α, достигается 86% поглощение фотонов и при x = 3/α, она достигает 95% [4–9, 15].
Важным параметром прямого детектора, представленного
на рис. 6.8, а, является квантовая эффективность η, введенная
в формуле (6.13). Мы определим этот параметр более точно, как
отношение числа генерированных фотоэлектронов, которые
собираются (то есть, которые пересекают зону обеднения (см.
рис. 6.6), создавая фототок) к числу фотонов, падающих и проникающих в детектор. Это определение полностью относится
к внешней квантовой эффективности прибора, учитывающей
потери за счет отражения от поверхности детектора.
Если, как и выше в формулах (6.13) и (6.14), Φ – это интенсивность фотонов, а Jph = I/S – это плотность фототока, то квантовая
эффективность определится следующим образом
η=
J ph
eΦ
,
(6.15)
где e– это заряд электрона. Обозначив падающую оптическую
мощность на поверхность детектора S через Pr, мы перепишем
формулу (6.15) в виде
η=
I ph hn
ePr
.
(6.16)
Это приводит к определению отклика прямого детектора R
[9–14], как
120
R=
eη
, A/W. hn
(6.17)
В итоге, фототок прямого детектора Iph = Jph⋅S задается формулой
I ph = RPr . (6.18)
Это основной результат для прямого детектирования, представленного на рис. 6.8, а. Как следует из рис. 6.8, а, оптический
сигнал с мощностью PS(t) и частотой fS, распространяясь через
PiN-детектор, преобразуется в электрический ток IS = R⋅PS(t).
Высокие значения внешней квантовой эффективности η в подобного рода фотодетекторах достигается за счет следующих
факторов:
– Уменьшения отражательной способности поверхности детектора за счет нанесения антиотражательных покрытий на эту
поверхность.
– Достижения максимального поглощения в зоне обеднения,
зависящего от структуры полупроводника и требующего по
энергетике величины энергии перехода порядка W≈2/α÷3/α (см.
рис. 6.6);
– Исключения рекомбинации носителей тока, основанного
на минимизации поглощения фотонов вне зоны обеднения.
В таких фотодетекторах создаётся широкая зона обеднения
(то есть, запретная зона) и имеет место предварительная генерация носителей тока, которые просачиваются сквозь дрейфовое
поле с малой или вообще отсутствующей рекомбинацией. Генерация электрон-дырочных пар вне зоны обеднения создается за
счёт процесса диффузии дрейфовых носителей зарядов в сторо-
а)
~
Es(t)
Детектор
б)
Оптический
микстер
Is
Рис. 6.8. а – главная схема действия прямого детектора
с промодулированным оптическим сигналом (волной); б – схема
смешивания промодулированной оптической волны
с локальной волной на оптическом микстере
121
ну перехода, которые в итоге участвуют в создании фототока.
Понятно, что фотоэлектроны и дырки, рекомбинируемые до достижения перехода не участвуют в создании фототока. Поэтому
генерация носителей зарядов вне зоны обеднения может привести к потерям за счет рекомбинации, и в итоге – к влиянию на
операционные характеристики детектора, такие как время работы, скорость срабатывания и полоса частот.
Как было показано в работе [9], роль перехода, определяющего глубину зоны обеднения, характеризуется емкостью детектора CD, который в свою очередь определяет электрические
и шумовые параметры приемника. Емкость зависит от ширины
запретной зоны W (см. рис. 6.6 и 6.7) и от диэлектрической проницаемости материала полупроводника, то есть, CD∝ε/W, где
ε = εrε0 (см. гл. 2).
Более того, ширина зоны обеднения серьезно ограничивает время прохода через неё электронов и дырок в результате их
дрейфа поперёк этой зоны, то есть, ограничивает частотный диапазон (отклик) детектора, а также среднее время переходов τ .
Этот отклик на уровне приема детектора в неосвещенных условиях, ID, и от фототока в диоде, возникающего в освещенных условиях, Iph, определяют полный шум в таких детекторах, NPiN,
равный
где
NPiN = 2e  I + 2ID + I ph  , (6.19)
 eV 
I + ID =
I0 exp 
  nkBT 
(6.20)
это ток в диоде в неосвещенных условиях. Здесь V – это приложенное напряжение в вольтах, kB = 1,38⋅10–27 Дж/К постоянная
Больцмана, и T – температура в градусах Цельсия.
6.4.2. Принцип модуляции световой интенсивности
Принцип модуляции световой интенсивности и прямого детектирования, осуществляющихся в PiN – детекторе представлен выше на рис. 6.8, а. Рисунок 6.8, б показывает принцип когерентного детектирования.
В данном случае, как видно из рис. 6.8, б, промодулированный по полю сигнал E S (t) = ES e j (2πfSt +ϕS ) от модулирующего ла122
зера поступает на вход оптического сместителя, оперирующего
по квадратичному закону (смотри определения в работе [9]), вместе с осциллирующим локальным полем E L (t) = EL e j (2πfLt +ϕL ) .
Принцип когерентного детектирования, представленный на
рис. 6.8, б, заключается в следующем. В когерентном детекторе поле от модулирующего лазера, оперирующего на частоте ωS,
комбинируется с полем от локального осциллирующего лазера,
оперирующего на частоте ωL.
Так как базовый детектор является детектором мощности, и
оптическая мощность пропорциональна квадрату модулей комбинированного оптического поля, то созданный в детекторе фототок будет пропрорционален следующей величине
2
ES exp  j ( ωS t + ϕS )  + EL exp  j ( ωL t + ϕL )  , (6.21)
которая после усреднения по времени запишется в виде
ES2 EL2
+
+ ES EL cos ( ωIF t + ∆ϕ ), 2
2
(6.22)
где ωIF = ωS–ωL – это промежуточная частота. Тогда результирующий фототок в детекторе будет равен
1/2
I=
ph RPS + RPL + 2R ( PS PL )
cos ( ωIF t + ∆ϕ ). (6.23)
Так как когерентный детектор является детектором мощности, работающим по квадратичному закону относительно оптического поля лазера, то его поведение, как миксера, сводится
к созданию выходного электрического сигнала на промежуточной частоте ωLF = ωS–ωL, несущего сигнала. Таким образом, выражение (6.23) определяет основной прицип работы когерентного детектирования, представленного на рис. 6.8, б.
Модуляция сигнала может осуществляться по амплитуде
(посредством изменения мощности PS), частоты (за счет изменения частоты ωS) или фазы (за счет изменения фазы ϕS), в отличие от прямого детектирования, представленного на рис. 6.8, а.
При этом, увеличивая на промежуточной частоте мощности PL,
мы увеличиваем отношение сигнала к шуму (SNR). Необходимо в связи с этим отметить, что увеличение SNR не может быть
связано только с увеличением мощности PL. Процесс увеличения SNR имеет более сложный характер. Однако мы не будем
123
входить в технические детали работы детекторов, подробно описанные в работах [6–14], так как изначально определились с тематикой изложения данной книги.
6.4.3. Фотоумножение
Фотодиоды, такие, например, как фото-эмиссионные диоды,
не являются сильно чуствительными детекторами. Для увеличенмя их чуствительности обычно используется так называемое
фотоумножение. Принцип работы фотоумножения схематически представлен на рис. 6.9, следуя работе [9]. В таком фотоумножителе устанавливают ряд электродов с напряжением Vk
k = 1,2,3…, на пути потока фотонов в вакууме. При этом напряжения подаются на электроды так, чтобы удовлетворялось условие
Vk+1>Vk. В этом случае, фотоны, проникая в сильно-чуствительный фотокатодный материал, располагают достаточной энергией, чтобы выбивать электроны из материала в вакуумную среду
окружающую электроды. Первично инжектируемые электроны
затем ускоряются электрическим полем следующего (в цепочке)
электрода, которое создается между электродами за счет напряжения U1 = V2 – V1 при V2 > V1. Падая на второй электрод, фотоны
инжектируют вторичные электроны с большей энергией. Этот
процесс продолжается до более 10 и выше стадий, обеспечивая
умножение электронов в потоке (то есть, фототок) с фактором
106÷109. Этот фактор зависит от вида материала электродов и от
приложенных к ним потенциалов Vk.
Таким образом, большой фототок может быть получен при
достаточно малой приложенной входной оптической мощности.
Так, мощность ниже 10–15 Вт может быть измерена таким при-
S
V0
V1
V5
V3
V7
Анод
hν
Выход
Вход
V2
V4
V6
V8
Рис. 6.9. Схематическая диаграмма
процесса умножения фотонов в потоке
124
I
hν
Рис. 6.10. Схемное представление самопроизводящего
процесса фотоумножения
бором. Однако, в описанных приборах некогерентный шум, проявляющийся в детектируемой заданной полосе частот, создает
дополнительные проблемы, понижающие эффективность фотоумножителя.
Как можно решить данную проблему с шумом, схематически показано на рис. 6.10. Для этого фотодиод с p-n переходом
должен оперировать поперек перехода с противоположно-направленным напряжением к внешнему. Если это напряжение
увеличивается и достигднет величины, при которой электроны
и дырки получат достаточную энергию от поля, они начинают
ионизироваться и создавать электрон-дырочные пары, как это
показано на рис. 6.10. Итак, под действинм очень большого напряжения электроны и дырки могут начать ионизацию, что
приводит к началу умножения возникающих носителей зарядов в виде электрон-дырочных пар, возбуждаемых падающими
фотонами света. Более того, носители зарядов могут получать
достаточную энергию от поперечного к переходу поля для дальнейшего создания электрон-дырочных пар из самих себя, что
приводит к самопроизводящему умножению частиц, подобно
тому, как это происходит при процессе фотоумножения [6–14].
На основе этого эффекта созданы, так называемые, самопроизводящие фотодиоды (СФД).
В этом случае фототок равен:
I ph = MRPr , (6.24)
где M – это коэффициент усиления по току или фактор умножения и R – отклик фотодетектора.
125
Необходимо отметить, что данный самопроизвольный процесс
умножения сопровождается повышением уровня шума, порожденного статистически случайной природой процесса умножения. Если каждый фотогенерируемый носитель заряда производит постоянное число вторичных носителей зарядов, то одновременно будет производиться также многократно умноженный
короткий по-шаговый шум в генерируемом токе, то есть,
(
=
∆Is M 2eI p ∆f
)
1/2
,
(6.25)
где Ip – фотогенерируемый ток и ∆f – полоса частот диода;
остальные параметры были определены выше. Учитывая, что
результирующий ток Id определяется простым произведением
Id = M Ip, получаем
=
∆Is
(2eMId ∆f )1/2 . (6.26)
Однако, существует еще и дополнительный шум, ассоциируемый с тем фактом, что вторично-возбужденные носители, созданные фотогенерированным током, будут также изменяться
статистически. Поэтому, реально наблюдаемый ток может быть
записан следующим образом [9]
1/2
(6.27)
=
∆IS′ ( 2eFMId ∆f ) , где F – это фактор дополнительного шума, который является
функцией от M, и обычно лежит в пределах от 2 до 20.
Весь шум на самопроизводящем фотодиоде (СФД) можно определить аналогично тому, как это сделано выше для PiN и n-p диодов, а именно [5, 9]
N APD =2e ⋅  ID + (ID + I ph ) M2 F (M)  , 

(6.28)
где все параметры и характеристики определены выше.
6.4.4. Операционные характеристики фотодиодов
Как следует из предыдущих параграфов, наболее известные
и применяемые в оптической связи (проводной и беспроводной)
фотодетекторы являются фотодиоды с PiN или p-n полупроводниковой структурой, которые преобразуют мощность оптического излучения в электрический ток, проходящий по цепи
126
Таблица 6.1
Основные параметры наиболее используемых полупроводников
Материал
λ, нм
λ(Pмакс), нм
R, А/Вт
Si
Ge
InGaAs
300–1,100
500–1,800
1,000–1,700
800
1,550
1,700
0,5
0,7
1,1
детектора. Тогда принимаемый ток в детекторе определится по
следующей формуле [9, 14, 15]:
I ph = RP, (6.29)
где, как и выше, R – отклик фотодетектора, определяемый выражением (6.17), и P – мощность на входе детектора (приемного
устройства). Последняя определяется произведением мощности
излучения, падающего на поверхность детектора, Pr, введенной
ранее, на коэффициент усиления детектора G, то есть,
P = Pr G. (6.30)
Материалы фотодетекторов и их оперативные полосы пропускания по частоте, а также пики откликов на световое воздействие фотонами представлены в табл. 6.1 согласно работе [14]
для более часто использующих полупроводников, составляющих основу фотодетекторов.
Критическая длина волны, до которой может продолжаться
процесс фотоионизации, определяется шириной запрещенной
зоны (то есть, глубиной обеднения зоны перехода см. рис. 6.3
или 6.6) и задается следующей формулой
1,24
λc =
. Wg
(6.31)
Как и в формуле (6.11), введенной для описания эмиссионных
LED детекторов, в формуле (6.31) длина волны задается в микрометрах, а энергия в электрон-вольтах (эВ). Понятно, что только
длины волн, меньшие или равные критической длине волны,
могут быть детектированы на приемном устройстве.
Согласно соотношения (6.29) фотодетекторы воздействуют
подобно источникам постоянного тока. Поэтому, выходное напряжение, равное V = I⋅RL, можно увеличивать за счет увеличе127
ния приложенного сопротивления RL. Так как полоса пропускания фотоприемника не может превысить порог
Bω =
1
,
2πRL Cd
(6.32)
то увеличение RL ведет к уменьшению полосы пропускания
приемника Bω. В формуле (6.32) Cd – это шунтирующая емкость
в приемнике.
Ввиду того, что источник шума является важной характеристикой фотопроводящего процесса во всех видах диодов (смотри
выше), мы вкратце упомянем здесь, что существуют два вида
шумов внутри каждого из рассмотренных выше фотодетекторов: термальный (температурный) шум (названный шумом
Джонсона [4–9]) и ионизационно-рекомбинационный шум [9–
15]. Спектральная плотность шума Джонсона пропорциональна
абсолютной температуре T (в Кельвинах) и обратно пропорциональна сопротивлению фотодетектора на излучение RS , то есть,
NT =
4T
.
RS
(6.33)
Что касается ионизационно-рекомбинационный шума, который возникает за счет флуктуаций скорости ионизации и рекомбинации электрон-дырочных пар в процессе фотоэмиссии,
то его спектральная мощность может быть представлена следующей формулой [9, 15]
N ph =
4eGI ph
1 + 4π2f 2 τ2R
, (6.34)
где τR – это среднее время рекомбинации электронов и дырок,
f- это полоса частот, определяемая на уровне 3дБ по мощности,
которую можно определить как [9, 15]
f 3dB =
1
, 2πGtT
(6.35)
где tT – это время транзита по детектору носителей зарядов, то
есть, фототока.
В заключении следует отметить, что все типы фотодетекторов работают достаточно эффективно до оптических модуляци128
онных частот, не превышающих 1 Ггц. При превышении этой
величины, необходимо особое внимание уделить материалам
полупроводников и дизайну их конструкций для достижения
полосы частот до 30 Ггц и более. Более широкую и подробную
информацию о световых источниках и детекторах читатель найдет в соответствующей литературе [6–15], представленной в библиографии ниже.
Литература
1. Maiman T. H. «Stimulated optical radiation in ruby masers»,
Nature, vol. 187, 1960, pp. 493–503.
2. Yariv A. Introduction in optical electronics, Chapter 5, Ed. by
Holt, Rinehard, and Winston, New York, 1976.
3. Kressel H., Butler J. K. (Eds.). Semiconductor lasers and
heterojunction LEDs, New York: Academic Press, 1977.
4. Kressel H. (Ed.). Semiconductor devices for optical
communications, New York: Springer-Verlag, 1980.
5. Sze S. M. Semiconductor devices: Physics and technology,
New York: John Wiley & Sons, 1985.
6. Agrawal G. P., Dutta N. K. Long-wavelength semiconductor
lasers, New York, 1986.
7. Siegman A. E. Lasers, Mill Valley, CA.: University Science
Books, 1986.
8. Ebeling K. J. Integrated optoelectronics, New York: SpringerVerlag, 1993.
9. Optical fiber sensors: Principles and components. Vol. 1, Ed.
by J. Dakin and B. Culshaw, Boston-London: Artech House, 1988.
10. Coldren L. A., Corzine S. W. Diode lasers and photonic
integrated circuits, New York: John Wiley & Sons, 1995.
11. Marz R. Integrated optics: Design and modeling, Norwood,
MA: Artech House, 1995.
12. Morthier G., Vankwikelberge P. (Eds.). Handbook : Distributed
feedback laser diodes, Norwood, MA: Artech House, 1997.
13. Murphy E. J. Integrated optical circuits and components,
Design and Applications, New York: Marcel Dekker, 1999.
14. Palais J. C. Optical communications, in Handbook:
Engineering electromagnetics applications, Ed. by R. Bansal, New
York: Taylor & Francis Group, 2006.
15. Optical fiber sensors: Principles and components. Vol. 2., Ed.
by J. Dakin and B. Culshaw, Boston-London: Artech House, 1988.
129
ГЛАВА 7. КОДИРОВАНИЕ В ОПТИЧЕСКИХ
КАНАЛАХ СВЯЗИ
В главе 5 при рассмотрении принципов модуляции, аналоговой и цифровой, или дискретной, были даны элементарные представления о видах кодирования и представления кодов в каналах проводной и беспроводной оптической связи. В данной главе
на основе строгого математического описания будут приведены
и описаны основные принципы кодирования дискретных оптических сигналов, основываясь на теоретических положениях
разработанных в работах [1–12, 38–42]. На базе основ теории кодирования, рассмотренной ниже, в гл. 11 будут приведены оценки параметров потока дискретной информации, пропускаемой
через оптические каналы связи, и будут описаны вероятностные
характеристики обнаружения ошибок при передаче через каналы связи дискретных цепочек битов информации.
7.1. Основные понятия кодирования с исправлением ошибок
7.1.1. Общая схема связи
Помехоустойчивое кодирование – традиционное и мощное
средство для борьбы с искажениями, возникающими при передаче, хранении и обработке информации. Историю теории кодирования принято отсчитывать с фундаментальных работ Шеннона, с тех пор результаты, полученные в рамках этой теории
как зарубежными, так и отечественными исследователями,
нашли широчайшее применение в современных стандартах беспроводной, проводной связи, системах хранения данных [1, 8,
12, 38, 40, 42].
Будем рассматривать схему передачи, изображенную на
рис. 7.1. Здесь источнику сообщений требуется передать информацию получателю, при этом передаваемая информация может
быть искажена каналом связи (физической средой, различными устройствами, процедурами обработки информации и т. п.,
Источник
Кодер
Канал связи
Декодер
Получатель
Рис. 7.1. Система дискретной (кодовой) связи
130
см. гл. 1 и 5). В задачу кодера и декодера входит такое преобразование информации, которое позволило бы обнаружить произошедшие в канале ошибки и попытаться их исправить.
Определим код (блоковый) как произвольное отображение
множества всех последовательностей из k символов в последовательности из n символов, причем k<n. Будем предполагать, что
последовательности заданы над некоторым дискретным конечным алфавитом. Назовем n длиной кода, а отношение k/n скоростью кода R.
В процессе передачи, обработки и хранения информации на
кодовые символы воздействует шум, характеристики которого
зависят от свойств канала и который обычно описывается случайным процессом (см. гл. 4). Заметим, что источником шума
не всегда являются помехи непосредственно канала связи – свой
вклад в шумовой процесс вносят сигналы других пользователей (так называемая интерференция между пользователями),
неточности процедур обработки при приеме сигнала и т.п. Таким образом, с точки зрения теории кодирования под «каналом
связи» на рис. 7.1 традиционно понимают любые воздействия на
кодовые символы от момента окончания работы кодера (и, как
правило, начала работы модулятора) и до начала работы декодера (который обычно оперирует с символами на выходе демодулятора).
Задачей декодера является: определить, привел ли наличествующий в канале шум к изменению кодовых символов (т. е.
обнаружить ошибку), и если да – попытаться ее исправить. Обнаружение ошибок обычно заключается в проверке того, является ли полученное декодером слово кодовым, а исправление –
в принятии решения о передававшемся кодовом слове, руководствуясь заранее заданным критерием. В случае, когда декодер
принимает неверное решение о передававшемся кодовом слове,
говорят об ошибке декодирования. Это событие характеризуется своей вероятностью, что является одним из главных характеристик системы связи.
Фундаментальными результатами в теории кодирования (и
в более общей теории информации) являются теоремы Шеннона
[15, 49]. Теоремы эти сформулированы для каналов связи, характеризуемых некоторой величиной C, называемой пропускной способностью или емкостью канала связи, зависящей от
свойств канала [4, 10, 11].
131
Теорема 7.1 (прямая теорема кодирования)
Пусть C пропускная способность канала связи. Тогда для
любых ε, δ>0 существует число n0 такое, что для любого n ≥ n0
существует код длиной n со скоростью R∈[C–δ,C), вероятность
ошибки декодирования которого Pe ≤ ε.
Теорема 7.2 (обратная теорема кодирования)
Пусть C пропускная способность канала связи и R = C+δ, где
δ>0 произвольное число. Тогда существует ε>0 такое, что для
всякого кода с длиной n и скоростью R вероятность ошибки декодирования Pe ≥ ε.
Смысл приведенных теорем состоит в том, что если скорость
передачи не превышает пропускной способности канала C (более
того, она может быть сколь угодно близка к ней), то существует
способ кодирования со сколь угодно малой вероятностью ошибки, то есть, попросту говоря, возможна сколь угодно надежная
связь.
С другой стороны, если скорость передачи превышает пропускную способность, вероятность ошибки ограничена снизу положительной величиной, то есть, сколь угодно надежная
связь невозможна.
К сожалению, теоремы Шеннона являются теоремами существования и не предлагают практических способов построения
сколь угодно надежных кодов, скорость которых достигает пропускной способности канала. Эта задача не решена и по сей день.
Более того зачастую используемые сегодня коды заведомо плохи с точки зрения достижения пропускной способности, и могут
лишь обеспечить некоторую вероятность ошибки декодирования, которую можно счесть приемлемой для конкретных практических параметров системы связи.
Для постановки задачи кодирования с минимизацией вероятности ошибки декодирования необходимо:
а) уметь описывать воздействие канала связи на передаваемые данные,
б) сформулировать правило декодирования,
в) определить параметры кода, влияющие на вероятность
ошибки.
Для выполнения первой задачи строится модель канала связи. Модель, с одной стороны, должна быть достаточно простой,
132
чтобы с ее помощью можно было получать аналитические вероятностные оценки, а с другой стороны – должна быть возможность выбора параметров модели, адекватных некоторым реальным каналам связи. При невозможности получения аналитических оценок прибегают к имитационному моделированию, что
может быть довольно трудоемкой процедурой для малых целевых значений вероятности ошибки. В следующих разделах рассмотрим наиболее часто используемые модели каналов связи.
7.1.2. Модель ДСК
Одной из наиболее распространенных в теории кодирования моделей канала является двоичный симметричный канал
(ДСК), представленный на рис. 7.2. Входной и выходной алфавиты канала совпадают и состоят из двух символов 0 и 1, а вероятность искажения входного символа при передаче по такому
каналу (переходная вероятность) не зависит от значения передаваемого символа и обозначается через p.
Пропускная способность ДСК может быть вычислена по формуле CДСК = 1–η(p), где η(p) = –plogp–(1–p)log(1–p) энтропия двоичного ансамбля [42].
Искажения передаваемых символов в модели ДСК происходят независимо от искажений других символов, то есть, ДСК
является моделью канала без памяти. С учетом предложенного
допущения, вероятность того, что из n переданных символов будут искажены v, составляет
P(n,v) = Cnv pv (1 − p)n −v . (7.1)
Это выражение будет нами использовано в дальнейшем для
получения вероятности ошибки декодирования. Модель ДСК
1– р
0
0
р
р
1
1– р
1
Рис. 7.2. Двоичный
симметричный канал
133
долгие годы была основной при построении помехоустойчивых
кодов, однако ее простота не позволяет адекватно описывать
большинство реальных каналов связи. Входные и выходные
алфавиты этой модели дискретны, в то время как более соответствуют реальным системам передачи так называемые полунепрерывные каналы связи, в которых входной алфавит дискретен, а выходной является непрерывным множеством.
В последние годы основной рассматриваемой моделью является Гауссовый канал, или канал связи с аддитивным белым
Гауссовым шумом (АБГШ), мы рассмотрим его наиболее распространённый вариант – канал с АБГШ и биполярным входом
[42].
7.1.3. Модель канала с АБГШ
Пусть входной алфавит является биполярным и состоит из
символов x∈{±1}. Определим выходной символ как y = x+η, где
η∈N(0,σ2) нормально распределенная случайная величина с нулевым средним и дисперсией σ2. Такой канал часто изображается с помощью Гауссовых плотностей вероятностей, как это представлено на рис. 7.3. Так же, как и ДСК, канал с АБГШ является
каналом без памяти.
Пропускная способность этого канала может быть найдена
как
CÀÁÃØ =
+∞
 p(y | x) 
1
p(y | x) log 
 dy, ∑
∫
−∞
2 x =±1
 p(y) 
-1
0
1
Рис. 7.3. Полунепрерывный Гауссовый канал
с биполярным входом
134
(7.2)
где переходная (или условная) вероятность в интеграле (8.2)
определится следующим образом
p(y =
| x ±=
1)
1
2πσ
exp(−(y  1)2 / (2σ2 )). (7.3)
А полная вероятность в интеграле (7.2) связана с переходной
вероятностью (7.3) следующим соотношением
1
p(y) = ( p(y | x =
+1) + p(y | x =
−1)). 2
(7.4)
Если модель ДСК характеризуется своей переходной вероятностью p, то канал с АБГШ задается через отношение сигнал/
шум (ОСШ или SNR, signal-to-noise ratio) Eb/N0, где Eb энергия
на передаваемый бит, N0 = 2σ2 плотность мощности Гауссового
процесса.
В случае биполярного входного алфавита Eb = 1. Однако, если
используется кодирование со скоростью R, то Eb характеризует энергию на информационный бит и должно вычисляться как
Eb = 1/R. С учетом этого Eb/N0 = 1/(2Rσ2). и эту величину принято
измерять в децибелах. При этом, выходом Гауссового канала является вещественное число.
Если выполнить преобразование xˆ = sign(y) (т. е. принять
жесткое решение), то канал с АБГШ преобразуется в ДСК с переходной вероятностью
=
p
∞
∫1/σ
1
2
2π
e−β
/2
dβ. (7.5)
Таким образом, основное достоинство канала с АБГШ по
сравнению с ДСК – это возможность учесть не только знак пришедшего символа, но и абсолютное значение. При этом становится ясным, что чем больше абсолютное значение принятого
символа, тем более «надежно» оно характеризует свой знак (см.
рис. 7.3). Эта надежность обычно поступает на вход декодера
в виде логарифма отношения правдоподобия (LLR, log-likelihood
ratio):
LLR(x | y) = log
Pr(x = +1 | y)
.
Pr(x = −1 | y)
(7.6)
135
Декодеры, работающие с жесткими решениями, принятого
называть жесткими, в то время как декодеры, учитывающие
надежность принятого символа (как правило, в виде LLR) – мягкими. Выигрыш при использовании мягкого декодера в Гауссовом канале по сравнению с жестким обычно составляет порядка
2–3 дБ (при одинаковых вероятностях ошибки).
7.1.4. Критерии декодирования
Задача процедуры декодирования – сопоставить принятому
из канала связи слову один из кодовых слов. Для этого необходим критерий, по которому будет производиться такое сопоставление. Если у нас задана модель канала, позволяющая получать
вероятностные оценки зависимостей входа и выхода канала,
естественным критерием декодирования будет являться принятие решения в пользу наиболее вероятного кодового слова.
Сформулируем этот критерий более формально.
Пусть x = (x1,…,xn) переданное кодовое слово, y = (y1,…,yn) принятое слово. Канал может быть описан переходными вероятностями p(y|x), причем для каналов без памяти (например, ДСК
n
или канала с АБГШ) p(y | x) = ∏ i =1 p(yi | xi ). Такую переходную
вероятность называют функцией правдоподобия. Тогда выбор
наиболее вероятного кодового слова при условии знания полученной последовательности y соответствует критерию максимума апостериорной вероятности:
=
=
xˆ arg
max p(x | y) arg max
x
x
p(y | x) p(x)
.
p(y)
(7.7)
При условии, что каждое кодовое слово равновероятно (как
это обычно и бывает на практике), критерий максимума апостериорной вероятности может быть записан как критерий максимума правдоподобия:
xˆ = arg max p(y | x). x
(7.8)
Однако приведенные критерии требуют вычисления условных вероятностей, определяемых каналом, и следовательно, не
позволяют получить прямые требования к параметрам кода,
которые можно было бы сформулировать как постановку задачи
кодирования. Поэтому на практике вместо критерия правдоподобия (7.8) часто используют критерий минимума расстояния:
136
(7.9)
xˆ = arg min d(x, y), x
где d(x,y) функция расстояния, призванная оценить «меру близости» векторов x и y. В качестве такой функции используют метрику, то есть функцию d(x,y), обладающую следующими свойствами:
1. Неотрицательность: d(x,y) ≥ 0, причем d(x,y) = 0 ⇔x = y.
2. Симметричность: d(x,y) = d(y,x).
3. Неравенство треугольника: d(x,y) ≤ d(x,z)+d(z,y).
Наиболее часто используемой в теории кодирования метрикой является метрика Хэмминга dH(x,y), равная количеству
различающихся позиций x и y. В дискретном канале метрика
Хэмминга может быть описана, как количество ошибок, произошедших при передаче кодового слова x. Можно показать [38,
42], что декодирование по максимуму правдоподобия в канале
ДСК совпадает с декодированием по минимуму расстояния Хэмминга. Аналогично декодирование по максимуму правдоподобия в канале с АБГШ совпадает с декодированием по минимуму
расстояния в метрике Евклида. В дальнейшем под метрикой мы
будем понимать метрику Хэмминга.
Введенное понятие метрики и связанного с ней критерия декодирования позволяет сформулировать требования к помехоустойчивому коду. Рассмотрим геометрическую трактовку, представленную на рис. 7.4. Предположим, что код длиной n и скоростью R = k/n задан над q-м алфавитом (конечным полем GF(q)).
Тогда код является подмножеством мощности qk множества всех
q-х последовательностей мощности qn.
Представим на рис. 7.4 кодовые слова точками пространства,
содержащего qn точек. Введенная на этом пространстве метрика
позволяет вычислять расстояние между любыми двумя точками
пространства, тогда определим d0 как минимальное расстояние
среди всех расстояний между парами кодовых слов. Проведем
вокруг каждого кодового слова сферу радиусом t = (d0–1)/2 это
максимальный радиус сферы, который можно выбрать, чтобы
никакие две сферы не пересекались и не имели общих точек.
Тогда декодирование по минимуму расстояния может быть
трактовано как поиск для произвольной точки пространства (на
рис. 7.4 такая точка обозначена звездочкой) ближайшей точки,
являющейся кодовым словом.
137
d0
t
*
qn
Рис. 7.4. Геометрическая
трактовка
помехоустойчивого кода
Очевидно, что декодирование будет ошибочным, если принятое слово оказалось «ближе» к другому кодовому слову, нежели
к тому, которое передавалось. Однако можно заметить, что если
произошло не более, чем t ошибок, ближайшим кодовым словом
всегда будет правильное, и это можно трактовать как нахождение принятого слова внутри соответствующей сферы радиусом
t. Если же произошла t+1 ошибка, то, по крайней мере, для двух
кодовых слов, находящихся на расстоянии d0, возможна ситуация, при которой принятое слово окажется в «соседней» сфере и
декодирование будет неверным.
Таким образом, минимальное расстояние является параметром, влияющим на способность кода исправлять ошибки: чем
больше d0, тем больше гарантированных ошибок может исправить код. Более того, во многих практических схемах кодирования делается предположение, что в канале связи произойдет не
более, чем t ошибок (в противном случае исправление ошибок не
гарантируется). Это позволяет строить реализуемые процедуры
декодирования и вместе с тем получить удобный способ описания исправляемых ошибок. Хотя в действительности код может
быть способен исправить и значительное количество ошибок,
лежащих вне соответствующих сфер, реализация таких процедур в общем случае имеет экспоненциальную сложность.
138
С учетом вышесказанного, можно уточнить критерий декодирования по минимуму расстояния, как декодирование в сфере
с радиусом t, сводящийся к нахождению ближайшего кодового
слова, находящегося не далее, чем на расстоянии t от принятого, и отказ от декодирования (или декодирование в произвольное кодовое слово), если такое слово не найдено. Именно этим
критерием руководствуются важнейшие практические схемы
кодирования, в частности, циклические коды.
7.1.5. Параметры кодов, исправляющих ошибки
Любая система передачи информации характеризуется следующими параметрами:
1. Pош вероятность ошибки;
2. V скорость передачи (бит/с);
3. ϑ сложность устройств кодера/декодера.
При построении системы связи требуется обеспечить высокую скорость передачи при малой вероятности ошибки и малой
сложности, что можно представить в виде следующих обозначений уменьшения ↓и увеличения ↑:
Pош↓, V↑, ϑ↓
То есть требуется минимизировать вероятность ошибки при
как можно большей скорости передачи и как можно меньшей
сложности кодирования/декодирования.
Как следует из вышесказанного, способность кода длиной n
со скоростью R исправлять ошибки (то есть, обеспечивать ту или
иную вероятность ошибочного декодирования), может быть описана с помощью минимального расстояния кода d0. Эти параметры кода связаны со сформулированными выше параметрами
системы связи. Так, сложность ϑ прямо зависит от длины кода
n, а скорость передачи зависит от скорости кода R, которая часто оценивается числом слов в коде N, так как N = qnR. При этом
вероятность ошибки Pош уменьшается с ростом расстояния d0.
Таким образом, требуется обеспечить следующие требования:
d0↑, N↑, n↓
Однако данные требования противоречивы. Длина кода n
определяет размер пространства сообщений длины n. Если зафиксировать этот параметр, то увеличение N повлечет за собой
уменьшение d0, и наоборот. Таким образом, задача построения
139
хорошего кода может формулироваться как оптимизация одного из параметров d0, N, n при фиксированных остальных параметрах. Например, можно рассматривать задачу максимизации
N(n, d0) при фиксированных значениях n и d0.
Чтобы оценивать качество кода, нужно определить предельно достижимые границы для N при фиксированных параметрах
n и d0.
Верхняя граница N, или граница Хэмминга [12], означает,
что для любого q-ичного кода длиной n, при мощности N и минимальном расстоянии d0 = 2t + 1 справедливо следующее неравенство:
qn
N≤N=
t
∑
i =0
.
Cni (q − 1)i
Коды, лежащие на границе Хэмминга (для которых N = N ),
называют совершенными. Все совершенные коды известны – это
коды Хэмминга и два кода Голея. Других совершенных кодов не
существует [12]. Граница Хэмминга означает, что не существует
кодов, для которых N > N.
Нижняя граница, или граница Варшамова-Гилберта, для
наиболее важного класса кодов, линейных кодов, рассматриваемых далее, означает следующее: если для некоторых q, n, d0, N
выполняется неравенство:
N<N=
d −2
0
∑
i =0
qn
,
Cni −1 (q − 1)i
то существует q-ичный (линейный) код длиной n с минимальным
расстоянием d0 и мощностью N. Другими словами, граница Варшамова-Гилберта означает существование кодов с количеством
слов, сколь угодно близким к нижней границе. Такие коды в теории кодирования обычно называют «хорошими», и в общем случае задача построения таких кодов остается открытой.
7.1.6. Линейные коды
В предыдущих разделах мы рассматривали код как отображение множества из qk информационных слов длины k в мно140
жество кодовых слов длины n. Очевидно, что уже при малых
величинах k задание кода с помощью простого указания списка кодовых слов становится нереализуемым. Необходим более
простой метод задания кода (кодирования), такой метод может
быть предложен с помощью математического аппарата линейных векторных пространств.
Множество V называется векторным (линейным) пространством над полем K, если:
1. V является абелевой группой по сложению.
2. Для любых v∈V, λ∈K определен λv∈V (умножение вектора
v на скаляр λ). При этом удовлетворяются следующие свойства:
a. λ(v1+v2) = λv1+λv2
b. (λ1+λ2)v = λ1v +cv
c. (λ1λ1)v = λ1(λ2v)
d. 1Kv = v
Здесь 1K нейтральный элемент по умножению поля K.
В дальнейшем будем рассматривать в основном векторные
пространства над полем GF(2). В каждом линейном пространстве размерности k есть базис, то есть, набор из k линейно независимых векторов. Линейное пространство задается всеми 2k
линейными комбинациями векторов базиса. Это позволяет компактно задавать линейное пространство.
Линейным двоичным (n,k)-кодом будем называть k-мерное
подпространство n-мерного пространства двоичных последовательностей.
Так как (n,k)-код является k-мерным пространством, он содержит базис из k линейно независимых векторов. Запишем
этот базис в матрицу G размерности (k×n) и назовем ее порождающей, или генераторной матрицей кода G.
Тогда кодирование может быть представлено следующей процедурой. Пусть m это информационный вектор длины k. Тогда
кодовое слово a получается умножением информационного вектора на порождающую матрицу G:
ϕ
m → a = mG.
Матрица G содержит информацию о параметрах кода: длине
n, числе кодовых слов N = 2k и скорости R = k/n. Единственный
параметр, не задаваемый в явном виде порождающей матрицей
это минимальное расстояние d0.
141
Пусть матрица G имеет вид G = [C1|C2], где C1 квадратная (k×k)матрица; C2 – некая матрица размерности (k×n–k).
Тогда, если C1 невырожденная матрица, то, умножив матрицу G слева на C1−1, получим другой базис G′ этого же линейного
пространства:
G ′ = Ik | C  , (7.11)
где Ik единичная (k×k)-матрица; C = C1−1C2 . Тогда при кодировании с помощью матрицы G′ получим
ϕ
m → a = mG' = ( m | c ),
 
k
n −k
Тогда, первые k позиций кодового слова всегда содержат информационный вектор в явном виде. Код, заданный матрицей
вида (7.11), называется систематическим.
Рассмотрим матрицу
H =  −CT | Ir  

(7.12)
размерности (r×n), где r = n–k число избыточных символов,
C(k×r)-матрица из (7.11). Для двоичных кодов –C = C.
Заметим, что
 −C 
GHT =Ik | C    =−C + C =0,
 Ιr 
т. е. матрица (7.12) является базисом пространства, ортогонального коду G.
Если первые k столбцов порождающей матрицы G линейно
зависимы (то есть, матрица C1 вырождена), то с учетом того, что
G базис, ранг G равен k, и, следовательно, в порождающей матрице найдутся k линейно независимых столбцов. Переставив
эти столбцы на первые k позиций внутри G, получив матрицу
H, как указано в выражении (7.12), и осуществив в полученной
матрице обратную перестановку столбцов, мы также получим
базис пространства, ортогонального первоначальному коду G.
142
Заметим, что для любого кодового слова a выполняется равенство
=
aHT (mG
=
)HT
m
=
(GHT ) 0.
C другой стороны, ни для какого вектора e, не являющегося
кодовым словом, произведение eHT не может быть равно нулю
(нулевому вектору), так как e не принадлежит пространству G.
В итоге, линейный код может быть задан как множество слов {a}
таких, что aHT = 0, т. е. матрица H также однозначно задает линейный код и называется проверочной матрицей кода (с помощью матрицы H легко проверить, является ли некоторый вектор кодовым словом).
Таким образом, существует несложная процедура обнаружения ошибок. Пусть из канала связи принято слово b. Вычислив
синдром
(7.13)
S = bHT , можно принять решение о том, что принято кодовое слово (если
синдром равен нулю), или же обнаружена ошибка передачи (в
противном случае).
Итак, линейные коды позволяют с помощью задания порождающей и проверочной матрицы кода легко решать задачи
кодирования и обнаружения ошибок. Способность исправлять
ошибки, как мы указывали выше, обычно характеризуется минимальным расстоянием d0 кода. В случае, когда код является
линейным, его минимальное расстояние определяется свойствами его порождающей и проверочной матриц.
Пусть W(a) вес Хэмминга некоторого вектора a, то есть, количество его ненулевых позиций. Назовем минимальным весом W0
кода G минимальный вес Хэмминга ненулевых кодовых слов,
W0 = minai ∈G W (ai ).
Тогда справедливы следующие утверждения.
Теорема 7.3
Минимальное расстояние линейного кода равно его минимальному весу, d0 = W0.
Теорема 7.4 (о минимальном расстоянии линейного кода)
Для того, чтобы линейный (n,k)-код с проверочной матрицей H
имел минимальное растояние d0, необходимо и достаточно, чтобы:
143
1) любые d0–1 столбцов матрицы H были линейно независимы;
2) в матрице H существовали d0 линейно зависимых столбцов.
Теоремы 7.3 и 7.4 дают способ нахождения минимального
расстояния линейных кодов через поиск кодовых слов минимального веса или анализ линейной зависимости столбцов проверочной матрицы. Однако сложность этой процедуры остается
экспоненциальной, более того, задача определения минимального расстояния линейных кодов NP-полна [22].
В работе [22] показано, что задача декодирования по минимуму расстояния для линейных кодов также NP-полна. Таким
образом, для получения практически реализуемых (полиномиальных) процедур декодирования необходимо вводить дополнительные свойства линейных кодов. Наиболее важные классы
таких кодов рассматриваются в следующих разделах.
7.1.7. Оценка вероятности ошибки декодирования
Как было описано в параграфе 7.1.4, наилучшим с точки зрения вероятности ошибки является декодирование по максимуму правдоподобия, однако оценить обеспечиваемую при таком
декодировании вероятность ошибки в большинстве случаев не
представляется возможным. С другой стороны, многие практические схемы кодирования в действительности используют декодирование в сфере некоторого радиуса t (см. также рис. 7.4),
и в этом случае можно получить аналитические оценки вероятности ошибки.
Будем считать, что декодер принимает решение относительно
всего передававшегося слова целиком, и будем оценивать вероятность ошибки декодера как вероятность события, при котором
декодер не выдал правильное кодовое слово (такую вероятность
называют вероятностью ошибки на слово).
Эта вероятность может быть легко вычислена, например, для
ДСК. Ошибки происходят, когда в канале произошло v ошибок,
и значение v превышает радиус сферы t. Для ДСК с переходной
вероятностью p вероятность события v > t для n переданных
символов с учетом (7.1) равна
Pw= P(v > t)=
144
n
∑
v = t +1
Cnv pv (1 − p)n −v . (7.14)
Выражение (7.14) использует суммирование биномиальных
коэффициентов, что не очень удобно вычислять на практике,
особенно для больших n и малых целевых значений Pw. Тогда
можно воспользоваться некоторыми границами, в частности,
одна такая достаточно точная граница приведена в [8]:
Pw <
p(1 − τ)
1
−n(Tp (τ) − H (τ))
e
, τ − p 2πnτ(1 − τ)
(7.15)
где τ = t/n и τ > p, H(τ) = -τlnτ–(1–τ)ln(1–τ) энтропия двоичного ансамбля с параметром τ и Tp(τ) = –τlnp–(1–τ)ln(1–p).
При передаче по каналу с АБГШ и жестким декодированием
значение Pw может быть также найдено с использованием (7.14)
и (7.15), с учетом того, что при жестком декодировании канал
с АБГШ преобразуется в ДСК с переходной вероятностью, определяемой в соответствии с (7.2).
Однако, во многих практических приложениях требуется
оценить не вероятность ошибки на слово, а вероятность ошибки на бит, так как даже при неправильном выходе декодера
значительное количество бит могут оказаться правильными.
Аналитическое вычисление этой величины – значительно более
трудная задача.
Ясно, что ошибочные биты могут появиться на выходе декодера только в случае ошибки на слово. Это событие складывается из двух исходов.
Во-первых, принятое слово может находиться за пределами какой-либо сферы (это соответствует звездочке на рис. 7.4).
Обычно в таком случае декодер, следующий критерию декодирования в сфере, осуществляет попытку исправления ошибок,
однако полученное в результате слово не является кодовым, и
декодер может этот факт обнаружить. Будем называть это событие отказ от декодирования, и одним из вариантов действий
в таком случае является выдача декодером принятого слова без
изменений.
При рассмотрении малых вероятностей ошибки наиболее
вероятное событие, приводящее к отказу от декодирования, соответствует тому, что в канале произошло t+1 ошибок (доминирующим в (7.14) является первое слагаемое), в этом случае доля
ошибочных бит составит (t+1)/n, и вероятность ошибки на бит
может быть оценена как
145
 t +1 
Pb(1) ≈ 
 Pw .  n 
(7.16)
Во-вторых, принятое слово может оказаться в сфере, центром
которой является не то кодовое слово, которое в действительности передавалось. В этом случае декодирование в сфере гарантированно находит центр соответствующей сферы, являющийся кодовым словом, однако найденное кодовое слово неверно.
Будем называть такой исход ошибкой декодирования. Отметим,
что декодер не в состоянии обнаружить факт ошибки декодирования.
Снова, в случае рассмотрения малых вероятностей ошибки
наиболее вероятно, что принятое слово попадет в ближайшую
сферу, таким образом, кодовым словом при ошибке декодирования будет ближайшее к передававшемуся слову. В коде с минимальным расстоянием d0 мы можем оценить количество различающихся символов в двух ближайших словах величиной d0,
тогда
d 
Pb(2) ≈  0  Pw .  n 
(7.17)
Отметим, что так как d0 = 2t+1, из (7.16) и (7.17) имеем
1
≈ Pb(2) , что при малых вероятностях ошибки зачастую
2
можно считать пренебрежимо малым различием.
Pb(1)
7.2. Коды с алгебраическим декодированием
7.2.1. Циклические коды
В предыдущем разделе мы рассмотрели задачу кодирования
информационного сообщения из k символов в кодовое слово из
n символов с целью повышения надежности передачи информации по каналам связи с ошибками. Количество информационных сообщений длиной k экспоненциально велико, однако использование в качестве кодов линейных подпространств позволило задать эффективную процедуру кодирования с помощью
умножения информационного вектора на базис пространства G.
Задачу декодирования по минимуму расстояния мы определили как поиск кодового слова, ближайшего к принятому в некоторой метрике (например, Хэмминга). Однако, так как кодовых слов также экспоненциально много, решить такую задачу
146
последовательным перебором в большинстве практических случаев вычислительно невозможно. Поэтому помимо задания линейных кодов требуется обладание ими какой-то дополнительной структурой, которая позволила бы осуществлять реализуемое декодирование (с полиномиальной сложностью).
На практике наибольшее распространение получили так
называемые циклические коды, то есть линейные коды, у которых циклический сдвиг любого кодового слова также является кодовым словом. Для рассмотрения таких кодов поставим в соответствие вектору f = (fn–1, …, f0) многочлен f(x) = fn–1,
xn–1 +…+ f1x + f0. Тогда вектору длины n будет соответствовать
многочлен, степень которого не превышает n–1.
Пусть g(x) многочлен степени r = n–k, являющийся делителем многочлена xn–1. Тогда множество многочленов степени, не
превосходящей n–1, которые делятся на g(x), образуют циклический код длины n с k информационными символами. Многочлен g(x) называется порождающим многочленом циклического
кода. Произведение любого многочлена m(x) на кодовое слово
a(x) (умножение многочленов производится по модулю xn–1, то
есть с учетом того, что xn = 1) является кодовым словом. Кодирование информационной последовательности m(x) =
k −1
∑ mi xi
ци-
i =0
клическим кодом с порождающим многочленом g(x) = grxr+gr–
r–1+…+g осуществляется по правилу
1x
0
m(x)→m(x)g(x)modxn –1 = m(x)g(x).
Порождающая матрица циклического кода может быть представлена в виде
 g0
0
G=
…

0
…
g0
…
…
gr
…
…
…
0
gr
…
0
…
0
…
g0
… 0
… 0 
.
… …

… gr 
(7.18)
Проверочным многочленом кода с порождающим многочленом g(x) называется многочлен
h(x) =
xn − 1
g(x −1 )xr
,
(7.19)
147
где x–1 величина, которая при умножении на x дает 1 (xx–1 = 1).
Произведение любого кодового слова a(x) = m(x)g(x) на многочлен
h(x) выглядит как:
a(x)h(x) = m(x)g(x)h(x) = 0modxn–1. (7.20)
Соотношение (7.20) является основным проверочным соотношением для кодовых слов. Поскольку xn–1 делится на h(x), то
равенство (7.20) эквивалентно равенству
a(x) = 0modg(x).
Проверочная матрица циклического кода выражается через
h(x)следующим образом:
h0 … hk 0 …
0 h … h
0
0
k
H=
… … … … …

 0 … … 0 h0
… 0
… 0 
.
… …

… hk 
(7.21)
Порождающий многочлен циклического кода позволяет не
только осуществлять процедуру кодирования, но и оценивать
минимальное расстояние полученного кода.
Пусть п(x) порождающий многочлен циклического кода G,
и все корни g(x) лежат в поле GF(q). Тогда они могут быть записаны в виде степеней η примитивного элемента поля GF(q):
ηi1 , ηi2 ,…, ηir . Будем рассматривать последовательности подряд
стоящих чисел во множестве {i1,i2,…,ir}, и пусть самая длинная
из таких последовательностей: m1, m0+1,…, m0+ d0–2
Следующая теорема дает возможность оценить расстояние
циклического кода.
Теорема 7.5 (граница БЧХ)
Пусть G циклический код с порождающим многочленом g(x),
и m0, m0+1,…, m0+ d0–2 последовательность чисел, определенная
выше. Тогда минимальное кодовое расстояние d кода G оценивается снизу как d ≥ d0.
Теорему 7.5 называют БЧХ-границей кодового расстояния
циклических кодов. Она позволяет оценивать расстояние любого циклического кода посредством анализа корней его порождающего многочлена. При этом она дает оценку расстояния
циклических кодов, которая может быть меньше истинного рас148
стояния циклического кода. В некоторых случаях оценку БЧХ
можно уточнить.
Теорема 7.6
Циклический код, среди корней которого имеются
ηi , ηi + j , ηi +2 j ,…, ηi +(d0 −2) j , где η примитивный элемент соответствующего поля, имеет минимальное расстояние d, не меньшее
d0, если j и n взаимно просты.
7.2.2. БЧХ-коды
Рассмотрим следующий способ построения циклического
кода длины n = qm–1, где q степень простого числа, исправляющего t ошибок. Выберем примитивный многочлен степени m и
построим конечное поле GF(qm). Найдем минимальные многочлены fj(x) для элементов ηj, j = 1,2,…,2t. Положим
=
g(x) ÍÎÊ{f1 (x), f2 (x),…, f2t (x)}. (7.22)
В соответствии с теоремой 7.5 такой код, называемый кодом
БЧХ, имеет минимальное расстояние d ≥ d0 = xt+1, т. е. позволяет исправлять t ошибок.
В табл. 7.1 в качестве примеров приведены минимальные
многочлены для элементов поля GF(24) и GF(42). Таблицы минимальных многочленов могут быть также найдены в [1, 12].
Проверочная матрица БЧХ-кода может быть записана как
1
ηm0

1
ηm0 +1
H=
…
…

m0 +d0 −2
1 η
(ηm0 )n −1


…
(ηm0 +1 )n −1 
. …
…


… (ηm0 +d0 −2 )n −1 
…
(7.23)
Отметим, что матрица (7.23) (называемая матрицей Вандермонда) задана над полем GF(q) расширением того поля, над которым задан код. Число строк в ней отлично от r = n–k. До сих
пор мы задавали проверочную матрицу в основном поле, и число строк в ней было строго равно r. Чтобы перейти от матрицы
(7.23) к традиционному виду, достаточно представить элементы
ηi в ней как векторы-столбцы над GF(q) и удалить из получившейся матрицы линейно зависимые строки.
149
Таблица 7.1
Минимальные многочлены для полей GF(24) и GF(42)
Поле GF(24)
Элемент поля
Поле GF(42)
Минимальный
многочлен
Элемент поля
Минимальный
многочлен
0
0
0
0
1
η
x+1
x+1
x4+x+1
1
η
x2+x+2
η2
x4+x+1
η2
x2+x+3
η3
x4+x3+x2+x+1
η3
x2+3x+1
η4
x4+x+1
η4
x2+x+2
η5
x2+x+1
η5
x+2
η6
x4+x3+x2+x+1
η6
x2+2x+1
η7
x4+x3+x+1
η7
x2+2x+2
η8
x4+x+1
η8
x2+x+3
η9
x4+x3+x2+x+1
η9
x2+2x+1
η10
x2+x+1
η10
x+3
η11
x4+x3+1
η11
x2+3x+3
η12
x4+x3+x2+x+1
η12
x2+3x+1
η13
x4+x3+1
η13
x2+2x+2
η14
x4+x3+1
η14
x2+3x+3
В общем случае для определения кода БЧХ может использоваться не только примитивный элемент поля.
Пусть γ элемент поля GF(qm), мультипликативный порядок
которого равен N, и пусть m0 ≥ 0 и 2 ≤ d0≤N целые числа. Пусть,
кроме того, fm0 (x) , fm0 +1 (x) , … , fm0 +d0 −2 (x) минимальные многочлены для γm0 , γm0 +1, …, γm0 +d0 −2 соответственно, тогда циклический код с порождающим многочленом
(7.24)
=
g(x) ÍÎÊ{fm0 +1 (x),…, fm0 +d0 −2 (x)} называется кодом БЧХ.
Параметры кода БЧХ: n = N; k = N–deg g(x) (deg(⋅) степень многочлена (⋅)); d ≥ d0. Если n = N = qm–1, то код БЧХ называется примитивным.
Число проверочных символов r БЧХ-кодов (степень порождающего многочлена), построенного с помощью элемента γ∈GF(qm),
150
может быть оценено произведением r ≤ m(d–1). Для двоичных кодов эта оценка может быть улучшена как r ≤ mt.
Уточнение истинного расстояния циклических кодов, более
точная оценка числа проверочных символов кодов БЧХ являются нерешенными задачами теории кодирования.
7.2.3. Коды Рида-Соломона
Коды Рида-Соломона (РС), предложенные в 1960 г., до сих
пор остаются одними из наиболее применяемых на практике, и,
несмотря на их простоту, служат основой новых, глубоких обобщений [1, 12].
Начнем их обсуждение со следующего простого замечания.
Теорема 7.7 (граница Синглтона)
Для любого линейного (n,k)-кода с расстоянием d выполняется n–k ≥ d–1.
Коды, достигающие границы Синглтона, являются оптимальными с точки зрения минимального расстояния, и их принято называть кодами с максимально достижимым расстоянием (МДР).
Наиболее важным на практике примером МДР-кода являются коды Рида-Соломона, которые могут быть получены как коды
БЧХ, заданные над тем же полем, в котором лежат корни порождающего многочлена, другими словами n = q–1. В этом случае порождающий многочлен для кода, исправляющего t ошибок, с учетом (7.22) равен
2t
g(x) = ∏ (x − ηi ). (7.25)
i =1
Проверочной матрицей РС-кода является матрица Вандермонда из (7.23).
Так как для РС-кодов граница Синглтона выполняется с равенством, для этих кодов d = n–k+1. Во многих практических
приложениях и стандартах используются коды Рида-Соломона длиной n = 255 над полем GF(28) (например, (255, 239)-код,
исправляющий 8 ошибок), так как символы этого поля можно
представить 8-битными последовательностями (байтами), что
упрощает реализацию кодеров и декодеров.
151
7.2.4. Декодирование циклических кодов
БЧХ-коды, и особенно РС-коды, находят широкое применение на практике. Это объясняется не только тем, что эти коды
обладают хорошими дистанционными и скоростными характеристиками, но и тем, что для их декодирования разработаны эффективные процедуры, основанные на описании циклических
кодов с помощью алгебры многочленов.
Пусть G циклический (n,k)-код (БЧХ или РС) над полем GF(q)
с расстоянием d = dt+1, и g(x) порождающий многочлен этого
кода. Пусть, кроме того, η, η2, …, η2t – корни многочлена g(x).
Напомним, что проверочная матрица кода G может быть записана в виде (7.23). Перепишем ее:
1
ηm0

1
ηm0 +1
H=
…
…

m0 +d0 −2
1 η
(ηm0 )n −1


…
(ηm0 +1 )n −1 
. …
…

m0 + d0 −2 n −1 
… (η
)

…
(7.23а)
Пусть b(x) принятое слово, равное сумме кодового слова a(x) и
ошибки e(x), т. е. b(x) = a(x)+e(x), причем многочлен ошибки
e(x) = ε0 + ε1x +…+ εn −1xn −1 (7.26)
содержит ровно v ≤ t ненулевых коэффициентов εi1 , …, εiv . Умножая b(x) на H, получим синдром с компонентами
Sj =
b(ηj ), j =
1,…,2t. (7.27)
Поскольку a(ηi) = 0 для любого кодового слова, равенство
(7.14) перепишется в виде
Sj = εi1 (ηj )i1 + εi2 (ηj )i2 +…+ εiv (ηj )iv .
Многочлен ошибки (8.13) полностью описывается множеством пар {εi1 , i1 }, …, {εiv , iv }. Обозначим εis через Ys, а ηi через
Xs тогда
Sj = X1j Y1 +…+ Xvj Yv , j= 1,…,2t. (7.28)
Величины Ys мы будем называть значениями ошибок, а величины Xs локаторами ошибок. Величины Sj непосредствен152
но могут быть вычислены по принятому вектору, следовательно, (7.28) можно рассматривать как систему из 2t нелинейных
уравнений относительно 2v неизвестных Xs,X2,…Xv, Y1,…,Yv,
которые и нужно найти для декодирования принятого слова.
Исторически первым алгоритмом решения системы (7.28) был
алгоритм Питерсона-Горенстейна-Цирлера [13], сводящий нелинейную систему (7.28) к линейной, однако он имеет сложность
O(n3) и на практике не используется, так как известны более эффективные алгоритмы декодирования циклических кодов.
Для получения линейной системы уравнений в алгоритме Питерсона-Горенстейна-Цирлера вводится многочлен
σ(x) = 1+σ1x+…+σvxv минимальной степени, такой, что его корнями являются X1−1, …, Xv−1 величины, обратные локаторам
ошибок:
σ(x) = (1 − xX1 )(1 − xX2 )·…·(1 − xXv ). (7.29)
Многочлен σ(x) называют многочленом локаторов ошибок,
и его нахождение является центральным местом во всех алгебраических процедурах декодирования циклических кодов.
Основным отличием этих процедур от алгоритма Питерсона-Горенстейна-Цирлера является использование так называемого
ключевого уравнения
ω(x)
= S(x)mod xr σ(x)
(7.30)
вместо решения системы уравнений (7.15), для нахождения не
только многочлена локаторов σ(x), но и некоторого многочлена
значений ошибок ω(x).
Приведем общую схему декодирования циклических кодов.
1. Вычисление синдрома. Пусть b = a+e принятый вектор,
где a кодовое слово, e вектор ошибки, W(e) ≤ t. Первый шаг декодирования состоит в вычислении синдрома S(x), см. (7.30).
Заметим, что эта процедура может быть выполнена с линейной
сложностью с помощью схемы Горнера, вычисляющей значение
многочлена f(x) степени n в точке, используя следующую группировку операций:
f (x) =
n
∑ fi xi = f0 + x(f1 + x(f2 + x(…(fn−1 + fn x)))).
i =0
153
2. Решение ключевого уравнения. Вторая фаза декодирования
состоит в решении ключевого уравнения (7.30), т. е. нахождении
многочлена локаторов σ(x) и многочлена значений ошибок ω(x).
Многочлен ω(x) используется на шаге 4 для нахождения значений ошибок.
3. Нахождение локаторов ошибок (процедура Ченя). Этот шаг
заключается в нахождении корней σ(x). Так как корни этого
многочлена лежат в конечном поле GF(q), они могут быть найдены с помощью перебора. Заметим, что для его реализации также может быть использована схема Горнера.
4. Нахождение значений ошибок (процедура Форни). На последнем шаге значения ошибок могут быть найдены с помощью
многочлена ω(x), полученного на шаге 2:
εi =−
ω(η−i )
σ′(η−i )
, (7.31)
где σ′(x) формальная производная многочлена σ(x):
σ′(x) =
v
∑ jσ j x j −1
j =1
и i позиция ошибки.
Лучшим способом осуществления второго и третьего этапов
декодирования циклических кодов считается итеративный алгоритм Берлекэмпа-Месси [1, 12]. Смысл этого алгоритма заключается в том, что многочлен σ(x) ищется методом последовательных приближений, начиная с σ(0)(x), σ(1)(x), и так далее, до
σ(v)(x) = σ(x), выбирая σ(j)(x) как уточнение σ(j–1)(x).
Для компонент синдрома имеет место рекуррентное уравнение
v
Sj =− ∑ σi Sj −i , j =v + 1,…,2v. (7.32)
i =1
Будем говорить, что многочлен σ(j)(x) порождает S1, …, Sj,
если для всех этих величин выполняется равенство
v( j )
Sj =
− ∑ σ(i j) Sj −i , i =1
154
(7.33)
где v(j) степень многочлена σ(j)(x), а σ(i j) коэффициенты этого
многочлена. В полях характеристики 2 это условие можно переписать как
v( j )
∆( j) = Sj + ∑ σ(i j) Sj −i ,
i =1
∆(j) = 0,
(7.34)
σ(j)(x)
если
то
порождает S1,…,Sj и ∆(j)≠0 в противном случае.
Тогда задача нахождения σ(x) может трактоваться как нахождение многочлена минимальной степени, который порождает последовательность компонент синдрома S1, S2, …, S2t. Итеративный процесс отыскания σ(x) начинается с σ(0)(x) = 1 и упрощенно состоит в следующем. При заданном многочлене σ(j–1)(x),
порождающем S1, …, Sj–1 проверяется, не является ли σ(j–1)(x)
порождающим и для Sj (т. е. выполняется ли ∆(j) = 0); если является, то σ(j)(x) полагается равным σ(j–1)(x), в противном случае
σ(j)(x) уточняется так, чтобы он генерировал последовательность
S1, …, Sj–1 ,Sj. Процесс продолжается до тех пор, пока не отыщется многочлен, порождающий все компоненты синдрома.
Алгоритм Берлекэмпа-Месси имеет множество вариаций
[1, 8]. На рис. 7.5 приведена одна из версий. При этом, помимо
многочлена локаторов σ(x), алгоритм находит также многочлен
значений ω(x), который затем может использоваться для нахождения значений ошибок.
Алгоритм Берлекэмпа-Месси является, вероятно, самым распространенным методом декодирования циклических кодов.
Его сложность оценивается как O(n2), однако при его реализации используют множество модификаций, позволяющих понизить сложность практической схемы декодирования.
Тем не менее, алгоритм Берлекэмпа-Месси является не единственным возможным алгебраическим декодером. К примеру,
известны также алгоритмы на основе расширенного алгоритма
Евклида, а также использование в процедуре декодирования
быстрого дискретного преобразования Фурье над конечным полем. Более подробно эти вопросы рассмотрены в [1, 12].
В заключение отметим, что результатом декодирования циклического кода является кодовое слово, находящееся на расстоянии, не превышающим t, от принятого слова. Такую ситуа155
Исходные данные : коэффициенты S1 , … , S2 ,… , SN .
Выходные данные : вычисление полиномов
σ(x ) и ω(x ).
Обозначения: j - номер шага; v(j ) - степень полинома
σ( j ) ( x ) =
v( j)
∑ σ(i j ) x i ;
i =0
k (j ) , L (j ) и Θ (j ) (x ), Ω (j ) (x ) - промежуточные переменные на j -м шаге.
Начальные условия: j =0; k (0) =-1 ; L (0) =0,
Θ (0) (x )= x , ω(0) (x)=0, Ω (0) (x )= -1.;
.
σ(0) ( x ) = σ(0)
0 =1
Алгоритм :
1. Выполнить j=j+1 .
2. Вычислить
∆( j ) = S j +
v ( j −1)
∑ σ(i j −1)S j −i ;
i =1
σ( j ) ( z ) = σ( j −1) ( x ) − ∆( j )Θ( j −1) ( x );
ω( j ) ( z ) = ω( j −1) ( x ) − ∆( j )Ω( j −1) ( x ).
3. Оценить j, если j=N, перейти к п.7, при
j<N - к п.4.
4. Принять
L( j −1) ,
если ∆( j ) = 0;
L( j ) = 
( j −1)
( j −1)
, j −1− k
), если ∆( j ) ≠ 0.
max(L
5. Вычислить Θ (j ) (x ), Ω (j ) (x) и k (j ) в зависимости от следующих условий:
если L (j ) = L (j -1) , то
Θ( j ) ( x ) = x Θ( j −1) ( x );
Θ( j ) ( x ) = x Ω( j −1) ( x );
k ( j ) = k ( j −1) ;
если L (j ) > L (j -1) , то
Θ( j ) ( x ) = x σ( j −1) ( x ) / ∆( j ) ;
Ω( j ) ( x ) = x ω( j −1) ( x ) / ∆( j ) ;
k ( j ) = j − 1 − L( j −1) .
6. Вернуться к п.1.
7. Конец алгоритма. Возвратить
σ(x)= σ (N ) (x ), ω(x)= ω (N ) (x ).
Рис. 7.5. Алгоритм Берлекэмпа-Месси
156
цию мы описывали в параграфе 7.1.4 как декодирование в сфере
радиусом t. Вероятность ошибочного декодирования в этом случае может быть вычислена аналитически, см. параграф 7.1.7.
7.2.5. Особенности использования циклических кодов
в системах связи
В прошлых разделах мы рассматривали циклические коды,
являющиеся классическим результатом теории кодирования.
Связь между этими кодами и алгеброй многочленов позволяет
получить полиномиальные процедуры декодирования, однако
использование этих кодов обладает некоторыми специфическими особенностями, которые необходимо учитывать при выборе
этих кодов для использования в реальных системах передачи
информации, а также при оценивании параметров этих кодов и
обеспечиваемых ими вероятностей ошибок.
1. Жесткое декодирование. Как мы видели в параграфе 7.2.4,
классические алгебраические декодеры циклических кодов работают в том же конечном поле, над которым задан код. Такие
декодеры могут использоваться, к примеру, для двоичных кодов
в канале ДСК (см. параграф 7.1.2), однако их перенос в полунепрерывный канал, например канал с АБГШ (см. параграф 7.1.3)
связан с определенными трудностями, т.к. по своей природе эти
декодеры используют алгебраические свойства кода, а не вероятностные оценки отдельных принятых символов.
2. Конструктивное расстояние. Коды БЧХ и РС, рассмотренные в параграфах 7.2.2 и 7.2.3, могут рассматриваться как
коды с заданными параметрами n , k и d0, способные исправлять любую комбинацию из t = (d0–1)/2 ошибок, при этом истинное минимальное расстояние d циклических кодов в общем
случае неизвестно и оценивается как d ≥ d0. В связи с этим параметр d0 называют конструктивным минимальным расстоянием, а коды рассматриваются как способ исправления заданного
количества ошибок (примерно до половины конструктивного
расстояния).
3. Декодирование в сфере. Конструктивное расстояние – это
не только параметр кода, гарантирующий нижнюю границу для
кодового расстояния, но и параметр декодера, т.к. алгебраические декодеры, описанные в параграфе 7.2.4, гарантируют исправление любой комбинации ошибок веса не более t, т. е. гарантируют декодирование в сфере (см. параграф 7.1.4), однако
157
не работают в случае, когда принятое слово не находится внутри
какой-либо кодовой сферы. Известны попытки создания процедур декодирования сверх конструктивного расстояния (например, алгоритм Гурусвами-Судана [35, 38]), однако они связаны
со значительными вычислительными трудностями.
4. Поблочное декодирование. Как мы отмечали в параграфе
7.2.4, алгебраический декодер осуществляет декодирование
в сфере радиусом t, и он принимает решение относительно слова
целиком. Таким образом, при оценке вероятности ошибки наиболее естественно оценивать вероятность ошибки на переданное
слово, а для уменьшения этой вероятности требуется построение кодов с большим минимальным (или конструктивным) расстоянием. Однако на практике характеристикой многих систем
передачи является вероятность ошибки на переданный информационный бит. Задача минимизации этой величины может
быть более эффективно решена при использовании декодеров,
принимающих посимвольные решения, что не является традиционным для циклических кодов. Такое посимвольное декодирование может осуществляться путем представления кода с помощью т.н. решеток и декодирования с их помощью [19], однако эта процедура в случае циклических кодов экспоненциально
сложна и может осуществляться лишь для кодов со сравнительно небольшими величинами параметров.
В следующем разделе мы рассмотрим один из классов кодов,
обладающих характеристиками, отличными от перечисленных
кодов.
7.3. Коды с малой плотностью проверок на четность
7.3.1. Основные понятия
В разделе 7.2 были рассмотрены циклические коды, и в параграфе 7.2.5 сформулированы их основные особенности. В последние два десятилетия развитие теории кодирования характеризуется рассмотрением полунепрерывных каналов связи.
Построение декодеров в таких случаях, как правило, основывается на итеративных посимвольных процедурах, а вероятность
ошибки определяется не минимальным расстоянием соответствующих кодов, а больше зависит от характеристик декодера.
В этой ситуации весьма затруднительно получить как критерии
для построения кодов, так и аналитические оценки вероятно158
стей ошибки, и для выполнения обеих задач привлекаются вероятностные средства: построение псевдослучайных кодов, отталкиваясь от некоторых, зачастую эмпирических, конструкций, и
оценка вероятностей ошибки путем интенсивного компьютерного моделирования. Тем не менее, используя наиболее яркие примеры такого подхода: турбо-коды и коды с малой плотностью
проверок на четность (LDPC, low-density parity-check), удается
построить схемы кодирования, часто более эффективные, чем
классические циклические коды с «жестким» поблочным декодированием. При этом, как правило, турбо-коды показывают
хорошие результаты, обладая сравнительно небольшой скоростью, а LDPC-коды особенно выигрышны при высоких скоростях и находят в последние годы широкое применение в высокоскоростных системах связи, в т.ч. при передаче по оптическому
каналу. Рассмотрению LDPC-кодов и посвящен данный раздел.
Впервые LDPC-коды были предложены сравнительно давно
Р.Галлагером [5], и позднее исследовались в работах [6, 42–44,
46]. Несмотря на то, что в течение долгого времени LDPC-коды
были практически исключены из рассмотрения, в последние
годы наблюдается большой рост исследований в этой области.
Это связано с тем, что, обладая плохим минимальным расстоянием, коды с малой плотностью, тем не менее, обеспечивают
высокую степень исправления ошибок при весьма малой сложности их декодирования. Было показано, что с ростом длины некоторые LDPC-коды могут превосходить турбо-коды, и приближаться к пропускной способности канала с АБГШ [33].
Вместе с тем, многие предложенные конструкции LDPCкодов являются циклическими или квазициклическими, что
позволяет не только быстрое декодирование, но и дает эффективные процедуры кодирования. Кроме того, даже для LDPCкодов, не обладающих свойством цикличности, были предложены эффективные процедуры кодирования [47].
Традиционно код с малой плотностью проверок на четность
(LDPC-код) задается своей проверочной матрицей H, обладающей свойством разреженности, то есть ее строки и столбцы содержат мало ненулевых позиций по сравнению с размерностью
матрицы. Наравне с традиционным заданием кода как нулевого пространства проверочной матрицы, LDPC-коды часто задаются с помощью графа инцидентности матрицы H (т.н. графа
Таннера [51]). Такой граф инцидентности представляет из себя
159
двудольный граф, вершины которого делятся на два множества:
n символьных вершин, соответствующих столбцам, и r проверочных вершин, соответствующих строкам проверочной матрицы. Ребра, соединяющие вершины графа, соответствуют ненулевым позициям в матрице H. Пример такого графа приведен на
рис. 7.6.
Итеративный алгоритм декодирования LDPC-кодов производит принятие решения по каждому символу в отдельности. Таким образом, даже при большом числе произошедших в канале
ошибок, и неправильном принятии решения декодером о кодовом слове в целом, вероятность ошибки на информационный бит
для LDPC-кодов может оставаться достаточно низкой. На характеристики работы декодера при этом могут влиять другие параметры кода, помимо минимального расстояния.
Пусть g0 обозначает минимальную длину цикла в графе Таннера LDPC-кода (эту величину называют обхватом). В [5] показано, что итеративный декодер обеспечивает экспоненциальное
убывание вероятности ошибки декодирования при условии статистической независимости вычисляемых декодером значений,
что обеспечивается при достаточно большом значении g0.
Помимо минимального расстояния d0 и длины минимального цикла g0, важными характеристиками LDPC-кода являются
Символьные
вершины
Проверочные
вершины
r
n
Рис. 7.6. Граф Таннера
160
распределения числа ненулевых элементов в строках и столбцах
проверочной матрицы. LDPC-коды, у которых строки и столбцы
содержат одинаковое число единиц, принято называть регулярными кодами, в то время как коды с неравным числом единиц
называются нерегулярными кодами.
Более точно, определим регулярный (n, γ, ρ) – код как линейный код длины n, каждый столбец проверочной матрицы которого содержит γ ненулевых позиций, и каждая строка проверочной матрицы содержит ρ ненулевых позиций. Нерегулярные
коды часто задаются производящими функциями своих весоdv
dc
i =2
i =2
вых распределений, λ(x), и ρ(x), λ(x) = ∑ λ i xi −1, ρ(x) = ∑ ρi xi −1,
где λ доля столбцов проверочной матрицы, имеющих вес i,
ρi доля строк в H, имеющих вес i, и dv, dc максимальные веса
столбцов и строк, соответственно.
Как правило, построение хороших нерегулярных кодов использует вероятностные методы, анализ таких кодов производится в асимптотике, тогда как регулярные конструкции основаны на некоторых объектах с известными свойствами, и могут
анализироваться с учетом свойств этих объектов. Хорошо подобранные весовые распределения нерегулярных кодов дают выигрыш особенно на низких отношениях сигнал/шум (в канале
с АБГШ), когда качество кода определяется его средними характеристиками. При увеличении отношения сигнал/шум определяющими в вероятности ошибки декодирования становятся
дистанционные характеристики кода, и здесь выигрыш можно
получить с помощью регулярных конструкций, которые позволяют производить анализ минимального расстояния, и на основе этого анализа построение кодов с лучшими спектральными
свойствами.
Определение LDPC-кодов как линейных кодов, чья проверочная матрица содержит мало ненулевых элементов, не задает
конкретных способов построения проверочной матрицы, более
того, часто при построении LDPC-кодов используются вероятностные методы. Тем не менее, при отсутствии четкого задания
конструкции кода, существуют результаты, анализирующие
коды с малой плотностью проверок на четность как отдельный
класс кодов. Эти результаты основаны на рассмотрении ансамблей кодов, и оценке характеристик в среднем по ансамблю
161
[UrbankeCapacity,add23]. Ансамбль LDPC-кодов задается, в первую очередь, весами строк и столбцов (γ, ρ) проверочной матрицы, длина кода n рассматривается как параметр, который обычно оценивается в асимптотике для данных весов.
В работе [5] Галлагер показал, что для ансамбля (n,γ, ρ)-кодов
существует параметр δjk, такой, что с ростом длины кода n большинство кодов в ансамбле имеют минимальное расстояние nδjk,
где δjk не зависит от n, и следовательно, минимальное расстояние большинства кодов ансамбля увеличивается линейно с ростом n.
Галлагером были предложены алгоритмы декодирования
LDPC-кодов, которые могут работать как с дискретным, так и
с непрерывным выходом канала. Пинскером и Зябловым [6]
было показано, что среди кодов с низкой плотностью существуют коды с алгоритмом декодирования, обеспечивающим исправление ошибок кратности до δn со сложностью nlogn.
Для ансамбля LDPC-кодов существует величина, называемая порогом и связываемая с некоторым параметром канала,
в качестве которого обычно рассматривают величину, рост которой ухудшает канал, то есть понижает его пропускную способность. Например, для канала ДСК это переходная вероятность,
для канала с АБГШ дисперсия шума и т.п.
В [46, 48] приводится процедура, которая позволяет вычислять порог для некоторых каналов, а также определять такие
весовые распределения (γ,ρ) (или (γ(x),ρ(x)), для нерегулярных
кодов), которые максимизируют значение порога. Это позволяет находить весовые распределения, обеспечивающие хорошее
качество кода, особенно при передаче в канале с параметром,
близким к порогу (то есть, например, на низких отношениях
сигнал/шум в АБГШ). Данная процедура получила название
«эволюция плотностей» («density evolution»), так как вычисляет
изменение плотности вероятности числа ошибочных сообщений
с ростом числа итераций декодирования.
Данный анализ является асимптотическим, и не дает метода
построения кодов по заданным весовым распределениям, однако зачастую полученные в результате эволюции плотностей распределения весов используются различными конструкциями,
как изначально нерегулярными, так и регулярными с последующей оптимизацией весов.
162
Наконец, важным характерным свойством LDPC-кодов является эффект насыщения («error floor»), то есть замедление
скорости уменьшения вероятности ошибки с увеличением отношения сигнал/шум (SNR) в канале. Этот эффект особенно
присущ нерегулярным конструкциям, за счет оптимизации
весовых распределений обеспечивающих быстрый спад вероятности ошибки в низкой области SNR, однако довольно быстро достигающих эффекта насыщения. Обычно наличие эффекта насыщения связывают с тем фактом, что минимальное
расстояние LDPC-кодов мало, и сравнительно редкие события
неисправляемых ошибок малого веса не сказываются при малых SNR, однако становятся доминирующими при улучшении
канала в область высоких SNR. Однако с другой стороны, этот
эффект связан также с особенностями работы итеративного
декодера в случае, когда обрабатываемые им величины надежностей кодовых символов являются зависимыми вследствие
малого обхвата g0 графа Таннера и малого влияния на эти зависимые величины информации от других кодовых символов.
Данный граф описывается обычно в терминах так называемого. блокирующего множества («trapping set») [46, 48]. Задача
построения кодов с как можно меньшей вероятностью ошибки,
на которой происходит эффект насыщения, а также связанная
с ней задача нахождения этой вероятности являются важными
проблемами при практическом выборе LDPC-кодов для использования в современных системах связи. Зачастую наилучшим
известным подходом является интенсивное компьютерное моделирование, однако известны и некоторые эмпирические подходы к построению кодов с минимизацией эффекта насыщения
[23, 25, 36, 50].
7.3.2. Декодирование LDPC-кодов
Процедуры декодирования LDPC-кодов были введены Галлагером как для дискретного, так и для полунепрерывного каналов [5]. Эти процедуры предназначены для исправления ошибок
в каналах без памяти, где искажение некоторой позиции в передающемся кодовом слове не зависит от искажений, произошедших в других позициях. Впоследствии процедуры декодирования много раз модифицировались как с целью упрощения их
реализации, так и с целью понижения вероятности ошибки, но
общим для всех этих методов декодирования является то, что
163
они обеспечивают итеративное посимвольное декодирование
принятого слова [42].
Вначале рассмотрим декодер для дискретного канала на примере ДСК. Идея работы такого «жесткого» декодера заключается в том, что в результате разреженности проверочной матрицы,
особенно при условии отсутствия маленьких циклов в графе
Таннера, для некоторого принятого символа ci любой другой
символ входит не более чем в одну проверку символа ci. Другими
словами, множество проверок ортогонально относительно символа ci [1, 9]. Тогда столбцы проверочной матрицы имеют мало
общих ненулевых позиций, и следовательно, не выполнившаяся
проверка (элемент синдрома) более вероятно состояла из одного
ошибочного символа, чем из суммы трех и более. Это приводит
к следующей процедуре декодирования, называемой инвертированием битов («bit-flipping»).
Вначале вычисляются все проверочные соотношения матрицы H (то есть вычисляются компоненты синдрома), и затем биты
принятого слова, принявшие участие в большом количестве не
выполнившихся проверок, инвертируются, и процедура повторяется, пока не будет получено кодовое слово или не будет превышен лимит числа итераций. Формально этот алгоритм изображен на рис. 7.7.
При построении декодера для полунепрерывного канала (декодера для работы с «мягкими» решениями) на вход декодера
поступают надежности принятых символов, чаще всего представленные в виде логарифма отношения правдоподобия (7.6):
1. Вычислить S=rH T в поле GF(2). Если S=0, возвратить r, являющееся кодовым
словом.
2. Вычислить f=SHв поле целых чисел.
3. Определить элементы f, не меньшие некоторого порога, и проинвертировать
соответствующие элементы в r (в качестве наиболее простого варианта в качестве
порога можно выбрать максимальное значение элемента в f ).
4. Если не достигнуто максимальное количество итераций, вернуться к шагу 1. В
противном случае возвратить r.
Рис. 7.7. Алгоритм инвертирования бит
164
LLR(x | y) = log
Pr(x = +1 | y)
.
Pr(x = −1 | y)
Для биполярного гауссовского канала с дисперсией σ2 логарифм отношения правдоподобия для переданного символа x∈{±1}
при условии принятого символа y составляет LLR(x|y) = 2y/σ2
[42].
Алгоритм «распространения доверия», являющийся стандартным алгоритмом для декодирования LDPC-кода и предложенный Галлагером [5], может описываться следующим
образом, используя графическое представление проверочной
матрицы в виде графа, приведенного Таннером [42]. Всем n символьным вершинам графа Таннера приписываются логарифмы
отношения правдоподобия соответствующих символов принятого слова. Затем декодер осуществляет итерации, каждая из
которых состоит из двух фаз. На одной, «вертикальной» фазе,
1. Инициализация. Приписать каждой символьной вершине
равную логарифму отношения правдоподобия
j графа Таннера величину L j ,
j-го символа. Кроме того, установить L j→i
=L j для всех ненулевых элементов hij проверочной матрицы H, т.е. для всех i, j, для
которых hij =1
2. Горизонтальная фаза. Для всех ребер графа Таннера i→j вычислить


1

Li → j = 2 tanh−1  ∏ tanh  L j '→i   .
 j '∈N ( i )\{j}
2



3. Вертикальная фаза. Для всех ребер графа Таннера j→i вычислить
L j →i = L j +
∑
i '∈N ( j )\{ i }
Li '→ j .
4. Обновление надежностей . Для всех символьных вершин j = 0,n − 1 вычислить
Lj = Lj +
∑
i∈N ( j )
Li → j .
5. Критерий остановки . Для всех символьных вершин
решение, исходя из знака величин
j = 0,n − 1 принять «жесткое»
L j . Если для полученного в результате двоичного
вектора â выполняется âH = 0 или достигнут лимит количества итераций, алгоритм
возвращает â , в противном случае вернуться к шагу 2.
Рис. 7.8. Алгоритм распространения доверия
165
каждый j-й символьный узел, j = 1,n, пересылает каждому
смежному с ним проверочному узлу i некоторую величину Lj→i,
зависящую от всех величин, полученных j-м символьным узлом
от всех смежных с ним проверочных узлов, кроме i-го. Аналогично действует другая, «горизонтальная» фаза, с тем отличием, что теперь величины Lj→i пересчитываются и пересылаются
от проверочных узлов к символьным.
После каждой итерации, алгоритм принимает жесткие решения относительно каждого кодового символа, в соответствии со
знаком текущей величины символьного узла. Если полученный
жесткий вектор является кодовым словом, или если достигнуто
максимальное число проделанных итераций, алгоритм заканчивает свою работу.
Обозначим множество проверочных узлов, смежных с символьным узлом j, как N(j), тогда все смежные узлы, кроме узла
i, обозначим как N(j)\{i}. Аналогично N(i)\{j} множество всех
символьных узлов, смежных с проверочным узлом i, кроме символьного узла j. С учетом введенных обозначений алгоритм распространения доверия представлен на рис. 7.8.
Таким образом, декодирование LDPC-кодов может быть выполнено крайне эффективно, тем не менее, существуют другие
алгоритмы декодирования LDPC-кодов, позволяющие при незначительном ухудшении вероятности ошибки обеспечить еще
большую скорость работы [24, 34, 42, 55].
7.3.3. Построение нерегулярных LDPC-кодов
Как отмечалось в параграфе 7.3.1, процедура «эволюции
плотностей» позволяет находить распределения весов строк
и столбцов проверочной матрицы нерегулярного LDPC-кода,
улучшающие работу итеративного декодера, в особенности в областях низкого отношения сигнал/шум. С другой стороны, на
работу декодера влияет обхват графа Таннера (т. е. длина минимального цикла g0). Возникает задача построения проверочной матрицы, которая с одной стороны, следовала бы заданным
весовым распределениям λ(x) и ρ(x), а с другой – имела бы как
можно больший обхват.
В работе [54] предлагается эмпирическая процедура для решения этой задачи, дающая конструкцию, называемую PEG
166
Для j=0 до n-1 выполнять
Для k=0 до dv j −1 выполнять
Если k=0
Ev0 ← edge(c i ,v j ) , где Ev0 - первое ребро, смежное с vj , и ci - проверочная
j
j
вершина, им еющая минимальную степень в текущем графе Ev 0 ∪ Ev1 ∪  ∪ Ev j −1 .
В противном случае
построить дерево из вершины vj на глубину l в текущем графе, до тех пор, пока не
выполнится Nv ≠ ∅ и Nv+1 = ∅ , или мощность Nvl не прекратит увеличиваться,
j
j
но не превысит r, тогда
ci
Evk
j
j
← edge(c i ,v j ) , где
Evk
j
- k-е ребро, смежное с vj , и
- проверочная вершина, выбранная из множества
Nv
j
и имеющая
минимал ьную степень.
Рис. 7.9. Алгоритм PEG
(«progressive edge-growth» – прогрессивное «наращивание» ребер).
Конструкция PEG основывается на предвычисленном распределении весов символьных и проверочных узлов графа Таннера, например, с помощью процедуры эволюции плотностей,
однако точно так же алгоритм может использовать любое другое
распределение, в том числе и регулярное.
Алгоритм построения графа с заданными λ(x) и ρ(x) основывается на итеративной процедуре, пошагово добавляющей ребра
к уже существующему графу, с целью максимизации так называемого локального минимального цикла для данной вершины,
то есть длины минимального цикла, содержащего данную вершину.
Процедура PEG представлена на рис. 7.9. Пусть граф Таннера
содержит n символьных вершин vi, i = 1,n, и r проверочных вершин cj, j = 1,r . Далее, пусть dvi , dcj степень символьного узла vi
и проверочного узла cj, соответственно, где под степенью вершины подразумевается число исходящих из нее ребер (эта величина задается распределениями λ(x) и ρ(x), Evi множество ребер,
исходящих из символьной вершины vi, Nv множество провеi
рочных вершин, которые могут быть достигнуты из символьной
167
вершины vi за  или менее переходов по ребрам графа, Nv множество, дополняющее
Nv ,
i
другими словами,
Nv
i
i
∪ Nv
i
=
Vc ,
множеству всех проверочных вершин графа. Через edge(c,v) обозначено ребро, соединяющее вершины c и v.
В работе [54] получены оценки длины минимального цикла
g0 и минимального расстояния d0 для кодов, построенных при
помощи описанной процедуры.
Пусть dv и dc максимальные веса соответственно символьных
и проверочных вершин графа Таннера, тогда длина минимального цикла этого графа ограничена снизу как g0 ≥ 2(x+2) где


rd
log  rdc − c − r + 1 
dv

 − 1. =
x
log ( (dv − 1)(dc − 1) )
(7.35)
Рассмотрим графы Таннера с регулярными символьными
вершинами, имеющими постоянную (одинаковую) степень dv, и
пусть граф имеет длину минимального цикла, равную g0. Тогда минимальное расстояние кода, задаваемого таким графом,
можно оценить как
(
(
)
 d (d − 1) ( g0 −2)/4 − 1
v
v

,
1 +
dv − 2

åñëè g0 / 2 íå÷åòíî;
d0 ≥ 
 dv (dv − 1) ( g0 −2)/4 − 1
( g −2)/4 
1 +
,
+ (dv − 1)  0

dv − 2

åñëè g0 / 2 ÷åòíî.
(7.36)
)
Моделирование показывает, что конструкция PEG позволяет строить нерегулярные коды, обеспечивающие очень быстрый
спад вероятности ошибки на бит, и зачастую выигрывающие
у регулярных конструкций. Однако этим кодам присуще явление насыщения, обсуждавшееся в параграфе 7.3.1. Так как про168
цедура является эмпирической и в сущности псевдослучайной,
и кроме того – зависящей от входных весовых распределений,
то качество полученных с ее помощью кодов труднее анализировать в сравнении с регулярными LDPC-кодами. Поэтому данную
процедуру обычно оценивают с помощью интенсивного моделирования.
7.3.4. Построение регулярных LDPC-кодов
В соответствии с определением из параграфа 7.3.1 регулярными называются LDPC-коды, у которых строки и столбцы проверочной матрицы имеют одинаковый вес, или, что то же самое,
граф Таннера таких кодов имеет одинаковую степень для символьных и проверочных узлов.
Хотя такое определение не накладывает ограничений на способы построения кодов, на практике в большинстве случаев построение регулярного LDPC-кода означает использование некоторой конструкции, как правило, комбинаторной или кодовой,
позволяющей добиться необходимых свойств регулярности.
Методы построения LDPC-кодов, основанные на регулярных
конструкциях, позволяют использовать свойства тех объектов,
которые лежат в основе метода построения для получения кодов
с заданными параметрами. Таковыми, как кодовая длина или
скорость, проводить анализ полученных конструкций на основе свойств использовавшихся объектов, получать оценки минимального расстояния и длины минимального цикла.
Необходимо отметить, что с точки зрения процедуры эволюции
плотностей, нерегулярные распределения весов позволяют получить более низкое значение порога (см. параграф 7.3.1), чем регулярные. В связи с этим на практике зачастую рассматривается
подход, при котором используется конструкция регулярного кода,
на основании свойств которой получаются оценки параметров
кода (например, минимального расстояния или длины минимального цикла), а затем путем некоторых модификаций полученная
регулярная матрица приводится к нерегулярному виду, близкому
к желаемому (нерегулярному) весовому распределению.
На сегодняшний день существует множество конструкций
регулярных LDPC-кодов [26, 30, 38–42, 53]. Однако большинство этих конструкций могут быть обобщенно описаны с помощью подхода, впервые предложенного еще Галлагером в его
169
пионерской работе [5] о построении проверочной матрицы из
блоков-подматриц:
 H1,1
H
2,1
H=
 …

 H γ,1
… H1,ρ 
… H2,ρ 
.
… … 

… H γ,ρ 
H1,2
H2,2
…
H γ,2
(7.37)
Наиболее часто в качестве этих подматриц выступают перестановочные матрицы, в основном матрицы циклической перестановки [7, 26, 42]. Более формально, определим проверочную
матрицу как
 Ci11

Ci21
H=
 …
 i
 C γ1
Ci12
Ci22
…
i
C γ2
… C 1ρ 

i2ρ 
… C
, … … 
i 
… C γρ 
i
(7.38)
где C – (m×m) -матрица циклической перестановки:
0
1

C = 0

…
0

0
0
1
…
0
0
0
0
…
0
…
…
…
…
…
0
0
0
…
1
1
0 
0 , 
…
0 
(7.39)
и ρ ≤ m. Такие коды являются регулярными LDPC кодами с длиной n = mρ, постоянным весом столбцов γ и строк ρ.
В работе [40] предложен выбор в качестве степеней матрицы
циклической перестановки степени примитивного элемента матрицы Вандермонда:
HW
170
Im

Im
=
…

I
 m
Im
C
…
Cs−1
…


…
C

. …
…

… C( γ−1)(ρ−1) 
Im
ρ−1
(7.40)
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Рис. 7.10. Шаблоны нулевых блоков проверочной матрицы
Такие коды имеют минимальное расстояние γ+1 ≤ d0 ≤ 2m.
Дальнейшую модификацию блочно-перестановочной конструкции можно получить, если рассмотреть в качестве варианта заполнения блока Hi,j матрицы, состоящей из всех нулей.
С одной стороны, как уже упоминалось, это дает возможность
получать нерегулярные LDPC-коды и оптимизировать весовые
распределения строк и столбцов. С другой, такая процедура может приводить к уменьшению количества кодовых слов малого
веса и таким образом, если не приводить к увеличению минимального расстояния, то к улучшению спектра кода и уменьшению вероятности ошибки.
Выбор мест для расстановки нулевых блоков является отдельной задачей и зависит от конкретной проверочной матрицы. Несколько вариантов шаблонов, сохраняющих регулярную
структуру матрицы, приведены на рис. 7.10.
На сегодняшний день LDPC-коды находят множество применений и как объект для дальнейших исследований, и как
мощное средство для борьбы с ошибками, используемое во множестве стандартов. Эти коды используются во множестве предложений и для передачи по оптическим каналам связи [18, 21,
27–29, 31, 37].
7.4. Способы комбинирования кодов
171
Коды с алгебраическим декодированием – такие, как БЧХ и
РС, описанные в разделе 7.2, являются классическим результатом теории кодирования, однако с ростом их длины их характеристики ухудшаются (минимальное расстояние увеличивается
не так быстро, как длина кода), а сложность декодеров растет.
В то же время эти коды ориентированы на исправление независимых дискретных ошибок, что соответствует, например, модели ДСК, а реальные каналы обладают свойством группирования ошибок, и чтобы привести модель в большее соответствие
реальным искажениям в канале связи, применяют процедуру
перемежения (интерливинга), что подразумевает использование
достаточно длинных кодов. Возникает задача построения кодов
большой длины (порядка нескольких тысяч символов) без значительного увеличения сложности процедур кодирования-декодирования, позволяющих эффективно исправлять ошибки.
Одним из подходов для решения этой задачи является комбинирование нескольких кодов меньшей длины. Впервые такой подход был предложен Д. Форни [14] и получил название
каскадных кодов. Схема каскадного кодирования состоит в последовательном соединении нескольких кодеров на передающей
стороне и аналогичным каскадом декодеров на приемной, см.
рис. 7. 11.
В классической каскадной схеме, использующихся во многих
системах связи, используется каскад из двух кодов, где «внешним» кодом является код Рида-Соломона, а «внутренним» код
БЧХ. Такая схема позволяет также скомбинировать возможность двоичного кода БЧХ исправлять независимые ошибки и
способность кода Рида-Соломона над полем GF(2m) исправлять
кодер 1
кодер 2
...
кодер N
канал
декодер 1
декодер 2
...
декодер N
Рис. 7.11. Каскадная схема кодирования
172
пакеты (группы) двоичных ошибок длиной m. Если в качестве
внешнего кода используется код (n1, k1, d1) со скоростью R1 = k1/n1,
а в качестве внутреннего (n2, k2, d2)-код со скоростью R2 = n2/n2,
то результирующим будет код (n2,k1,d3) со скоростью
R3 = k1/n2 = R1R2 и минимальным расстоянием d1d2.
Развитием каскадной схемы является итеративная схема (называемая также произведением кодов), в котором комбинирование осуществляется путем формирования двумерной матрицы,
в которой столбцы представляют собой кодовые слова первого
кода, а строки – кодовые слова второго кода, см. рис. 7.12.
Произведение двух кодов: (n1,k1,d1) со скоростью R1 и (n2,k2,d2)
со скоростью R2 дает (n1n2,k1k2)-код с минимальным расстоянием d3 = d1d2 и скоростью R3 = R1R2. Более того, двумерная природа кодового слова дает возможность адаптации к каналу: такой
итеративный код способен не только исправлять все ошибки,
обеспечиваемые кодовым расстоянием, но также множество
комбинаций ошибок, которые можно описать геометрически
с помощью матрицы. К примеру, пакет ошибок, затронувший
строку кодового слова-матрицы (или даже несколько строк) и
состоящий из очень большого количества ошибочных символов, все еще может быть исправлен, так как количество ошибок
в столбцах остается низким. Это свойство особенно ценно в каналах, которые также могут быть описаны двумя размерностяk2
k1
информ.
символы
кодер 2
n1
кодер 1
n2
Рис. 7.12. Итеративная схема кодирования
173
ми, например, временной и частотной составляющими беспроводных каналов при многочастотной передаче.
Следует отметить, что описанные схемы каскадирования
и итерирования являются лишь самыми общими и простыми
примерами, в реальных схемах кодирования принцип комбинирования кодов может использовать различные параметры и
модификации рассмотренных схем [2, 3, 20].
Дальнейшее улучшение помехоустойчивости итеративной
схемы кодирования может быть достигнуто путем применения
мягких декодеров в полу-непрерывном канале связи. С использованием в качестве компонентных кодов в итеративной (или
каскадной) схеме кодов с мягкими процедурами декодирования
(причем такие процедуры обычно не только работают с мягким
входом, но выдают также и мягкий выход) естественной представляется схема организации итеративного декодера с обменом
мягкой информацией между различными стадиями декодирования различных компонентных кодов. Эта идея лежит в основе
так называемых турбо-кодов-произведений (TPC, «turbo product
codes»), предложенных в [45] и также нашедших широкое практическое применение.
7.5. Кодирование в оптических каналах
В этом разделе мы рассмотрим применение кодовых методов,
описанных в предыдущих разделах, в оптической связи. Исторически применение кодов, исправляющих ошибки, для передачи по оптическим каналам может быть разбито на несколько
этапов или «поколений» [53].
1. Первое поколение помехоустойчивого кодирования в оптических системах связи описывается стандартами ITU-T G.709 и
G.975 [16]. Схемы кодирования, описанные в этих стандартах,
основаны на классических циклических кодах с алгебраическим жестким декодированием, а именно кодах БЧХ и РС, описанных в параграфе 7.2.
2. Второе поколение кодовых схем связывают со стандартом
ITU-T G.975.1 [17], описывающим в основном комбинирование
кодов БЧХ и РС с жестким декодированием способами, описанными в параграфе 7.4.
3. Третье поколение использует возможности мягкого декодирования для кодов с малой плотностью (LDPC), описанных
в параграфе 7.3. Выбор именно LDPC-кодов, а не, скажем, турбо174
кодов с мягким декодированием обусловлен тем, что передача по
оптическим каналам осуществляется на экстремально высоких
скоростях, при которых LDPC-коды особенно эффективны. Однако может использоваться также итеративная схема с мягким
декодированием (схема TPC, см. параграфе 7.4).
4. Наконец, четвертое поколение ориентировано на такие
высокие скорости передачи, при которых модель с АБГШ оказывается слишком неадекватной, и необходимо учитывать другие, более специфические воздействия канала на передаваемый
сигнал. Одним из наиболее часто рассматриваемых эффектов
является межсимвольная интерференция, для борьбы с которой
используют процедуру эквализации. Задача эквалайзера – обработать принятый из канала сигнал таким образом, чтобы шум
на выходе эквалайзера был близок к Гауссовому, и затем применить стандартные методы кодирования для канала с АБГШ. Таким образом, четвертое поколение схем кодирования в оптических каналах связи преимущественно посвящено рассмотрению
процедурам турбо-эквализации с использованием LDPC-кодов.
В теории кодирования, когда нельзя получить аналитические оценки вероятности ошибки и применяется компьютерное
моделирование, способность кода исправлять ошибки оценивается частотой ошибок в информационных битах (BER, «bit error
rate») для данного отношения сигнал/шум. В практических системах, в том числе, при оптической передаче данных, оценивается параметр чистого выигрыша от кодирования (NCG, «net
coding gain»), определяемый как [32]
=
NCG 20 log10 (erfc−1 (2BERref )) −
−20 log10 (erfc−1 (2BERin )) + 10 log10 R (dB),
(7.41)
где BERin обозначает BER на входе декодера, BERref обозначает
целевую BER, erfc(⋅) дополнительная функция ошибок (см. гл. 4),
erfc(x) =
2
+∞ − z2
∫
π x
e
dz,
и R скорость кода. На сегодняшний день стандартной целевой
BER при передаче по отптическим каналам является величина
порядка 10–15.
175
На сегодняшний день основными стандартами, регламентирующими кодирование в оптических системах, являются стандарты ITU-T G.975 [16] и G.975.1 [17]. Кроме того, в последние
годы появилось множество публикаций, предлагающих различные схемы кодирования для высокоскоростных оптических
каналов связи (свыше 100 Гбит/с), см., например, [52].
В стандарте ITU-T G.975 предполагается использование классического кода Рида-Соломона (255,239) над полем GF(28). В параграфе 7.1.7 мы рассматривали оценку вероятности ошибки
на слово и на бит для декодирования в сфере радиуса t. Однако
в случае РС-кода, являющегося МДР-кодом (см. параграф 7.2.3),
эта оценка может быть уточнена, так как минимальное расстояние и весовой спектр этих кодов известен.
Например, в соответствии со стандартом ITU-T G.975, вероятность ошибки декодирования на бит для кода РС (255, 239) с t = 8
оценивается как
Pb =1 − (1 − Ps )1/8 , (7.42)
где Ps вероятность ошибки на 8-битный кодовый символ, оцениваемая как
Ps
=
255
i
i
psi (1 − ps )255−i , ∑ 255C255
(7.43)
i =9
где Ps вероятность ошибки на 8-битный символ в канале.
Стандарт ITU-T G.975.1 является развитием стандарта G.975
и предлагает восемь кодовых схем. Параметры этих схем приведены в табл. 7.2 (первая строка таблицы соответствует коду
из G.975). Как можно видеть, шесть из девяти схем кодирования являются итеративными или каскадными схемами (символ
«+» в таблице означает последовательное каскадирование, см.
рис. 7.11), которые, тем не менее, могут использовать различные
способы комбинирования. Большинство схем обладают избыточностью примерно в 7%. Из всех схем только схема 5 предполагает использование мягкого декодирования (обозначено в таблице как МД).
В табл. 7.3 приведены оценки помехоустойчивости этих схем
в терминах NCG, см. (8.41). Практически все схемы имеют целевую BER, равную 10–15.
176
Таблица 7.2
Кодовые схемы из стандартов G.975 и G.975.1
№
Каск./
итерат.
Параметры схемы
Избыточность
1
2
3
4
5
6
7
8
9
нет
да
да
да
да (МД)
нет
да
нет
да
РС(255,239)
РС(255,239)+сверточный код
БЧХ(3860,3824)+БЧХ(2040,1930)
РС(1023,1007)+БЧХ(2040,1952)
РС(1901,1855)+итеративный код
LDPC(32640,30592)
Каскадный БЧХ
РС(2720,2550)
Итеративный БЧХ(1020,988)x2
6,69%
24,48%
6,69%
6,69%
6,69%
6,69%
7%, 11%, 25%
6,67%
6,69%
Таблица 7.3
Помехоустойчивость схем кодирования стандартов G.975 и G.975.1
Избыточность
NCG
(дБ)
Входной
BER
Целевой
BER
РС(255,239)
РС(255,239)+
сверточный код
БЧХ(3860,3824)+
БЧХ(2040,1930)
РС(1023,1007)+
БЧХ(2040,1952)
РС(1901,1855)+
итеративный код
6,69%
24,48%
5,6
8,88
1.8e-4
5.2e-3
1e-12
1e-15
6,69%
8,99
3.15e-3
1e-15
6,69%
8,67
2.17e-3
1e-15
6
7
LDPC(32640,30592)
Каскадный БЧХ
8
9
РС(2720,2550)
Итеративный БЧХ
(1020,988)x2
6,69%
7%
11%
25%
6,67%
6,69%
№
Параметры схемы
1
2
3
4
5
6,69%
8,5/9,4 1.9/4.5e-3
8,02
8,09
9,19
10,06
8
8,67
1.12e-3
1.3e-3
4.44e-3
1.3e-2
1.1e-3
3.5e-3
1e-15
1e-15
1e-15
1e-15
2.1e-14
В табл. 7.4 приведен обзор схем, предлагавшихся в последние годы для высокоскоростных (свыше 100 Гбит/с) систем оптической связи [52] для избыточности около 7%. Можно видеть,
что большинство этих схем являются либо LDPC-кодами, либо
177
Таблица 7.4
Кодовые схемы для передачи свыше 100 Гбит/с (избыточность 7%)
Название
Тип
Swizzle
Staircase
LDPC
Сверточный LDPC
Итеративный БЧХ
Каскадный
БЧХ
Итеративный БЧХ
Каскадный
БЧХ
Каскадный
БЧХ
Итеративный
SP-BCH
2-it. conc.
BCH
UEP-BCH
CI-BCH 3
CI-BCH 4
TPC
ЖД/
МД
Избыточность
NCG (дБ)
BER
ЖД
ЖД
6,7%
7%
9,45
9,41
1e-15
1e-15
ЖД
7%
9,4
1e-15
ЖД
6,81%
8,91
1e-15
ЖД
7%
9,35
1e-15
ЖД
6,7%/12%/
20%
6,7%/12%/
20%
7%/15%/
20%
ЖД
ЖД/
МД
9,35/9,90/10,3 1e-15
9,55/10/10,5
1e-15
9,3/11,1/11,4
1e-15
Таблица 7.5
Кодовые схемы для передачи свыше 100 Гбит/с
(избыточность 20%)
Название
Тип
MTPC
GLDPC
TPC-BCH
Итеративный РС
LDPC
Итеративный
БЧХ
Каскадный
LDPC
Сверточный
LDPC
Каскадный
Каскадный LDPC
Каскадный
Недвоичный
LDPC
Каскадный
LDPC+SPC
QC-LDPC
CC-LDPC
LDPC+RS
SC-LDPC
NB-LDPC+RS
NB-QC-LDPC
3-conc. NBLDPC+RS
178
ЖД/
МД
Избыточность
NCG
(дБ)
BER
ЖД
ЖД
ЖД
20%
20%
20%
9.3
9.6
>10
1e-15
1e-15
1e-15
МД
МД
МД
20.5%
20%
20%
11.3 1e-15
11.3 1e-15
11.5 1e-15
МД
МД
МД
МД
20%
25.5%
20.5%
20%
9
12
10.8
10.8
МД
20.5%
10.8 1e-15
1e-13
1e-15
1e-15
1e-12
итеративными/каскадными (в том числе, TPC, см. раздел 7.4), и
почти все используют жесткое декодирование (обозначено ЖД).
В заключении, в табл. 7.5 приведены схемы для меньших
кодовых скоростей (избыточность около 20%). В этом случае используются те же классы кодов, большинство используют мягкое декодирование.
Как мы видим из табл. 7.2–7.5, все схемы кодирования используют либо коды БЧХ и РС (раздел 7.2), либо LDPC (раздел
7.3), либо различные схемы их комбинирования (раздел 7.4).
Дальнейшее развитие систем кодирования в высокоскоростной
оптической связи требует более специфического учёта влияния
канала на передаваемые сигналы. Это может достигаться как
с помощью стандартных подходов: упомянутой выше турбоэквализации, методов мультиплексирования с ортогональным
частотным разделением каналов (OFDM, «Orthogonal frequencydivision multiplexing»), фактически пытающихся «отбеливать»
канал и приблизить его к каналу с АБГШ, так и с помощью постановки задачи построения кодов, учитывающих специфику
канала. Не только решение, но даже и формальная постановка
такой задачи с формулировками требований к параметрам кодовой схемы являются сегодня открытыми проблемами, еще ожидающими своего решения.
Литература
1. Блейхут Р. Теория и практика кодов, контролирующих
ошибки. М.: Мир, 1986
2. Блох Э. Л., Зяблов В. В. Обобщенные каскадные коды (Алгебраическая теория и сложность реализации). М.: Связь, 1976.
3. Блох Э.Л., Зяблов В.В. Линейные каскадные коды. М.: Наука, 1982.
4. Галлагер Р. Теория информации и надежная связь. М.: Советское радио, 1974.
5. Галлагер Р., Коды с малой плотностью проверок на четность, М.: Мир, 1966.
6. Зяблов В.В., Пинскер М.С. Оценка сложности исправления
ошибок низкоплотностными кодами Галлагера. Проблемы передачи информации. XI(1). 1975.
7. Козлов А. В., Крук Е. А., Овчинников А. А. Подход к построению блочно-перестановочных кодов с малой плотностью
179
проверок на четность. Изв. вузов. Приборостроение. № 8. 2013.
С. 9–14.
8. Колесник В. Д. Кодирование при передаче и хранении информации (Алгебраическая теория блоковых кодов). М.: Высшая школа, 2009.
9. Колесник В. Д., Мирончиков Е. Т. Декодирование циклических кодов. М.: Связь.1968.
10. Колесник В. Д., Полтырев Г. Ш. Курс теории информации.
М.: Наука, 1982.
11. Кудряшов Б. Д. Теория информации. СПб.: Питер, 2009.
12. Мак-Вильямс Ф. Дж., Слоэн Н. Дж. А. Теория кодов, исправляющих ошибки. М.: Связь, 1979.
13. Питерсон У., Уэлдон Э. Коды, исправляющие ошибки. М.:
Мир, 1976.
14. Форни Д. Каскадные коды. М.: Мир. 1970.
15. Шеннон К. Работы по теории информации и кибернетике.
М.:Иностранная литература, 1963.
16. ITU-T Recommendation G.975/G709. Forward error
correction for submarine systems (10/2000).
17. ITU-T Recommendation G.975.1. Forward error correction
for high bit-rate DWDM submarine systems (02/2004).
18. Arabaci M., Djordjevic I. B., Saunders R., Marcoccia R. M.
«Nonbinary Quasi-Cyclic LDPC Based Coded Modulation for
Beyond 100-Gb/s», IEEE Transmission, Photonics Technology
Letters, vol.22, no.6, pp.434–436, March15, 2010.
19. Bahl L., Cocke J., Jelinek F. and Raviv J. Optimal decoding
of linear codes for minimizing symbol error rate, IEEE Trans. Inf.
Theory, vol. IT-20, no. 2, pp.284–287 1974.
20. Barg A., Zemor G. Concatenated codes: serial and parallel,
IEEE Transactions on Information Theory, vol. 51, no. 5, pp. 1625–
1634, May 2005.
21. Batshon H. G., Djordjevic I.B., L. Xu, Wang T. Multidimensional
LDPC-Coded Modulation for Beyond 400 Gb/s per Wavelength
Transmission, Photonics Technology Letters, IEEE , vol.21, no.16,
pp.1139–1141, Aug.15, 2009.
22. Berlekamp E., McEliece R. and Van Tilborg H. On the inherent
intractability of certain coding problems, Information Theory,
IEEE Transactions on, vol. 24, no. 3, pp. 384–386, May 1978.
180
23. Butler B. K., Siegel P. H., Error Floor Approximation for
LDPC Codes in the AWGN Channel, Information Theory, IEEE
Transactions on , vol.60, no.12, pp.7416–7441, Dec. 2014.
24. Chen J., Tanner R. M., C. Jones, and Y. Li, Improved minsum decoding algorithms for irregular LDPC codes, Proc. Int.
Symp. Information Theory, pp. 449–453, September 2005.
25. Cole C. A., Wilson S. G., Hall E. K., Giallorenzi T. R. Analysis
and Design of Moderate Length Regular LDPC Codes with Low
Error Floors, Information Sciences and Systems, 200 40th Annual
Conference on, vol., no., pp.823,828, 22–24 March 2006.
26. Diao Q., Huang Q., Lin S.; K. Abdel-Ghaffar, A matrixtheoretic approach for analyzing quasi-cyclic low-density paritycheck codes, Information Theory, IEEE Transactions on , vol.58,
no.6, pp.4030,4048, June 2012.
27. Djordjevic I., Arabaci M., Minkov L. L., Next Generation
FEC for High-Capacity Communication in Optical Transport
Networks, Lightwave Technology, Journal of , vol.27, no.16,
pp.3518–3530, Aug.15, 2009.
28. Djordjevic I., Sankaranarayanan S., Chilappagari S.K.,
Vasic B. Low-density parity-check codes for 40-gb/s optical
transmission systems, Selected Topics in Quantum Electronics,
IEEE Journal of, vol.12, no.4, pp.555–562, July-Aug. 2006.
29. Djordjevic I., Vasic B., Nonbinary LDPC codes for optical
communication systems, Photonics Technology Letters, IEEE ,
vol.17, no.10, pp.2224–2226, Oct. 2005.
30. Djordjevic I., Xu J., Abdel-Ghaffar K., Lin S. A class of lowdensity parity-check codes constructed based on Reed-Solomon
codes with two information symbols, Communications Letters,
IEEE , vol.7, no.7, pp.317–319, July 2003.
31. Djordjevic I., Xu L., Wang T., Cvijetic M. GLDPC Codes
with Reed-Muller Component Codes Suitable for Optical
Communications, Communications Letters, IEEE , vol.12, no.9,
pp.684–686, September 2008.
32. Forestieri E. Optical communication theory and techniques.
Springer, 2005.
33. Forney G. D., Richardson T. J., Urbanke R. L., and Chung S.Y. On the Design of Low Density Parity-Check Codes within 0.0045
db of the Shannon Limit. IEEE Communications Letters, 5(2), Feb.
2001.
181
34. Fossorier M., Mihaljevic M., and Imai H. Reduced Complexity
Iterative Decoding of Low Density Parity-Check Codes Based on
Belief Propagation. IEEE Transactions on Communications, 47(5),
May 1999.
35. Guruswami V. and Sudan M. «Improved decoding of ReedSolomon and algebraic geometric codes», IEEE Trans. Inform.
Theory, vol. IT-45, no. 6, pp. 1755–1764, September 1999.
36. Hirotomo M., Morii M. Detailed evaluation of error floors of
LDPC codes using the probabilistic algorithm, Information Theory
and its Applications (ISITA), 2010 International Symposium on ,
vol., no., pp.513–518, 17–20 Oct. 2010.
37. Gho G.-H., Kahn J.M. Rate-adaptive modulation and
low-density parity-check coding for optical fiber transmission
systems, Optical Communications and Networking, IEEE/OSA
Journal of , vol.4, no.10, pp.760–768, Oct. 2012.
38. Kabatiansky G., Krouk E., and Semenov S. Error Correcting
Coding and Security for Data Networks : Analysis of the
Superchannel Concept. John Wiley & Sons, 2005.
39. Kou Y., Lin S., and Marc P.C. Fossorier. Low-Density ParityCheck Codes Based on Finite Geometries: A Rediscovery and New
Results. IEEE Transactions on Information Theory, 47(7), Nov.
2001.
40. E. Krouk and S. Semenov, Modulation and coding techniques
in wireless communications. NJ: John Wiley & Sons, 2011.
41. Li J., Liu K., Lin S., Abdel-Ghaffar K. A Matrix-Theoretic
Approach to the Construction of Non-Binary Quasi-Cyclic LDPC
Codes, Communications, IEEE Transactions on , vol.63, no.4,
pp.1057–1068, April 2015.
42. Lin S., Ryan W. Channel Codes: classical and modern.
Cambridge: Cambridge University Press, 2009.
43. MacKay D. Good error correcting codes based on very
sparse matrices. IEEE Transactions on Information Theory, 45,
Mar. 1999.
44. MacKay D., Neal R. Near Shannon Limit Performance of LowDensity Parity-Check Codes. IEEE Transactions on Information
Theory, 47(2), Feb. 2001.
45. Pyndiah R., Near-optimum decoding of product codes: block
turbo codes, «Communications, IEEE Transactions on, vol. 46, no.
8, pp. 1003–1010, Aug 1998.
182
46. Richardson T. J., Urbanke R. L. The Capacity of low-Density
Parity-Check Codes Under Message-Passing Decoding. IEEE
Transactions on Information Theory, 47(2), Feb. 2001.
47. Richardson T. J. and Urbanke R. L. Efficient Encoding of LowDensity Parity-Check Codes. IEEE Transactions on Information
Theory, 47(2), Feb. 2001.
48. Richardson T. J., Urbanke R. L., and S.-Y. Chung. Analysis of
Sum-Product Decoding of low-Density Parity-Check Codes Using
a Gaussian Approximation. IEEE Transactions on Information
Theory, 47(2), Feb. 2001.
49. Shannon C. E. «A mathematical theory of communication».
Bell System Technical Journal, 1948, pp.
50. Schlegel C. Shuai Zhang, On the Dynamics of the Error Floor
Behavior in (Regular) LDPC Codes, Information Theory, IEEE
Transactions on , vol.56, no.7, pp.3248–3264, July 2010.
51. Tanner M.. A Recursive Approach to Low Complexity Codes.
IEEE Transactions on Information Theory, IT(27):533–547, Sept.
1981.
52. Tzimpragos G., Kachris C., Djordjevic I., Cvijetic M.,
Soudris D., Tomkos I., A Survey on FEC Codes for 100G and Beyond
Optical Networks, Communications Surveys & Tutorials, IEEE ,
vol.PP, no.99, pp.1–2.
53. Vasic B., Djordjevic I., Ryan W. Coding for Optical Channels.
Springer, 2010.
54. Xiao H.-Yu, Eleftheriou E., Arnold D. M. Regular and
irregular progressive edge-growth tanner graphs, Information
Theory, IEEE Transactions on , vol.51, no.1, pp.386–398, Jan.
2005.
55. Zhao J., Zarkeshvari F., Banihashemi A. On implementation
of min-sum algorithm and its modifications for decoding lowdensity parity-check (LDPC) codes, IEEE Trans. Communications,
vol. 53, no. 4, pp. 549–554, April 2005.
183
ГЛАВА 8. СВЕТОВЫЕ ВОЛНЫ
В НАПРАВЛЯЮЩИХ ОПТИЧЕСКИХ СТРУКТУРАХ
В данной главе, следуя работам [1–7], мы кратко опишем существующую в настоящее время информацию об оптических
направляющих волноводных структурах – от простой двухмерной направляющей плоской пластины и цилиндрического
оптического волновода, до различных типов оптоволоконных
направляющих структур.
8.1. Световые волны в двумерной направляющей пластине
Рассмотрим вначале симметричную двумерную (2-Д) пластину толщиной d = 2a, представленную на рис. 8.1, с бесконечной
длиной и с индексом рефракции n1, представленную в виде сэндвича между двумя другими бесконечными диалектрическими
плоскостями, рефракционный индекс каждой из которых равен
n2. Используя Декартову систему координат, представленную на
рис. 8.1, рассмотрим световой луч, берущий своё начало с точки
(0,0,0) системы координат и распространяющийся внутри внутренней пластины под углом θ.
Если угол падения θ превышает критический угол θкр ≡ θc,
как было показано в гл. 2, свет не будет покидать первую среду
и за счет полного внутреннего отражения от границ других двух
плоскостей, верхней и нижней, будет распространяться вдоль
внутренней пластины (см. рис. 8.1). Последняя ведет себя как
волновод [1–3, 6, 7], направляющий энергию оптической волны,
отражающейся поочередно от нижней и верхней границы, вдоль
внутренней пластины.
Не теряя общности изложения предмета, рассмотрим направленную оптическую волну с вертикальной поляризацией,
Ox
Ey .
i
Oy
Oz
H
n2
θ θ
x=2a
n1
θ θ
n2
x=0
Рис. 8.1. Геометрия распространения оптической волны
внутри двумерной пластины толщиной x = d = 2а
184
то есть TE-волну, и обозначим ее через E⊥ (смотрите определения, введенные в гл. 2). Как видно из представленного рисунка,
компонента электрического поля перпендикулярна плоскости
падения (так называемая E⊥ – поляризация).
Электрическое поле падающего луча, представленного индексом «i» на рис. 8.1, может быть записано в виде [1–3, 6]:
Ei =
≡ Ey0 E0 exp{− j ( ωt + kn1x cos θ + kn1z sin θ )}, (8.1)
где E0 – амплитуда падающего светового луча.
Таким же образом можно записать поле луча, отраженного от
первой (скажем, верхней) границы между двумя пластинами,
учитывая изменение фазы δV при полном внутреннем отражении (ПВО) вертикально поляризованной волны:
Er =
≡ Ey1 E0 exp{− j ( ωt − kn1x cos θ + kn1z sin θ − δV )}. (8.2)
Прямая и отраженная волна при взаимодействии интерферируют и, как результат, их суперпозицию, то есть результирующую волну, можно представить следующим образом:
ET ≡ Ei + Er =
= E0 exp{− j ( ωt + kn1z sin θ − δV / 2 )} ×
×2 cos ( kn1x cos θ + δV / 2 ).
(8.3)
Результирующая оптическая волна распространяется вдоль
оси оz с волновым числом kn1sinθ, а амплитуда этой волны промодулирована в направлении оси оx по закону cos(kn1cosθ+δV/2).
Так как задача симметрична относительно первого отражения от верхней или от нижней границы, выражение для оптического луча одинаково для обоих типов отражения. Это приводит
к одинаковым условиям как на верхней, так и на нижней границе, т. е., при x = 2a и при x = 0, а именно,
или
=
cos2 ( δV / 2 ) cos2 ( kn1 2a cos θ + δV / 2 ) (8.4)
(8.5)
2akn1 cos θ + δV = mπ, где m – целое число. Так как δV зависит только от угла θ (согласно формулам Френеля, представленным в гл. 2), то этот угол
185
может принимать только определенные дискретные значения,
если полагать, что результирующее интерференционное поле
остается неизменным вдоль длины направляющей пластины и
хакрактеризуется определенным числом m, соответствующим
своему углу падения луча θ.
Направив распространение оптической волны вдоль внутренней
пластины, т. е., вдоль оси oz, из формулы (8.3) получим, что это
распространение характеризуется продольным волновым числом, которое обозначим следующим образом:
=
β kn1 sin θ. (8.6)
Более того, условие полного внутреннего отражения (ПВО),
определяемое формулой sinθ ≥ n2/n1, приводит к условию (см.
гл. 2)
kn2 ≤ β ≤ kn1 (8.7)
при котором продольное волновое число всегда лежит между
волновыми числами, характеризующими эти две среды (пластины).
В то же время, поперечное волновое число q можно определить согласно (8.3) в виде
=
q kn1 cos θ. (8.8)
Следуя работе [6], мы введем дополнительное волновое число
p, определяемое следующим образом
p2 =β2 − n22 k2 . (8.9)
Тогда, согласно результатам, полученным в работе [6], вместо
условия (8.5) имеет место следующие условие поперечного резонанса
π p

tan  aq − m  =
2 q

(8.10a)
для поперечной оптической волны типа TE (т. е., для E⊥поляризационной моды), а также условие продольного резонанса для продольной оптической волны типа TM (т. е., для E||поляризационной моды):
186
π  n12 p

tan  aq − m  =
.
2  n22 q

(8.10б)
Уравнения (8.10а) и (8.10б) характеризуют обе оптические
моды для произволных двумерных направляющих структур
с произвольной геометрией. Решения этих двух уравнений также можно разделить на содержащие нечетные и четные моды
распространения, в зависимости от того, какое значение принимает целое число m – нечетное или четное, соответственно. Для
нечетных значений m мы получаем [6]:
π

tan  aq − míå÷  =
− cot(aq),
2


(8.11а)
а для четных значений m мы получаем [6]:
π

tan  aq − m÷åò  =
tan(aq). 2


(8.11б)
Не нарушая общности изложения, запишем (8.10а) в виде
aq tan ( aq ) = ap. (8.12)
Следуя определениям параметра q из (8.8) и параметра p из
(8.9), можно дополнительно получить следующее соотношение
между ними
2
a2 p2 + a2q=
a2k2 (n12 − n22 ). (8.13)
Вводя теперь прямоугольную систему координат с осями ap
и aq, последнее соотношение между p и q трансформируется
в окружности с радиусами
=
u ak(n12 − n22 )1/2 (рис. 8.2). Если на
этих же осях построить функции aqtan(aq), то уравнение (8.12)
соответствует всем точкам пересечения двух функций, определяемых равенством левой и правой частей уравненения (8.12)
(рис. 8.2).
Таким же образом можно определить соотношение между модами для четных чисел m, что мы представляем читателю сделать самостоятельно.
Точки пересечения на рис. 8.2 позволяют определить величины углов падения θ на границы между верхним и нижним слоями, которые соответствуют каждой в отдельности распростра187
няющейся моде в направляющей двумерной структуре. Определив величину θ для заданного k, мы можем теперь получить β из
формулы (8.6): β = kn1sinθ. Окончательно параметр β может быть
определен, как функция от k для заданного числа m. Результирующие кривые на рис. 8.2 – это и есть иная форма представления дисперсных свойств волноводных оптических волн, предложенная в работе [6].
Из вышеизложенного становится понятным, что число m
направленных вдоль структуры мод (или соответствующих
падающих и m-кратно отраженных лучей) зависит от параметров направляющей структуры. Это заключение следует также
из рис. 8.2, где окружность всегда пересечет кривую тангенса
даже при достаточно малом ее радиусе. Если существует единственное решение, то для него, как следует из рис. 8.2, параметр
окружности должен быть меньше, чем π/2, т. е.,
или
ak(n12 − n22 )1/2 < π / 2 (8.14а)
4a 2
(n1 − n22 )1/2 < 1. λ
(8.14б)
u =5
ap
u =2
u =1
aq
Волновые моды с числом aq
Рис. 8.2. Дисперсионная диаграмма оптических мод,
распространяющихся в двумерной пластине
188
Неравенство (8.14б) описывает условие существования единственной главной волноводной моды в симметричном двумерном
плоском волноводе. Оно представляет важный случай существования только одной моды в волноводе, существенно упрощающей передачу энергию волны внутри оптического волновода
без дополнительных искажений, связанных с интерференцией
между волноводными модами более высокого порядка.
Чтобы показать это более точно, представим на рис. 8.3, а и
8.3, б примеры оптических мод в двумерной направляющей пластине для TE и TM волн, соответственно, как функций безраз-
а)
n эф
3.600
3.595
90°
ТЕ0
3.590
3.585
3.580
ТЕ1
θ
ТЕ2
3.575
ТЕ3
3.570
3.565
3.560
ТЕ4
ТЕ5
θс
6 80.4°
3.555
0
б)
3.600
3.595
2
~
d
3
4
5
90°
ТЕ0,ТM 0
3.590
3.585
П эф
1
ТЕ1,ТM 1
θ
ТЕ2,ТM 2
3.580
3.575
ТЕ3,ТM 3
3.570
3.565
ТЕ4,ТM 4
3.560
3.555
0
1
2
~ 3
d
4
5
θс
80
.4°
6
Рис. 8.3. Критический угол падения θс = 80,4°: а – нормализованный
индекс рефракции для мод TE в зависимости от нормализованной
ширины пластины =
d d / λ ; б – нормализованный индекс рефракции
для мод TM в зависимости от нормализованной ширины пластины
189
мерной (нормализованной на длину волны) ширины волноводной пластины =
d d / λ для случая n1 = 3,6 и n2 = 3,55. На рисунках вдоль вертикальной оси отложены значения эффективного
индекса рефракции nэф ∈ [n2, n1]. Дополнительно, в нижней левой части рисунков представлен критический угол θкр≡ θс = 80,4°.
Угол θ0 = 90° взят в качестве верхнего предела падающих углов
на стенки направляющей пластины.
Аналогичное совместное распределение эффективного индекса рефракции nэф ∈ [n2, n1] для мод TM и ТЕ, в зависимости от
нормализованной ширины пластины представлено на рис. 8.3, б
для тех же параметров рефракции n1 = 3,6 и n2 = 3,55 и для критического угла падения θс = 80,4°.
Далее, согласно определению, введенному выше, для волнового числа q = k1cosθ = kn1cosθ, можно построить по соответствующим кривым так называемое характеристическое уравнение
или уравнение волноводных мод:
qd
tan=
2
1/2
(n1 cos θ )−1 (n1 cos θ )2 − n22 
.
(8.15)
Отметим, что при этом получаются многочисленные решения, так как тангенциальная функция в правой части уравнения (8.15) имеет для заданных величин n1 и n2 бесконечное число решений для аргумента qd/2 этой функции.
В заключении отметим, что для симметричной пластины
распределение мод поперек пластины всегда симметрично, тогда
как для несимметричной пластины наблюдается уширение сигнала вдоль ее ширины. Это явление называют дисперсией мод
в направляющей структуре, о чем речь пойдет ниже при рассмотрении оптического волокна, как направляющей структуры
оптических лучей.
8.2. Распространение оптической волны
в трехмерной цилиндрической структуре
Изначально следует отметить, что в такой трехмерной (3-Д)
структуре, называемой часто цилиндрическим волноводом,
могут распространяться только волны типа TM (горизонтально поляризованные) и типа TE (вертикально поляризованные),
и полностью отсутствуют моды ТЕМ, в которых нет компонент
электрического и магнитного полей вдоль направления распро190
Y
Z
P
r
φ
X
O
α
Рис. 8.4. Цилиндрическая трехмерная незаполненная внутри
направляющая структура
радиуса r = a
странения [4, 5]. Как следует из рис. 8.4, подобная 3-Д цилиндрическая структура имеет внутренний радиус a без специального
указания на толщину внешней оболочки, полагая ее полностью
проводящей. Внутреннее заполнение цилиндра рассматривается диэлектрическим без особых потерь, а также однородным и
изотропным со следующими магнитным и диэлектрическим параметрами: µr = µ/µ0 = 1, εr = ε/ε0≡n2≠1.
8.2.1. Моды TM в цилиндрическом 3-D волноводе
Следуя работам [4, 5], мы опишем распространение оптической волны в такой направляющей структуре, опираясь на представление оптических волн и их компонент, описанных в гл. 2.
В частности, рассмотрим вертикальную компоненту электрического поля волны, то есть ее z-компоненту, и запишем для неё
уравнение вида:
(∇2⊥ + γ2 + k2 ) Ez (r,ϕ) =0, (8.16)
где ∇2⊥ – поперечный оператор Набла в цилиндрической системе
координат, записанный следующим образом
=
∇2⊥
1 ∂  ∂  1 ∂2
.
r  +
r ∂r  ∂r  r 2 ∂ϕ2
191
Используя метод разделения переменных, известный из теории дифференциальных уравнений
Ez=
(r , ϕ) F1 (r ) F2 (ϕ),
получим окончательно
или
 1 d2 F2 
 1 d  dF1  
2
F2 
r
 + κ F1 F2 =0  + F1  2


2
r
dr
dr



 r dϕ 
(8.17а)
 r d  dF1    1 d2 F2 
2 2
r
 + κ r =0. 
+


2
 F1 dr  dr    F2 dϕ 
(8.17б)
Если теперь зафиксировать r , а ϕ считать переменной величиной, то никаких изменений не происходит во втором слагаемом формулы (8.17б). Поэтому для него можно записать следующее равенство:
1 d2 F2
=
−n2 =
const, F2 dϕ2
(8.18)
где параметр n должен быть определен. Общее решение уравнения (8.18) можно представить в следующем виде:
=
F2 (ϕ) ( K1 cos nϕ + K2 cos nϕ ), (8.19)
где K1 и K2 являются постоянными величинами. Из формулы
(8.19) следует, что при увеличении переменной ϕ на 2π, функция
F2(ϕ) будет повторять свои прежние значения, то есть является
периодической. При этом n должен быть целым числом, то есть,
n = 0,1,2,... Сумма двух других слагаемых в уравнении (8.17б),
первого и последнего, должна также быть равна n2 = const. Если
это так, то после умножения этих слагаемых на F1/r2, получим
1 d  dF1   2 n2 
r
+  κ − 2  F1 =
0. r dr  dr  
r 
(8.20)
Используя теперь переменную
v = κr,
получим из формулы (8.20) следующее дифференциальное уравнение
192
d2 F1
dn2
+
1 dF1  n2 
+  1 − 2  F1 =
0. n dn 
n 
(8.21)
Данное дифференциального уравнение, имеющее общее решение, выражаемое посредством полиномиальных функций
Бесселя, Ханкеля или Неймана. Не вникая в математические
детали и учитывая реккурентную связь между этими функциями, рассмотрим, без потери общности изложения, решение
уравнения (8.21) через функцию Бесселя, т. е., через функцию
вида [8, 9]:
(−1)m (n / 2)n +2m
,
m !(n + m)!
m =0
∞
Jn (n) =∑
(8.22)
где Jn(v) – функция Бесселя первого рода n-го порядка.
Комбинируя решения (8.19) и (8.21), получим общее решение
уравнения (8.17б) в виде
Ez (κr , ϕ
=
) Jn (κr ) ( K1 cos nϕ + K2 sin nϕ ). (8.23)
Из граничных условий на оболочке (при r = a): Ez(κa,ϕ) = 0, получим Jn(κr) = 0. Функции Jn(v) представлены на рис. 8.5.
Функции Jn(v) имеют последовательность корней vnm, определяемых из уравнения
Jn (nnm ) =
0. 1.0
0.5
0
(8.24)
J0(v)
J1(v)
J2(v)
2
4
6
8
10
12
v
–0.5
Рис. 8.5. Функции Бесселя первого рода n-го порядка
в зависимости от переменной v
193
Тогда поле волны, как решение, должно удовлетворять граничным условиям при r = a, если принять, что волновые числа
оптических мод равны
nnm
, κc,nm =
a
(8.25)
что приводит решение (8.23) к виду
Ez (nnm , ϕ
=
) Jn (nnm r / a) ( K1,nm cos nϕ + K2,nm sin nϕ ). (8.26)
Это и есть искомое решение для продольного поля (вдоль оси
z) TMnm мод внутри цилиндрического волновода. Так, для каждой функции Jn(v) с n ≥ 1 (n = 1, 2, 3…), используя m = 0, 1 2, 3,...,
получаем выражения для каждой волноводной моды. В частности, J0(v) будет соответствовать vn0 = 0 для произвольного числа n ≥ 1 и m = 0. При этом Ez≡0 для m = 0 при любых n ≥ 1. Таким
образом, мы получаем волновые числа n = 0,1,2,3,. и m = 1,2,3,..,
которые определяют распространение соответствующих оптических мод в в трехмерном цилиндрическом волноводе.
Здесь, критические волновые числа κc,nm из (8.25) устанавливают различие между режимом распространения и режимом
полного затухания волны, т. е., отсутствия режима распространения. Другими словами, эти числа определяют критические
частоты или длины волн для TMnm мод в цилиндрическом волноводе. Следуя работам [4, 5], можно получить эти критические
длины волн или частоты, соответственно:
c nnm
2πa
.
λ c,nm = , fc,nm =
n 2πa
nnm
(8.27)
Тогда параметр распространения волноводных оптических
мод можно определить как
γ2nm
(
2
=− k
− κ2c,nm
или
γmn= jk 1 −
194
)
 
κc,nm
= −k 1 − 
 k
 
λ2
λ2c,nm
2
≡ jk 1 −
fc2,nm
f2
2




.
 

(8.28)
(8.29)
Другие электромагнитные компоненты поля волны можно
определить, используя формулу (8.19) и следующее соотношение
∇ ⊥ F= ir
∂F
1 ∂F
+ iϕ
.
∂r
r ∂ϕ
В итоге получим для электромагнитных компонент поля волны следующие выражения
(8.30а)
cos nϕ
Ez =
± jJn (nnm r / a) 
; sin nϕ
(8.30б)
cos nϕ
jγ
Er =
− 2nm Jn' (nnm r / a) 
; κc,nm
sin nϕ
=
Eϕ
sin nϕ
jγnm n
J
(
n
r
/
a
)
; 
n
nm
κ2c,nm r
− cos nϕ
Hr = 
Eϕ
ZTM
, Hϕ = ±
Er
. ZTM
(8.30в)
(8.30г)
Здесь ZTM = γnm/jωε – импеданс мод TM, а J′(vnmr/a) – производная функции Бесселя J(vnmr/a) от r [6]. Верхние решения в системе уравнений (8.30а)–(8.30г) соответствуют выбору констант
K1,nm = ±j, K2,nm = 0, тогда как нижние решения соответствуют
выбору констант K1,nm = 0, K2,nm = ±j. Используя (8.30г) получаем для импеданса мод TM следующую формулу
2
Z
=
TM
 fc,nm 
η0
1−
 ,
n
 f 
(8.31)
где, как и в гл. 2, η0 = (µ0/ε0)1/2≈377Ω – импеданс свободного пространства.
Умножая систему (8.30) на exp{jωt±γnmz}, могут быть получены полные гармонические решения для всех компонент оптической волны, E(r,ϕ,z,t) и H(r,ϕ,z,t). Для произвольных комплексных констат K1,nm и K2,nm можно получить и более сложные решения для мод TMnm.
195
Из выражения (8.31) следует, что при f>fc,nm импеданс ZTM –
это реальное число и волновые моды TMnm распространяются
вдоль однородного волновода с фазовой скоростью
=
v
ph
ω
c
=
βmn n
1
1−
fc2,mn
,
(8.32)
f2
где n – индекс рефракции материала внутри волновода, в качестве которого, например, в полом волноводе выступает воздух.
Поток энергии оптической волны при этом распространяется
внутри волновода с груповой скоростью [4, 5]
−1
2
fc,mn
c
 dβ 
vãð  mn =
1− 2 . =

n
 dω 
f
(8.33)
Если теперь f < fc,nm, то импеданс ZTM – мнимое число и волны TMnm быстро затухают, т. е. внутри цилиндрического волновода отсутствует распространение любых TMnm волн.
8.2.2. TE-моды в цилиндрическом 3-Д волноводе
Для TE-мод, определяемых равенством Ez = 0, (см. гл. 2), используя ту же процедуру, что и для TM-мод, получаем следующее общее решение:
Hz (κr , ϕ
=
) Jn (κr ) ( K1′ cos nϕ + K2′ sin nϕ ). (8.34)
Тогда, следуя работам [4, 5], получаем следующее соотношение между электрической и магнитной компонентой поля TE
оптической волны:
jωµ ∂Hz
(8.35)
Eϕ (κr , ϕ) = 0
.
κ2 ∂r
Из граничных условий Ej(κa,ϕ) = 0 на идеально проводящей
оболочке волновода получаем уравнение вида: Jn(κa,ϕ) = 0. Как
это было сделано в предыдущем параграфе, обозначим через
n nm корни порядка n для функции Jn (n nm ) . Тогда волновые
числа TE-мод можно снова представить через корни функции
Бесселя, а именно:
196
n nm
κc,nm =
a
(8.36)
В итоге, согласно (8.34), получим окончательно полное решение продольных (вдоль оси z) TEnm-мод внутри цилиндрического волновода в виде:
Hz (n nm , ϕ
=
) Jn (n nm r / a) ( K1′,nm cos nϕ + K2′ ,nm sin nϕ ). (8.37а)
Здесь, как и в предыдущем параграфе, n = 0,1,2,3,.., и
m = 1,2,3,..
Другие электромагнитные компоненты поля волны TE, содержащей различные TEnm-моды, запишем в таком же виде,
как это было представлено выше в случае TMnm-мод, а именно:
cos nϕ
 nm r / a) 
H
=
;
z jJn (n
sin nϕ
=
Er
− sin nϕ
ωµ0 n
Jn (n nm r / a) 
; 2
r
κ
cos nϕ
(8.37б)
(8.37в)
c,nm
cos nϕ
ωµ
Eϕ =
− 2 0 Jn' (n nm r / a) 
;
κc,nm
sin nϕ
Hr = 
Eϕ
ZTE
, Hϕ = ±
Er
, ZTE
(8.37г)
(8.37д)
где
ZTE =
η0
n
1
2
 fc,nm 
1−

 f 
.
(8.38)
В формулах (8.37), (8.38) все параметры соответствуют введенным в предыдущем параграфе. Кроме того следует отметить,
что все характерные признаки и критерии распространения мод
или отсутствия их распространения в волноводе полностью совпадают с рассмотренными выше для TMnm-мод. B частности,
формулы (8.32) и (8.33), являются общими для обеих типов
волн, TEnm и TMnm.
Дополнительный анализ корней функций Бесселя Jn(vnmr/a)
и Jn (n nm r / a) показал, что мода TE11 имеет наиболее длинную
197
Z
λg
3λg / 4
λg / 2
λg / 4
0
Y
φ
X
Z= 0
Рис. 8.6. Электрическое (верхняя панель)
и магнитное (нижняя панель) поле
для волновой оптической моды TE11
в цилиндрическом волноводе
критическую длину волны и наиболее низкую критическую частоту по сравнению с любыми модами TE и TM, которые могут
распространяться внутри цилиндрического волновода. Следующей модой с наименее низкой критической частотой (наиболее
длинной критической длиной волны) является мода TM10. Поэтому, для заданной оперирующей частоты f и для соответствующей ей длины волны λ выбирается нормализованный радиус
цилиндрического волновода a/λ таким образом, чтобы он удовлетворял следующему условию: (n 11 / 2π) < (a/λ) < (n10 / 2π).
Так, если 0,3λ<a<0,4λ, то только мода TE11 может распространяться в цилиндрическом волноводе. Распределение элек198
трического (E) и магнитного (H) поля волноводной моды TE11
в цилиндрическом волноводе представлено на рис. 8.6 для верхних решений в формулах (8.37а)–(8.37г).
Если теперь повернуть эту картину распределения полей
на 90°, то получим картину для нижних решений из формул
(8.37а)–(8.37г).
8.3. Оптоволоконные Структуры
8.3.1. Типы оптоволоконных структур
Обычно оптоволокно представляет собой более сложную цилиндрическую структуру, отличную от обычного цилиндрического волновода, рассмотренного выше, и состоящую из двух
цилиндров: а) внутреннего, заполненного диэлектрическим материалом с индексом рефракции n1, и б) внешнего, пространство
между которыми заполнено диэлектрическим материалом с индексом рефракции n2, как это представлено на рис. 8.7.
Центральный цилиндр с диэлектрическим заполнением,
определяемым параметром n1, имеет радиус a, тогда как заполненная оболочка, определяемая параметром n2, имеет радиус b. Существуют два вида оптоволоконных структур: а) с пошаговым (резким) изменением индекса рефракци (step-index), и
б) со степенным (непрерывным) изменением индекса рефракци
(graded- index), отличие которых заключается в различии профилей индекса рефракции во внутреннем и внешнем цилиндрах, как это иллюстрирует рис. 8.8.
Из рис. 8.8 следует, что для «по-шагового» волокна индекс
рефракции скачком меняет индекс при переходе из внутренне-
n1
n2
Рис. 8.7. Внутренняя структура оптического волокна
199
Пошаговый
Степенной
b
b
.. ..
.. ..
.. ... .. a ..
. ..
..
.
..
.
.
.
.
..
.
a
.
.. ..
. .
n1
a
n1
a
n2
b
n2
b
n0
n0
Расстояние по радиусу
Расстояние по радиусу
Рис. 8.8. Различие между профилями индекса рефракции
у по-шагового и срепенного оптоволокна
Φ
n0
ϴi
ϴr
n1
n2
Рис. 8.9. Геометрия траекторий двух лучей,
распространяющихся вдоль по-шагового оптоволокна
го цилиндра во внешний, тогда как «степенное» волокно меняет
индекс рефракции плавно при переходе границы между цилиндрами.
Обычно на практике применяется оптоволокно с «пошаговой» направляющей волну структурой. При таком скачкообразном профиле индекса рефракции разные лучи (или моды)
распространяются вдоль волокна с различными длинами траекторий распространения, как это показано на рис. 8.9.
200
Согласно определения полного внутреннего отражения
(ПВО), чтобы получить полное отражение от материала наполнителя оболочки его индекс рефракции должен быть меньше
индекса рефракции во внутреннем цилиндре, т. е., n1>n1. Рисунок 8.9 показывает геометрию лучей внутри внутреннего цилиндра в предположении о достаточной толщине заполненной
диэлектриком оболочки.
Мы полагаем, что эффекты, связанные с конечной толщиной диэлектрической оболочки незначительны, и поле лучей не
оказывает влияния вне границы материала оболочки. Эффекты
распространения, как видно из рис. 8.9, аналогичны тем, что
имеют место в двухпроводной пластине, рассмотренной в параграфе 8.1. Как будет показано ниже, в многомодовом оптоволокне с «по-шаговым» профилем индекса рефракции имеет место
существенное нарушение модальности. Во избежании данного
недостатка, применяют новый тип оптоволокна, называемый
«степенным», который имеет ту же структуру, что и первый тип,
и который изображен на рис. 8.8 справа.
8.3.2 Распространение оптической волны
в оптоволоконной структуре
Мы рассмотрим теперь цилиндрическую оптоволоконную
структуру, показанную на рис. 8.10, которая является реальным
геометрическим представлением оптического волокна, как направленной волноводной оптической структуры с внутренним
волноводом и внешней оболочкой, заполненными диэлектриками со своими собственными индексами рефрации (см. рис. 8.10).
x
φ
n2
r
0
z
n1
n2
y
Рис. 8.10. Представление оптоволоконной структуры
в цилиндрической системе координат (вид слева)
201
Как и для случая цилиндрического трехмерного волновода,
рассмотренного в параграфе 8.2, мы будем использовать метод
разделения переменных для волнового уравнения, записанного в цилиндрической системе координат, однако имея дело
не с волноводными модами, а с оптическими лучами, каждый
из которых, переотражаясь от внешней и внутренней границы
оптоволокна, соответствует своей волноводной моде согласно
законам геометрической оптики [1–3, 6]. Волновое уравнение
для геометрической структуры, показанной на рис. 8.10, можно
представить в цилиндрической системе координат для µr = 1 следующим образом:
∇2 E =
1 ∂  ∂E  1 ∂2 E ∂2 E
∂2 E
r
 + 2 2 + 2 = µε 2 r ∂r  ∂r  r ∂ϕ
∂z
∂t
(8.39)
Как и в параграфе 8.2, представим решение уравнения (8.39)
в виде суперпозиции компонент электрического поля оптической волны, каждая из которых зависит от определенной переменной в системе координат {r,ϕ,z,t}:
=
E Er (r ) Eϕ (ϕ) Ez (z) Et (t). (8.40)
Основываясь на физике распространения волны вдоль оси
цилиндра, представим компоненту E(t,z) в следующем виде:
E(t,z) ≡ Et(t)Ez(z) = exp{i(βz–ωt}. Это позволяет преобразовать
уравнение (8.39) к следующему виду:
(
1 ∂  ∂ Er Eϕ
r
∂r
r ∂r 

)  + 1 ∂2 ( Er Eϕ ) − β2 E E
 r2

∂ϕ2
r
ϕ
+
n2ω2
c2
( Er Eϕ ) = 0. (8.41)
Предположим теперь, что функция Ej является периодической и ее можно представить следующим образом
(8.42)
Eϕ= exp ( ±imϕ ), где m – целое азимутальное число. В этом случае искомое уравнение упрощается и имеет окончательный вид:
∂2 Er
202
∂r 2
+
1 ∂Er  2 ω2
m2 
+  n 2 − β2 − 2  Er = 0. r ∂r 
c
r 
(8.43)
Уравнение (8.43) является одной из форм представления уравнения Бесселя, решениями которого являются модифицированные функции Бесселя первого, J(qr), и второго, K(pr), порядка,
определенные через соответствующие волновые параметры q и
p, введенные согласно формулам (8.8) и (8.9), соответственно.
Это приводит в итоге к уравнениям внутри центрального волновода (при r ≤ a) вида:
∂2 Er
∂r 2
+
1 ∂Er  2 m2 
0 +  q − 2  Er =
r ∂r 
r 
(8.44a)
и внутри диэлектрической оболочки (при (r>a) вида:
∂2 Er
∂r 2
+
1 ∂Er  2 m2 
0. +  p + 2  Er =
r ∂r 
r 
(8.44б)
Решениями этих уравнений будут соответственно
Er = Ec Jm (qr ); (8.45a)
Er = Ec1 Km ( pr ). (8.45б)
Функции Jm(qr) и Km(pr) более точно определяются как функция Бесселя первого рода и функция Ханкеля (как функция
Бесселя второго рода) [8, 9]. В качестве примера, корни функции
Бесселя Jm(qr) представлены на рис. 8.5. Информацию о корнях
функции Ханкеля Km(pr)читатель может найти в работах [8, 9].
Окончательно, полное решение внутри центрального волновода запишется
=
E Ec Jm (qr )exp{− j ( ωt − βz )} exp ( ± jmϕ ). (8.46a)
Аналогично полное решение внутри лиэлектрического слоя
оболочки будет иметь вид
=
E Ec1 Km ( pr )exp{− j ( ωt − βz )} exp ( ± jmϕ ). (8.46б)
Используя, как и в случае пластины и цилиндрического волновода, граничные условия при r = a, рассмотренные в предыдущих параграфах, мы можем определить для оптоволоконной
структуры соответствующие величины p, q и β. Связь между
этими параметрпми описывает дисперсию распространения, ко203
n2 k
β
m=
0
1
2 3
n1 k
k
Рис. 8.11. Дисперсионная диаграмма оптических лучей (мод)
в оптоволоконной структуре
торая, в свою очередь, определяет возможность или невозможность распространения оптических лучей внутри такой структуры. Соответствующие дисперсионные кривые представлены
на рис. 8.11 в виде зависимости параметра распространения β от
волнового числа k.
Штриховые линии определяют границы внутреннего волновода с волновым числом n1k и внешней диэлектрической оболочки с волновым числом n2k. Видно, что с увеличением числа
переотражений от внутренней и внешней стенок оптоволоконной структуры (с увеличением азимутального числа m) влияние
внешней оболочки становится все более и более ощутимым. При
увеличении k (то есть, при уменьшении длины волны или увеличении ее частоты) m–кратно переотраженные лучи (оптические
моды) распространяются с волновым числом, близким к n2k.
Строгое решение задачи распространения оптических волн
в оптоволокне довольно сложно получить аналитически, и мы
воспользовались при изложении задачи так называемым приближением «слабого волноводного эффекта». Данное приближение позволяет использовать допущение, что при n1≈n2 угол
падения луча на границу между внутренним цилиндром и оболочкой, заполненной диэлектриком, довольно большой, чтобы
обеспечить полное внутреннее отражение (ПВО) во внутрь направляющей оболочки (см. рис. 8.9). При этом оптические лучи
будут распространяться таким же образом, как поперечные
204
волны с очень малыми компонентами вдоль оси oz. Пренебрежение продольными компонентами поля волны, Ez, Hz приводит
к упрощению результатов теоретического анализа и приводит
к результату, аналогичному полученному в параграфе 8.1 для
двумерной (2-Д) пластины.
Так как внутри оптоволокна мы полагаем распространяющимися только поперечные волны, то как и в свободном пространстве, их можно представить в виде суперпозиции двух
линейно поляризованных компонент оптической волны, называемых линейно поляризованными (LP) модами [1–3, 6]. При
этом решения, полученные выше, относятся напрямую к оп-
Поляризация
I( r )
LP01(m=0)
LP11(m=0)
Рис. 8.12. Основные линейно поляризованные оптические волноводные моды с вертикальной (левые рисунки) и горизонтальной (правые
рисунки) поляризацией внутри оптоволоконной структуры
205
тическому волноводу и описываются приближением «слабого
волноводного эффекта», при котором выполняется соотношение
(n1–n2)/n1≈0,01.
Пространственное распределение интенсивности некоторых мод низкого порядка представлено на рис. 8.12 согласно
работам [1–3, 6]. Здесь же приводится тип поляризации мод и
величины соответсвующих азимутальных чисел m. Как видно
из представленного рисунка, существуют две возможные моды
у оптического волокна: LP01(m = 0) и LP11(m = 1) [1–3, 6]. Стрелки, вертикальная и горизонтальная указывают на два вида поляризации оптической волны, верикальную и горизонтальную,
соответстственно.
Для цилиндрически-симметричной геометрии оптоволокна
условие существования только одной (основной), волноводной
моды можно представить следующим образом [1–3]:
2πa 2
(n1 − n22 )1/2 < 2,404. λ
(8.47)
8.4. Дисперсионные свойства оптоволоконных структур
Чтобы понять дисперсные свойства оптоволоконных направляющих структур, передающих непрерывные и импульсные
сигналы посредством оптических лучей на большие расстояния,
необходимо различать разные виды таких волноводных структур и понимать, какие потери и искажения при передаче информационных сигналов можно ожидать в таких оптоволоконных
структурах.
Как было показано выше, все оптические лучи (тождественные волноводным модам), отражающиеся от верхней и внутренней границ оптоволокна при углах меньших критического угла,
будут распространяться вдоль оптоволокна. Их количество определяет тип оптоволокна. Так, при растространении нескольких
лучей, переотраженных от стенок оптоволоконной структуры,
оптоволокно определяют как многомодовую структуру, в которой за счет неидеальности стенок и других элементов геометрии
оптического кабеля возникает интерференция между лучами –
модами, приводящая к многомодовой дисперсии.
Оптоволоконную структуру, в которой за счет подбора параметров материалов внутреннего и внешнего кабеля, его гео206
а)
n1
n2
Покрытие
a
n(r)
Показатель
преломления
Ядро
n2
б)
n1
n(r)
Показатель
преломления
Ядро
a
Покрытие
Рис. 8.13. Иллюстрация многомодового (а)
и одномодового (б) оптоволокна
метрии и длины оптической волны, распространяется только
одна, основная мода, определяемая формулой (8.47), называют
одномодовой. Так, оптоволокно с диаметром внутреннего волновода, превышающем длину оптической волны, позволяет
пропускать множество оптических волноводных мод, тогда как
в случае соотношения одного порядка между диаметром и длиной волны вдоль волокна распространяться будет только одна
мода. Рис. 8.13 иллюстрирует представление оптоволоконных
структур, описанных выше.
Введем теперь несколько важных параметров, характеризующих процессы распространения оптических лучей в оптоволокне и «реакцию» самого волокна на процессы распространения,
т. е., его «отклик» на распространение оптических сигналов.
8.4.1. Характерные параметры
оптоволоконных структур
Одним из важных параметров оптоволоконной структуры,
обычно используемых в волоконной оптике, является численная апертура («numerical aperture»), обозначаемая в литературе
аббревиатурой N.A. [1–7] и определяемая следующим образом:
N.=
A. n1 sin θc ≡ sin θa , (8.48)
207
где двойной угол, 2θa, называют углом существования полной
связи вдоль оптоволокна [1–7], когда полное внутреннее отражение во внутрь кабеля имеет место. Согласно известной формуле
cos2θ = 1–sin2θ, получаем в итоге:
N.=
A.
(n12 − n22 )
1/2
.
(8.49)
Зачастую в оптоволоконной физике используют параметр,
носящий название относительного индекса рефракции:
=
∆
(n12 − n22 ) ≡ ( N.A.)2 n12
n12
(8.50)
Используя формулы (8.49), (8.50), получим связь между этими инженерными параметрами, а именно:
N. A.= n1 ⋅ (∆)1/2 . (8.51)
8.4.2. Дисперсия оптического сигнала
в оптоволоконной структуре
Дисперсия сигналов в оптических направляющих структурах проявляется за счет уширения передаваемых импульсов
в случае дискретной связи или за счет зависимости скорости
распространения непрерывной оптической волны (луча) от частоты. Проблема передачи импульсных оптических сигналов
через оптоволоконную структуру зависит от двух независимых
факторов.
Первый фактор заключается в том, что источник света не
излучает на одной длине волны, а на нескольких длинах волн,
определяющих спектральную полосу источника-эммитера [1–7].
Второй фактор заключается в зависимости индекса рефракции
от длины волны – он различен для каждой длины волны. Этим
явлениям соответствуют два вида дисперсии, которые мы рассмотрим раздельно.
Многомодовая дисперсия – результат действия первого фактора, когда свет от источника проникая в оптоволокно представляет собой некое число лучей, каждый из которых входит
в оптический кабель под различными углами, и, поэтому, проходящими вдоль кабеля различные по длине траектории. Это
приводит также к уширению импульсов с оптической информа208
цией вдоль траектории распространения внутри оптоволокна.
Отметим, что данный вид дисперсии возможен только в случае
многомодовой направляющей оптической структуры, представленной на рис. 8.13, а.
Другой вид дисперсии, материальной, имеет место для обоих видов оптоволоконной структуры, как многомодовой, так и
одномодовой. Рассмотрим вкратце это явление.
Материальная дисперсия связана с многочастотным спектром излучаемого оптического источника внутри оптоволокна и
зависимостью индекса рефракции от длины волны. Как результат этих факторов, тот же импульсный сигнал распространяется внутри волновода с различной фазовой скоростью, вызывая
уширение начального импульса с расстоянием. Отметим, что
эти факторы вызваны неодноролностью материала диэлектрической оболочки оптического кабеля. Другими словами, материальная дисперсия меняется согласно изменениям свойств диэлектрического заполнения вдоль оболочки кабеля.
Как при многомодовой, так и при материальной дисперсии
оптического сигнала, уширение импульса линейно зависит от
длины оптического кабеля и тем самым ограничивает емкость
и скорость передачи информации в оптоволокне. Уширение начальных импульсов приводит к пересечению соседних между
собой импульсов в потоке информации, создавая интерференцию импульсов (рис. 8.14), приводящую к ошибкам в передаче
информации и уменьшению скорости передачи информации.
Свойства материалов, из которых создаются оптоволоконные
структуры, полностью определяют материальную дисперсию,
а)
100 нс
1 км
б)
100 нс
2 км
Рис. 8.14. Различие между возможностью выделять
информационные импульсы (а) и невозможностью
их разделения из-за интерференции между ними (б)
209
вызывающую изменение длины оптической волны при ее распространении внутри оптоволокна.
Это происходит из-за того, что каждая мода (называемая
в оптике волновой гармоникой) распространяется со своей собственной длиной волны (частотой), а значит со своей скоростью
распространения вдоль оптоволокна, приходя на приемник, соединенный с излучателем-эммитером с помощью оптоволокна,
со своим собственным временным запаздыванием. Это приводит
в итоге к уширению исходного оптического сигнала длительностью τ на единицу длины кабеля l на величину
τ
∆   = − M∆λ l
(8.52)
М (пс/ (нм · км))
Здесь M – фактор дисперсии материала, изображенный на
рис. 8.15 согласно работам [6, 7] для чистого силиконового стекла, как функция длины волны оптического сигнала, изменяющейся от 0,7 мкм до 1,55 мкм и далее. Фактор дисперсии материала измеряется в пикосекундах на нанометр на каждый километр длины оптоволоконной структуры, т. е., в [nc/(нм⋅км)].
Легко видеть из представленного рисунка, что фактор материальной дисперсии равен нулю (M = 0) при длине волны в 1300
нм, при которой оптический импульсный сигнал имеет минимальное уширение во времени. Для длин волн от 1200 нм до
1600 нм фактор дисперсии сигнала за счет материала можно
апроксимировать следующей формулой:
110
1.3
- 20
0.82
1.55
λ (мкм)
Рис. 8.15. Зависимость фактора дисперсии материала в [nc/(нм⋅км)]]
оптоволокна от длины волны излученного сигнала
как функции его длины волны λ (в мкм)
210
=
M
M0 
λ4 
 λ − 03 . 4 
λ 
(8.53)
Здесь M0≈–0,095 пc/(нм⋅км) и λ0≈1300 нм (длина волны при
M = 0). При длине волны в 1500 нм M≈–20 пc/(нм⋅км). Так, использование лазерного эмиссионного детектора типа LED (см.
гл. 6) с полосой длин волн в 20 нм приводит к уширению импульса сигнала на единицу в один километр длины канала связи внутри оптического кабеля, равному
τ
∆   = − M∆λ = −(−20) ⋅ 20 = 400 ïñ/êì. l
(8.54)
Данный пример указывает на то, что, несмотря на кажущуюся ничтожность дисперсии оптического сигнала в оптоволокне на каждый километр его длины (сотни пикосекунд), данный
проводный канал связи нельзя использовать на расстояниях,
превышающих сотни километров, ибо эта дисперсия может усилить влияние мультипликативного шума на информационный
сигнал, увеличивая ошибку в передаче битов информации (см.
гл. 11). В этом и состоит эффект влияния материальной дисперсии оптических сигналов в оптоволоконных структурах.
Зададимся теперь вопросом: а что можно сказать о влиянии
многомодовой дисперсии на оптические сигналы в оптоволокнах, вызванной несимметричным распределением индекса рефракции в них – с резким (по-шаговым) и непрерывным (ассиметричным степенным) профилем показателя преломления (см.
рис. 8.8).
Так, следуя работам [6, 7], можно показать, что для пошагового (градиентного) оптоволокна, представленного на
рис. 8.8, а, нормированное на километр длины кабеля уширение оптического сигнала за счет многомодовой дисперсии можно
представить следующим образом:
 τ  n1
∆ =
(n1 − n2 ). 
 l  cn2
(8.55)
Для непрерывного (степенного) профиля индекса рефракции,
представленного на рис. 8.8, б, получаем, с учетом (8.50), нормированное уширение модальных импульсов в виде
211
(
)
2
2
 τ  n1∆ n1 − n2
. ∆  =
=
c
l
2c ⋅ n1
(8.56)
Здесь, как и в предыдущих главах, c – скорость света в вакууме.
О влиянии уширения сигнала на скорость и эффективность
передачи информации, а также на ошибки в передачи битов информации будет рассмотрено в гл. 11. Сейчас лишь отметим, что
прооблема с уширением оптических импульсов в оптоволоконных структурах ограничивает емкость и скорость передачи информации, передающейся по оптоволокну на достаточно далекие
расстояния [7], вызывая пересечения импульсов между собой,
т. е., межимпульсную интерференцию (МИИ) [10]. Последняя
приводит к ошибкам в передаче оптической информации, что
будет рассмотрено в гл. 11 как для оптоволоконных (проводных),
так и для беспроводных (атмосферных) каналов связи.
Что касается аналоговых оптических систем, уширение сигналов уменьшает полосу пропускания системы. Так при потерях
в энергии сигнала на 3 дБ в такой системе, ограничения полосы
пропускания оцениваются на каждый километр ее длины как
0,35
f 3äÁ × l =
.
∆τ / ∆l
(8.57)
Используя значения параметров, представленные в формуле
(8.54), получим оценочную формулу для ограничения по частоте
в оптической проводной аналоговой системе
=
f 3äÁ × l 0,875 ÌÃö × êì. (8.58)
На частотах модуляции, ниже данного предела, аналоговый
сигнал распространяется вдоль оптоволокна без его искажений,
тогда как выше этого порога сигналы бысто затухают.
Затухание внутри волоконнооптической структуры. Как
показано в гл. 2, потери сигнала при распространении внутри
материальной среды описываются коэффициентом затухания
α, входящим в виде вещественной компоненты комплексного
параметра распространения γ = α+jβ, измеряемого в км–1. В во212
3.0
Затухание, дБ/км
ОН пик затухания
Полные
потери
2.5
2.0
1.5
1.0
0.5
0
800
Расеяние Рэлея
900
1000
1100
1200
1300
Длина волны, нм
1400
1500
1600 1700
Рис. 8.16. Нормализованный коэффициент затухания (в дБ на км)
импульсного оптического сигнала внутри оптоволокна
как функция длины волны сигнала (в нм)
локонной оптике параметр затухания сигнала обычно определяют в децибелах на километр длины оптического волокна, т. е.,
в дБ/км. В таком случае следует установить связь между обоими
представлениями параметра затухания, а именно:
äÁ/êì = −8,685 ⋅ α. (8.59)
Пример затухания в оптоволокне с силиконовым стекляным
заполнением внешней оболочки представлен на рис. 8.16, основанном на анализе, проведённом в работах [6, 7].
Как видно из рис. 8.16, пик затухания оптического сигнала
внутри оптического кабеля приходится на длину волны около
1300 нм с боковым пиком поглощения на 940–980 нм. Легко
видеть, что в области длин волн от 800 до 900 нм и от 1250 до
1650 нм оптический кабель прозрачен (то есть имеет окна прозрачности) для передачи через него оптических информационных сигналов.
Также нужно отметить изменения начальной поляризации
оптической волны внутри оптоволоконных структур, вызванных многомодовой дисперсией исходных оптических сигналов
внутри оптоволокна и названных, поэтому, дисперсией поляри213
зационных мод (ДПМ). Данное явление характеризуется следующим параметром девиации (отклонения):
σp =
D p l. (8.60)
Здесь Dp – параметр дисперсии поляризационной моды
(ДПМ), измеряемый в пикосекундах на корень квадратный из
километра (то есть в пc/км1/2). Для обычного оптического кабеля этот параметр ниже, чем 0,5 пc/км1/2, и для многих применяемых на практике оптоволокон он может превышать величину
в 10 пc/км1/2.
Литература
1. Adams M. J. An Introduction to optical waveguides, New
York: John Wiley & Sons, 1981.
2. Elliott R. S. An introduction to ouided waves and microwave
circuits, New Jersey: Prentice Hall, 1993.
3. Palais J. C. Fiber optic communications, 4th Ed., New Jersey:
Prentice-Hall, 1998.
4. Jackson J. D. Classical electrodynamics, New York: John
Wiley & Sons, 1962.
5. Chew W. C. Waves and fields in inhomogeneous media, New
York: IEEE Press, 1995.
6. Optical fiber sensors: Principles and components, Handbook,
Ed. by J. Dakin and B. Culshaw, Boston-London: Artech House,
1988.
7. Palais J. C. Optical communications, in Handbook:
Engineering Electromagnetics Applications, Ed. by R. Bansal,
New York: Taylor & Francis Group, 2006.
8. Korn G., Korn T. Mathematical Handbook for scientists and
engineers, New York: McGraw-Hill, 1961.
9. Abramowitz M., Stegun I. A. Handbook: Mathematical
functions, New York: Dover Publications, 1965.
10. Blaunstein N., Arnon Sh., Zilberman A., Kopeika N. Applied
aspects of optical communication and LIDAR, New York: Taylor &
Francis Group, 2010.
214
Часть III
ОПТИЧЕСКИЕ ВОЛНЫ
В БЕСПРОВОДНЫХ АТМОСФЕРНЫХ
КАНАЛАХ СВЯЗИ
ГЛАВА 9. АТМОСФЕРНЫЕ КАНАЛЫ ОПТИЧЕСКОЙ СВЯЗИ
9.1. Структура атмосферы
Атмосфера представляет собой газовую сплошную оболочку,
окружающую Землю – от ее поверхности до нескольких сотен
километров по высоте, и содержит несколько слоев, отличающихся как по составу газовых компонент, так и по структуре и
параметрам, таким как температура, влажность, атмосферное
давление, концентрация, и так далее [1–21]. Стандартное представление этих слоев по высоте показано на рис. 9.1. Кратко рассмотрим каждый из слоев согласно представленному на рис. 9.1
их расположению по высоте.
Тропосфера. Этот слой является самым нижним слоем атмосферы Земли, простираясь от ее поверхности до примерно 11
миль или 17 км по высоте (см. рис. 9.1). Здесь, как следует из
рисунка, основное влияние на распространение оптических (да
и радио) волн оказывают облака и погода, определяемая гидрометеорами. Под последними подразумевают дождь, снег, аэрозоли, туманы, облака, и так далее. Как будет показано ниже,
тропосфера характеризуется существенным изменением температуры, давления и плотности газовой составляющей, которые
в свою очередь, сильно меняются с высотой.
Стратосфера. Этот атмосферный слой лежит по высоте от
земной поверхности между 11 и 31 миль (или между 17 и 50 км)
и характеризуется слабым изменением температуры по высоте
и отсутствием облаков и гидрометеоров. Только озоновый слой
наблюдается на этих высотах (см. рис. 9.1). Озоновый слой находится в стратосфере и абсорбирует и поглощает основное количество ультрафиолетовых солнечных лучей, губительных для
жизни человека.
Тропопауза. Является пограничным переходным слоем между тропосферой и стратосферой и характеризуется незначительным изменением температуры газовой составляющей атмосферы или вообще независимостью ее температуры от высоты – она
остается неизменной в данном слое с ростом высоты.
Мезосфера. Данный слой атмосферы простирается по высоте
от 31 до 50 миль (т. е., от 50 до 80 км) от поверхности Земли. Мезосфера характеризуется быстрым уменьшением температуры
с увеличением высоты.
217
Земная атмосфера
Высота (мили и км)
800 мл
400 мл
Слой
Температура
1, 280 км
640 км
Термосфера
Внешнее
пространство
Экзосфера
Ионосфера
Полярное
сияние
50 мл
80 км
Озоновый
слой
31 мл
50 км
Погода,
облака
11 мл
17 км
Мезосфера
Стратосфера
Тропосфера
Рис. 9.1. Представление атмосферных слоев в километрах и милях
Термосфера. В данном атмосферном слое температура газа
растет с высотой от поверхности Земли. Термосфера включает
в себя ионосферу и часть экзосферы (рис. 9.1).
Ионосфера. Данный слой простирается по высоте от 31–
43 миль (50–70 км) до 400 миль (640 км). Кроме молекул и атомов газовых компонент атмосферы ионосфера содержит ионы и
электроны, находящиеся в равновесном состоянии друг с другом и имеющие одинаковую плотность на определенных расстояниях, превышающих радиус Дебая. При таких условиях ионизированный газ представляет собой плазму. Сами же электроны
и ионы создаются за счет ионизации нейтральных молекул и
218
атомов солнечными лучами и радиацией из космического пространства, окружающего Землю.
Экзосфера. Данный атмосферный слой является самым удаленным от земной поверхности, простираюшимся от 400 миль
(640 км) до 800 миль (1,280 км). Этот слой в литературе еще называют магнетосферой. В этом слое, ввиду низкого давления
газа и температуры газа, атомы или молекулы, а также заряженные частицы свободно покидают пределы Земли и улетучиваются во внешнее космическое пространство.
На оптическую беспроводную связь, наземную и атмосферную (например, между вертолетами и самолетами) существенное влияние оказывает тропосфера, на которой мы ниже
остановимся более подробно. Сейчас же отметим основные
моменты, которые будут освещены в этой главе. Тропосфера
содержит различные виды газообразных, жидких и кристаллических структур, а также гидрометеоры [9–15], такие как
аэрозоли, дождь, снег, облака, и так далее. Более того, за счет
нерегулярных в пространстве и спорадических во времени потоков воздуха, т. е. ветров, возникают хаотические структуры, известные под названием атмосферные турбулентности
[5, 8, 19, 21]. При дальнейшем изложении предмета, в этой
главе будут кратко описаны все перечисленные выше составляющие тропосферы, которые влияют на распространение
оптических волн в приземных тропосферных каналах беспроводной связи.
9.2. Основные параметры тропосферы
Физические свойства тропосферы характеризуются такими
основными параметрами атмосферного неоднородного континиума, как температура T (в Кельвинах, К), давление p (в миллибарах, Паскалях, или в мм ртутного столба: мм-pc) и плотность
ρ (в кг на м3). Все эти параметры существенным образом меняются с изменением высоты над поверхностью Земли и сильно
зависят от сезонных широтных и долготных погодных условий,
имеющих место в тропосфере [21–23].
Более 98% атмосферного контента составляют кислород и
азот. Численные значения высотных профилей плотности молекул и атомов азота и кислорода, ρ(h), от высоты h можно найти
в работе [23]. Температуру T(h) и давление P(h), как функции
высоты h (измеряемой в метрах) для первых 11 км над поверх219
ностью Земли в тропосфере можно оценить по следующим формулам [5, 21, 23]:
T (h) = 288,15 − 65,45 ⋅ 10−4 h, Ê;  288,15 
P=
(h) 1,013 × 105 ⋅  −

 T ( h ) 
(9.1)
5,22
, ìáàð. (9.2)
Их высотный профиль для высот от 11 до 17 км в тропосфере
можно определить, следуя работам [5, 21, 23]:
T ( h ) = 216,65, Ê; (9.3)
 0,034164 ( h − 11000 ) 
P ( h )= 2,269 × 104 ⋅ exp  −
 , ìáàð. (9.4)
216,65


Плотность основных молекул и атомов в тропосфере можно
оценить по следующей формуле [5, 21, 23]:
P(h)
 28,964 êã/êìîëü  P ( h )
, êã/ì3 . (9.5)
=
ρ(h ) 
 = 0,003484 ⋅
T (h)
 8314 Äæ/êìîëü − K  T ( h )
Эти три основных параметра и определяют физические процессы и наличие тех или иных структурных компонент в тропосфере Земли, которые будут освещены ниже.
9.3. Состав тропосферы
9.3.1. Аэрозоли
Аэрозоли представляют собой связные системы жидких или
твердых частиц, однородным или неоднородным образом распределенных в атмосферном газе, состоящем из молекул и атомов [24–42]. Аэрозоли играют важную роль в формировании и
перераспеделении атмосферного электричества и, тем самым,
влияют на процесс распространения оптических волн по беспроводному каналу земля-атмосфера и атмосфера-атмосфера
в ее приземном тропосферном слое.
Размер аэрозолей. Реальные частички аэрозолей в диаметре
составляют от нескольких нанометров до нескольких микрометров. С уменьшением размера аэрозолей в суспензии их лег220
че организовать в системную структуру, располагающую свойствами реальных аэрозолей. Скорость образования больших по
размеру частиц настолько высока, что приводит к разрушению
самой структуры реальных аэрозолей. Несмотря на это, в случае туманов и облаков, их элементарные компоненты, сохраняющие свойства аэрозолей, могут достигать размеров от 50 мкм
до 100 мкм [5–7]. В основном в литературе выделяют атомарные
(диаметром меньше 0,1 мкм), композитные (от 0.1 до 1 мкм) и
структурные (диаметром свыше 1 мкм) аэрозоли [31], сформированные за счет естественных и искусственных (созданных деятельностью человека) процессов, идущих от земной и водной
поверхности. В работе [24] приводятся примеры более крупных
аэрозолей и показано, что не только их размеры меняются за
счет фотохимических процессов, но и их форма и конфигурация
меняются существенно – от сферической до сплющенной эллиптической формы.
Итак, можно заключить, что размеры аэрозолей изменяются от нескольких нанометров (нм) до нескольких десятков и более микрометров (мкм). Такой диапазон их размеров позволяет
понять их влияние на рассеяние ультрафиолетовой радиации
Солнца, оптических и инфракрасных лучей в тропосфере. В работе [24] было показано, что эти эффекты существенно зависят
от высоты над земной поверхностью, от типа поверхности –
земная или водная, а также от времени суток и сезона. Данная
классификация была расширена на тип поверхности – островную, континентальную, городскую или сельскую [25–30]. Более
того, в работах [32, 33] было показана роль аэрозолей размерами
от 0,01 до 10 мкм в рассеянии оптического излучения, что очень
важно для построения тропосферных оптических каналов связи.
Высотная локализация аэрозолей. В настоящее время нет
общей точной модели, описывающей высотное распределение
аэрозольного контента в тропосфере, ибо оно зависит от высоты, времени суток, сезона, активности поверхности Земли (вулканы, тайфуны, цунами), солнечной активности, и так далее.
Поэтому существующие модели описывают лишь определенные слои в атмосфере, где могут концентрироваться аэрозоли
под действием внешних факторов. Сопутствующие физические
процессы определяют времена жизни таких структур в тропосфере, их размер, форму и плотность. Отметим, что существу221
ющие модели устанавили следующую закономерность [34, 35]:
пограничный слой, содержащий смесь аэрозолей пролегает от 0
до 2,0–2,5 км по высоте, свободно перемещаясь в тропосферные
слои, лежащие на высотах от 2,5 до 7–8 км, а также может достичь стратосферную область, лежащую между 8 и 30 км [21].
Оцененая средняя толщина слоя, содержащего аэрозольную
смесь, приблизительно составляет 2,0–2,5 км и существенно зависит от метеорологических и климатических условий [35–42].
В работе [16] были обобщены различные исследования и была
создана климатическая карта оптических свойств аэрозолей
над Арктикой, Антарктикой, над пустынной, континентальной
(городской и сельской), а также над морской поверхностью.
Концентрация аэрозолей. В тропосферном слое, простирающемся от 2,0–2,5 км до 7–8 км, экспоненциальное уменьшение
концентрации (плотности) аэрозолей с высотой можно описать
следующим образом [12]:
 z 
=
N ( z ) N ( 0 ) exp  − .  z0 
(9.6)
где высотный масштаб над земной поверхностью z0 изменяется
от 1 до 1,4 км. Другая форма высотного профиля плотности аэрозолей N(z) учитывает инверсный слой на высоте z1 и смешанный
турбулентный слой на высоте z2, как граничные слои области,
содержашей аэрозоли [36]:

 N ( z0 ) − N ( z1 ) 
 N ( z0 ) − 
 ⋅ z,
z1




N
=
z
N
=
z
,
const
( )  ( 1)

 N ( z2 ) exp  z2 − z  ,
 8 




z0 ≤ z ≤ z1
z1 < z ≤ z2 . (9.7)
z > z2
Обычно z1 = 0,3 км и z2 = 4 км – для летнего периода, и z1 = 0,4
км и z2 = 1,5 км – для зимнего периода.
Дополнительные эксперименты и исследования показали,
что в этих пограничных слоях (от 0 до 2–4 км), а также в нижней
тропосфере (от 9 до 14 км) могут находиться и другие смешанные слои с постоянной или увеличивающейся концентрацией
аэрозолей [37, 38]. Эти слои, по мнению исследователей, вызва222
ны температурной инверсией на уровне земной поверхности и
эффектами тропопаузы, когда температурный градиент меняет
свой знак. Была также обнаружена широтная зависимость расположения слоев, содержащих аэрозоли. Так вблизи экватора
слои эти локализуются на высотах от 22 до 26 км, тогда как в полярной области их высота меняется от 17 до 18 км.
Распределение аэрозолей по размерам. Как было указано
выше, размеры аэрозолей изменяются от 0,01 до 100 мкм, причем для малых частиц их число ограничено процессом коагуляции, а для больших частиц – процессом гравитационной седиментации [5, 23]. Внутри этих крайних случаев число частиц
изменяется в зависимости от их реальных размеров. Таким образом, важной характеристикой аэрозолей становится их пространственное распределение по размерам.
Распределение аэрозолей по размерам играет определяющую
роль при прогнозе затухания и поглощения оптического излучения, переданного передатчиком и принимаемого приемником
в различных приложениях – от оптической связи до оптических
локационных систем (лидаров).
Нормированное число частиц n(r) на единичный интервал
изменения их радиусов и на единичный объем их локализации определяется через производную их плотности по радиусу r:
n (r ) =
dN ( r )
dr
.
(9.8)
Дифференциал dN(r) [совместно с соответствующими формулами (9.7) или (9.6)] определяет нормированное число частиц
с радиусами, лежащими между r и r+dr, в единице объема согласно распределению (9.8) функции n(r).
Формулу (9.8) можно также представить в логарифмическом
виде, часто применяемом на практике
n (r ) =
dN ( r )
d log ( r )
. (9.9)
Более часто применяемое полиномиальное распределение
впервые было предложено в работах [24, 41] в логарифмической
форме
223
=
n (r )
dN ( r )
= Cr −v , r ≥ rìèí d log r
(9.10)
dN ( r )
= 0.434Cr −v , dr
(9.11)
и в обычной форме
n (r )
=
здесь C – постояная нормализации полного числа частиц на единичный объем и v –параметр вида и структуры аэрозолей, лежащий в интервале 3 ≤ v ≤ 5 для запыленной и чистой тропосферы и
для аэрозолей с радиусами, лежашими в интервале между 0,1 и
10 мкм [42]. Согласно формуле (9.11) число частиц уменьшается
по степенному закону с увеличением их радиуса.
Модифицированное полиномиальное распределение было
приведено в работе [40], которое затем было улучшено в работе
[42], основываясь на Гамма-Гамма распределении
=
n (r )
dN ( r )
= ar α exp −br β , dr
(
)
(9.12)
где a – полная плотность частиц; α, β, и b – параметры вида и
структуры аэрозолей.
В итоге полная концентрация аэрозольных частиц будет определяться по формуле [42]:
− α+1 β  α + 1 
N= a ⋅β−1 ⋅ b ( ) Γ 
.  β 
(9.13)
Так как Гамма-Гамма распределение (9.13) имеет четыре постоянных параметра, его можно применять для различных моделей распределения аэрозолей и может быть использовано для
описания распределения частиц по размерам в тумане, пыли и
облаках.
Кроме того, внутри оптического диапазона от 0,16 до 1,2 мкм
коэффициент рассеяния оптического сигнала, α(λ), и распределение аэрозолей по размерам в форме (9.13) позволяет использовать иное полиномиальное соотношение между α(λ)и длиной
волны [12]
224
α(λ) = Cλ −b , (9.14)
где b = v–3 [12], а параметр v определен выше. Тогда при больших
степенях b , когда параметр α сильно зависит от длины волны,
функция распределения частиц по размерам уменьшается с увеличением их размеров. Измерения показали, что величины показателя степени b в (9.14) выше для континентальных аэрозолей по
сравнению с аэрозолями в морских акваториях [5, 12, 21].
Многократное рассеяние оптических волн на аэрозолях (см.
гл. 10) в тропосферных каналах связи приводит к затуханию интенсивности сигнала и к пространственному и временному федингу сигналов (смотри определения в гл. 5). Это в свою очередь
ограничивает максимальную скорость передачи информации и
увеличение ошибок при передаче битов информации (BER). Все
эти вопросы будут рассмотрены в гл. 11.
9.3.2. Гидрометеоры
Как было указано выше, гидрометеоры представляют собой
водяные или ледовые частицы, формирующиеся в атмосфере
или над земной поверхностью как результат конденсации и сублимации. Некоторые из известных гидрометеоров – это дождь,
туман, снег, облака, и так далее. Рассеяние и затухание гидрометеорами существенно влиянет на распространение оптических сигналов через атмосферу.
Туман. Туман представляет собой облако у земной поверхности, заполненное малыми каплями воды. Туман полностью или
частично нарушает условие прямой видимости даже на расстояниях до нескольких десятков метров. Туман формируется за
счет конденсации водяного пара и превращения его в водяные
ядра, которые присутствуют даже в обычном воздухе. Превращение тумана в водяные ядра возможно при влажности воздуха, превышающей 1%. В запыленном или загрязненном воздухе
водяные ядра растут довольно быстро, вызывая туман с влажностью, достигающей 95%. Три процесса могут увеличить относительную влажность:
1) охлаждение воздуха за счет адиабатического расширения;
2) смешение двух потоков влажного воздуха различной температуры;
3) прямое охлаждение воздуха за счет радиации (например,
космическими лучами).
Мы не входим в тонкости описания физических процессов
формирования тумана и отсылаем читателя по этим вопросам
225
к специальной литературе [5–7]. Отметим только, что модели
различнного вида туманов основываются на результатах измерений распределений водяных ядер по их размерам, а также на
модифицированном Гамма-Гамма распределении по размерам,
определенном формулами (9.12)–(9.13) [34]. В тяжелых и средних туманах концентрация водных капель составляет от 100 до
200 частиц на кубический сантиметр (см3), имеющих радиусы
в пределах от 1 до 10 мкм при среднем радиусе, меняющимся
в пределах от 2 до 4 мкм.
С уменьшением толщины туманов, концентрация капель
в них становится менее 10 частиц на см3 со средними радиусами, лежащими в промежутке от 6 до 12 мкм. Капли радиусом
менее 3 мкм наблюдаются в полностью сформированном тумане
(с относительной влажностью ОВ = 100%). Обычно полагают, что
индекс рефракции полностью сформировавшегося тумана соответствует этой же величине для чистой воды.
Дожди. Дождь представляет собой сплошной или дискретный поток водных капель диаметром, превышающем 0,5 мм.
Меньшие по размеру капли формируют брызги или аэрозоль.
Концентрация капель в дожде обычно меняется в широких пределах – от 100 до 1000 капель на кубический метр (на м–3). Более
крупные по размеру капли дождя (c диаметром, превышающим
4 мм) быстро падают вниз. Причем, с ростом размера капель, их
концентрация уменьшается.
Метеорологи классифицирует дожди согласно скорости их
выпадения, и разделяют их на легкие, средние и тяжелые, которым соответствуют размеры капель – меньше 2,5 мм, между
2,8 и 7,6 мм, и более 7,6 мм, соответственно. Скорости выпадания дождей, менее 250 мм и более 1500 мм в год, являются экстремальными для дождей по всем контенентам Земли (смотри
детали в работах [1, 6–10]).
Полагая плотность и размеры капель дождя постоянными,
получим, согласно работам [6–10], экспоненциальное затухание
мощности оптического сигнала Pr в приемном устройстве, отстоящем от передающего устройства на расстоянии r, при том,
что весь путь оптического сигнала заполнен дождем. Параметр
затухания α по мощности определим, как и прежде, через затухание мощности принимаемого оптического сигнала в e–1 раз по
сравнению с передаваемой мощностью Pt≡Pr(0), то есть,
226
=
Pr Pr (0)exp{−αr } (9.15)
Тогда затухание по мощности в децибелах запишется стандартным образом (см. гл. 3)
Pt
4,343αr , äÁ. =
L 10 log
=
Pr
(9.16)
Другой способ оценки полного затухания оптического сигнала через знание о специфическом затухании, введенном выше
и измеряемом в децибелах на метр, был введен в работе [10] посредством следующей зависимости между ними
γ=
L
= 4,343α, äÁ/ì. r
(9.17)
При этом фактор затухания по мощности α был представлен
в виде одномерного интеграла от диаметра капель D, их количества в дожде N(D), и от эффективного сечения ансамбля капель,
распределенных по их диаметрам, измеряемого через затухание
мощности сигнала в капелях дождя C(D) [дБ/м]:
∞
∫
=
α
N (D) ⋅ C(D)dD. (9.18)
D =0
Как было показано в работах [8–10], в реальных тропосферных условиях распределение ансамбля капель по размерам N(D)
не является постоянным и может быть расчитано из зависимости фактора затухания γ = γ(r) от длины оптической трассы r
между передатчиком и приемником, проходящей через толщу
дождя. Интегрируя этот фактор по всей длине оптического канала связи rR, получаем полные потери сигнала в канале
L=
rR
∫ γ(r )dr, äÁ. (9.19)
0
Используя эту процедуру расчета полного затухания оптического сигнала, в работе [10] получено распределение капель дождя по размерам N(D) в виде
 D 
=
N (D) N 0 exp −
,  Dm 
(9.20)
227
где N0 = 8⋅103 м–2мм–1 – постоянный параметр [10], Dm – параметр, зависящий от скорости выпадания осадков в виде дождя
R, измеряемой в миллиметрах в час (мм/час),
=
Dm 0,122 ⋅ R 0,21ìì. (9.21)
Что касается сечения затухания C(D) из формулы (9.18), его
можно определить через приближение Рэлея, которое верно при
превышении длины волны средним радиусом капли дождя и
которое приводит к довольно простой зависимости от размера
капель, а именно,
C(D) ∝
D3
.
λ
(9.22)
При этом затухание, вызванное дождем, увеличивается довольно медленно, достигая постояной величины, называемой
оптической границей эффекта затухания [6, 8, 10]. Возле этой
границы рассеяние на каплях дождя формирует значительное
затухание, которое хорошо аппроксимируется теорией рассеяния Ми [6, 8].
На практике применяют эмпирическую модель зависимости
фактора затухания γ(r) от скорости выпадения дождя R и частоты оптической волны [1, 8–10]
γ(f, R) =
a(f )R b(f ) , (9.23)
где γ измеряется в единицах дБ/км; функции a(f) и b(f) зависят
от частоты, измеряемой в МГц.
Распределение вероятностей размера капель дождя при этом
меняется экспоненциально [8–10]
P (=
D ) exp ( − D D0 ), (9.24)
где D0 – средний диаметр ячейки дождя, являющийся функцией пикового значения скорости выпадения дождя Rпик. Для Европы и США средний диаметр D0 уменьшается незначительно
с увеличением Rпик при Rпик>100 мм/час. Это позволяет связать
эти параметры и получить следущую закономерность
228
−b
D0 = a Rïèê
, Rïèê > 10, ìì ÷àñ. (9.25)
Значения коэффициента a меняются от 2 до 4, а коэффициента b – от 0,08 до 0,25 [8–10]
Отметим, что пространственное распределение капель дождя
является самым трудно прогнозируемым параметром, так как
дожди характеризуются вариациями как в горизонтальной, так
и в вертикальной плоскостях, что ведет к использованию всякий раз факторов коррекции длины оптической трассы, проходящей через толщу дождя.
Облака. Размеры, вид, структура и состав облаков существенно зависят от движения воздушных масс, формирующего
облака и способствующего их рост, а также от типа частиц в облаках. При обычных погодных условиях облака малы по размерам (в вертикальной и горизонтальной плоскости), составляющим не более одного-двух километров, и вызывают рассеяние
оптических сигналов. При сложных погодных условиях они застилают большую часть неба с толщиной слоя до 10 км и более.
Растущие облака сопровождаются направленными вверх воздушными потоками со скоростями – от нескольких см/сек, до
нескольких м/сек. Достаточный рост капель облака приводит
к их падению сквозь облако со скоростью падения, до одного см/
сек на земную поверхность в виде дождя, моросящего или сильного.
Были выбраны четыре класса, по которым классифицируют
облака в зависимости от вида движения воздуха, создающего
облако. Это:
1) слоистые облака, сформированные широко растекающимися регулярными потоками воздуха;
2) слоистые облака, сформированные широко-растекающимися нерегулярными потоками воздуха или турбулентностями
(см. параграф 9.4);
3) кучевые облака, сформированные проникающими конвенциями потоков воздуха;
4) плотные фигуральные облака, сформированные воздушными массами над холмами и горами.
Подробности о каждом классе облаков читатель найдет в цитируемой литературе [1–8]. То же касается и математических
моделей облака для каждого из перечисленных выше классов,
которые довольно подробно описаны в работах [4, 6–8]. Отметим
лишь, что, как следует из многочисленных наблюдений [7, 20–
24], капли в туманах и облаках обычно по размерам составляют
229
менее 0,1 мм. В этом случае работает теория рассеяния Рэлея на
мелкомасштабных атмосферных структурах, что дает для коэффициента затухания следущую формулу
γ c ≈ 0,438 c ( t ) q λ2 , äÁ êì, (9.26)
где l – длина волны (в см) и q – водный состав в облаке, измеряемый в граммах на кубический метр (гр/м3). Для прямой видимости на трассах в 30 м, 120 м, и 600 м, водный состав в тумане или
облаке должен составлять 2,3 гр/м3, 0,32 гр/м3, и 0,032 гр/м3,
соответственно. Оценки показывают, что затухание оптической
волны, вызванное средним по плотности и конфигурации облаком, не превышает затухание, вызванное дождем, выпадающим
со скоростью 6 мм/час.
Снег. Основу снега составляют кристалики воды, которые
выпадают на земную поверхность, покрывая долгосрочно или
краткосрочно около 23% поверхности Земли, охватывая ее широты, от северных (С) до южных (Ю), то есть, от 35° С до 35° Ю.
Однако в западном континентальном полушарии снег в общем
выпадает только на высоких северных широтах. В экваториальной зоне выпадение снега имеет место только в горных районах
на высотах 4900 метров и выше. Размеры и форма кристаллов
зависит в основном от температуры и количества паров воды,
необходимых для их формирования. Чем холоднее воздух, тем
меьшими по размерам и более компактно сгруппироваными
в снежные структуры становятся кристаллики. Мы не будем
вдаваться в детали всех семи форм кристаллов снега и трех типов сформированных снежных структур, так как это выходит
за рамки содержания книги, и отошлем читателя к цитируемой
литературе [1–4, 6–9].
9.4. Атмосферная турбулентность
Флуктуации температуры, влажности и давления атмосферного газа, совместно со случайным направлением атмосферного
ветра и конвекциальных тепловых потоков вызывают случайные изменения плотности газа. Такие структуры обычно в литературе называют оптическими вихрями или турбулентностями и рассматривают их, как основополагающие атмосферные
структуры, вызывающие флуктуации интенсивности и фазы
оптических волн при их распространении в атмосфере [36–48].
230
Эти структуры определяют и случайные изменения индекса
рефракции оптических лучей.
Ниже, мы кратко введем параметры и характеристики, описывающие турбулизацию атмосферы, а также остановимся на
моделях, достаточно адекватно отражающих (на количественном уровне) эффекты распространения оптических волн в тропосфере Земли.
9.4.1. Явление турбулентности в тропосфере
Как было указано выше, хаотическое поведение турбулентных структур в атмосфере вызывает флуктуации индекса рефракции оптических волн [5, 8, 19, 43–56]. Пространственный
спектр турбулентных структур можно разделить на три зоны их
поведения с помощью двух основных масштабных размеров [5,
8, 43–49]:
– внешний масштаб или макроскопический масштаб турбулентности: L0;
– внутренний масштаб или микроскопический масштаб турбулуетности: l0.
Их величины меняются в зависимости от атмосферных условий, расстояния от земной поверхности по высоте, и других факторов. Внутренний масштаб l0 обычно изменяется в диапазоне
величин от 1 мм до 30 мм, где у поверхности Земли он меняется
вокруг промежутка от 3 мм до 10 мм, увеличиваясь до нескольких сантиметров при увеличении высоты h. Следует отметить,
что до настоящего времени высотный профиль внутреннего масштаба изучен недостаточно полно, даже экспериментально.
Что касается внешнего масштаба L0, то вблизи земной поверхности его можно приближенно аппроксимировать величиной kh, где k – постоянная величина порядка единицы. Так, масштаб L0 обычно равен расстоянию от земной поверхности, когда
турбулентные структуры расположены на высотах вблизи этой
поверхности, либо на высотах от 10 до 100 метров от нее. Был
разработан ряд моделей высотного профиля внешнего масштаба
турбулентности, однако разные модели прогнозируют различные результаты.
Для анализа физических свойств турбулентной жидкости на
начальной стадии изучения турбулентного течения, Рейнольдс
использовал теорию подобия для определения безразмерной
величины Re = V⋅l/v, определяемой как число Рейнольдса [5, 19,
231
43–48], где V и l – характерные скорость (в м/c) и размер (в м)
потока, соответственно, а v – кинематическая вязкость (в м2/с).
Переход из ламинарного течения в турбулентное течение жидкости имеет место на критических числах Рейнольдса, выше
которых движение рассматривается как турбулентное. Кинематическая вязкость в воздухе составляет порядка v = 10–5 м2с–1 [5,
19, 43–46], при которой движение воздуха полагают сильно турбулентным, когда числа Рейнольдса составляют Re~ 105 [43–46].
Ричадсон первым [50], а затем Колмогоров с Обуховым [43,
46], разработали теорию перераспределения энергии в процессе
диссипации турбулентных структур – от крупномасштабных до
мелкомасштабных, названную ими каскадной энергетической
теорией. При этом мелкомасштабные турбулентные структуры
порождаются нестабильностью крупномасштабных структур.
Каскадный процесс, описываемый формулой (9.27), демострирует распад крупномасштабных турбулентностей на все более
мелкие турбулентные структуры, доходя до минимальных их
масштабов, при которых механизм диссипации преобразует кинетическую энергию движения вихрей в тепло. Обозначим текуший размер турбулентных структур через l, а L0 и l0 – их внешние и внутренние масштабы, определенные выше. Посредством
параметров κ0 = 2π/L0, κ = 2π/l, κm = 2π/l0 обозначим пространственные волновые числа этих видов турбулентных структур,
соответственно.
В этих обозначениях мы можем разделить процесс формирования и последующую динамику турбулентных структур на три
области – зоны:
Входящая зона: L0 ≤ l, κ < 2π/L0
Инерционная зона: l0 < l < L0, 2π/L0 < κ < 2π/l0 Диссипативная зона: l ≥ l0, 2π/l0 ≥ κ
(9.27)
В этих трех областях происходит порождение сильных, средних и слабых пространственных и временных вариаций амплитуды и фазы оптического сигнала, распространяющегося в атмосферном канале связи. Эти вариации называются сцинтилляциями сигналов [43–48].
Согласно теории Колмогорова-Обухова [43, 46], во время каскадного процесса происходит уменьшение роли крупномасштабных турбулентностей и увеличение роли все более мелких
232
по масштабу турбулентностей – эффект, имеющий универсальность для всех видов турбулентных течений. Следуя теории Колмогорова-Обухова, каскадный процесс диссипации энергии, содержащейся в вихрях, сводится к следующему:
1) каскадному процессу ввода энергии в атмосферу большими
вихрями в так называемой зоне входа,
2) протеканию энергии через инерционную зону,
3) окончанию процесса в зоне диссипации энергии, в которой
эта энергия распределяется по все более мелким турбулентным
структурам, как это следует из формулы (9.27) и рис. 9.2.
При этом определенная порция кинетической энергии атмосферы, как газообразной структуры, конвертируется в энергию
турбулентных структур в процессе каскадного формирования
турбулентностей – с внешими масштабами L0, при которых
энергия начинает каскадно трансформироваться, пока не передастся полностью от крупномасштабных (с внешним размером
L0) к мелкомасштабным (с внутренним размером l0) турбулентностям. Текуший масштаб турбулентностей l ограничен при
этом сверху размером L0 и снизу – размером l0, которые и формируют инерциальную зону. Согласно [19, 43–45], в инерциальной зоне, где выполняется условие L0 > l > l0, турбулентные течения однородны и изотропны, и энергия передается от турбулентности к турбулентности без потерь, Поэтому согласно работам
[19, 43–47], энергия, которая изначально была инжектирована
Инжекция
энергии
L0
Передача
энергии
l0
Диссипация
Рис. 9.2. Схематическое представление
каскадной теории турбулентности
233
в крупные структуры, равна энергии, которая на последней стадии каскада диссипировалась в тепло.
Однородность процесса означает также его стационарность
[48, 49] и указывает на независимость статистических характеристик турбулентностей от их положения внутри поля течения
турбулентного потока. Другими словами, изотропность предполагает зависимость только от расстояний между точками внутри поля течения для второго и более высоких статистических
моментов, описывающих это турбулентное поле течения атмосферного газа.
В инерциальной зоне доминируют силы инерции, и усредненные свойства турбулентного потока определяются в основном средней скоростью диссипации кинетической энергии турбулентностей, ε (в единицах м2/с3). Как только турбулентности
достигают своего минимального размера l0, их энергия трансформируется в тепло посредством процесса вязкости. Согласно
гипотезе Колмагорова-Обухова, движения, ассоциирующиеся
с мелкомасштабными структурами, l0, единообразно определяются кинематической вязкостью v и параметром ε, введенном
выше, а именно, l0~ η = (v3/ε)1/4, где η – параметр, названный
микроразмером турбулентности [1–4, 5].
Итак, можно утверждать, что каскадный турбулентный процесс, введенный Ричардстоном и описываемый формулой (9.27),
был детализирован и обобщен Колмогоровым [43–45] и Обуховым [46]. Поэтому, этот процесс называют каскадным турбулентным процессом Колмогорова-Обухова [43, 45, 46]). Предложенная ими теори утверждает, что средняя скорость диссипации кинетической энергии турбулентностей ε распределена
в области пространственных волновых чисел κ как:
во входящей области (κ0~1/ L0) ε ~ κ0–5/3;
в инерционной области (κ~ 1/l): ε ~κ–5/3;
в области диссипации (κm~1/l0): ε ~κm–5/3.
где все обозначения параметров были определены выше.
Сложность интерпретации явления турбулунтности заключается в следующем. Дело в том, что турбулентные потоки в тропосфере не являются ни однородными, ни изотропными, ни стационарными. Однако, можно рассматривать их как локальнооднородные и локально-изотропные в малых подобластях атмос234
феры и применить для их математического описания некоторые
характеристические функции.
9.4.2. Характеристические функции и параметры
в турбулентной тропосфере
Анализируя размерности параметров турбулуетностей, Колмогоров показал, что структурная функция случайного поля
скоростей турбулентностей, как второй статистический момент
случайного процесса, между двумя точками наблюдения r1 и
r2 = r1+r, в инерционном интервале удовлетворяет универсальному закону «2/3» , то есть [43–47],
2
DV (r ) = ( V (r2 ) − V (r1 ) )
≡ CV2 r 2/3 , l0 < r < L0 . (9.28)
Здесь, как и в предыдущих главах, угловые скобки означают
усреднение по времени или по ансамблю (что обусловлено их взаимной эргодичностью), V(r1) – компонента вектора турбулентной
скорости в точке r1, V(r2) – компонента вектора турбулентной
скорости в точке r2, r = |r| – расстояние между этими точками
наблюдения, r1и r2, а CV2 – структурная постоянная флуктуаций скорости турбулентного потока воздуха, определенная в работах [5, 19, 43–47] как величина полной энергии внутри турбулентного потока, так как она ассоциируется со средней скоростью диссипации энергии ε, а именно CV2 = 2ε2/3 [5, 19, 44].
Существует простая связь между внутренним масштабом l0
турбулентности и введенным Колмогоровым микропараметром
η, а именно, l0 = 12,8η [49, 52, 53]. В Работах [5, 19, 44] была получена более уточненная зависимость между этими параметрами,
а именно, l0 = 7,4⋅η = 7,4⋅v3/4ε–1/4. Отметим, что l0 увеличивается
с увеличением кинематической вязкости v, которая увеличивается с высотой над земной поверхностью. Обратная зависимость
внутреннего масштаба турбулетности l0 от средней скорости
диссипации ε показала, что сильные турбулентности приводят
к меньшим внутренним масштабам l0, тогда как слабые турбулентности – к большим внутренним масштабам l0 [22, 54–56].
Внешний масштаб турбулентностей L0 пропорционален ε1/2, и
увеличивается или уменьшается напрямую с соответствующим
изменением ε, то есть, с изменением «мощности» турбулентности [5, 19, 44–47]. Как было указано выше, внешний масштаб
235
L0 можно привязать к высоте h над земной поверхностью в пространственном слое до 100 метров толщины по закону L0 = 0.4h
[5].
Поведение структурной функции, описывающей поле скоростей турбулентного потока, для микромасштабных структур
(r < l0) изменяется пропорционально квадрату расстояния между точками наблюдения r по закону [5, 43–47]
DV (r ) = CV2 l0−4/3r 2 , 0 < r < l0. (9.29)
Так как случайное поле флуктуаций скорости турбулентного потока обычно неизотропно на масштабах, превышающих
внешний размер L0, то к настоящему времени отсутствует общее
представление структурной функции для случаев с r > L0.
Закон в степени «2/3» для структурной функции (9.28) был
проверен многочисленными эксперементами, доказавшими его
корректность [54–56].
Обсудим теперь структурный параметр индекса рефракции
Cn2 , характеризующий «мощность» турбулентных структур в атмосфере [5, 8, 19, 44], и как следствие, является критическим
параметром, определяющим влияние турбулентности на распространение оптической волны (луча) в атмосферном канале.
Обычно, чтобы получить связь между структурным параметром рефракции Cn2 и атмосферным параметром флуктуаций
индекса рефракции δn ([19, 43–47]) полагают, что флуктуации
эти стационарны, однородны и изотропны несмотря на тот факт,
что индекс рефракции n является сложной функцией метерологических параметров [8, 48]. Простейшее приближение, указывающее на связь между этими параметрами, было предложено
в работах [19, 44]
Cn2
≈
(δn)2
R 2/3
,
(9.30)
здесь R представляет собой расстояние между источником и детектором оптической волны, а Cn2 – структурная величина индекса рефракции, измеряемая в м–2/3.
Статистическое описание случайного поля флуктуаций индекса рефракции в атмосфере, внесенных турбулентностями,
подобно тому, как это описано для поля флуктуаций скорости
236
турбулентных потоков, рассмотренное выше. Эту связь получил
Обухов в работе [46], анализируя структурную функцию для
флуктуаций скорости и структурную функцию для флуктуаций
потенциальной температуры. Затем им была проанализирована
структурная функция вариаций индекса рефракции Dn(r), для
которой была получена следующая зависимость от расстояния
между точками наблюдения r = |r2–r1|.
Dn=
(r )
(n(r2 ) − n(r1 ) )2
≡ Cn2r 2/3 , l0 < r < L0 . (9.31)
Эта функция характеризует величину девиации индекса
рефракции, вызванной турбулентностью, то есть, является критической характеристикой оптической турбулентности [5, 19,
43–47].
Что касается структурного параметра индекса рефракции Cn2 ,
его типичные значения вблизи земной поверхности меняются от
10–16 м–2/3 (для слабых турбулентностей) до 10–12 м–2/3 (для
сильных турбулентностей) с амплитудным изменением в течение минутного периода измерения процесса. Для вертикальных
и наклонных оптических трасс Cn2 является функцией высоты
над поверхностью Земли и, более того, является также сложной
функцией от метерологических параметров [5, 19, 44, 57–62].
Что касается другого параметра CT2 , который отражает среднеквадратичное изменение температуры среды ΔT между двумя
точками вдоль траектории оптической волны, находящимися
на расстоянии r друг от друга, за счет влияния турбулентности,
эту зависимость можно представить следующим образом
CT2=
(∆T)2 r 2/3 . (9.32)
Существует связь между структурными параметрами индекса рефракции и температуры, полученная эмпирически [22,
54–56]
2
P  2

Cn2 = 79 ⋅ 10−6 ⋅
 CT . T2 

(9.33)
Как следует из формул (9.31)–(9.33) структурные функции
случайных полей флуктуаций индекса рефракции и температу237
ры в тропосфере отличаются только величиной коэффициентами, ибо температура в приземном слое близка к постоянной.
9.4.3. Эмпирические модели
тропосферной турбулентности
Как было показано в различных теоретических и экспериментальных исследованиях тропосферные турбулентности
играют важную роль для оптической связи в околоземном пространстве. Например, между спутниками, земными станциями,
платформами и космическими кораблями, самолетами и вертолетами, и так далее. При этом, структурная постоянная индекса рефракции в турбулентной среде, Cn2 , для различных слоев
тропосферы определяет характер фединга оптического сигнала
[5, 57–62]. Как было отмечено выше, в околоземных тропосферных горизонтальных каналах оптической связи коэффициент
Cn2 существенно зависит от высоты над поверхностью Земли и
от метео условий и меняется в пределах от 10–15 до 10–13 м–2/3
[59–61].
Так, для атмосферы над морской поверхностью была получена эмпирическая зависимость между параметром Cn2 и структурными параметрами девиации температуры, CT2 , и паров
2
, а также с комбинацией температуры с парами воды,
воды, CQ
CTQ, называемой ковариацией [5, 19, 44]:
Cn2
2
P 

≈  79 ⋅ 10−6 2 
T 

( CT2 + 0,113CTQ + 0,003CQ2 ). (9.34)
Структурная постоянная индекса рефракции CT2 определена
выше формулой (9.32), постоянные CTQ и CQ подробно описаны
в работах [5, 8, 19]. Все остальные параметры определены в параграфе 9.1. Одной из наиболее используемых эмпирических
моделей является модель Хафнагеля-Валея [61, 62]. Однако эта
модель была разработана для среднеширотной атмосферы и не
подходила для прогноза эффектов турбулентности в других областях земной атмосферы. В работе [62] была разработана полуэмпирическая модель для определения структурной постоянной
индекса рефракции для среднеземноморской акватории, включая ближневосточный регион. Эта модель не противоречила
модели Хафнагеля-Валейя, но включала в рассмотрение спец238
ифичные турбулентные слои, наличие которых было потверждено многочисленными экспериментальными наблюдениями
[57–60].
Как было показано в работе [5] путем анализа различных
эмпирических и полу-эмпирических моделей для атмосферных
высот до 1–2 км, которые применялись в основном для прогноза
оптической связи между платформами в стратосфере, параметр
Cn2 меняется в широких пределах от 8⋅10–17 м–2/3 до 7⋅10–16 м–2/3
со средней величиной Cn2 = 4⋅10–16 м–2/3 и со стандартной девиацией σ = ±1⋅10–16 м–2/3.
Специальные исследования оптической турбулентности над
континентальной местностью и над островами показали, что
здесь работают, соответственно, два полуэмпирических подхода: а) модель, основанная на макроскопической метеорологии
атмосферы [59–63], и б) модель морской среды согласно концепции Циерманна [64] для околоземных атмосферных слоев, основой для которой стала теория подобия Монина-Обухова [65]. Оба
подхода для получения слоевого надповерхносного профиля Cn2
использовали стандартные метеорологические параметры, как
входные параметры модели. В последние годы были разработаны и обоснованы экспериментально полу-эмперическме модели,
как расширение существующей макроскопической модели [64,
67, 68], для прогноза параметра Cn2 в турбулентной тропосфере
над континентальной земной поверхностью, где макроскопическая модель имеет значительные ограничения.
Как было отмечено выше и показано в формуле (9.33), а также согласно работ [5, 63, 69], параметр флуктуаций индекса
рефракции тесно связан с параметром девиации температуры
CT2 (измеряется в К2м–2/3).
При этом, модель турбулентной атмосферы Циерманна [64]
позволяла определить CT2 , представив профиль CT2 согласно модели, представленной в работах [65, 70], формулы которой мы
приводить не будем ввиду их сложности и отправим читателя
к первоисточникам [64, 65, 70]. В тоже время мы представим
ниже те модели и результаты их расчетов, которые полностью
соответствуют данным, полученным экспериментально как для
континентальных, так и субтропических зон [59–61].
Макроскопическая метеорологическая модель. В Работах
[59–61] была предложена макроскопическая метеорологическая
(ММ) модель для прогноза значений структурого коэффициента
239
индекса рефракции вместо применения сложных математических выражений, полученных в модели Циерманна. Его полуэмпирическая модель (названная макроскопической атмосферной моделью (МАМ)), включала ряд данных о ситуации в атмосфере, таких как внешнее излучение в атмосферу и потоки тепла
в ней [64, 70].
Согласно ММ-модели, разработанной в работах [57, 59, 60],
результаты которых были просуммированы в работе [5] с учетом
экспериментальных данных, структурный параметр индекса
рефракции в турбулентной тропосфере Cn2 , выраженный в единицах м–2/3, может быть представлен в следующем виде:
Cn2 = 3,8 ⋅ 10−14 W + f (T ) + f ( U ) + f ( ÎÂ ) − 5,3 ⋅ 10−13. (9.35)
Здесь использованы добавочные функции от температуры Т, К; f(T) = 2⋅10–15 T, от скорости U атмосферного газа, м/c;
f(U) = –2,5⋅10–15U+1,2⋅10–15U2–8,5⋅10–17U3, от относительной влажности OB, f(OB) = –2,8⋅10–15OB+2,9⋅10–17 OB2–1,1⋅10–19 OB3, %,
где W – достаточно изученный эаспериментально (по-часам) весовой множитель [59–61].
Однако, как показали многочисленные измерения ММмодель применима для оценки параметра Cn2 только для высот,
не превышающих 15 метров над земной поверхностью. Поэтому,
ММ-модель «работает» только для приземных оптических трасс
при изменении температуры от 9 до 35°C, и при относительной
влажности (ОВ) газовой смеси от 14% до 92%, а также при скоростях атмосферных ветров от 0 до 10 м/c.
Для обеспечения правильной оценки параметра Cn2 для других, более высоких тропосферных слоев (измерения в работах
[59–61] велись в основном на высотах от 2,5 м до 7,5 м) в дальнейшем была применена модель Татарского, учитывающая высотную зависимость структурного коэффициента индекса рефракции от высоты [19, 44] :
Cn2 ( h ) = Cn20 h −4 3 , (9.36)
где Cn20 – структурный коэффициент индекса рефракции на
земной поверхности, т. е. при h = 0 м. Следует отметить, что в работах [71–73] была сделана попытка улучшить применимость
ММ-модели для высот от 0 до 100 м, однако, даже в этом случае,
240
модель не давала надежные результаты (при сравнении с экспериментальными данными) для целого ряда континентальных и
морских акваторий.
Расширенная ММ-модель. В работах [5, 59–61] была также
предложена расширенная ММ-модель (РММ-модель), позволяющая расширить ее применимость на континентальные и приморские местности и акватории с более широким диапазоном
изменения относительной влажности воздуха и для более широкого диапазона скоростей атмосферных ветров. Кроме того, как
показали дополнительные экспериментальные и теоретические
исследования [5, 60, 61], данная модель позволяет учитывать не
только рассеяние на атмосферных турбулентностях, но и учесть
поглощение оптических волн на аэрозолях. Другими словами,
РММ учитывает роль турбулентностей в усилении нагрева атмосферного газа, и как следствие, увеличение параметра оптической рефракции Cn2 [62], о чем пойдет речь в следующей главе.
Ниже, следуя работам [5, 59–61], представим две версии
РММ-модели для дневной и ночной атмосферы, учитывающие
высокие скорости ветров, высокую влажность атмосферного
газа, а также тип земной поверхности, определяемый величиной Альбедо (А), и текущее время наблюдений. Так, в работах [5,
60, 61] была оценена область применимости этой расширенной
модели и было экспериментально показано, что она верна в области температур от 9 до 35 °C для низких приземных оптических трасс.
Так, для дневной приземной тропосферы при скорости ветров
в диапазоне 8 м/с ≤ U ≤ 17 м/с и при относительной влажности
в пределах 30% ≤ OB ≤ 70%, изменения коэффициента Cn2 для
среднеширотных континентальных зон могут быть достаточно
точно оценены с использованием уравнения [5, 60, 61]:
Cn2 =3,8 ⋅ 10−14 W +
A
⋅ 10−4 + f ( U ) + f ( ÎÂ ) − 4,45 ⋅ 10−14 , (9.37)
exp{T}
где для гористой среднеземноморской и пустынной местности
соответствуюшие функции скорости и влажности могут быть
представлены следующими формулами:
f ( U ) = 8 ⋅ 10−16 U − 4 ⋅ 10−18 U 2 ; (9.38а)
241
f ( OB ) =−8 ⋅ 10−16 ÎÂ + 5 ⋅ 10−18 ÎÂ2 , (9.38б)
тогда как на континентальных местностях, покрытых растительностью, они определяются следующими формулами:
f (=
U ) 2,58 ⋅ 10−14 U; (9.39а)
f ( OB ) =
−6,797 ⋅ 10−15 ÎÂ (9.39б)
Здесь А – земное Альбедо, введенное выше и равное А = 0,5
(для земной поверхности с растительностью) и А = 0,35 (для пустынной гористой местности) [71]. Все остальные параметры
определены выше в ММ-модели, однако температура в уравнении (9.37) представлена в градусах Цельсия.
Для ночной приземной тропосферы при скорости ветров
в диапазоне 5 м/с ≤ U ≤ 10м/с и при относительной влажности
в пределах 92% ≤ OB ≤ 100%, изменения коэффициента Cn2 для
среднеширотных континентальных зон можно достаточно точно
оценить, используя следующее уравнение [5, 59–61]:
Cn2 = f (T ) + f ( U ) + f ( ÎÂ ) − 1,9 ⋅ 10−14 , (9.40)
где соответствуюшие функции скорости и влажности могут
быть представлены следующими формулами:
f (T )= 3 ⋅ 10−17 T; f ( U=
) 1,2 ⋅10−14 U;
(9.41а)
f ( OB ) =
−7,5 ⋅ 10−16 ÎÂ.
(9.41б)
(9.41г)
В последнем случае не учитывается по-часовой весовой множитель W и тип поверхности (в Альбедо), так как для ночного
времени суток влияние этих факторов несущественно при сильных ветрах и высокой влажности воздуха.
Сравнение измеренных значений Cn2 с оценочными данными согласно МАМ-модели Циерманна [64, 70] и согласно РММмодели (9.40), представлены на рис. 9.3, а в виде зависимости
от относительной влажности при постоянных скорости ветра
242
а)
10-12
Измерения
МА - модель
РММ- модель
10-13
Cn2 , м–2/3
Горы
10-14
10-15
90
10-12
б)
92
94
96
98
Относительная влажность, ОВ [%]
Измерения
МА - модель
РММ- модель
100
Горы
10-13
Cn2 , м–2/3
10-14
10-15
Пустыня
90
12
10-
92
94
96
98
Относительная влажность, ОВ [%]
Измерения
МА - модель
РММ- модель
100
Горы
13
10-
Cn2 , м–2/3
14
10-
Пустыня
15
10-
8
10
12
14
Скорость ветра [м / c]
16
18
Рис. 9.3. Изменение коэффициента Cn2 при температуре T = 20 °C:
а – от относительной влажности (в %) для постоянных
скорости ветра U = 8 м/с; б – от скорости ветра (в м/с)
для постоянной влажности ОВ = 40 %
243
U = 8 м/с и температуре T = 20 °C, и на рис. 9.3, б – от скорости ветра в атмосфере при постоянных влажности ОВ = 40 % и
температуре T = 20 °C, соответственно. Из иллюстраций, представленных на рис. 9.3, а для горной местности при различной
влажности воздуха, ясно, что расширенная макроскопическая
метеорологическая (РММ) модель более точно (по сравнению
с обычной МАМ-моделью Циерманна) описывает результаты измерений.
Та же тенденция проявляется как для гористой, так и для
пустынной местности, изображенная на рис. 9.3, б в зависимости от скорости ветра. Так, РММ-модель прогнозирует параметр
турбулентности атмосферы с высокой степенью корреляции
с экспериментальными данными (до 90 %) во всех экспериментально наблюдаемых диапазонах изменения макроскопических
параметров приземного слоя тропосферы, температуры, влажности воздуха и скорости атмосферных ветров.
Следует отметить, что МММ-модель и РММ-модель, представленные формулами (9.37) и (9.40), соответстенно, имеют довольно простое математическое описание, отличное от сложных
математических формул, разработанных для других эмпирических моделей, включая анализируемую МАМ-модель Циерманна. Кроме того, эти модели применимы для описания оптических приземных трасс при более широкой вариации макроскопических метеорологических параметров тропосферы и для более широкого диапазона типов местности, гористой, пустынной,
покрытой растительностью и морской, как для дневной, так и
для ночной приземной тропосферы [5, 59–62]. При этом обе модели физически не противоречат эмпирической МАМ-модели
[63], предложенной на базе концепции Циерманна [64], и основанной на теории, разработанной в работах [65, 70].
В тоже время, как МММ-модель, так и РММ-модель применимы только для горизонтальных приземных оптических трасс, и
они не могут адекватно описывать изменения оптических волн,
подверженных рефракции, на вертикальных и наклонных
трассах при связи с самолетами, платформами, вертолетами и
в спутниковой оптической связи. Однако, для приземных трасс
эти модели можно легко адаптировать для любых континентальных приземных оптических каналов связи при любых погодных условиях и типах местности.
244
Литература
1. Pruppacher H. R., Pitter R. L. «A semi-empirical determination
of the shape of cloud and rain drops». J Atmos. Sci., vol.28, pp. 86–
94, 1971.
2. Slingo A. «A GSM parametrization for the shortwave radiative
properties of water clouds». J. Atmos. Sci., vol. 46, pp. 1419–1427,
1989.
3. Chou M. D. «Parametrizations for cloud overlapping and
shortwave single scattering properties for use in general circulation
and cloud ensemble models», J. Climate, vol. 11, 1998, pp. 202–214.
4. International
Telecommunication
Union,
ITU-R
Recommendation. P. 840-2, «Attenuation due to clouds and fog»,
Geneva, 1997.
5. Liou K. N. Radiation and cloud processes in the atmosphere,
England: Oxford University Press, 1992.
6. Blaunstein N., Arnon Sh., Zilberman A., Kopeika N. Applied
aspects of optical communication and LIDAR, New York: CRC
Press, Taylor & Francis Group, 2010.
7. Bean B. R., Dutton E. J. Radio meteorology. Dover, New York,
1966.
8. Blaunstein N., Christodoulou Ch. Radio propagation and
adaptive antennas for wireless communication links: terrestrial,
atmospheric and ionospheric. New Jersey: Wiley InterScience,
2007.
9. International
Telecommunication
Union,
ITU-R
Recommendation. P. 838, «Specific attenuation model for rain for
use in prediction methods», Geneva, 1992.
10. Saunders S. R. Antennas and propagation for wireless
communication systems, New York: John Wiley & Sons, 1999.
11. Twomey S. Atmospheric aerosols. Amsterdam: Elsevier,
1977.
12. McCartney E. J. Optics of the atmosphere: scattering by
molecules and particles. New York: John Wiley & Sons, 1976.
13. Whitby K. Y. «The physical characteristics of sulfur aerosols».
Atmopheric Environments, 1978, no. 12, pp. 135–159.
14. Friedlander S. K. Smoke, Dust and haze. New York: John
Wiley & Sons, 1977.
15. Seinfeld J. H. Atmospheric chemistry and physics of air
pollution. New York: John Wiley & Sons, 1986.
245
16. d'Almeida G. A., Koepke P., Shettle E. P. Atmospheric aerosols,
global climatology and radiative characteristics, Hampton: Deepak
Publishing, 1991.
17. Ishimaru A. Wave propagation and scattering in random
media , New York: Academic Press, 1978.
18. Rytov S. M., Kravtsov Yu. A., Tatarskii V. I. Principles of
statistical radiophysics, Berlin: Springer, 1988.
19. Tatarski V. I. Wave propagation in a turbulent medium, New
York: McGraw-Hill, 1961.
20. Andrews L. C., Phillips R. L. Laser beam propagation through
random media, 2nd Ed., SPIE Press, Bellingham, WA, USA, 2005.
21. Kopeika N. S. A System engineering approach to imaging,
SPIE Press, Bellingham, WA, 1998.
22. US Standard Atmosphere (1976), US GPO, Washington,
D.C., 1976.
23. Kovalev V. A., Eichinger W. E. Elastic LIDAR: theory,
practice, and analysis methods, John Wiley & Sons, Inc., Hoboken,
New Jersey, 2004.
24. Junge C. E. Air chemistry and radioactivity, New York:
Academic Press, 1963.
25. Jaenicke R. «Aerosol physics and chemistry», in Physical
Chemical Properties of the Air, Geophysics and Space Research, 4
(b), Fisher, G., Ed., Berlin: Springer-Verlag, 1988.
26. d'Almeida G. A. «On the variability of desert aerosol radiative
characteristics», J. Geophys. Res., 1987, vol. 93, pp. 3017–3026.
27. Shettle E. P. «Optical and radiative properties of a desert
aerosol model», in Proc. Of Symp. on Radiation in the Atmosphere,
Fiocco, G., Ed., A. Deepak Publishing, 1984, pp. 74–77.
28. Remer L. A., Kaufman Y. J. «Dynamic aerosol model: Urban/
Industrial aerosol», J. Geophys. Res., 1998, vol. 103, pp. 13859–
13871.
29. Crutzen P. J., Andreae M. O. «Biomass burning in the tropics:
impact on atmospheric chemistry and biogeochemical cycles»,
Science, 1990, vol. 250, pp. 1669–1678.
30. Rosen J. M., Hofmann D. J. «Optical modeling of stratospheric
aerosols: present status», Applied Optics, 1986, vol. 25, no. 3, pp.
410–419.
31. Whitby K. Y. «The physical characteristics of sulfur
aerosols», Atmospheric Environment, 1978, vol. 12, pp. 135–159.
246
32. McClatchey R. A., Fenn R. W., Selby J. E. A., Volz F. E., Garing
J. S. Optical properties of the atmosphere, Air Force Cambridge
Res. Lab.: L.G. Hanscom Field, Bedford, MA, AFCRL 1– 72 – 0497,
1972.
33. Deirmenjian D. Electromagnetic scattering on spherical
polydispersions, New York: American Elsevier Publishing , 1969
34. Butcher S. S., Charlson R. J. Introduction to air chemistry,
New York: Academic Press, 1972.
35. Cadle R. D. Particles in the atmosphere and space, New York:
Van Nostrand Reinhold, 1966.
36. Shettle E. P., Fenn R. W. «Models for the aerosols of the lower
Atmosphere and the effects of humidity variations on their optical
properties», Report AFGL-TR-79–0214 of Air force Laboratory,
Washington, 1979.
37. Herman B., LaRossa G., Turner R. E. Atmospheric scattering,
in Handbook: Infrared Light, Eds. V. L. Wolf, and G. G. Zissisa,
Michigan Research Institute of Media, Michigan, USA, 1989.
38. Balin Yu., Belen'ki M. S., Mironov V. L. «Lidar investigations
of aerosol inhomogeneities in the atmosphere», Atmosphere and
Ocean, 1986, vol. 22, no. 10, pp. 1060–1064.
39. Hobbs P. V., Bowdle D. A., Radke L. F. «Particles in the
lower troposphere over the high plains of the United States. I:
Size distributions, elemental compositions and morphologies», J.
Climate Applied Meteorology, 1985, vol. 24, pp. 1344–1349.
40. Kent G. S., Wang P.-H., McCormick M. P., Skeens K. M.
«Multiyear Stratospheric Aerosol and Gas Experiment II
measurements of upper tropospheric aerosol characteristics»,
J. Geophys. Research, 1995, vol. 98, pp. 20725–20735.
41. Bendersky S., Kopeka N. S., Blaunstein N. S. «Aerosol models
for Middle East coastal zones: a modified NAM model», SPIE,
Free-Space Laser Communication Technologies, XVI, Ed. by G.
S. Mecherle, C. Y. Yong, and J. S. Stryjewski, 2004, vol. 5338, pp.
276–287.
42. Bendersky S., Kopeika N., Blaunstein N. «Effects of
attenuation of 1.064 micrometer optical waves by humid aerosols
and fog over horizontal atmospheric communication links»,
J. Optical Engineering, 2004, vol. 43, No. 3, pp. 539–552.
43. Bendersky S., Kopeika N., Blaunstein N. «Aerosol particles
and size distribution measurements and modeling in the urban
environment for semi-arid and rainy atmospheric conditions»,
247
Proc. of SPIE International Conference, Florida, USA, August
5–11, 2006, pp. 614–625.
44. Kolmogorov A. N. «The local structure of turbulence in
incompressible viscous fluids for very large Reynolds numbers», in
Turbulence, Classic Papers on Statistical Theory (S. K. Friedlander
and L. Topper, eds.), pp. 151–155, New York: Wiley InterScience,
1961.
45. Tatarskii V. I. The Effects of the turbulent atmosphere on
wave propagation, Trans. For NOAA by the Israel Program for
Scientific Translations, Jerusalem, 1971.
46. Kraichman R. H. «On Kolmogorov’s inertial-range theories»,
J. Fluid Mecanics, 1974, vol. 62, pp. 305–330.
47. Obukhov A. M. «Temperature field structure in a turbulent
flow», Izv. Academii Nauk SSSR: Ser. Geog. Geofiz., 1949, vol. 13,
pp. 58– 69.
48. Andrews L. C., Phillips R. L., Hopen C. Y. Laser Beam
Scintillation with Applications, SPIE Press, Bellingham, WA,
2001.
49. Good R. E., Watkins B. J., Quesada A. F., Brown J. H., Loriot
G. B. «Radar and optical measurements of Cn2», Applied Optics,
1982, vol. 21, pp. 33 – 73.
50. Zuev V. E., Krekov G. M. Optical models of the atmosphere,
Hydrometeorology Publishers, 1986.
51. Richardson L. F. Weather prediction by numerical process,
Cambridge University Press, Cambridge, UK, 1922.
52. Andrews L. C., Phillips R. L., Hopen C. Y., Al-Habash M. A.
«Theory of optical scintillations», J. Optical Society of America,
1999, vol. 16, pp. 1417–1429.
53. Businger J. A., Wyngaard J. C., Izumi Y., Bradley E. F.
«Flux profile relationships in the atmospheric surface layer», J.
Atmospheric Sciences, 1973, vol. 28, pp. 181–189.
54. Champagne F. H., Friehe C. A., LaRue J. C., Wyngaard J. C.
«Flux measurements, flux-estimation techniques, and fine-scale
turbulence measurements in the unstable surface layer over land»,
J. Atmospheric Sciences, 1977, vol. 34, pp. 515–530.
55. Stull R. B. An introduction to boundary layer meteorology,
Kluwer Academic Publishers, Boston, 1988.
56. Andrews L. C. «An analytical model for the refractive index
power spectrum and its application to optical scintillations in the
atmosphere», J. Modified Optics, 1992, vol. 39, pp. 1849–1853.
248
57. Sadot D., Kopeika N. S. «Forecasting optical turbulence
strength on basis of macroscale meteorology and aerosols: models
and validation,» Optical Engineering, 1992, vol. 31, pp. 200–212.
58. Sadot D., Shemtov D., Kopeika N. S. «Theoretical and
experimental investigation of image quality through an
inhomogeneous turbulent medium,» Waves and Random Media,
1994, vol. 4, no. 2, pp. 177–189.
59. Bendersky S., Kopeika N., Blaunstein N. «Prediction and
modeling of line-of-sight bending near ground level for long
atmospheric paths», Proc. of SPIE International Conference, San
Diego, USA, 2004, August 3–8, pp. 512–522.
60. Bendersky S., Kopeika N., Blaunstein N. «Atmospheric
optical turbulence above the terrain surface in the middle-east
costal media: prediction, modeling and measurements», J. Applied
Optics, 2004, vol. 43, pp. 4070–4079.
61. Yakerson N., Zilberman A. «On variations of electric
conditions in the specified meteorological conditions in the nearthe ground atmospheric layer in the semi-transparent regions», J.
Science of Full Media, 2005, vol. 347, pp. 230–240.
62. Zilberman A., Kopeika N. S. «Aerosol and turbulence
characterization at different heights in semi-arid regions,» in
Handbook: Atmospheric optical modeling, measurement, and
simulation, S. M. Doss-Hammel and A. Kohnle eds., Proc. SPIE,
2005, vol. 5891, pp. 129–140,.
63. Friehe C. A., La Rue J. C., Champagne F. H., Gibson C. H.,
Dreyer G. F. «Effects of temperature and humidity fluctuations
on the optical refractive index in the marine boundary layer,» J.
Optical Society of America, 1975, vol. 65, No. 12, pp. 1502–1511.
64. Thiermann V., Kohnle A. «A simple model for the structure
constant of temperature fluctuations in the lower atmosphere,» J.
Phys., 1988, vol. 21, S37-S40.
65. Berk A., Bernstein L. S., Robertson D. C. ‘‘MODTRAN: A
moderate resolution model for LOWTRAN 7’’, Air Force Geophysics
Laboratory Technical Report GL TR-89–0122, Hanscom AFB, MA,
1989.
66. Kopeika N. S., Kogan I., Israeli R., Dinstein I. «Prediction
of image quality through atmosphere as a function of weather
forecast», in Handbook: Propagation Engineering, Ed. by N. S.
Kopeika and W. B. M iller, Proc. SPIE, 1115, pp. 266–277, 1989.
249
67. Herman B., LaRocca A. J., Turner R. E. «Atmospheric
scattering», in Handbook: Infrared, Ed. By Wolfe, W. L., Zissis, G.
J., Environmental Research Institute of Michigan, 1989.
68. Vernin J., Crochet M., Azouit M., Ghebrebrhan O. «SCIDAR
radar simultaneous measurements of atmospheric turbulence»,
Radio Science, vol. 25, 1990, pp. 953.
69. Beland R. R. «Propagation through atmospheric optical
turbulence», in Handbook: The Infrared and electro-optical
systems, Ed. By F. G. Smith, vol. 2, SPIE Press, Bellingham, WA,
1993, p. 157.
70. Thiermann V., Grassl H. «The measurement of turbulent
surface layer fluxes by use of bichromatic scintilation,» BoundaryLayer Meteorolog., 1992, vol. 58, pp. 367–389.
71. Holstag M., Van Ulden A. P. «Simple scheme for daily data
estimations of surface streams via the weather data», J. Climatic
Applied Meteorology, 1983, vol. 22., pp. 517–529.
72. Ben-Yosef N., Tirosh E., Weitz A., Pinsky E. «Refractiveindex structure constant dependence on height,» J. Optical Society
of America, 1979, vol. 69, pp. 1616–1618.
73. Jursa A. S., Ed. Handbook: Geophysics and the space
environment, Air Force Geophysics Laboratory, 1985.
250
ГЛАВА 10. ВЛИЯНИЕ НЕОДНОРОДНОЙ
МНОГОСЛОЙНОЙ АТМОСФЕРЫ
НА РАСПРОСТРАНЕНИЕ ОПТИЧЕСКИХ ВОЛН
Как указано в гл. 9, тропосфера представляет слоистую неоднородную газообразную среду, в которой оптические волны
распространяются не по прямым траекториям, как это наблюдается в свободном пространстве (см. гл. 2). Их распространение
подвержено рефракции, за счет которой траектории лучей искривляются в атмосфере в направлении к земной поверхности
или в направлении от нее. При этом, эффект рефракции зависит от состава атомов и молекул атмосферного газа, градиентов
температуры, давления и влажности, а также от спорадических
газовых структур – турбулентностей, и различных видов гидрометеоров (смотри определения в гл. 9). Поэтому ниже будут
рассмотрены явления рефракции, поглощения и рассеяния оптических волн в тропосфере на высотах до 10–20 км, которые
являются наиболее актуальными для приземных атмосферных
каналов оптической связи [1–10].
10.1. Тропосферная рефракция
Как было указано выше в гл. 9, мы рассматриваем тропосферу
как газообразную сферическую среду, простирающуюся вокруг
Земли, компоненты которой однородно распределены внутри
слоев вдоль высоты, измеряемой от земной поверхности [1]. В такой среде распространение оптических волн характеризуется
индексом рефлакции n для каждого слоя атмосферы, связанного с относительной диэлектрической постоянной воздуха, εr, как
n= εr . Известно, что индекс рефракции n в приземном слое атмосферы ненамного превышает единицу и у поверхности Земли
составляет порядка 1,000315 [2–6]. Так как этот параметр близок к единице, то вводят параметр, выраженный в N-единицах,
обычно называемый рефрактивностью [2–6], равный разности
реального индекса рефракции и единицы, умноженной на миллион, то есть:
N = (n − 1) ⋅ 106. (10.1)
Тогда на поверхности Земли рефрактивность будет равна
N≡N0≈315 N-единиц. В реальной атмосфере рефрактивность N
251
меняется с давлением и температурой газа и с давлением водяного пара от точки к точке, и связь между ними может быть
представлена с помощью полуэмпирической модели Дебая согласно следующей формулы [4–8]
=
N
pH2O
77,6 
 p A + 4810
T 
T

. 
(10.2)
Здесь T – абсолютная температура (в Кельвинах, К), pA – атмосферное давление (в миллибарах, мб), и pH2O – давление водянного пара (в миллибарах, мб). Обычно наблюдаются сезонные и дневные вариации рефрактивности, измеряемой у поверхности Земли N0 [2, 3, 5–8].
В общем, мы можем не учитывать горизонтальные вариации
параметра N и рассматривать атмосферу в виде сферической
слоистой квазиоднородной среды. Тогда, основные изменения
параметра N имеют место по высоте, уменьшаясь от земной
поверхности и стремясь к нулю с увеличением высоты (где реальный индекс рефракции n становится близким к единице).
В тропосфере, на высотах до нескольких десятков километров,
высотную зависимость рефрактивности можно представить экспоненциальной функцией от высоты [2–8]:
 h
=
N N0 exp − .  H
(10.3)
где h – текущая высота над уровнем моря, и H = 7,35 км стандартный высотный масштаб атмосферы. Уравнение (10.3) называют в литературе стандартной экспоненциальной моделью
в тропосфере, и оно корректно при линейном уменьшении с высотой температуры воздуха, при линейном уменьшении давления согласно барометрической формуле, и при экспоненциальном изменении влажности с высотой.
Вариации индекса рефракции с высотой приводят к незначительному замедлению фазовой скорости оптических волн вблизи земной поверхности таким образом, что траектории лучей не
являются прямыми, а закругляются незначительно в направлении к земной поверхности или от нее в зависимости от знака градиента изменения индекса рефракции. Другими словами, угол
252
Атмосфера
n2
θ2
Слой 2
α2
θ1
h1
n1
α1
Слой 1
T
Земля
Рис. 10.1. Схематическое представление явления рефракции
оптического луча в слоистой газообразной тропосфере
α1 вхождения в слой начального луча в некоторой произвольной
точке изменяется после рефракции на угол α2 (рис. 10.1).
Подобная ситуация повторяется и для следующего виртуального слоя с номером 3 с другим индексом рефракции n3, и так
далее в других слоях. В итоге луч, входящий в тропосферу с поверхности Земли, распространяется вдоль кривой с радиусом ρ
в любой ее точке. Этот радиус мы представим, согласно работам
[4–8], через изменение индекса рефракции n по высоте h следующим образом:
 cos α1 dn 
ρ = −

 n dh 
−1
. (10.4)
В результате луч, проходящий через тропосферу, отклоняется от прямолинейной траектории и, поэтому, приходит в пространственную точку, отстоящую далеко от облучаемого объекта. При этом градиент рефрактивности является функцией
высоты, а именно,
g ( h ) = dN dh . (10.5)
253
В работах [4–6] полагали, что у поверхности Земли эта функция меняется экспоненциально по закону
gs ( h ) =
− 0,04 exp ( −0,136 h ), êì −1, (10.6)
согласно которому градиент рефракции нелинейно зависит от
высоты в приземном слое тропосферы. Однако, в качестве первой аппроксимации, можно использовать линейную модель, при
которой на поверхности Земли при h = 0 имеем g = g(0). Такая линейная аппроксимация, как следует из рис. 10.2, полностью соответствует экспоненциальной модели стандартной однородной
тропосферы (10.3) для приземных оптических каналов связи на
высотах, не превышающих 2–3 км. При этом, линейную модель
можно представить следующим образом [4–8]:
N ≈ N0 −
N0
h, H
(10.7)
где H – стандартная высота газообразной однородной тропосферы, приведенная выше в формуле (10.3).
При этом рефрактивность имеет приблизительно постоянный градиент по высоте, равный – 43 N-единиц на километр
h, м
7000
6000
5000
4000
3000
2000
1000
0
0
50
Линейная
100
150
200
250
300
Экспоненциальная
350
N [N-единиц]
Рис. 10.2. Сопоставление линейной модели градиента
рефрактивности (пунктирная линия) с экспоненциальной моделью
(сплошная кривая)
254
высоты. Тогда и радиус кривизны траектории оптического
луча, определяемый формулой (10.4), также будет неизменным
(при dn/dh = const).
В общем случае, для учета явления рефракции, вместо реального радиуса Земли Re = 6375 км вводят фактор рефракции κe
с учетом влияния атмосферы и вместо истинного радиуса Земли, Re, вводят ее эффективный радиус, Reff [2–6]:
Reff = κe Re , êì.
(10.8)
Для стандартной атмосферы и в пределах линейной модели (10.7), когда градиент g(h) приблизительно постоянен,
g = –3,925⋅10–2, 1/км, тогда параметр влияния тропосферы равен
κe = 4/3 так что, согласно (10.8) эффективный радиус равен приблизительно 8,500 км [2–5].
Однако, в работах [5] было отмечено, что фактор рефракции
в тропосфере, κe, меняется с высотой и, поэтому, вместо постоянной его величины, вводят эффективный параметр κэф, зависящий от градиента индекса рефракции и от метеорологических
макропараметров. Так, эффективный фактор рефракции равен
[5]
=
κýô
Re
1
≅
. dn
+ 1 1 − Re
Re
dh
ρ
(10.9)
Так как вариации индекса рефракции наблюдается в основном в вертикальной плоскости, то лучи, посылаемые и принимаемые под относительно большими углами, можно не принимать во внимание, и для лучей, близких к горизонтальным,
которые актуальны для приземных каналов оптической связи,
получают [5]
ρ ≈ −106 g , (10.10)
где g – градиент рефрактивности, введенный нами в (10.5). При
этом индекс рефракции можно записать следующим образом [5]
(
κýô = 1 + 10−6 gRe
)
−1
.
(10.11)
255
Анализ метеорологических макро параметров в среднеширотной атмосфере позволяет оценить численно фактор рефракции [5]
0,157
κýô =
.
0,157 + g
(10.12)
Как просуммировано в работе [6], эффекты рефракции,
описанные даже в рамках линейной модели, приводят к существенному отклонению луча на больших высотах в тропосфере,
а следовательно – к искажению картинки, передаваемой по оптическому каналу связи. Однако для приземных оптических
каналов связи этот эффект не столь очевиден [6], и его можно не
принимать во внимание при анализе распространения оптических сигналов и их приема детекторами в околоземных каналах
саязи.
10.2. Рассеяние в тропосфере от гидрометеоров
Рассеяние оптических волн в атмосфере происходит наравне с поглощением энергии волны или даже, когда поглощение
полностью отсутствует (см. гл. 9). В данном параграфе мы остановимся на кратком изложении эффектов чистого рассеяния на
газообразных компонентах атмосферного газа.
Рассеяние теоретически можно описать в рамках трех независимых методов, в зависимости от соотношения между длиной
волны оптического сигнала и размерами частиц в гидрометеорах
(смотри определение в гл. 9), как основных рассеивателей. Эти методы можно сформулировать следующим образом [6, 11–13]:
1. Рассеяние Рэлея.
2. Рассеяние Ми.
3. Неселективное рассеяние.
Рассеяние Рэлея. Данный метод применим, когда излучаемая
длина оптической волны намного меньше размеров частиц воздуха. Объемный коэффициент рассеяния (называемый сечением рассеяния) в данном методе может быть представлен следующей формулой [11–13]
4π2 NV 2 λ4 )( n2 − n02 )
(
σ=
2
(n2 + 2n02 )
2
256
.
(10.13)
Здесь N – число частиц в единице объема; V – объем, содержащий частицы (в см3); l – длина волны (в см); n0 – индекс рефракции в в однородной невозмущенной атмосфере; n – индекс
рефракции в случае атмосферы, заполненной рассеивателями
в виде молекул, атомов и других гидрометеорных структур. Например, в случае сферических капель житкости, регулярно распределенных в воздухе, сечение рассеяния равно [6, 11]
σ =0,827
Nσ3S
,
(10.14)
λ4 где σS – площадь сечения рассеяния капель. Это выражение
в итоге может быть проинтегрировано по промежутку изменения l и по σS, выбраного на основе эмпирических данных о распределении частиц по размерам (см. гл. 9).
В случае, когда диаметр частиц, 2 σS π, много меньше длины волны l, такое же рассеяние имеет место как для большого
числа малых частиц, так и для малого числа больших частиц,
так как в обоих случаях произведение Nσ3S будет одинаковым.
В случае стандартной температуры и давления спектральный
(то есть, зависящий от частоты) коэффициент рассеяния равен
[5, 11]:
sl = 1,07×10–3 l–4,05 км–1,
где l – в микронах).
Рассеяние Ми. Данный метод применим, когда размер частиц
сравним с длиной оптической волны. Поверхностный коэффициент рассеяния согласно теории Ми определяется отношением фронта падающей оптической волны, рассеянной частицей,
к поверхности (названной поперечником рассеяния) самой частицы. Этот коэффициент рассеяния равен [11, 12]
=
σ NKπa2 , ñì2 . (10.15)
Здесь величина параметра K изменяется от 0 до 4 и ассимтотически достигает величины 2 для больших капель дождя.
В общем случае, когда частицы непрерывно распределены
в пространстве по размерам, применяют более строгую формулу
для поперечника рассеяния Ми [11, 12] (cм. гл. 9)
σλ =π∫
a2
a1
N ( a )K ( a,n ) a2da. (10.16)
257
Здесь sl – коэффициент рассеяния, зависящий от частоты
(длины волны), см–1, введенный выше; N(a) – число частиц на
кубический сантиметр в интервале радиусов частиц da, см–3;
K(a,n) – коэффициент рассеивающей поверхности; a – радиус
сферической капли, см; и n – индекс рефракции (все эти параметры определены в гл. 9, но мы приводим их снова для удобства
понимания обсуждаемого предмета). Чтобы провести расчеты
формулы (10.16) в единицах км–1, используемые при вычислении единицы для s должны быть умножены на 105.
Многими авторами были детально рассмотрены все вытекающие возможности применения теории рассеяния Ми к атмосферным беспроводным каналам связи. Так, в работах [11–13],
были рассмотрены приложения этой теории для широкого спектра изменения структуры частиц, их формы и размеров, а поперечник рассеяния согласно теории Ми был предложен в различных его модификациях [6, 11–13].
Неселективное рассеяние. Данный метод применим, когда
размер частиц намного превышает длину оптической волны,
излученной в атмосферу. Рассеяние на крупномасштабных частицах гидрометеоров включает в себя три процесса взаимодействия оптической волны с частицами-рассеивателями:
– отражение от поверхности частицы без проникновнения во
внутрь;
– прохождение частицы с отражением или без внутреннего
отражения от ее внутренних стенок;
– диффракция на углах (на границах) частицы.
В работах [5, 6, 11–13], объединенный эффект от всех трех процессов был детально проанализирован и обсужден. В частности,
было показано для частиц с размерами вдвое превышающими
длину волны, что коэффициент рассеяния достигает величины
2, то есть вдвое превосходит поперечник самой частицы. Такой
же результат достигается при использовании ассимптотической
формулы (10.15) по теории Ми. Кроме того было показано, что
учет дифракции, рефракции и отражения проявляется довольно слабо и вносит малый вклад в общую теорию Ми. Не вдаваясь
в детали результатов, полученных авторами этих работ, мы отсылаем читателя к оригиналам, представленным в соответствующей библиографии в конце этой главы.
258
10.3. Влияние атмосферной турбулентности
на сцинтилляцию параметров оптической волны
Оптические волны, распространяясь через турбулентную
тропосферу, характеризующуюся быстрыми вариациями индексов рефракции, подвержены быстрым изменениям амплитуды и фазы [5, 6, 14–21]. Этот эффект называют тропосферными
сцинтилляциями. Флуктуации амплитуды и фазы происходят
как в пространстве, так и по времени. Более того, это явление
сильно зависит от частоты (длины волны): более короткие длины волн приводят к более существенным флуктуациям амплитуды и фазы сигнала, возникающим при определенных масштабах размеров турбулентностей [5, 6, 22–25]. Данные масштабы
можно определить с помощью экспериментального мониторинга сцинтилляций оптического сигнала на двух близких трассах
или посредством анализа кросскорелляции между сцинцилляциями вдоль трасс распространения. Если эффекты сильно
коррелированы, то масштабный размер превосходит дистанцию
между оптическими трассами [26]. Дополнительные исследования показали, что распределение флуктуаций сигнала (в децибелах) можно аппроксимировать распределением Гаусса, чья
стандартная вариация определяет интенсивность сигнала [5, 6,
14–25].
Индекс сцинтилляции. Распространение оптических волн
через случайную среду, такую, как турбулентная тропосфера,
подвержено флуктуациям оптического излучения даже на коротких трассах распространения, названными в литературе
сцинтилляциями. Индекс сцинтилляции по интенсивности
определяется следующим образом [19–21]
2
σ=
1
I2 − I
I
2
2
=
I2
I
2
− 1. (10.17)
В формуле (10.17) величина I означает интенсивность оптической волны, а угловые скобки означают усреднение по ансамблю флуктуаций излучательной характеристики волны (или по
времени согласно эргодичности случайного процесса). При такой формулировке, значания индекса сцинтилляций окажутся
меньшими единицы при режиме слабых флуктуаций интенсивности оптической волны или луча, то есть, слабого влияния тур259
булунтной среды. В этом случае, индекс сцинтилляции определяется величиной, названной в литературе индексом вариации
Рытова [19–21]:
σ12 =
1,23Cn2 k7/6 R11/6 . (10.18)
Cn2 – структурный параметр индекса рефракции, опре-
Здесь
деленный в гл. 9, k – волновое число, и R – длина оптической
трассы между излучателем и приемником.
Несмотря на то, что индекс вариации Рытова (10.18) представляет собой индекс сцинтилляции плоской волны в неограниченной атмосфере, заполненной слаботурбулентными образованиями, приводящими к слабым флуктуациям волны, его можно
расширить и для описания режимов с сильными флуктуациями
при увеличении либо параметра Cn2 , либо при увеличении дальности оптической трассы R, либо одновременно обоих факторов.
Как было показано в работах [19–21], индекс сцинтилляции
увеличивается с увеличением вариации Рытова пока он не достигнет своего максимума, превышающего единицу. Данный
режим соответствует случайной фокусировке оптического луча,
вызванной крупномасштабными турбулентными структурами,
при которых и достигается сильный фокусирующий эффект.
С увеличением длины оптической трассы или увеличением количества неоднородных образований на пути распространения
луча, многократное рассеяние уменьшает эффект фокусировки
луча. При этом флуктуации волны начинают медленно уменьшаться, приходя к насыщению на уровне, при котором индекс
сцинтилляции достигает величины, равной единицы. Качественно процесс насыщения можно объяснить влиянием многократного рассеяния оптической волны турбулентностями – неоднородностями среды, уменьшающего когерентную составляющую интенсивности волны и увеличивая ее некогерентную
составляющую.
Сцинтилляция интенсивности сигнала в турбулентной
среде. Ранние исследования распространения плоской или сферической волны сквозь случайную неограниченную среду ограничивались только описанием слабых флуктуаций интенсивности волны (смотри библиографию в работе [26]). Для объяснения теории слабых флуктуаций были введены три параметра,
характеризующие проблему, дополнительно к введенным нами
260
Турбулентная структура
Модель диска
С1
r1
С2
r2
Детектор
Рис. 10.3. Когерентность между двумя соседними точками
расположения турбулентностей, описываемая близким
к единице коэффициентом корреляции, то есть, при 0<<ρ( r1,r2) ≤ 1
ранее внешнем L0 и внутреннем l0 масштабам турбулентности,
а именно:
(a) Масштаб когерентности, выраженный через коэффициент
когерентности ρ0
(10.19а)
l1 ≡ lco ~ 1 / ρ0 , oписывающий эффект когерентности по амплитуде и/или фазе
между двумя лучами (волнами) в двух соседних точках, как это
представлено на рис. 10.3.
(b) Масштаб первой зоны Френеля (см. работы [5, 6, 19])
(10.19б)
l2 ≡  F ~ R / k, oписывающий эффект прямой видимости в канале распространения оптическогой волны между передающим и приемным
устройствами [5, 6, 19]).
(c) Размер рассеивающего диска
(10.19в)
l3 ~ R / ρ0 k модулирующего турбулентные структуры, где, как и выше, R –
длина опической трассы.
261
На основе введенных выше трех параметров, Татарский предположил, что масштаб корреляции волны по флуктуациям ее
интенсивности является порядка первой зоны Френеля, т. е.
порядка  F ~ L / k [17, 18] (смотри детали также в работах [5,
19]). В Работах [22–25] результаты, полученные в работах [17,
18, 20, 21], были распространены на случай сильных флуктуаций интенсивности оптического луча, а также было показано, почему наименьшие масштабы флуктуации интенсивности
соответствуют режиму насыщения. Основные качественные
результаты этих работ полностью подтверждают теорию Колмогорова-Обухова, согласно которой между внешним (макро) и
внутренним (микро) масштабами турбулентностей формируется непрерывный континуум структур с уменьшающимися размерами в процессе их диссипации во времени и в пространстве
до тех пор, пока их кинетическая энергия не перейдет в тепло
(см. гл. 9).
Модификация метода Рытова, представленная в работах [22–
25], позволяет качественно, не вникая в сложные математические вычисления, проанализировать процесс перехода от сильных к средним и слабым флуктуациям интенсивности оптической волны в турбулентной среде. В этих работах были сделаны
следующие допущения:
– Атмосферная турбулентность, воздействующия на распространяющуюся волну, является статистически неоднородной.
– Принимаемое излучение оптической волны может быть
представлено, как результат процесса модуляции, при котором
мелкомасштабные флуктуации промодулированны крупкомасштабными флуктуациями.
– Мелкомасштабные и крупномасштабные процессы статистически независимы.
– Метод Рытова для описания сцинтилляций интенсивности
сигнала верен даже при режиме насыщения.
– Метод геометрической оптики может быть применен для
описания крупномасштабных флуктуаций излучения.
В рамках таких допущений было показано, что ячейки, содержащие турбулентности, действуют как рефракционные линзы с фокусной длиной порядка сотен и более метров, создающие
фокусный эффект или рефракционное рассеяние (термин, введенный в работах [22–25]). Данный тип рассеяния определяется
когерентной компонентой полного оптического сигнала, прохо262
дящего сквозь турбулентную атмосферу. Причем, наименьшие
по размеру ячейки турбулентности характеризуются слабыми
рефракционными свойствами, а наибольшие по размеру ячейки
характеризуются сильными рефракционными свойствами.
При распространении оптической волны в случайной среде
волна рассеивается наименьшими по размерам турбулентными
ячейками (с размерами порядка несколько миллиметров), создавая так называемый эффект дефокусировки или диффрекционного рассеяния (термин, введенный в работах [22–25]).
Такой тип рассеяния определяется некогерентной составляющей полного сигнала, действуя как дефорусирующие линзы,
уменьшающие амплитуду волны даже на коротких расстояниях. Как было показано в работах [5, 6, 19], в режиме сильных
флуктуаций коэффициент пространственной когерентности
волны ρ0 определяет масштаб корреляции флуктуаций излучения, а диск, моделирующий турбулентность и рассеивающий
волну, характеризуется толщиной, определяемой формулой:
R/ρ0k.
Дифференционный и рефракционный процессы рассеяния
являются дополняющими друг друга механизмами, и полный
процесс рассеяния действует как модуляция мелкомасштабных флуктуаций крупномасштабными флуктуациями. При
этом, мелкомасштабные сцинтилляции ассоциируются с турбулентными ячейками, меньшими по размерам по сравнению
с радиусом первой зоны Френеля R / k или с радиусом корреляции ρ0, в зависимости от того, которое из этих величин меньше по размеру.
Крупномасштабные флуктуации излучения оптической волны, наоборот, генерируются турбулентными ячейками с размерами, превышающими радиус первой зоны Френеля R / k или
масштаб рассеивающего диска R/kρ0, в зависимости от того, какая из этих величин больше по размеру. Эти флуктуации можно
описать с помощью методов геометрической оптики.
Итак, ввиду потерь в пространсвенной корреляции, только
очень большие ячейки, расположенные возле передатчика, дают
вклад в фокусирующий эффект при освещении малых диффракционных ячеек, расположенных возле приемника. Когда потери
в когерентности имеют место, освещение малых ячеек статистически неоднородно распределено по ячейкам, а сами флуктуации оптической волны вызваны случайной интерференцией
263
большого числа диффракционных рассеяний от малых турбулентных ячеек.
10.4. Влияние тропосферной турбулентности
на фединг оптического сигнала
Быстрый фединг оптического сигнала, определение которого
дано в гл. 5, на открытых беспроводных трассах обычно вызывается многолучевостью при распространении оптической волны
в атмосфере, содержащей либо гидрометеоры, либо турбулентности, либо и то и другое одновременно. Как было отмечено выше,
все эти факторы приводят к существенным вариациям индекса
рефракции в атмосфере, и, следовательно, к флуктуациям амплитуды, фазы и интенсивности оптической волны, что, как было
указано в гл. 5, приводит к возникновению быстрого фединга, зависящего или нет от несущей частоты излучаемой волны. Ниже
рассмотрим быстрый фединг через призму флуктуаций индекса
рефракций или его структурного параметра. Как было указано
выше, флуктуации интенсивности оптического сигнала, вызванные атмосферной турбулентностью, распределены согласно закона Гаусса или нормально-логарифмического закона. Используя
модель Колмогорова, можно показать, что нормированная стандартная девиация для данного распределения может быть представлена вместо формулы Рытова (10.18), записанной в в терминах Cn2 , следующей формулой в терминах Cε2 :
σ2 =
0,12 Cε2 k7 6d11 6 . (10.20)
Здесь, как и раньше, k = 2π/λ – волновой номер, и Cε2 – структурный параметр диэлектрической проницаемости турбулентности, усредненный по длине оптической трассы. Его связь
с введенным ранее структурным параметром индекса рефракции Cn2 вытекает из связи между индексом рефракции n и относительной диэлектрической постоянной среды εr, то есть, n2 = εr
(см. гл. 9).
В атмосфере структурный параметр Cε2 может изменяться
в широких пределах величины – от 10–15м–2/3 до 10–10м–2/3. Так
как усредненная по траектории статистика такого вида фединга
была оценена только эвристически, в работах [15, 16] была получена полуэмпирическая формула для описания нормированной
корреляционная временная функция вида
264
=
K ( τ)

×  1 + α4 4


(
)
11 12
где α = τ/τ0, τ0 =
1
×
sin ( π 12 )
53
 π 11
α2  11  α  
sin 
+ arctan
− 
 ,  12 6
2  6  2  


(10.21)
dk
, d – длина оптической трассы и v – проекv
ция скорости приемника в плоскости, перпендикулярной траектории распространения оптической волны. Время корреляции τc
вычисляется из равенства K(τc ) = 0,5 и может быть оценено величиной, равной τc≈0,62τ0. При этом спектр флуктуаций интенсивности волны определяется формулой [15, 16]
S ( ω) =β2 w ( ω) ω, (10.22)
что позволяет определить нормированную спектральную плотность мощности оптического сигнала
∞
w ( ω)= 4ω∫ dτ cos ( ωτ ) K ( τ ).
0
Эту плотность для высоких нормированных частот Ω = τ0ω
можно оценить следующим образом [15, 16]:
w(Ω
=
(10.23)
) 12,0 Ω−5 3 , Ω ≥ 5, а для низких частот может быть аппроксимирована в виде
[15, 16]:
w(Ω
=
) 3,47 Ω exp  −0.44 Ωϕ( Ω )  , Ω ≤ 5, 

(10.24)
ϕ( Ω
=
) 1,47 − 0,054 Ω. (10.25)
σ2θ =
0,075 Cε2k2dk0
где
Нормированная плотность мощности сигнала w(Ω) принимает максимальное значение, равное 2,30 при Ωm≈1,60, и, поэтому,
ωm≈1,60/τ0 [15, 16].
Флуктуации фазы оптической волны распределены также по
нормальному закону с дисперсией
−5 3
, (10.26)
265
где k0 = 2π/L0, и L0 – это внешний масштаб спектра турбулентностей, зависящий от высоты над земной поверхностью и меняющийся приблизительно в пределах от 10 до 100 метров. Оценки и
данные экспериментов [14–18] показали, что флуктуации фазы,
вызванные турбулентностями, незначительны в реальных атмосферных условиях даже при наличии сильных турбулентностей.
Подитоживая материал, изложенный в гл. 9 и 10, можно отметить, что все эффекты, вызванные гидрометеорами, такие как
многократное рассеяние, рефракция и фединг, вызванный атмосферными турбулентностями, должны быть учтены при прогнозировании приземных тропосферных и атмосферных беспроводных каналов оптической связи.
Следует подчеркнуть, что обсуждаемая выше частотная селективность каналов связи, вызванная рассеянием на турбулентностях, приводит в итоге к частотно-селективному федингу,
рассмотренному в гл. 5. Поэтому, для полной оценки эффектов
затухания и фединга оптического сигнала в беспроводных тропосферных каналах связи, необходимо создание реалистичных
моделей атмосферной турбулентности с учетом атмосферной
многослоевой структуры.
Литература
1. Brehovskih L. M. «Reflection of plane wave from layered
inhomogeneous media», Journal of Technical Physics, Moscow,
1949, vol. 19, pp. 1126–1135.
2. International
Telecommunication
Union,
ITU-R
Recommendation P.453–6, «The radio refractive index: its formula
and refractivity data», Geneva, 1997.
3. International
Telecommunication
Union,
ITU-R
Recommendation P.834–2, «Effects of tropospheric refraction on
radiowave propagation», Geneva, 1997.
4. Saunders S. R. Antennas and propagation for wireless
communication systems, New York: John Wiley & Sons, 1999.
5. Blaunstein N., Christodoulou Ch. Radio propagation and
adaptive antennas for wireless communication links: terrestrial,
atmospheric and ionospheric, Hoboken, New Jersey: Wiley
InterScience, 2007.
6. Blaunstein N., Arnon S., Zilberman A., Kopeika N. Applied
aspects of optical communication and LIDAR, Boca Roton, FL:
CRC Press, Taylor & Francis Group, 2010.
266
7. International
Telecommunication
Union,
ITU-R
Recommendation PN. 837, «Characteristics of precipitation for
propagating modeling», Geneva, 1992.
8. International
Telecommunication
Union,
ITU-R
Recommendation P. 618–5, «Propagation data and prediction
methods required for the design of Earth-space telecommunication
systems», Geneva, 1997.
9. Rappaport T. S. Wireless communications: principles and
practice, New York: IEEE Press, 1996.
10. Janaswamy R. «A curvilinear coordinate based splitstep parabolic equation method for propagation predictions over
terrain», IEEE Trans. Anten. Propagat., 1998, vol.46, no. 7, pp.
1089–1097.
267
ГЛАВА 11. ОПТИЧЕСКИЕ СИГНАЛЫ
В ОПТОВОЛОКОННЫХ
И АТМОСФЕРНЫХ КАНАЛАХ СВЯЗИ
Как было показано в гл. 5, беспроводные атмосферные каналы
связи подвержены федингу: а) медленному за счет дифракции и
затухания на гидрометеорах, и б) быстрому – за счет рассеяния
на движущихся под воздействием ветровых потоков турбулентных структурах. Особенно это проявляется в приземных и тропосферных беспроводных каналах оптической связи. В проводных оптоволоконных направляющих структурах фединг оптического сигнала вызван как многолучевостью распространения
оптических мод, так и неоднородностью материала внутренней
и внешей оплетки оптоволокна. Таким образом, оба вида каналов оптической связи можно считать селективными по частоте
и по времени, подверженными (за счет эргодичности процессов)
как частотной, так и временной дисперсии [1–3]. В течении последних десятилетий существенный прорыв был достигнут в изучении влияния неоднородной многослойной атмосферы, содержащей широкий спектр естественных неоднородных структур
(см. гл. 9), на вариацию параметров оптических сигналов с инфрормацией, таких как амплитуда, фаза и интенсивность [3–
13]. В большей мере это касается сцинтилляций интенсивности
сигналов с информацией, вызванных атмосферными турбулентностями [14–23] (см. гл. 9). Наблюдаемые на практике создания
оптических каналов связи фединг информационных сигналов
являются основным источником мультипликативных шумов,
которые, в отличие от аддитивного Гауссового шума, очень трудно предсказать ввиду его частотной и временной селективности
[11, 13, 24–28]. Поэтому, для достижения высоких скоростей и
качества передачи (т. е., без ошибок) оптических сигналов с информацией через канал связи, проводной оптоволоконный [36–
39] или атмосферный беспроводный [8–10], очень важно изучить
следующие аспекты.
Во-первых, это вопрос об уменьшении влияния мультиселективного фединга посредством изучения процессов распространения волн в оптических каналах связи. Во-вторых, анализ
влияния того или иного канала связи, то есть, его отклик на
распространяющиеся оптическией волны. В-третьих, это оптимальный подбор соответствующих функций распределения сиг268
нала в дисперсном по времени и по частоте канале оптической
связи. Таких, например, как функций распределения Райса [11,
13] и Гамма-Гамма [8–10], а также анализ связи между ними посредством параметра Райса K, введенного в работах [14, 36, 37]
(см. гл. 5).
Ниже при анализе атмосферного оптического канала, мы
представим соответствующие формулы для каждого из указанных выше параметров канала и сигнала. Это будет достигнуто
посредством введения фактора фединга K, который определим
через индекс сцинтилляции по интенсивности σ2I и через структурный параметр индекса рефракции Cn2 . Последний параметр
обычно определяется в атмосферных беспроводных каналах связи через данные измерений в ходе реальных оптических (лазерных) экспериментов. В проводных оптоволоконных каналах, мы
свяжем пропускную способность или емкость канала с параметрами временной дисперсии оптических импульсов, источником
которой является многолучевость распространения оптических
волн в оптоволокне и неоднородность материала оптоволокна,
из которого изготовлены ее внутренняя и внешняя оплетки (см.
гл. 8). При анализе ошибок при передаче дискретной оптической
информации через оптические проводные и беспроводные каналы связи, мы будем основываться на определениях, введенных
в гл. 3, и на теоретических основах кодирования оптических информационных сигналов, приведенных в гл. 7.
11.1. Основные параметры потока информации
в каналах оптической связи
Известно, что емкость любого проводного и беспроводного
канала связи определяют из классической теории, как поток
информационных сигналов, пропускаемых в единицу времени
каналом связи, измерямый в битах на секунду (бит/сек) [1–3].
Был предложен ряд методов оценки емкости того или иного
канала связи, как радио, так и оптического, основанные на использовании теоремы Шеннона-Хартли, называемой в литературе классической [1–3, 11, 13, 14, 29–35]. Однако, эта теорема
устанавливает логарифмическую связь между емкостью канала
связи и белым или аддитивным шумом (названным в литературе AWGN, смотри определения в гл. 4 и 5), описываемый Гауссовыми PDF и CDF [1–3, 11, 13, 14]. Недавно был предложен другой
подход, учитывающий в формуле Шеннона не только Гауссовый
269
аддитивный шум, но и мультипликативный шум, описываемый
параметром фединга Райса K [1–3, 11, 13, 14]. Несмотря на то,
что данный вопрос обсуждался в гл. 5 и 7, мы вкратце к нему
вернемся для наглядности изложения вопроса, обсуждаемого
ниже.
Как было отмечено в гл. 7, согласно классическим теоремам
Шеннона-Хартли, емкость или пропускная способность информационного потока в AWGN канале с полосой пропускания
Bω [в Гц] прямо пропорциональна этой полосе Bω и логорифмически зависит от Гауссового аддитивного шума через отношения мощности сигнала с информацией к мощности шума
(Nadd = N0addBω):


S
C Bω log2 1 +
=
 , áèò/ñåê,  N0add Bω 
(11.1)
где S – это мощность сигнала с информацией, и N0add – спектральная плотность мощности аддитивного или белого шума [в
Вт/Гц]. Само отношение сигнала к шуму обозначают либо SNR,
либо S/N [8, 13, 14].
Зачастую, в литературе по информатике и связи вводят другую
характеристику канала связи, называемую спектральной эффективностью канала, в случае, когда рассматривается только
логарифмическая функция от SNR [1–3, 13, 14, 29–37]:
C
=


C
S
= log2 1 +
 , áèò/ñåê/Ãö, Bω
 N0add Bω 
(11.2)
При использовании второго подхода, как было указано выше,
кроме N0add, была введена спектральная плотность мультипликативного шума N0mult, которая умноженная на полосу частот,
занимаемую этим шумом в канале связи, BW, определяет мощность мультипликативного шума Nmult. В этом случае, вместо
классической формулы Шеннона, получаем [36, 37]:
270


S
C=
Bω log2  1 +
=
N
N
+
add
mult 



S
= Bω log2 1 +
. N
B
N
B
+
0add ω
0mult Ω 

(11.3)
Формулу (11.3) можно записать следующим образом


S
C=
Bw log2  1 +
=
Nadd + Nmult 

−1
 N
N
 
= Bw log2  1 +  add + mult     S
S  


(11.4)
и учесть тот факт, что параметр Райса можно записать как отношение мощности сигнала к мощности мультиплитикативного
щума [13, 14, 36, 37], а именно, K = S/Nmult. В итоге, после простых преобразований формулы (11.4) в обозначениях отношения
сигнала к аддитивному шуму, SNRadd, и вводя параметр фединга K, имеем:

K ⋅ SNRadd
C Bω log2  1 +
=
K
+ SNRadd


. 
(11.5)
Соответственно, формула (11.3) для спектральной эффективности канала связи пробразуется следующим образом:
C
=

K ⋅ SNRadd
C
= log2  1 +
Bω
K
+ SNRadd


. 
(11.6)
Анализ, проведенный в работах [36, 37], и сопоставление
с классической теоремой Шеннона-Хартли показали, что формула (11.2) и формула (11.6) с одинаковой точностью описывают емкость канала. Однако формула (11.6) корректна при условии превышения параметром K отношения SNRadd, то есть,
при K > 1. С целью наглядности, на рис. 11.1 представлен расчет
спектральной плотности, описываемый формулой (11.2) (пунктирные кривые) и формулой (11.6) (сплошные кривые) для трех
различных значений SNRadd согласно расчетов, представленных в работе [37].
Видно, что с увеличением SNRadd (от 1дБ до 10дБ) спектральная эффективность канала связи увеличивается более, чем в три
раза. Кроме того, видно, что оба подхода, классический Шеннона и расширенный [36, 37], дают близкие результаты при K > 1.
Этот эффект более нагляден, когда аддитивный шум в децибелах становится меньше, чем параметр K, измеряемый в децибелах, то есть, при SNRadd ≤ 10 dB.
271
~
C
3.5
SNRadd 10 дБ
3.0
2.5
2.0
SNRadd 5 дБ
1.5
1.0
SNRadd 1 дБ
0.5
10
20
30
~
Классическая C
К
50
40
~
Аппроксимированная C
Рис. 11.1. Спектральная эффективность
как функция от K-фактора
Возможно также решить обратную задачу – выразить параметр фединга K через емкость или спектральную эффективность, используя результаты, полученые в работах [14, 36, 37], а
также формулы (11.5) и (11.6), а именно:
 C

SNRadd  2 Bw − 1 



SNRadd 2C − 1




.
=
K =

 C
 SNR
− 2C − 1
add
SNRadd −  2 Bw − 1 






(
(
)
)
(11.7)
Формула (11.7) показывает связь между спектральной эффективностью оптического канала, проводного (оптоволоконного) и
беспроводного (атмосферного), подверженного федингу, и параметром K, определяющим степень воздействия канала с федингом на прохождение через него оптического сигнала.
Так как в основном через оптический канал связи распространяются сигналы с информацией, представленной в виде
последовательности битов, то, как показано в гл. 5, очень важ272
ной характеристикой воздействия фединга в канале связи – это
ошибка в передаче битов по каналу с федингом. Ее обозначают
в литературе через аббреаиатуру BER и определяют классической формулой [29–35] (см. также гл. 7):
∞
BER =
 SNR 
1
PDF ( x ) erfc 
x  dx. 2∫
 2 2 
(11.8)
0
Здесь PDF(x) – плотность функции распределения, описывающая процесс изменения амплитуды или интенсивности сигнала; erfc(•) – функция ошибок, определенная в гл. 5 и 7.
Используя теперь распределение Райса и соответствующее
ему PDF через параметр K фединга (см. гл. 5) можно, следуя работе [36], получить связь между BER, SNRadd, дисперсией σ и
параметром K [36]:
∞
x2
1 x − 2σ2 − K  x

BER ( K, SNRadd , σ )
e
e I0 
2K  ×
=
2 ∫ σ2
σ

0


K ⋅ SNRadd
x  dx
× erfc 
 2 2 ( K + SNR

add ) 

(11.9)
Данная формула, устанавливающая связь между BER,
SNRadd и параметром K, позволяет оценить априори степень
влияния фединга (через дисперсию σ и отношение полезного
сигнала к аддитивному шуму SNRadd в канале) на вероятность
потерь или искажения последовательности битов информации
внутри проводного или беспроводного канала оптической связи.
11.2. Связь между параметрами оптических сигналов
и характеристиками беспроводных
и проводных каналов связи
В данном параграфе мы рассмотрим связь между ключевыми
параметрами информационных оптических сигналов, представленными выше, и характеристиками беспроводного тропосферного канала связи, введенными в гл. 9 и 10, а также связь с емкостью проводного оптоволоконного канала связи, рассмотренной
в гл. 8.
273
Атмосферный канал оптической связи. В случае атмосферного беспроводного канала связи, мы будем придерживаться
методов, представленных в работах [14, 36, 37] и полученными
в них оценками параметров атмосферного канала связи.
Вначале мы рассмотрим связь между интенсивностью сцинтилляций оптических сигналов, σ2I , вызванных неоднородностью атмосферы, содержащей гидрометеоры и турбулентные газовые структуры, которую называют индексом сцинтилляций
интенсивности сигнала (см. гл. 10), с параметром фединга K,
характеризующим степень влияния канала на распространяющуюся в нем информацию. Следуя работам [13, 14, 36, 37], эту
связь для случайных процессов с нулевым средним значением
флуктуаций параметров сигнала можно представить следующим образом [1–3]:
2
σ=
I
2
Iinc
2
Ico
≡ K −2 . (11.11)
Здесь, согласно гл. 10, Ico и Iinc являются когерентной и некогерентной компонентой полной интенсивности оптического
сигнала Itotal = Ico+Iinc. Ранеее, в гл. 10, мы показали прямую
связь между индексом сцинтилляции σ2I оптического сигнала
и структурным параметром индекса рефракции Cn2 , который
можно оценить экспериментально для любых сценариев состояния атмосферного канала связи (см. гл. 10). Из этих экспериментальных данных следует, что для ночной приземной тропосферы Cn2 ≈ 10−15 ì −2/3 , тогда как для дневной приземной атмосферы Cn2 ≈ 10−13 ì −2/3 .
Тогда, используя формулу (11.11), получаем значения фактора фединга K, а через него, параметры атмосферного канала
связи с федингом и потока информации, проходящего через данный беспроводный канал связи. Другими словами, определим
емкость, спектральную эффективность канала и ошибку в передаче битов информации, соответственно. Предложенный в работах [14, 37] алгоритм связи и вычисления параметров – один
за другим, представлен на рис. 11.2, который можно объяснить
следующим образом.
Вначале экспериментально измеряют структурный параметр
рефракции Cn2 , позволяющий затем, используя соответствующие формулы, представленные в гл. 9, получить значения σ2I ,
274
2
Cn
2
σI
K
SNR
BER
C
∼
С
Рис. 11.2. Графическая презентация алгоритма нахождения
параметров канала и информационного сигнала согласно [14, 37]
и через него, по формуле (11.11) – значения параметра фединга
K. Затем, имея информацию об оптической системе, из которой
следует информация об отношении полезного сигнала к аддитивному Гауссовому шуму, SNRadd, вычисляют емкость или
спектральную эффективность по формулам (11.5) и (11.6), соответственно, а затем и вероятность ошибок при передаче информации через канал связи, подверженный федингу, то есть, параметр BER по формуле (11.9).
Используя данный алгоритм была расчитана зависимость
спектральной эффективности канала от параметра фединга K,
представленная для нескольких значений SNRadd = 1,2, 10 дБ на
рис. 11.3. Из представленных иллюстраций на рис. 11.3 следует,
что с увеличением SNR наблюдается существенное увеличение
спектральной эффективности канала.
В тоже время, несмотря на увеличение или уменьшение отношения сигнала к шуму, при увеличении K-фактора, начиная
с K>10, наблюдается насыщение зависимости C (K) и в дальнейшем, при увеличении параметра K, спектральная эффективность, или при заданной полосе пропускания канала связи, пропускная способность канала связи стремится к насыщению.
Был проведён расчет вероятности ошибок при передаче потока битов информации через атмосферный канал оптической
связи посредством вычисления параметра BER, определенно275
3.5
3.0
∼
С [ Бит / сек / Гц ]
2.5
2.0
1.5
1.0
0.5
0
50
100
SNR= 1 дБ
SNR= 2 дБ
150
200
К-фактор
250
300
SNR=3 дБ
Рис. 11.3. Параметр C как функция от K-фактора
для SNRadd = 1дБ (пунктирная кривая), 2дБ (точечная кривая),
и 10дБ (сплошная кривая)
го согласно формуле (11.9). Один из расчётов представлен на
рис. 11.4 для случая сильной турбулентности в виде функции
длины оптической трассы, L, изменяющейся от 0,4 км до 6 км,
для различных значений SNR, полученных по данным экспериментов, описанных в гл. 10.
Как показали эксперименты, на трассах меньших 0,4 км
ошибка в передаче бытов информации ничтожно мала, а на
трассах, превышающих 6 км, оптические системы связи, основанные на лазерах, в настоящее время обычно не используются
[4, 7–10].
Из рис. 11.4 легко видеть, что с увеличением SNR, уменьшается вероятность ошибки при передаче битов информации.
Так, если при SNR = 5дБ параметр BER меняется от ∼1,5⋅10–3
(при L = 0,4 км) до ∼10–2 (при L = 6 км) , то при SNR = 20 дБ, BER
меняется от ∼3,5⋅10–5 (при L = 0,4 км) до ∼2⋅10–4 (при L = 6 км),
то есть, увеличивается вероятность ошибки с возрастанием
длины оптической трассы за счет увеличивающего влияния
сильной турбулентности, расположенной вдоль трассы распро276
0.1
< BER >
0.01
SNR=5 дб
0.001
SNR=10 дб
0.0001
SNR=15 дб
SNR=20 дб
0.00001
100
1000
10000
L[м]
Рис. 11.4. Средние значения BER в атмосферных оптических каналах
при наличии сильной турбулентности, как функция длины оптической трассы связи L, при SNR = 5, 10, 15, и 20дБ (согласно[14, 37])
странения оптических сигналоы с информацией на высотах
100–500 метров.
Данные расчеты были обобщены как для сильных, так и для
слабых турбулентностей посредством изменения индекса сцинтилляции, а через него – изменения параметра фединга K от 0
(сильный фединг) до 10 (слабый фединг), при различных значений SNR, меняющихся от 1 до 10 дБ. Результаты расчетов на
основе экспериментов, описанных в работах [14, 37], представлены в трехмерном формате на рис. 11.5.
Из представленного трехмерного графика видно, что при
0<K<1 и при SNR>5дБ наблюдается резкое уменьшение BER –
от ~0.3 до ~0,0003, то есть, на три порядка, уменьшая в итоге
количество битов с ошибками в потоке данных на три порядка
и выше.
В тоже время, как было указано в работе [36], и как следует
из рис. 11.3, спектральная эффективностьтакже растет с увеличением параметра фединга K. При этом увеличение спектральной эффективности канала беспроводной связи (от 0,2 до 0,8)
приводит к резкому уменьшению BER от 0,3–0,5 до 0,003–0,005,
эффект, зависяший от отношения сигнала к белому аддитивному шуму в канале, то есть уменьшается с увеличением SNR.
Оптоволоконный канал связи. Как было указано в гл. 9,
в волоконно-оптических проводных каналах связи фединг воз277
Рис. 11.5. Трехмерный график зависимости BER
от K и параметра SNR, дБ
можен за счет двух факторов, а именно, многолучевой интерференции лучей в оптоволокне, как направляющей многомодовой
волноводной структуре, и дисперсионных свойств материала
внутренней и внешней оплеткам оптоволокна за счет его неоднородной структуры по длине проводного канала. Дисперсия обоих типов была рассмотрена в гл. 8, однако для наглядности, мы
приведем еще раз основные формулы, позводяющие установить
связь между параметрами проводного оптического канала и параметрами оптического сигнала, несущего дискретную (битовую) информацию.
Так, дисперсию по времени запаздывания τ последовательности импульсов по длине l оптического волокна, Δ(τ/l), можно
определить посредством знания индексов рефракции его внутреннего и внешнего оптического кабелей, соответственно, n1 и
n2, а именно,
278
n
τ n
∆   = 1 (n1 − n2 ) = 1 ∆. l
cn
c
 
2
(11.12)
В случае многомодовой дисперсии, уширение импульсов информации по длине волокна по времени определится (см. гл. 8)
следующей формулой
=
∆T
l ⋅ n12
l ⋅ n1
∆∝
∆. cn2
cn2
(11.13)
В случае дисперсии, возникающей за счет неоднородности
материала, то согласно формуле (8.52) из Главы 8, имеем
τ
∆   = − M∆λ, l
(11.14)
где все параметрв приведены в гл. 8.
Тогда ограничения в емкости дискретного потока данных, передаваемых по оптоволокну, зависит от типа импульсов-битов,
либо возвратных (RZ), либо невозвратных (NRZ) к нулю (смотри
определения в гл. 3). Так для невозвратных к нулю информационных кодов полная по длине оптического кабеля емкость определяется следующей эмпирической формулой, полученной на
практике [14]:
0,7
, CNRZ × l =
∆(τ / l)
(11.15а)
а для возвратных к нулю кодов имеем [14]:
0,35
. CRZ × l =
∆(τ / l)
(11.15б)
На рис. 11.6, а, б представлены диаграммы алгоритмов вычисления пропускной способности оптических оптоволоконных
каналов связи по данным значений временной дисперсии канала за счет многомодовой картины распространения и за счет неоднородности материала, соответственно.
Используя численные данные для дисперсии материалов,
представленные в гл. 8, получим следующие формулы для оценки емкости оптоволоконного канала для обоих типов дискретных кодов, передаваемых по каналу, соответственно:
и
=
CNRZ × l 1,75, (Ìáèò/ñ) × êì (11.16a)
279
а)
б)
По формуле
(8.53)
n 1, n 2
М
τ
∆ 
l
τ
∆ 
l
l, км
C RZ
C NRZ
l, км
C RZ
C NRZ
Рис. 11.6. Диаграмма вычисления емкости канала:
а – по значению многомодовоости потока
оптических сигналов на длине канала связи l;
б – по значению дисперсии материала М на длине канала связи l
Рис. 11.7. Пропускная способность оптоволоконного канала длиной
в 1 км в зависимости от относительной разности между
индексами рефракции внутреннего и внешней оплетки оптоволокна
280
=
CRZ × l 0.875, (Ìáèò/ñ) × êì. (11.16б)
На рис. 11.7 представлена зависимость емкости оптоволокна
от относительной разности между индексами рефракции внутреннего и внешней оплетки оптоволокна по длине канала в 1
км при n1 = 1,46 согласно формуле (11.12).
Из рис. 11.7 следует, что при увеличении различия между индексами рефракции во внешнем и во внутреннем кабеле оптоволокна
(смотри структуру оптоволокна в гл. 8) емкость такого канала связи, и следовательно, максимальная скорость передачи дискретных
оптических сигналов по волокну экспоненциально уменьшается.
Таким образом, путем подбора материалов для внешней и внутренней оплетки оптоволокна, а именно, уменьшения различия между
ними, можно добиться существенного понижения временных дисперсионных эффектов в оптическом канале, и тем самым – увеличение емкости оптического проводного канала связи.
Литература
1. Papoulis P. Probabilistic variables and stochastic processes.
New York: McGraw –Hill, 1991.
2. Stuber G.L. Principles of mobile communication, Kluver,
1996.
3. Proakis J. G. Digital communication, 4th Ed, New York:
McGraw –Hill, 2001.
4. Tatarski V. I. Wave propagation in a turbulent medium, New
York: McGraw-Hill, 1961.
5. Ishimaru A. Wave Propagation and scattering in random
media, New York: Academic Press, 1978.
6. Stremler F. G. Introduction to communication systems,
Addison-Wesley Reading, 1982.
7. Banakh V. A., Mironov V. L. LIDAR in a turbulence atmosphere,
Dedham: Artech House, 1987.
8. Andrews L. C., Phillips R. L. Laser beam propagation through
random media, SPIE Optical Engineering Press, Bellingham, WA,
1998.
9. Kopeika N. S. A System engineering approach to imaging,
SPIE Optical Engineering Press, Bellingham, WA, 1998.
10. Andrews L. C., Phillips R. L., Hopen C. Y. Laser beam
scintillation with applications, SPIE Optical Engineering Press,
Bellingham, WA, 2001.
281
11. Saunders S. R. Antennas and propagation for wireless
communication systems, New York: John Wiley & Sons, 1999.
12. Andrews L. C. Special functions of mathematics for engineers,
2th Ed., SPIE Optical Engineering Press, Bellingham; England:
Oxford University Press, 1998.
13. Blaunstein N., Christodoulou Ch. Radio propagation and
adaptive antennas for wireless communication links: Terrestrial,
atmospheric and ionospheric, New Jersey: Wiley InterScience,
2006.
14. Blaunstein N., Arnon S., Zilberman A., Kopeika N. Applied
aspects of optical communication and LIDAR, Boca Roton, FL:
CRC Press, Taylor & Francis Group, 2010.
15. Kolmogorov A. N. «The local structure of turbulence
incompressible viscous fluid for very large Reynolds numbers,»
Reports of Acad. of Sci. USSR, vol. 30, pp. 301–305,
16. Monin A. S., Obukhov A. M. «Basic law of turbulent mixing
near the ground,» Trans. Akademy of Science., 1954, vol. 24,
no.151, pp. 1963–1987.
17. Kopeika N. S., Kogan I., Israeli R., Dinstein I. «Prediction of
image propagation quality through the atmosphere: The dependence
of atmospheric modulation transfer function on weather,» Optical
Engineering, 1990, vol. 29, no. 12, pp.1427–1438.
18. Sadot D., Kopeika N. S. «Forecasting optical turbulence
strength on basis of macroscale meteorology and aerosols: models
and validation,» Optical Engineering, 1992, vol. 31, pp. 200–212.
19. Sadot D., Shemtov D., Kopeika N. S. «Theoretical and
experimental investigation of image quality through an
inhomogeneous turbulent medium,» Waves and Random Media,
1994, vol. 4, no. 2, pp. 177–189.
20. Hutt D. L. «Modeling and measurements of atmospheric
optical turbulence over land,» Optical Engineering, 1999, vol. 38,
no. 8, pp. 1288–1295.
21. Bedersky S., Kopeika N., Blaunstein N. «Atmospheric
optical turbulence over land in middle east coastal environments:
prediction modeling and measurements», J. Applied Optics, 2004,
vol. 43, pp. 4070–4079.
22. Bendersky S., Kopeika N., Blaunstein N. «Prediction and
modeling of line-of-sight bending near ground level for long
atmospheric paths», Proc. of SPIE International Conference, San
Diego, USA, 2004, August 3–8, pp. 512–522.
282
23. Bendersky N., Kopeika N., Blaunstein N. «Atmospheric
optical turbulence over land in middle east coastal environments:
prediction modeling and measurements», J. Applied Optics, 2004,
vol. 43, pp. 4070–4079.
24. Zhang W., Tervonen J. K., Salonen E. T. «Backward and
forward scattering by the melting layer composed of spheroidal
hydrometeors at 5–100 GHz,» IEEE Transactions, 1995, pp. 223–
230.
25. Macke A., Mishchenko M. «Applicability of regular
particle shapes in light scattering calculations for atmospheric ice
particles,» Applied Optics, 1996, vol. 35, pp. 4291–4296.
26. Hovenac E. A. «Calculation of far-field scattering from
nonspherical particles using a geometrical optics approach,» J.
Applied Optics, 1991, vol. 30, pp. 4739–4746.
27. Spinhirme J. D., Nakajima T. «Glory of clouds in the near
infrared,» J. Applied Optics, 1994, vol. 33, pp. 4652–4662.
28. Duncan L. D., Lindberg J. D., Loveland R. B. «An empirical
model of the vertical structure of German fogs,» ASL-TR-0071,
US Army Atmospheric Sciences Laboratory, N. Mex.: White Sands
Missile Range, 1980.
29. Goldsmith A. J., Greenstein L. J., Foschini G. L. «Error
statistics of real-time power measurements in cellular channels
with multipath and shadowing», IEEE Trans. Vehicular Technol.,
1994, vol. 43, no. 3, pp.439–446.
30. Goldsmith A. J. «The capacity of downlink fading channels
with variable rate and power», IEEE Trans. Vehicular Technol.,
1997, vol. 46, no.3, pp.569–580.
31. Goldsmith A. J., Varaiya P. P. «Capacity of fading channels
with channels side information», IEEE Trans. Information Theory,
1997, vol. 43, no. 6, pp. 1986–1992.
32. Biglieri E., Proakis J., Shamai S. «Fading channels:
Information theoretic and communication aspects», IEEE Trans.
Information Theory, 1998, vol. 44, no. 6, pp. 2619–2692.
33. Alouini M.-S., Simon M. K., Goldsmith, A. J. «Average BER
performance of single and multi carrier DS-CSMA systems over
generalized fading channels», Wiley Journal on Wireless Systems
and Mobile Computing, 2001, vol. 1, no. 1, pp. 93–110.
34. Telatar I. E., Tse D. N. C. «Capacity and mutual information
of wideband multipath fading channels», IEEE Trans. Information
Theory, 2000, vol. 46, no. 4, pp. 1384–1400.
283
35. Winters J. H. «On the capacity of radio communication
systems with diversity in a Rayleigh fading environments», IEEE
Selected Areas in Communication, 1987, vol. 5, pp. 871–878.
36. Yarkoni N., Blaunstein N. «Capacity and spectral efficiency
of MIMO wireless systems in multipath urban environments with
fading», Proc. of European Conf. on Antennas and Propagation,
Nice, France, 2006, 6–10 Nov., pp.316–321.
37. Tiker A., Yarkoni N., Blaunstein N., Zilberman A., Kopeika N.
«Prediction of data stream parameters in atmospheric turbulent
wireless communication links», J. Applied Optics, 2007, vol. 46,
no. 2, pp. 190–199.
38. Blaunstein N., Plohotniuk E. Ionosphere and applied aspects
of radio communication and radars, New York: CRC Prress, Taylor
& Francis Group, 2008.
284
СОДЕРЖАНИЕ
Основные обозначения и символы............................................ 3
Часть I. ФУНДАМЕНТАЛЬНЫЕ АСПЕКТЫ
СИСТЕМ ОПТИЧЕСКОЙ СВЯЗИ
Глава 1. Основные элементы оптической связи........................... 7
1.1. Частотный спектр оптических волн.............................. 7
1.2. Развитие оптической связи в исторической перспективе.. 8
1.3. Представление канала оптической связи....................... 10
Литература..................................................................... 14
Глава 2. Основы распространения оптических волн.................... 2.1. Единая электромагнитная природа оптических волн
и радиоволн.............................................................. 2.2. Базовые аспекты распространенмя оптических волн....... 2.3. Распространение оптических волн
в свободном пространстве........................................... 2.4. Распространение оптической волны
через границу двух сред.............................................. 2.5. Полное внутреннее отражение в оптике......................... 2.6. Распространение оптических волн
в материальных средах............................................... Литература..................................................................... 15
15
18
21
22
27
32
37
Часть II. ОСНОВЫ ПРОВОДНОЙ И БЕСПРОВОДНОЙ СВЯЗИ
Глава 3. Типы сигналов в оптических каналах связи................... 3.1. Классификация оптических сигналов........................... 3.2. Математическое описание узкополосных сигналов......... 3.3. Математическое описание широкополосного сигнала...... Литература..................................................................... 41
41
46
56
59
Глава 4. Фединг в оптических каналах связи............................. 4.1. Параметры и типы фединга в оптических каналах связи.. 4.2. Типы мелкомасштабного фединга................................. 4.3. Математическое описание быстрого Фединга................. 4.4. Математическое описание медленного Фединга.............. Литература..................................................................... 61
62
67
71
79
81
Глава 5. Модуляция сигналов в оптических каналах связи.......... 83
5.1. Аналоговая модуляция – типы и принципы................... 84
5.2. Цифровая модуляция оптических сигналов................... 92
Литература..................................................................... 105
Глава 6. Оптические источники и детекторы.............................. 106
6.1. Эмиссия и поглощение оптических волн........................ 106
6.2. Лазеры..................................................................... 108
6.3. Источники – эмиттеры света и детекторы...................... 113
285
6.4. Принципы прямого детектирования и модуляции.......... 118
Литература..................................................................... 129
Глава 7. Кодирование в оптических каналах связи..................... 130
7.1. Основные понятия кодирования с исправлением ошибок. 130
7.2. Коды с алгебраическим декодированием....................... 146
7.3. Коды с малой плотностью проверок на четность.............. 158
7.4. Способы комбинирования кодов................................... 171
7.5. Кодирование в оптических каналах.............................. 174
Литература..................................................................... 179
Глава 8. Световые волны в направляющих оптических
структурах............................................................................ 184
8.1. Световые волны в двумерной направляющей пластине.... 184
8.2. Распространение оптической волны
в трехмерной цилиндрической структуре...................... 190
8.3. Оптоволоконные Структуры........................................ 199
8.4. Дисперсионные свойства оптоволоконных структур........ 206
Литература..................................................................... 214
Часть III. ОПТИЧЕСКИЕ ВОЛНЫ В БЕСПРОВОДНЫХ
АТМОСФЕРНЫХ КАНАЛАХ СВЯЗИ
Глава 9. Атмосферные каналы оптической связи........................ 217
9.1. Структура атмосферы................................................. 217
9.2. Основные параметры тропосферы................................. 219
9.3. Состав тропосферы..................................................... 220
9.4. Атмосферная турбулентность....................................... 230
Литература..................................................................... 245
Глава 10. Влияние неоднородной многослойной атмосферы
на распространение оптических волн........................................ 251
10.1. Тропосферная рефракция........................................... 251
10.2. Рассеяние в тропосфере от гидрометеоров..................... 256
10.3. Влияние атмосферной турбулентности
на сцинтилляцию параметров оптической волны.......... 259
10.4. Влияние тропосферной турбулентности
на фединг оптического сигнала................................... 264
Литература..................................................................... 266
Глава 11. Оптические сигналы в оптоволоконных
и атмосферных каналах связи.................................................. 268
11.1. Основные параметры потока информации
в каналах оптической связи....................................... 269
11.2. Связь между параметрами оптических сигналов
и характеристиками беспроводных
и проводных каналов связи........................................ 273
Литература ..................................................................... 281
286
Научное издание
Блаунштейн Натан Шаевич,
Крук Евгений Аврамович,
Сергеев Михаил Борисович
ОПТИЧЕСКАЯ СВЯЗЬ:
ОПТОВОЛОКОННАЯ,
АТМОСФЕРНАЯ
Mонография
Публикуется в авторской редакции
Компьютерная верстка А. Н. Колешко
Сдано в набор 15.10.16. Подписано к печати 26.12.16. Формат 60 × 84 1/16.
Усл. печ. л. 12,6. Тираж 500 экз. (1-й завод 100 экз.). Заказ № 515.
Редакционно-издательский центр ГУАП
190000, Санкт-Петербург, Б. Морская ул., 67
Документ
Категория
Без категории
Просмотров
25
Размер файла
6 493 Кб
Теги
blaynsteinkryk
1/--страниц
Пожаловаться на содержимое документа