close

Вход

Забыли?

вход по аккаунту

?

Prilipko1

код для вставкиСкачать
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное
образовательное учреждение высшего образования
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ
В. К. Прилипко, И. И. Коваленко
ФИЗИЧЕСКИЕ ОСНОВЫ
КВАНТОВЫХ ВЫЧИСЛЕНИЙ:
ОТ БИТОВ К КУБИТАМ
Учебное пособие
Санкт-Петербург
2016
УДК530.145
ББК 22.314
П76
Рецензенты:
доктор физико-математических наук, профессор В. В. Федоров;
доктор физико-математических наук, профессор В. Г. Фарафонов
Утверждено
редакционно-издательским советом университета
в качестве учебного пособия
Прилипко, В.К.
П76 Физические основы квантовых вычислений: от битов к кубитам:
учеб. пособие / В. К. Прилипко, И. И. Коваленко. – СПб.: ГУАП,
2016. – 179 с.
ISBN 978-5-8088-1141-6
Излагаются физические основы квантовых вычислений. Рассматриваются причины, приведшие к возникновению нового подхода к теории информации. Предлагается математический аппарат
квантовых вычислений. Для лучшего усвоения материала в пособие
включены многочисленные примеры и задачи.
Особый раздел пособия составляют Приложения.
Издание предназначено для студентов старших курсов технических специальностей, магистров и аспирантов».
УДК 530.145
ББК 22.314
ISBN 978-5-8088-1141-6
©
©
Прилипко В. К., Коваленко И. И., 2016
Санкт-Петербургский государственный
университет аэрокосмического
приборостроения, 2016
«Почему физик преподает курс информации?
Дело в том, что, по крайней мере, несколько
десятилетий физика информации и вычислений
является общепризнанной дисциплиной».
Дж. Прескилл.
Квантовая информация
и квантовые вычисления [1].
ПРЕДИСЛОВИЕ
В середине 80-х годов XX в. в научном сообществе благодаря
усилиям нового поколения физиков-теоретиков, активно использующих в своей работе компьютер, на стыке физики, классической
теории информации и математики возникло и активно развивается
новое направление – квантовая теория информации.
В этом предмете наиболее отчетливо прослеживается физическая природа информации. Одновременно квантовая теория информации приводит к новому пониманию физики: физические
системы могут мыслиться как компьютеры, вычисляющие информацию. При этом процессором квантового вычислителя могут служить ансамбли частиц, поведение которых продиктовано законами квантовой механики: электроны, фотоны, атомы, ионы и т. д.
Такие квантовые ансамбли обладают особыми свойствами, непостижимыми в рамках классических представлений: это когерентные суперпозиции квантовых состояний и явление запутанности.
Указанные свойства позволяют производить вычисления, объемы
которых и темп существенно выше, чем у классических компьютеров, а также обеспечивать абсолютно защищенную от подслушивания передачу информации по квантовым каналам в устройствах
квантовой криптографии.
Информация и вычисление – основные понятия, определяющие
работу любой вычислительной машины, – от простейшего калькулятора в вашем мобильном телефоне до современного многоядерного компьютера. С позиций физика, как одно, так и другое представляют собой физические объекты. Информация – это нечто, закодированное в состоянии физической системы, вычисление – проявление ее динамики.
Современному специалисту по информационным системам необходимо понимание физических принципов работы компьютеров и вытекающих из них ограничений или, напротив, открывающихся новых,
3
не виданных прежде возможностей. В качестве примера обратимся
к проблеме точного моделирования поведения физических тел.
Эта задача может быть решена точно только на основе законов
квантовой механики. Точное моделирование квантовых объектов
усложняется необычностью законов квантовой физики. На какомто этапе это должно сказаться на принципах вычислений. Сложность таких расчетов на классическом компьютере зачастую столь
велика, что даже самые прогрессивные многоядерные компьютерные ассоциации не в состоянии выполнять эти расчеты за разумное время. Так, для расчета молекулы метана требуется провести
вычисления методом сеток в 1042 точках [2]. Если считать, что
в каждой точке следует выполнить десять элементарных операций
и предположить, что вычисления производятся при сверхнизких
температурах, то для расчета молекулы метана потребуется израсходовать энергию, производимую на Земле примерно за одно столетие! Этот феноменальный результат вытекает из второго начала
термодинамики.
Таким образом, встает вопрос, можно ли моделировать на компьютере реальные физические объекты, состоящие из огромного
числа атомов. Ответ на этот вопрос напрашивается сам по себе – существующие компьютеры с архитектурой фон Неймана не в состоянии производить такие вычисления.
В начале 80-х годов ХХ в. было высказано предположение [3,
4], что трудность может быть преодолена, если для вычислений использовать квантовую систему – так называемый квантовый компьютер. Наши представления об информации при этом претерпели
значительные изменения.
Полезно разобраться в том, что нового вносит в этот вопрос
квантовая теория. Во-первых, получение информации как процесс
измерительный неизбежно возмущает измеряемый объект, вовторых, измерение несет в себе элемент случайности. В классической физике такие проблемы не возникают. Например, случайный
характер квантовой информации приводит к тому, что ее невозможно воспроизвести абсолютно точно (принцип невозможности
клонирования У. Вутерса, У. Зурека [5] и Д. Дикса [6], 1982 г.).
Действительно, всякое копирование неизбежно возмущает копируемую систему, и потому копия должна отличаться от оригинала.
Особенно тщательно драматические отличия классической информации от квантовой были исследованы Д. Беллом в 1964 г. [7].
Было установлено, что невозможно, оставаясь в рамках классической физики (локальная теория скрытых параметров), воспроиз4
вести предсказания квантовой механики. По Беллу, квантовая информация может быть закодирована (и фактически закодирована)
в нелокальных корреляциях между разными частями физической
системы, и эти корреляции не имеют классического аналога.
В области теории квантовой информации в течение последних
двух десятилетий достигнут значительный прогресс, чего, к сожалению, не скажешь о практической реализации. Проблемы,
которые при этом возникают, обусловлены исключительной хрупкостью квантовой системы, которая должна удовлетворять двум
взаимоисключающим требованиям – быть точно управляемой
в процессе вычислений и надежно защищенной от внешнего мира,
который эту систему неминуемо разрушит. Проблемы эти по масштабу можно сопоставить с проблемами, возникшими при создании термоядерного реактора, когда принципиальные ограничения
отсутствуют, а с практической реализацией вопрос все не решается.
Вместе с тем в мае 2011 г. в сети появилось сообщение канадской фирмы Digital Wave о создании и продаже! 128-кубитового
(quantum bit) квантового компьютера. Оставаясь оптимистами, будем надеяться, что можно ожидать появления более мощных (так
называемых масштабных) квантовых вычислителей и что наступит день, когда будет собран компьютер на 1052 квантовых элементах – кубитах.
По оценкам специалистов, такого числа кубитов будет достаточно для решения ряда экспоненциально сложных задач. Более реальные результаты, уже достигнутые в этой области, к настоящему
времени связаны с передачей информации в условиях повышенной
конфиденциальности – с квантовой криптографией. Принципы
квантовой физики позволяют построить (и уже построены) криптографические устройства, осуществляющие полную защиту от подслушивания.
Методологически идеология квантовых вычислений знаменует
новый подход [8] к решению естественнонаучных задач. Речь идет
о так называемом конструктивном подходе, отражающем неразрывное единство математики и физики.
Возникновение конструктивного метода связано с крахом программы выдающегося математика Д. Гильберта (конец ХIХ в.) по
аксиоматизации естественнонаучных дисциплин, и в первую очередь физики. Идея Гильберта состояла в поиске математических
аксиом, математическим следствием которых являлись бы все законы биологии, физики, химии и пр. Неудачная попытка реализации этого подхода привела к возникновению модификации мате5
матического аппарата, используемого применительно к сложным
системам. Так возникает математический конструктивизм (или
просто конструктивная математика). Он состоит из конструктивной математической логики, теории алгоритмов, конструктивного
математического анализа и конструктивной алгебры.
Конструктивная физика ставит целью моделирование сложных систем, состоящих из миллионов частиц с учетом квантового
характера их поведения. И тогда квантовые компьютеры могут
превратиться в основной инструмент исследования, а физика становится физикой алгоритмической. Последнее означает, что существует аппарат конструктивной математики, включающей в себя
конструктивный математический анализ, элементы алгоритмической алгебры, теорию алгоритмов, а также развитую технику программирования и мощные компьютеры.
Важной особенностью конструктивной физики является то, что
она позволяет получить визуальную картину реальности без ущерба для точности. Решение задачи перевода физики на конструктивный язык – трудоемкое, сложное, но очень важное занятие,
поскольку конструктивизм представляет собой новый инструмент
невиданной эффективности для изучения сложных систем, будь то
физика, химия или биология.
Авторы выражают глубокую признательность проф. А. Я. Казакову за ценные замечания, а также студентам 2-го факультета
С. Котовой, Е. Ильиной, С. Дьякову и А. Мирзагалиеву, проделавшим большую работу по подготовке рукописи к печати.
6
ГЛАВА 1. КЛАССИЧЕСКИЕ ПРЕДЕЛЫ
1.1. Проблемы микроэлектроники
Проблемы микроэлектроники начинаются с технологических
ограничений, возникающих при создании элементной базы современных компьютеров. Проблемы эти носят принципиальный
характер и, в конечном счете, ставят вопрос о выборе парадигмы
вычислений.
Хорошо известно, что с 1959 г., когда был изготовлен первый
планарный транзистор, микроэлектроника развивалась достаточно
стремительно, что удовлетворительно описывается законом Мура:
число транзисторов в микросхеме за один год удваивается. Такое положение спустя 15 лет изменилось – размеры элементов интегральных схем (ИС) уменьшаются в два раза за каждые полтора года.
Самые первые ИС изготавливались с размерами элементов в плоскости кристалла в несколько десятков микрометров. Современная
технология, использующая методы оптической, электронной и
рентгеновской литографии, сфокусированных ионных пучков, позволяет получать структуры с горизонтальными размерами менее
100 нм, а методы молекулярной эпитаксии обеспечивают уверенный контроль по составу при толщине слоев 1–10 нм.
В 1999 г. исследователи из университета в Беркли (США, Калифорния) сообщили о создании металл-оксид-полупроводникового
транзистора с длиной затвора 18 нм. В перспективе возможно и
дальнейшее уменьшение его размеров вплоть до структур размером
несколько атомов. При этом используются новые методы: это и сканирующий туннельный микроскоп в сочетании с методами химического осаждения, и химический синтез соединений, и методы молекулярной биологии. Компьютеры же остаются классическими,
хотя на их элементы существенное влияние начинают оказывать
квантовые явления (размерное квантование в низкоразмерных
структурах, баллистический режим переноса носителей, кулоновская блокада, интерференция электронных волн в квантовых нитях), они по-прежнему обрабатывают информацию, передаваемую
некогерентными сигналами, носителями которых являются токи и
напряжения.
Предельные размеры элементной базы, по-видимому, не могут
быть меньше размера атома. И к этому пределу исследователи подошли вплотную. Так, например, сотрудники Кванчжунского технологического (Китай) и Ханьянского (Корея) институтов, а также
7
Йельского университета (США) создали транзистор, который может претендовать на звание самого миниатюрного из всех существующих: он состоит всего из одной молекулы, причем эта молекула далеко не самая крупная, в сравнении с ней молекулы белка
или ДНК кажутся огромными.
Устройство, которое собрали эти исследователи, представляет
собой пластину из оксида кремния – типичного материала для изготовления чипов. На ее поверхности с помощью напыления тонких
(несколько нанометров толщиной) слоев золота созданы токопроводящие дорожки, напоминающие дорожки на обычных электронных
платах. В определенных местах дорожки разделены перемычками
из оксида алюминия, и именно в этих перемычках и размещены
отдельные молекулы бензендитиола – вещества, которое выглядит
как прозрачная и застывающая при 22°С жидкость.
Впрочем, говорить о нахождении одной молекулы в жидком или
твердом состоянии некорректно. И ученых интересовали не физические свойства бензендитиола как вещества, а квантовые свойства отдельных его молекул, поскольку, как показали предыдущие эксперименты, в зависимости от энергии молекулы может меняться и способность ее проводить электрический ток. А если проводимость молекулы, определяемая способностью к перераспределению электрического
заряда внутри нее, зависит от энергии, а энергию молекулы можно
изменять, то что мешает собрать устройство, позволяющее включать
или выключать ток в цепи с помощью единственной молекулы.
Как показали исследователи, собравшие первый экспериментальный чип с молекулами в зазорах электрической цепи, для реализации молекулярного переключателя не существует каких-либо
препятствий кроме некоторых второстепенных технических ограничений. Пока говорить о серийном производстве транзисторов из
одной молекулы преждевременно. Однако работающий одномолекулярный транзистор (а не просто модель вроде предложенной еще
в 2008 г.) – это значительный шаг вперед на пути к дальнейшей миниатюризации электроники.
Большие успехи на пути миниатюризации электронных схем
достигнуты благодаря использованию методов литографии. Здесь
уместно упомянуть работу специалистов из Физико-технического
института РАН «Нанолитография в микроэлектронике»[9]. В ней
анализируются достижения фотолитографии – основного метода
создания мелкоструктурных элементов интегральных схем. Именно метод фотолитографии определяет технический уровень и производственные возможности при изготовлении ИС.
8
Благодаря волновому характеру оптических процессов важнейшим преимуществом технологий фотолитографического формирования изображений является возможность одновременного
и параллельного переноса изображения, состоящего из многих
миллионов элементарных фрагментов. Именно это служит основой высокой технической и экономической эффективности метода
и возможности достижения уровня интеграции, характеризуемого
в настоящее время 107 – 1010 элементами (транзисторами) на чип.
Достигаемый в фотолитографии размер уже стал меньше 100 нм и
по праву может называться нанотехнологией. В то же время автор
статьи приходит к выводу, что возможности метода фотолитографии по уменьшению размера исчерпываются этим достижением.
Успехи, достигнутые в миниатюризации электронных схем, приводят к проблеме избыточного тепловыделения. Вычисления, основанные на принципе Шеннона – фон-Неймана – Ландауэра и использующие принцип неопределенности Гейзенберга, показывают,
что если согласно плану ITRS1 к 2016 г. будет применяться 22-нанометровая технология, то выделение теплоты процессором даже при
использовании идеальных материалов составит 5–10 млн ватт/см2 !!!
Для достижения высокой производительности ведется активный поиск новой элементной базы наноэлектроники, а одним из
кандидатов на замену КМОП-логики являются квантовые клеточные автоматы.2 Таким образом, проблема тепловыделения носит
принципиальный характер и без ее решения невозможно эффективно выполнять сложные вычисления.
1.2. Принцип Ландауэра
Рольф Ландауэр, исследователь из IBM, еще в 1961 г. показал [10],
что энергия в процессе вычислений расходуется не на что иное, как
на уничтожение битов информации. На практике при стирании бита
1
 ITRS – The International Technology Roadmap for Semiconductors – один из проектов международного консорциума ISMT (SEMATECH). Название данного проекта
можно перевести как «Международный план развития полупроводниковых технологий». Проект ITRS создан и поддерживается общими усилиями крупнейших мировых производителей и поставщиков полупроводниковой продукции. Это, по сути,
план того, что будет достигнуто в полупроводниковой индустрии в ближайшие 15 лет.
2
 Комплементарная логика на металл-оксид-полупроводниковых транзисторах;
КМOП (CMOS – Complementary-symmetry/metal-oxide semiconductor) – технология
построения электронных схем. Отличительной особенностью схем КМОП по сравнению с другими технологиями является очень малое энергопотребление.
9
происходит выделение некоторого (очень малого) количества теплоты. Но в классической фон-неймановской архитектуре значения битов в регистрах процессора переписываются огромное множество раз,
и объем выделяемой при этом энергии уже становится заметным.
В работе [11] ставятся вопросы, какие принципиальные ограничения накладывает природа на скорость вычислений, какие физические условия накладываются на те степени свободы, которые
переносят информацию.
Можно утверждать, что обработка информации неизбежно сопровождается выделением теплоты. Это можно доказать исходя из термодинамики. Можно рассчитать это минимальное количество теплоты. Оно на много порядков меньше количества теплоты, выделяемого
в реальных устройствах и представляет собой тот предел, преодолеть
который в рамках заданной парадигмы вычислений невозможно.
Принцип Ландауэра формулируется следующим образом: при
стирании компьютером одного бита информации в окружающую
среду неминуемо диссипирует энергия в количестве, не меньшем,
Äæ
чем kT ln 2, где k = 1,38 · 10−23
– постоянная Больцмана; T – абÊ
солютная температура.
Принципу Ландауэра можно придать иную форму, используя понятие энтропии1: при стирании компьютером одного бита информации энтропия окружающей среды возрастает не менее, чем на k ln 2.
В ходе дальнейшего изложения мы приведем аргументы в пользу этого положения. В данной главе важным является установление
связи между информацией и необратимыми тепловыми потерями,
возникающими в процессе вычислений, что в ряде случаев ставит
принципиальный предел возможностям классического компьютинга. Забегая вперед, отметим, что квантовый компьютер может
работать обратимым образом, сведя тем самым выделение теплоты
в его схеме к нулю.
1.3. Доказательство принципа Ландауэра
Следуя Ландауэру [12], будем рассматривать компьютеры как
тепловые машины, которые потребляют энергию Q1 и совершают
работу А. Однако реальные компьютеры к тому же еще и рассеивают (выделяют) теплоту Q2. Эти величины в соответствии с первым
1
 О связи энтропии и информации см. Приложение 3.
10
началом термодинамики связаны соотношением, выражающим закон сохранения энергии:
=
A Q1 − Q2 .
Так, Ландауэра интересовал вопрос: можно ли увеличить эффективность компьютера путем снижения Q2 до произвольно малого
значения? Иными словами, может ли компьютер работать без выделения теплоты? Ответ, полученный Ландауэром, отрицательный.
Хотя многие вычислительные операции могут (обратимо) осуществляться без выделения теплоты, существует фундаментальный предел, возникающий при стирании одного бита информации.
И численное значение этого предела (минимального количества теплоты) равно kT ln 2, где T – температура, при которой происходит
стирание.
Для доказательства этого обратимся ко второму началу термодинамики. Представим себе судно, которое всю мощность своих
двигателей получает за счет теплоты, отдаваемой морской водой
в результате трения ее о корпус судна. При этом морская вода становится холоднее. Такой замечательный двигатель мог бы решить
все проблемы с энергией – теплоту можно было бы просто полностью преобразовывать в полезную (механическую) энергию. Но подобное устройство, известное как «вечный двигатель второго рода»,
противоречит второму началу термодинамики.
Существует несколько формулировок второго начала. Для рассматриваемого случая наиболее подходит формулировка Кельвина, согласно которой невозможно полностью преобразовать теплоту в работу в ходе циклического процесса. После введения У. Клаузиусом понятия энтропии второе начало можно представить в виде
неравенства – неравенства Клаузиуса. Оно означает, что для системы, находящейся первоначально в состоянии теплового равновесия, количество теплоты Q, полученное системой при температуре
Т, не может превысить изменения энтропии системы DS, умноженной на температуру:
Q ≤ kTDS.
Последнее выражение записано в энергетической системе единиц, в которой энтропия – безразмерная величина. Знак равенства
в нем справедлив в случае, если процессы являются квазистатическими, обратимыми.
Рассмотрим теперь систему – частицу в потенциальной яме
с двумя устойчивыми состояниями, которую можно использовать
11
y
0
1
x
Рис. 1. Потенциальная энергия
бинарной механической системы
для кодирования бита информации, например, симметричную бистабильную потенциальную яму с высокоэнергетической перегородкой (рис. 1).
Эта система сначала находится в состоянии теплового равновесия при температуре Т, и оба ее состояния заняты с одинаковой
вероятностью. Затем прикладываем специально приготовленную
силу, которая переводит каждую частицу системы в одно из двух ее
состояний (одинаковое для всех частиц, например, в состояние 1)
с вероятностью, равной единице.
Рассчитаем изменение энтропии системы. Допустим, что сначала система находится в обоих (0 и 1) состояниях с одинаковой вероятностью:
1 ,
p=
1 p=
2
2
и энтропия Шеннона S равна
1 1 1 1
ln 2.
S1 =
−∑ pi ln pi =
− ln − ln =
2 2 2 2
i
Допустим, что после полного стирания информации система
оказывается в состоянии, которому соответствует логическая 1, и
энтропия S равна
S
=
=
1 0.
2 ln
Тогда из неравенства Клаузиуса получаем, что рассеянная (отданная) теплота Qdis составляет
Qdis = −Q ≥ −kTDS = kT ln 2 ≈ 0,96 · 10−23 T ( Äæ ).
Это и есть принцип стирания информации Ландауэра.
12
Рассмотрим подробнее случай бистабильной ямы, следуя Ландауэру [11]. Предположим, что имеем дело с простейшим вычислительным устройством, выполняющим функцию переключателя,
например, триггером, на сопротивлении нагрузки которого возникает напряжение, принимающее всего лишь два фиксированных
значения: V1 и V2, которым сопоставляются два числа: 0 и 1. Такое
устройство называют бинарной системой.
Допустим, что это устройство или какой-либо его аналог, в том
числе механический, имеет как минимум одну информационную
степень свободы. Например, это частица, движущаяся вдоль оси
х в силовом поле, потенциальная энергия которого представлена
на рис. 1.
Положениям устойчивого равновесия соответствуют точки на
кривой, обозначенные 0 и 1. Число степеней свободы в данном одномерном случае очевидно равно единице, и эту степень свободы
(координата х) можно назвать информационной. Напомним, что
под степенью свободы тела в физике понимают некоторую динамическую переменную (например, декартову координату частицы),
необходимую для описания движения этого тела. Являясь физической степенью свободы, она в соответствии с теоремой Больцмана о
равнораспределении энергии по степеням свободы [12] может принять количество тепловой энергии, равное в среднем kT. Переключающий сигнал, таким образом, должен иметь энергию, большую,
чем kT, для подавления шума.
Далее, рассмотрим операцию установки в положение 1 применительно к указанной потенциальной кривой и покажем, что при
этом должна возникнуть диссипация энергии.
Указанная операция предполагает, что если частица исходно
находится в состоянии 0, то под действием силы F(t) она перейдет
в состояние 1, которому соответствует дно второй ямы. А если она
исходно находится в состоянии 1, то там и должна остаться, причем под действием той же силы. Применительно к вычислительному процессу это означает, что переходы в состояние 0 или 1 реализуются одной программой.
Такая сила F(t) существует и устроена следующим образом. Допустим, что частица находится в состоянии 0. Сначала сила направлена слева направо и достаточно велика, чтобы частица смогла
преодолеть потенциальный барьер перейти в состояние 1, а затем
она уменьшается до нуля. При этом для предотвращения колебания частицы необходимо наличие вязкой силы трения, и потому
сила должна убывать достаточно медленно. Эта же сила совершит
13
переход в состояние 1 и в случае, когда частица исходно находится
в состоянии 1. Система с очень большим затуханием неприемлема,
потому что скорость установки в положение 1 очень мала, что негативно влияет на время вычислений.
Имеет ли подобное устройство аналог на практике, не являются
ли приведенные качественные рассуждения надуманными?
Рассмотренное механическое устройство служит прототипом
устройств, используемых для хранения информации. Их существует нескольких типов. Скажем, только что рассмотренное бистабильное устройство. Особенностью его является то, что оно хранит информацию без потерь энергии, последние возникают лишь
на стадии переключения. Но это механический пример. На практике подобные устройства реализуются на основе магнитных материалов, таких, как ферриты и тонкие магнитные пленки.
Еще один тип таких устройств – криотроны. Это устройства несколько иного типа, в которых потери энергии также возникают
только на стадии переключения. Наличие силы трения в данном
устройстве необходимо по той же причине, что и в механическом
примере. Потенциальная кривая, моделирующая криотрон, приведена на рис. 1.2.
Характерной особенностью криотрона является отсутствие потенциального барьера между состояниями частицы 0 и 1. Это означает, что она сохраняет свое состояние до тех пор, пока на нее не подействует какая-нибудь сила. Можно организовать такие условия,
при которых частица останется в этом свободном состоянии сколь
угодно долго. Единственный принципиально неустранимый фактор – броуновское ее движение под действием молекул окружения.
Его влияние можно практически устранить, устремив температуру
v
Положение 0
Положение 1
x
Рис. 1.2. Потенциальная кривая, моделирующая криотрон
14
частицы и ее окружения к абсолютному нулю. Отсюда и название
устройства – криотрон. Криотроны (и магнитные ядра) могут быть
использованы при построении существенных логических функций, и из них могут быть построены компьютеры.
1.4. Прямое экспериментальное подтверждение
принципа Ландауэра
Если принцип Ландауэра справедлив, то потеря одного бита
сопровождается выделением энергии, не меньшей kTln2. Однако
даже при нынешнем уровне миниатюризации микроэлектроники
характерные энергии переключения транзисторов в тысячи раз
больше, поэтому экспериментальная демонстрация принципа Ландауэра представляет собой непростую задачу, которую в 2012 г. решила французско-германская команда исследователей [13]. Ими
была построена ячейка памяти, основой которой стала микроскопическая коллоидная частица, а также измерена энергия, которая
затрачивается на удаление из нее информации.
С этой целью они воспользовались оптическим пинцетом1 –
устройством, позволяющим манипулировать микрочастицами
с помощью света: прозрачная частица улавливается в области перетяжки сфокусированного лазерного пучка. Фокусируя луч света
попеременно в двух соседних областях с высокой частотой переключения, они создали для частицы оксида кремния микрометровых размеров потенциал с двумя минимумами, соответствующими
логической единице и нулю (рис. 1.3, а). С помощью оптического
пинцета можно управлять также высотой потенциального барьера,
разделяющего ямы, перебрасывая частицу между двумя состояниями. Информация считается стертой, если система переводится
в одно из состояний независимо от начального положения частицы.
На протяжении всего процесса положение частицы отслеживалось высокоскоростной камерой, так что у исследователей была
возможность оценить энергию, рассеянную при акте стирания информации. Повторяя этот процесс сотни раз, они получили среднее
количество выделяющейся теплоты Q, а также измерили его зависимость от времени, в течение которого осуществлялся процесс
стирания бита. Как и предсказывает теория, количество тепло-
1
 Об оптическом пинцете см. Приложение 1.
15
U (kT)
10
a)
5
0
–0,5
áQñ (kT)
0
б)
0,5
Положение, мкм
4
3
2
1
0
10
20
30
40
τ, с
Рис. 1.3. Проверка принципа Ландауэра на системе
с двумя метастабильными состояниями: a – частица оксида кремния
в созданном лучом лазера эффективном поле с двумя потенциальными
минимумами; б – по мере увеличения времени перезаписи среднее
количество теплоты, выделяемое при стирании бита информации,
стремится к ландауэровскому пределу (штриховая линия)
ты уменьшалось, стремясь к величине, предсказанной Ландауэром: kTln2.
1.5. Логическая необратимость
Итак, будем считать, что рассмотренная процедура установки
в положение 1 требует диссипации энергии. Эта процедура является примером логической функции истинности, которую будем называть необратимой.
Напомним, что устройство называется логически необратимым,
если по сигналу на выходе нельзя однозначно определить сигнал на
входе. Необратимые логические устройства имеют принципиальное значение для вычислительной техники. Будем считать также,
16
что логическая необратимость обусловлена физической необратимостью, а последняя сопровождается диссипативными эффектами.
Существующие вычислительные устройства сильно зависят
от логически необратимых действий, и, следовательно, любая современная машина будет обладать логической необратимостью, а
значит, согласно приведенным рассуждениям и физической необратимостью.
Можно ли построить компьютер, работающий на обратимых
логических элементах? В качестве таких элементов могут быть использованы, например, тождество и отрицание, а также исключающее ИЛИ. Далее представлены соответствующие этим элементам
таблицы истинности:
тождество (эквивалентность, равнозначность):
A
B
F(AB)
0
0
1
1
0
1
0
1
1
0
0
1
;
отрицание:
A
B = –A
0
1
1
0
;
исключающее ИЛИ (бинарное сложение по модулю 2):
A
B
A⊕B
0
0
1
1
0
1
0
1
0
1
1
0
.
Однако этими функциями не исчерпывается полный набор логических функций, неизбежно включающий в себя и необратимые
логические функции, например, И. Выход из этой ситуации может
быть найден. Оказывается, можно выполнить ряд необратимых
функций, используя обратимые логические элементы.
Для демонстрации этой возможности рассмотрим следующее
устройство – небольшой трехбитовый компьютер. Пусть конкретная функция истинности, которая заменяет r на pq, если r = 0, и
r на pq, если r = 1. Переменные p и q, как видно, не меняются, а
r очевидно определяет выбор программы. Это устройство логически обратимо, так как состояние на выходе однозначно определяет
17
а)
б)
X0
X0
X∧Y
X
Y
X1
X1
И
X2
X2 ⊕
(X0 ∧ X1)
Рис. 1.4. Необратимый элемент И (а)
и его обратимый вариант (б)
входные данные. И, что удивительно, оно пригодно для выполнения такой логически необратимой операции, как И.
Поясним сказанное. Элемент И можно превратить в обратимый,
если добавить один входной и два выходных провода (рис. 1.4). Таблица истинности для элемента И имеет вид
Х
Y
Х∧Y
0
0
1
1
0
1
0
1
0
0
0
1
.
Как видно, копии входных значений сохраняются и к значению
дополнительного входного бита прибавляется по модулю 2 результат операции И битов X0 + X1 (обозначен как X0∧X1).
Если зафиксировать состояние дополнительного входного бита
в нуль и исключить копирование битов X0 и X1, то можно смоделировать необратимый элемент И.
1.6. О возможности обратимых вычислений
Возникает естественный вопрос: возможно ли проведение вычислений без потери информации. Ответ на него должен быть положительным, поскольку согласно современному пониманию физических законов они в основе своей обратимы. Зная конечное состояние замкнутой физической системы, на основе законов физики
можно определить начальное ее состояние. Если это так, то следует
предположить, что в необратимых логических элементах скрыты
какие-то обратимые вычисления. Где же она эта скрытая обратимость и можно ли использовать ее для построения обратимых компьютеров?
18
Исследователь Ч. Беннет, работавший в Аргоннской национальной лаборатории (США), показал, что машина Тьюринга после некоторой реконструкции может работать обратимым образом [14].
Это обстоятельство исключительно важно, поскольку позволяет
рассчитывать на построение компьютера, работающего с энергетическими потерями, гораздо меньшими, чем kT ln 2, на один бит.
Рассмотрим эту ситуацию подробнее.
Обычная программа для цифровых вычислительных машин часто производит операции, которые отбрасывают информацию об
истории компьютера. Машина находится в таком состоянии, когда
сведения о непосредственно предшествующем ему состоянии неопределенны. Это, например, операции стирания данных или запись новых данных поверх предыдущих и вход в части программы
с обращением к нескольким различным инструкциям по переносу.
Таким образом, типичный компьютер логически необратим.
Уже известно к чему приводит логическая необратимость: компьютер, работающий при комнатной температуре, должен рассеивать энергию, не меньшую kT ln 2 (примерно 3 ⋅ 10−21 Дж) на каждый стертый бит информации. Например, потеря энергии из-за необратимого стирания информации при форматировании жесткого
диска емкостью 1 Гб равна 3·10–11 Дж, что примерно соответствует
затратам энергии на сдвиг головки диска на половину диаметра
атома водорода. Это на много порядков меньше реального перемещения головки при форматировании. Вместе с тем если емкость
дисков будет расти так же быстро, как в настоящее время, то к концу XXIII в. для форматирования жесткого диска потребуется энергия, соответствующая годовому излучению Солнца [15].
1.7. Теорема Беннета1
Ч. Беннет в 1971 г. доказал возможность построения обратимой
машины Тьюринга, т. е. такой, которая не теряет информации и,
следовательно, в процессе работы может затрачивать любое заранее
заданное малое количество энергии.
Машина Тьюринга может произвести любое вычисление, выполняемое современной ЭВМ. Например, в машину Тьюринга можно добавить одну дополнительную ленту, на которую можно записать каждую операцию, как только она будет выполнена, со всеми
1
 Строгое доказательство теоремы Беннета см. в Приложении 4.
19
подробностями, так что предшествующее состояние может быть
затем восстановлено. Однако это не решает проблемы, поскольку
лента перед новым использованием должна быть очищена. Машина должна иметь возможность сохранять входные данные, в противном случае она не будет обратимой и, по-прежнему, будет проводить вычисления, при которых входные и выходные данные не
определяются однозначно входными данными.
Покажем, что обратимые машины Тьюринга существуют и что
они ненамного сложнее необратимых компьютеров, с которыми их
сравнивают.
Для вычислений на обратимых компьютерах потребуется примерно в два раза больше шагов, чем на обычном, и может появиться необходимость в большем объеме рабочей памяти для временного хранения данных. Понять это помогут следующие нестрогие рассуждения.
Рассмотрим обратимый компьютер, который производил вычисления в течение длительного времени и хранит все промежуточные
биты, т. е. полностью сохранивший историю своей деятельности.
Лента, сохранившая историю, содержит информацию, которой
можно воспользоваться для обратимой очистки ленты.
Например, если на некоторой стадии вычислений новая стадия описывается логической функцией перехода, которая обратна
функции перехода на предыдущем этапе, то машина начнет все вычисления в обратном порядке, приведя в конце концов ленту к начальному пустому состоянию. А поскольку прямые вычисления
были детерминированными и обратимыми, обратные должны быть
такими же.
К сожалению, стадия обратного вычисления трансформирует
выходные данные во входные, делая тем самым процедуру общего
вычисления бессмысленной. Этого можно избежать, если перед началом обратного процесса скопировать выходные данные на специальную ленту.
При проведении операции копирования запись на ленту истории
прекращается, поэтому обратный процесс уничтожит только оригинал, но не копию. К концу вычислений в компьютере останутся
оригинальные входные данные и неискаженная копия выходных:
все остальные данные будут к этому моменту восстановлены до первоначального пустого состояния. Даже если никакие сведения об
истории не сохранятся, вычисление будет обратимым и детерминированным, поскольку таковой была каждая его стадия.
Может показаться, что одним из недостатков обратимых машин
является потребность в большом объеме оперативной памяти, не20
обходимой для записи истории. Для n-шаговой первой стадии потребуется n записей истории. Мы не будем приводить формального
доказательства того, что при выполнении работы за более чем три
стадии требуемая оперативная память может быть значительно
сокращена, но сформулируем результат: можно доказать, что на
основе обычной машины Тьюринга можно построить обратимую
трехленточную машину Тьюринга, которая не хуже обычной при
любых стандартных входных данных и в конце вычислений даже
превосходит ее, оставляя только эти входные данные и требуемые
выходные. Обратимая машина производит вычисления в три стадии, при этом третья стадия служит для описания первой. Это утверждение носит название теоремы Беннета.
1.8. О реализации обратимого компьютера
Ранее уже был получен важный результат, согласно которому
при вычислении можно обойтись как без необратимых логических
элементов, так и без стирания информации. Указанное обстоятельство стимулировало появление математической модели обратимой
логики, основой которой служат законы физики. Подробно данный
вопрос изложен в Приложении 2.
Рассмотрим пример обратимого логического устройства, известного как вентиль Фредкина. Вентиль имеет по три входные и выходные линии. Сигнал на одной входной линии, называемой управляющим каналом, при прохождении через вентиль не изменяется.
Если сигнал на управляющем канале установлен равным нулю, то
входные сигналы на двух других линиях также проходят без изменения. Но если на управляющей линии установлена единица, то на
двух других выходных линиях происходит переключение: входной
сигнал одной линии становится выходным другой, и наоборот. Вентиль Фредкина не теряет информации, поскольку состояние входов
можно всегда определить по состоянию выходов.
Э. Фредкин показал, что любое логическое устройство, необходимое для работы ЭВМ, может быть построено в виде соответствующей
комбинации вентилей Фредкина. Для выполнения вычисления на
определенных входных линиях некоторых вентилей должны быть
предварительно установлены заданные значения (рис. 1.5, а).
Например, чтобы реализовать операцию И (рис. 1.5, б), один
вход устанавливают равным нулю, а два выходных бита, называемых мусорными, временно игнорируют (см. рис. 1.4, б)).
21
а)
б)
Вентиль Фредкина
Вход
Выход
Управляемые
Управляющие
А
А
В
В
Вход
Обратимый
вентиль И «Мусорные»
биты
С
А
В
0
Заранее
установленный бит
Вход
Выход
D
Выход
Выход
«Мусор»
В Управляемые А
В
А
В
С
D
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
0
0
1
1
0
0
1
0
1
1
0
0
1
0
1
0
0
0
0
0
0
1
0
0
1
0
0
0
1
0
0
1
0
0
0
0
0
0
Управляющие А
Выход
Рис. 1.5. Вентиль Фредкина и реализация
на его основе логической операции И
У вентилей Фредкина больше выходных линий, чем у тех, которые они моделируют. Поэтому в процессе вычислений образуются
«мусорные биты», т. е. биты информации, не требующиеся для получения результата. Перед тем как начать другое вычисление, необходимо каким-то образом очистить компьютер от этих битов. Но при
стирании их произойдет та самая диссипация энергии, которой мы
хотели избежать. Поэтому, как уже указывалось после получения
результата вычисления и копирования его из машины с обычных
выходных линий, процесс следует запустить в обратном направлении. Другими словами, используем «мусорные» и выходные биты,
полученные компьютером в ходе вычислений, в качестве входа, вводимого со стороны выхода. Это оказывается возможным, потому что
каждый логический вентиль компьютера является обратимым.
В процессе вычисления, выполняемого в обратном направлении,
не происходит никакой потери информации, а потому нет необходимости рассеивать энергию. В конце концов компьютер окажется
в состоянии, в котором он находился перед началом вычисления.
Следовательно, можно завершить цикл вычисления – прогнать
компьютер вперед и затем вернуться в исходное состояние без какого-либо рассеяния энергии.
22
До сих пор мы рассматривали абстрактные логические операции, не касаясь физических устройств, осуществляющих эти операции. Однако нетрудно представить себе физическое устройство,
работающее по принципу Фредкина (рис. 1.6). В таком устройстве
каналы для передачи информации реализуются в виде трубок.
В свою очередь, бит информации представляется наличием или отсутствием шарика в определенной секции трубки. Присутствие шарика интерпретируется как единица, а отсутствие – как нуль.
Узкий расщепленный участок трубки – это управляющий канал.
Когда в него попадает шарик, стенки трубки расходятся в стороны,
приводя в действие переключающий механизм. Последний, в свою
очередь, переводит любой прибывший шарик из линии А в линию
В, и наоборот. Две пружинки поддерживают управляющий канал
выключенным, когда в нем нет шарика. Такой вентиль не требует
статического трения для выполнения операций. Его можно погрузить в вязкую жидкость, и тогда силы трения будут зависеть лишь
от скорости шариков. В этом случае рассеиваемая энергия может
быть произвольно малой: чтобы уменьшить количество рассеиваемой энергии, необходимо лишь уменьшить скорость прохождения
шариков через вентиль.
В рассмотренной модели вычислительного устройства энергия,
расходуемая на трение, очень мала, если это устройство действует
достаточно медленно. Можно ли построить модель еще более идеализированной машины, которая могла бы проводить вычисления
Управляющий канал
0
0
К переключающему
механизму
1
1
1
0
1
0
Линия А
1
1
0
Линия В
0
Рис. 1.6. Идеализированная физическая модель вентиля Фредкина:
трубки играют роль проводников, а присутствие
или отсутствие шарика интерпретируется как 1 или 0
23
без всякого трения, или трение является необходимым атрибутом
вычислительного процесса?
Э. Фредкин вместе с Т. Тоффоли и другими специалистами показали, что трение не является необходимым. Они продемонстрировали это на модели вычислительного устройства, в котором вычисления проводятся путем «выстреливания» навстречу друг другу идеальных бильярдных шаров в отсутствие сил трения, – «бильярдном компьютере».
В бильярдной модели идеально отражающие «зеркала» (поверхности, меняющие направление движения шаров), расположены
таким образом, что движение шаров по столу моделирует прохождение битов информации через логические вентили (рис. 1.7). Как
и раньше, присутствие шара в определенной части «компьютера»
интерпретируется как 1, а отсутствие – как 0. Если два шара одновременно достигают логического вентиля, то они сталкиваются, и
траектории их движения изменяются; новые траектории представляют при этом выходные данные вентиля.
Э. Фредкин, Т. Тоффоли и другие исследователи разработали
схемы расположения «зеркал», соответствующие различным тиА
АиВ
Вход
a
В и не А
Лишний
выход
А и не В
b
0
0
0
0
АиВ
В
Вход
А В
1 1
1 0
0 1
0 0
А
Выход
Выход
1 2 3 4
1 0 0 1
0 0 1 0
0 1 0 0
0 0 0 0
1
c
2
В
3
Вход Выход
А В 1 2 3
1 1 0 1 1
1 0 0 0 1
0 1 1 0 0
0 0 0 0 0
А
d
Фиксированный
вход
В
0
0
В
А
Рис. 1.7. Бильярдная модель «компьютера»
24
Ответ
пам логических вентилей, и доказали, что можно построить бильярдную модель любого логического элемента, необходимого для
вычислений.
В бильярдных логических вентилях (рис. 1.7, а) траектории
шаров при столкновениях их друг с другом или с «зеркалами» изменяются. Кроме функций, выполняемых ими в вентилях, «зеркала» могут менять угол траектории шара (рис. 1.7, б, позиция а),
сдвигать ее в сторону (позиция b), задерживать шар, не меняя его
конечного направления или скорости (позиция с), или заставлять
траектории пересекаться (позиция d). «Зеркала» можно расставить таким образом, чтобы получившийся в результате «компьютер» выполнял функции любого логического устройства.
Например, можно построить «бильярдный компьютер» для распознавания простых чисел. Такой компьютер (рис. 1.7, в) на входе
принимает произвольное пятизначное двоичное число (в данном
случае 01101 или 13) и фиксированную входную последовательность 01. Как и вентиль Фредкина, «бильярдный компьютер» возвращает больше битов на выходе, чем требуется пользователю.
В рассматриваемом случае он возвращает само исходное число,
представляющее собой лишний выход, и ответ: последовательность
10, если число на входе простое, и 01, если оно составное.
Для того чтобы начать процесс вычисления, «выстреливаем»
бильярдным шаром по входу «компьютера», если требуется ввести единицу. Шары должны входить в машину одновременно. Поскольку они абсолютно упругие, то не теряют энергии при столкновении друг с другом. Они выходят из машины, обладая той же кинетической энергией, с которой вошли в нее.
В процессе работы «бильярдный компьютер» порождает «мусорные биты», как и «компьютер», построенный на вентилях
Фредкина. После того как компьютер завершил выполнение задачи, мы отражаем бильярдные шары в обратном направлении, обращая процесс вычисления вспять. Шары выйдут из машины точно
там, откуда их направили в нее, и при этом будут двигаться с той
же скоростью. Таким образом, механизм, запустивший шары в машину, может получить теперь обратно их кинетическую энергию.
И в этом случае, выполнив вычисление, мы можем вернуть «компьютер» в исходное состояние, не рассеивая энергии.
У «бильярдного компьютера» есть один существенный недостаток: он чрезвычайно чувствителен к малейшим неточностям. Если
шар послан с небольшим отклонением от правильного направления
или зеркало повернуто под углом, слегка отличающимся от расчет25
ного, шары сойдут с нужных траекторий. Один или более шаров отклонятся от расчетного пути, и через какое-то время совместный
эффект этих ошибок нарушит весь процесс вычисления. Даже если
можно было бы изготовить абсолютно упругие, лишенные трения
шары, случайное тепловое движение молекул, из которых состоят шары, может оказаться достаточным для того, чтобы после нескольких десятков столкновений возникли ошибки.
Конечно, можно было бы установить корректирующую аппаратуру, которая возвращала бы неправильно движущийся шар на
нужную траекторию, но в этом случае пришлось бы уничтожать
информацию о предшествующих его состояниях. Например, потребовалось бы уничтожить информацию, касающуюся величины
отклонения зеркала от правильного положения. Однако избавиться от информации даже для того, чтобы исправить ошибку, можно
только в системе, в которой существуют силы трения и возможна
потеря энергии. Поэтому корректирующая аппаратура должна
рассеивать некоторое количество энергии.
Многих трудностей, с которыми приходится сталкиваться при
использовании бильярдной модели «компьютера», можно было
бы избежать или, во всяком случае, уменьшить их, если вместо
бильярдных шаров воспользоваться субмикроскопическими частицами, такими, например, как электроны. Как омечал У. Зурек (Национальная лаборатория, Лос-Аламос), благодаря законам
квантовой механики, накладывающим ограничения на состояние
элементарных частиц, возможность небольших отклонений в движении частиц может быть устранена.
Модели, основанные на обратимой машине Тьюринга, имеют преимущество перед такими машинами, как «бильярдный
компьютер» Фредкина – Тоффоли, в котором отсутствует трение.
В «бильярдном компьютере» случайное тепловое движение молекул приводит к неизбежным ошибкам. Обратимые машины Тьюринга на самом деле используют случайное тепловое движение:
они построены таким образом, что именно тепловое движение при
содействии слабой вынуждающей силы переводит их из одного состояния в другое.
Развитие вычислительного процесса напоминает движение иона
в растворе, находящемся в слабом электрическом поле. Если наблюдать за поведением иона в течение короткого периода времени, то
оно покажется случайным: вероятность движения в одном направлении почти такая же, как и в другом. Однако вынуждающая сила,
обусловленная действием электрического поля, придает движению
26
предпочтительное направление. Вероятность того, что ион будет
двигаться в этом направлении, несколько больше.
Такой характер действий очень распространен в природе. Его,
в частности, можно наблюдать в микроскопическом мире химических реакций. Случайное тепловое движение оказывается достаточно эффективным, чтобы реагирующие молекулы вступили
в контакт, расположились должным образом относительно друг
друга, как того требует данная реакция, и образовались новые молекулы, представляющие собой продукты реакции.
В принципе все химические реакции обратимы: то же броуновское движение, которое обеспечивает выполнение реакции в прямом направлении, иногда заставляет продукты реакции совершить
обратный переход. В состоянии равновесия обратное направление
реакции так же вероятно, как и прямое. Для того чтобы заставить
реакцию идти в прямом направлении, необходимо постоянно добавлять молекулы, вступающие в нее, и удалять молекулы – продукты реакции. Другими словами, мы должны приложить небольшую вынуждающую силу. Когда эта сила очень мала, реакция будет происходить в прямом и обратном направлении, но в среднем
она будет идти в прямом направлении. Для обеспечения вынуждающей силы следует затрачивать энергию, однако количество энергии может быть произвольно малым. Если нас устраивает очень
медленное выполнение операций, то не существует минимального
необходимого количества энергии, которую требуется затратить на
эти операции.
В этой связи возникает вопрос, не вступает ли термодинамический анализ в противоречие с квантовой механикой?
Ведь согласно квантовомеханическому соотношению неопределенностей Гейзенберга для энергии-времени ( δEδt ≥  [12, т. 3]
должна существовать обратная зависимость между степенью неопределенности энергии δ E и степенью неопределенности времени

δ t (так как δE ≥ ). Некоторые исследователи считают поэтому,
δt
что в любом процессе с переключением, протекающем за очень короткий промежуток времени, должна быть затрачена некоторая
минимальная энергия.
В действительности соотношение неопределенностей вовсе не
требует какого-то конечного минимума энергии для быстрого переключательного события. Соотношение неопределенностей относится к случаю, когда мы пытаемся точно определить момент времени,
когда произошло событие. Даже по законам квантовой механики
27
чрезвычайно быстрые события могут происходить без всякой потери энергии. То, что квантовая механика позволяет проводить
вычисления со сколь угодно малой затратой энергии, находит подтверждение в моделях обратимых квантовомеханических вычислительных машин, разработанных П. Бениоффом с коллегами [16].
Эти модели не рассеивают энергию и подчиняются законам квантовой механики.
Таким образом, соотношение неопределенностей, по-видимому,
не накладывает фундаментальных ограничений на процесс вычисления. Не накладывает их также классическая термодинамика.
Означает ли это, что вычисления не имеют вообще никаких физических ограничений? Это далеко не так. Реальные ограничения
связаны с вопросами, на которые значительно труднее ответить,
чем на те, которые мы поставили и рассмотрели. Например, требуют ли элементарные логические операции некоторого минимального конечного времени? Каковы минимальные размеры устройства,
способного выполнить такие операции?
Интерес, кроме того, вызывают вопросы, насколько можно увеличить память компьютера, как много частиц во Вселенной можно
собрать и соединить для этих целей. Дело в том, что максимально
возможный размер памяти компьютера накладывает ограничение
на точность, с которой можно проводить вычисления. Например,
будет ограничено число десятичных знаков в вычисленном значении числа p. Другой, возможно связанный с последним, вопрос
касается неизбежных процессов разрушения, протекающих в реальных вычислительных машинах по мере того, как они стареют.
Возможно ли снизить скорость процесса разрушения и накопления
ошибок до произвольно малых величин или эта скорость накладывает ограничение на максимальную продолжительность вычисления? Другими словами, существуют ли такие вычислительные
задачи, которые невозможно будет завершить до того, как материальная часть компьютера придет в негодность.
На самом деле подобные вопросы касаются ограничений на физическое выполнение математических операций. Физические законы, на которых, в конечном счете, должны базироваться ответы,
сами выражаются с помощью таких математических операций, т. е.
мы пытаемся ответить на вопрос, в какой форме могут применяться
физические законы при ограничениях, накладываемых свойствами Вселенной, которые сами описываются этими законами.
Физики пришли к выводу, что не существует ни одной необратимой технологии, на базе которой можно построить процессор с зет28
тафлопсной производительностью, характеризующийся разумным выделением теплоты. Ресурсы же этих технологий в соответствии с законом Мура и темпами развития процессорного рынка
будут исчерпаны примерно через 20 лет. Появление петафлопсных
устройств1 можно было ожидать примерно в 2010 г., а к 2020-му будет достигнут порог в 1 экзафлопс, после чего следует ждать технологического кризиса. В то же время какие-либо масштабные целенаправленные исследования по обратимым логическим процессам,
в которых любые вычисления выполняются с сохранением всех битов, до 2004 г. не проводились.
Даже единичные серьезные научные работы по этой теме как
физиков, так и математиков содержат ошибки. Ключевая и парадоксальная на первый взгляд проблема заключается в том, что создать обратимое логическое устройство не представляет никакого
труда. Достаточно немного усложнить логический блок, добавив
еще один выход, просто дублирующий вход, и тем самым сделать
его обратимым, получив возможность определять входные значения по выходным (не всегда). Однако подобный модуль не будет
обратимым в том смысле, какой вкладывали в эту концепцию Ландауэр и Беннет. Так может быть получена лишь модель (имитация
обратимого процесса). Тут и ошибалось немало исследователей,
путая предлагаемые ими модели обратимых процессов с реальной
термодинамической обратимостью.
Для построения обратимых вычислительных устройств нужны
обратимые физические процессы, которые теоретически описаны
хорошо, однако до практического их использования еще далеко.
Например, не подходят для этого транзисторные элементы – энергия в них рассеивается и при выполнении логически обратимых
операций. Или еще одно обстоятельство: чем быстрее выполняются обратимые физические процессы, тем сложнее воплотить их на
практике. Это еще одно препятствие на пути создания эффективных обратимых устройств.
Трудной задачей остается проектирование полноценных обратимых логических схем, сопоставимых по сложности с современными процессорами. Оказалось, что логически обратимые блоки мож1
 FLoating-point Operations Per Second, произносится как флопс – внесистемная единица, используемая для измерения производительности компьютеров, показывающая, сколько операций с плавающей запятой в секунду выполняет данная
вычислительная система. Так, производительности компьютера 1 терафлопс, соответствует 1012 флопсов, петафлопс – 1015 флопсов, эксафлопс – 1018 флопсов и, наконец, зеттафлопс – 1021флопсов.
29
но выстраивать строго определенным образом, при этом необходимо минимизировать число дополнительных регистров, поддерживающих обратимость, а также уметь выявлять неактивные части
процессора для реализации многозадачности, повторно используя
энергию сигнала, – для всего этого пока не существует хороших
проектных технологий.
В середине 1990-х годов в Массачусетском технологическом институте были созданы первые чипы-процессоры, сопроцессоры и
запоминающие устройства с обратимой логикой, а для них написаны реализации языка СИ. И хотя они, конечно, представляют
собой лишь модели (реального сохранения энергии не происходит,
так как применяются необратимые физические процессы), тем не
менее возможность проектирования логических обратимых схем
достаточно высокой сложности уже продемонстрирована.
В заключение отметим, что работы Р. Ландауэра, Ч. Беннета,
Т. Тоффоли и Э. Фредкина вдохновили Нобелевского лауреата по
физике Р. Фейнмана к разработке принципиально новой идеи вычислений, основанной на использовании в качестве носителей информации квантовых частиц.
Но прежде чем перейти к основной теме квантовых вычислений,
следует освоить необходимый математический аппарат – алгебру
векторов в конечномерном гильбертовом пространстве, а также напомнить основные положения квантовой механики, составляющие
идейную основу метода квантовых вычислений.
30
ГЛАВА 2. МАТЕМАТИЧЕСКИЙ АППАРАТ
КВАНТОВОЙ МЕХАНИКИ
В 30-е годы ХХ в., в пору становления квантовой механики, выдающийся физик-теоретик П. Дирак предложил описывать квантовую частицу с помощью математического объекта – вектора состояния в гильбертовом пространстве. Динамика частицы в рамках
данной модели обусловливается действием на ее вектор состояния
оператора динамической переменной. Последнее обстоятельство
предполагает использование математического аппарата линейных
операторов в гильбертовом пространстве. В настоящее время метод
векторов состояния, предложенный Дираком, является общепризнанным, и мы будем пользоваться им в дальнейшем.
Поскольку указанный формализм представляет собой понятийный фундамент предмета, содержание этого раздела представляется весьма значимым для предлагаемого курса, и поэтому вполне
уместно большое число примеров и упражнений. Содержание данной главы строится в основном на прекрасном учебнике по квантовой механике Э. В. Шпольского [17], фундаментальном труде
математиков Р. Хорна и Ч. Джонсона [18], оригинальном изложении методов квантовой механики «для пешеходов» Г. Липкина
[19] и наиболее близкой к теме квантовых вычислений монографии
A. Переса [20, 21].
2.1. Векторная алгебра
Напомним сначала основные положения векторной алгебры.
Векторы будем обозначать символами a, b, …, c. Множество векторов характеризуется, прежде всего, тем, что любым двум векторам
a и b можно сопоставить их сумму a + b, а каждому вектору a и любому вещественному числу α – произведение αa.
Эти операции обладают следующими свойствами:
I. Сложение:
1) для любых двух векторов справедливо a + b = b + a;
2) (a + b + c) = a + (b + c);
3) существует нулевой вектор 0, такой, что a + 0 = a;
4) для каждого a существует противоположный вектор –a, такой, что a + (–a) = 0.
II. Умножение:
1) I ⋅ a = a;
31
2) α(βa) = (αβ)a.
III. Сложение и умножение:
1) (α + β)a = αa + βa;
2) α(a+ b) = αa + αb.
Векторы a, b, …, c называются линейно независимыми, если равенство
αa + βb + … + γc = 0
справедливо лишь в случае, когда все числа α, β, γ, … равны нулю.
В противном случае векторы являются линейно зависимыми, т. е.
любой вектор может быть выражен через остальные. Например,
a = λb + … + μc.
В пространстве обычных векторов всегда найдутся три линейно
независимых вектора, которые образуют базис трехмерного пространства. Согласно строгому определению базиса [17] подмножество S векторного пространства V порождает V, если любой элемент
из V можно представить как линейную комбинацию элементов из
S с коэффициентами из соответствующего основного поля. Например, множество {[1, 0, 0]т, [0, 1, 0]т, [0, 0, 1]т, [1, 0, –1]т} порождает
R3 над R (или С3 над С). Линейно независимое множество, порождающее векторное пространство V, называется его базисом.
Вернемся к трехмерному пространству. Обозначив эти базисные
векторы символами e1, e2, e3, любой вектор можно записать в виде
линейной комбинации базисных векторов:
a = α1e1 + α2e2 + α3e3.
Коэффициенты этого разложения называются компонентами
(координатами) вектора. Отметим особо, что базисные векторы не
обязательно должны быть ортогональными. От них требуется лишь
линейная независимость.
Еще одна важная операция – скалярное произведение:
(a, b) = a⋅bcos(a, b).
Скалярное произведение обладает свойствами
(a, βb + γc) = β(a, b) + γ(a, c),
(a, b) = (b, a),
(a, a) ≥ 0,
причем (a, a) = 0 лишь при a = 0.
32
Через скалярное произведение длина вектора a и угол φ между
векторами a и b выражаются следующим образом:
a =
( a, a ),
=
cosj (a, b) / a ⋅ b .
В частности, условие ортогональности двух векторов (φ = p/2) записывается как равенство нулю их скалярного произведения:
a ⊥ b, åñëè (a, b) =
0.
В пространстве векторов базис можно выбирать произвольно, но
при изучении метрических соотношений наиболее удобным является декартов, или ортонормированный, базис, образуемый тройкой взаимно ортогональных единичных ортов ex, ey, ez:
(ex,ey) = (ex,ez) = (ey,ez) = 0,
(ex,ey) = (ey,ey) = (ez,ez) = 1.
Разложим произвольный вектор a по осям декартовой системы
координат:
a = axex + ayey + azez.
Умножив последовательно обе части этого равенства скалярно
слева на орты ex, ey и ez, получим
ax = (ex, a), ay = (ey, a), az = (ez, a).
Так, например,
ax = (ex, a) = ex⋅acos(a, ex),
т. е. компоненты вектора в декартовой системе координат равны
проекциям вектора на соответствующие оси.
Если имеются два вектора, то для них в ортонормированном базисе получаем
(a, b) = axbx + ayby + azbz.
В дальнейшем нам понадобится обобщение приведенного понятия вектора на случай пространства с большим числом измерений.
Обобщение проведем в два этапа. На первом этапе вместо трехмерного пространства введем пространство с произвольным числом измерений. При этом предусмотрим возможность умножения вектора не только на вещественное, но и на комплексное число. Кроме
того, допустим, что и сами компоненты вектора могут быть тоже
комплексными числами. На втором этапе определим понятие ска33
лярного произведения – это необходимо для введения в теорию метрических соотношений.
В последующем изложении в соответствии с установившейся
в математической литературе традиции, за исключением отдельных случаев, векторы не будут выделяться полужирным шрифтом.
2.2. Линейное n-мерное пространство
над полем комплексных чисел
Элементами такого пространства являются объекты j, φ, χ, ...,
называемые векторами и подчиняющиеся следующим правилам:
а) каждым двум векторам φ и j поставлен в соответствие вектор χ, называемый их суммой и обозначаемый как j + φ;
б) каждому вектору j и каждому комплексному числу α ставится в соответствие вектор φ, называемый произведением вектора j на число α и обозначаемый как αj;
в) введенные операции удовлетворяют условиям I–III (сложение, умножение, сложение и умножение).
Введенные понятия абстрактного векторного пространства оказываются исключительно полезными в физике.
Приведем примеры нескольких векторных пространств:
1) множество обычных векторов трехмерного пространства;
2) множество всех вещественных непрерывных функций f(x),
заданных на интервале а < x < b. Сложение и умножение на число
вводится так же, как и в анализе;
3) множество линейных операторов (см. далее), действующих
в пространстве функций;
4) множество совокупностей n комплексных чисел, расположенных в определенном порядке:
ψ = {ψ1, ψ2 , ..., ψn }.
Операции сложения и умножения для таких векторов определим формулами
ψ + φ = {ψ1 + φ1, ψ2 + φ2 , ..., ψn + φn },
αψ =
{αψ1, αψ2 , ..., αψn }.
Роль нулевого вектора здесь играет вектор 0 = {0, 0, …, 0}, а роль
вектора, противоположного ψ, – вектор −ψ = {−ψ1, − ψ2 , ..., − ψn }.
34
Понятие линейной зависимости вводится аналогично тому,
как это было сделано ранее в случае обычных векторов. Векторы
j, φ, ..., ξ называются линейно независимыми, если равенство
αj + βφ + ... + γξ =0
выполняется только в случае равенства нулю всех коэффициентов
α, β, ..., γ.
Если же векторы линейно зависимы, то любой из них можно выразить в виде линейной комбинации всех остальных:
φ = λj + ... + µξ. (2.1)
Линейное пространство называется n-мерным, если максимальное число линейно независимых векторов равно n.
Если в линейном пространстве можно найти любое число линейно независимых векторов, то его называют бесконечномерным.
Примером n-мерного пространства служит вектор, составленный
из n комплексных чисел, расположенных в определенном порядке:
ψ = {ψ1, ψ2 , ..., ψn }.
Приведем еще одно важное определение.
Базисом n-мерного векторного пространства называется совокупность n линейно независимых векторов e1, e2 , ..., en . При этом
любой другой вектор ψ из данного n-мерного пространства можно
представить в виде линейной комбинации базисных векторов (может быть разложен по базису):
n
ψ = j1e1 + j2e2 + ... + jn en = ∑ j j ej .
j =1
Задача 1. Доказать, что это разложение является однозначным.
В линейном пространстве векторов из примера 4 в качестве базисных векторов можно взять следующий набор:
e1
, 0, 0, ..., 0 ), e2 ( 0, 1,=
0, ..., 0 ), ..., en ( 0, 0, 0, ..., 1).
(1=
В этом базисе для произвольного вектора ψ имеем
ψ = ∑ ψ i ei = ψ1 (1, 0, 0, ..., 0 ) + ψ2 ( 0, 1, 0, ..., 0 ) + ... +
i
+ψn ( 0, 0, 0, ..., 1).
35
Таким образом, в рассмотренном случае роль компонентов вектора ψ играют сами числа ψ i , определяющие этот вектор.
Рассмотрим два вектора: ψ и φ. В произвольном базисе они могут быть представлены в виде
ψ=
∑ ψi ei ,
i
φ=
∑ φi ei .
i
Сложим два этих равенства:
ψ +=
φ
∑ (ψi + φi )ei .
i
Отсюда видно, что суммарный вектор ψ + φ имеет компоненты,
равные сумме компонент ψ i + φi .
Умножение вектора на число (в том числе комплексное):
αψ
=
∑ αψi ei .
i
Отсюда видно, что вектор αψ имеет компоненты aψ i .
Итак, при сложении векторов их компоненты складываются,
а при умножении вектора на число его компоненты умножаются
на это число. В результате заключаем, что анализ абстрактного
n-мерного линейного пространства можно свести к изучению пространства векторов.
Отметим особо, что на свойства векторов базиса до сих пор не
накладывались никакие ограничения за исключением требования
их линейной независимости. Дополнительные свойства у этих векторов появляются при введении в теорию метрических соотношений, позволяющих говорить о длине вектора и ортогональности
векторов.
2.3. Гильбертово n-мерное пространство
Отправным моментом является понятие скалярного произведения как числового объекта (числа) ( φ, j ), сопоставляемого векторам φ и j, который обладает следующими свойствами:
1) линейностью по второму аргументу:
(j, aj + βχ) = α(φ, j) + β(φ, χ); (2.2)
2) эрмитовостью, т. е.
36
( φ, j ) = ( j, φ )* ;
(2.3)
3) положительной определенностью:
( j, j ) ≥ 0,
причем ( j, j ) =0 только при j =0.
Линейное пространство, в котором введено скалярное произведение, назовем гильбертовым n-мерным пространством. (Наряду
с термином «гильбертово пространство» используется термин «евклидово пространство».)
Скалярное произведение в пространстве обычных векторов задается формулой
( a, b=) a ⋅ b cos ( a, b )
в пространстве непрерывных функций – формулой
b
(um , un ) = ∫ um (x)un (x)dx
a
в пространстве векторов ψ = {ψ1, ψ2 , ..., ψn }
n
(φ, j) = φ1* j1 + φ*2j2 + ... + φ*n jn = ∑ φ*j j j .
j=1
В общем случае вид скалярного произведения не конкретизируется.
Из перечисленных свойств вытекает антилинейность скалярного произведения по первому аргументу:
( αφ + βχ, j ) = α∗ ( φ, j ) + β∗ ( χ, j ).
В частности,
( αφ, j ) =α∗ ( φ, j ).
Действительно,
( αφ, j ) =( j, αφ )∗ =α ( j, φ )
∗
∗
=α∗ ( j, φ ) =α∗ ( φ, j ).
Из условия эрмитовости (2.3) вытекает вещественность скалярного произведения:
( φ, φ )∗ = ( φ, φ ).
Норма вектора j является обобщением понятия обычной длины и вводится выражением
j =
j, j.
37
Векторы j и φ называются ортогональными, если их скалярное произведение равно нулю, т. е. если
(φ, j) =0.
В произвольном линейном пространстве нельзя отдать предпочтение ни одному базису – все они равноправны, но в гильбертовом
пространстве наиболее удобными базисами являются ортонормированные базисы. Они играют ту же роль, что и декартова система
координат в аналитической геометрии.
Будем говорить, что в гильбертовом пространстве n-мерные векторы e1, e2 , .., en образуют ортонормированный базис, если они
линейно независимы и попарно ортогональны:
(=
ei , ek ) 0 ïðè i ≠ k,
норма каждого из них равна единице:
=
ej
=
ej , ej è (ej , ej ) 1.
Эти соотношения часто объединяют, записывая условие ортонормированности в виде
ej , ek = δ jk ,
(2.4)
где δ jk – символ Кронекера
0, j ≠ k 
δ jk =

.
1, j = k 
(
)
Например, в пространстве векторов j =
разованный из векторов
{j1, j2 , ..., jn }
базис, об-
=
e1 (1=
, 0, 0, ..., 0), e2 (0, 1,=
0, ..., 0), ..., en (0, 0, 0, ..., 1),
является ортонормированным по отношению к скалярному произведению.
Согласно (2.1) любой вектор j можно разложить по базисным
ортам:
j
=
n
∑ jj ej .
j =1
(2.5)
Если базис ортонормированный, то компоненты ji можно выписать в явном виде:
j=
i (ei , j),
38
в чем нетрудно убедится, умножив выражение (2.5) скалярно слева
на базисный вектор ek , воспользоваться условием линейности (2.2)
скалярного произведения и учесть условие ортонормированности
(2.4) базиса:
(ek , j)= (ek ,
n
∑ jj ej )= ∑ jj (ek , ej )= ∑ jj δkj=
j =1
jk .
Таким образом, в гильбертовом пространстве любой вектор однозначно задается совокупностью чисел ji – его компонент, которые также имеют смысл проекций вектора на базисные орты.
С учетом введенных свойств векторного пространства скалярное
произведение двух векторов ( j и φ ) можно представить в виде
(φ, j)=
n
∑ φ*j jj .
j=1
В частности, норма вектора j равна
j
=
n
∑ j*j j=j ∑ jj
2
.
j
2.4. Алгебра матриц
Напомним основные сведения из алгебры матриц.
Матрицей порядка n × m называется множество чисел, которое
записано в прямоугольную таблицу из m строк и n столбцов:
 a11a12 ...a1n 


 a21a22 ...a2n 
=
=
=
A (A
jk ) (a
jk ) 
.



 a a ...a 
mn 
 m1 m2
Элемент матрицы ajk – матричный элемент, индексы которого указывают номер строки (j) и номер столбца (k), где расположен
этот элемент.
Для наших целей интерес представляют три вида матриц:
1) квадратные матрицы порядка n × n;
2) матрицы-столбцы порядка n × 1
39
 j1 


 j2 
j = (j j ) = 
;
 


j 
 n
3) матрицы-строки порядка 1 × n:
_
_
j = (j j ) = (j1, j2 , ..., jn ).
Квадратные матрицы используются в теории для представления
операторов в гильбертовом пространстве, марицы-столбцы – для
представления векторов в том же пространстве. Матрицы-строки
представляют векторы в так называемом сопряженном гильбертовом пространстве.
Основные положения алгебры матриц:
1) равенство матриц. Равенство А = В для матриц порядка
m × n означает, что попарно равны все элементы обеих матриц, т. е.
выполняется равенство
( amn ) = ( bmn );
2) матрицы можно складывать: сумма матриц А и В – это матрица С, у которой элемент с индексами j и k равен сумме элементов
матриц А и В с теми же индексами:
(=
cmn ) (amn ) + (bmn ).
При этом, конечно, порядки складываемых матриц должны совпадать;
3) матрицу можно умножать на число. Произведением матрицы А на число α называется матрица С, такая, что выполняется равенство
(cmn ) = α(amn );
4) умножение матриц. Произведением матрицы А порядка
n × m на матрицу В порядка n × 1 называется матрица С, у которой
элемент с индексами i и j вычисляется по формуле
(2.6)
cij = ∑ aik bkj ,
где aik – элементы i-й строки матрицы А, а bjk – элементы j-й строки матрицы В. Таким образом, умножение возможно, если число
40
строк одной матрицы совпадает с числом столбцов другой. При
этом для порядков матриц справедливо соотношение
(m × n)(n × 1) = m × 1. (2.7)
В указанных произведениях первый сомножитель – число строк,
а второй – число столбцов. Отсюда вытекает, например, что перемножение квадратных матриц порядка n × n дает матрицу того же
порядка.
Следствие. Умножение матриц в общем случае некоммутативно, т. е.
A×B ≠ B×A.
Например,
 3 4  1 2   11 26 


=
,
 −2 −1  2 5   −4 −9 
но
 3 4  1 2   −1 2 


=
,
 −2 −1  2 5   −4 3 
Приведем несколько записанных в символьной форме правил
обращения с матрицами.
Умножение квадратной матрицы n × n справа на вектор-столбец
того же порядка дает
n n
   
(n × n)  ×  = × .
1  1 
   
Это правило, в частности, позволяет записать систему n линейных алгебраических уравнений
a11j1 + a12j2 + ... + a1n jn =φ1,
a21j21 + a22j2 + ... + a2n jn =φ2 ,

an1j1 + an2j2 + ... + an1n jn =φn ,
с неизвестными j1, j2 , ..., jn и заданными φ1, φ2 , ..., φn в виде
простого матричного уравнения
Aj = φ.
41
Вместе с тем не определено произведение
n
 
 ×  ( n × n ).
1 
 
Зато имеет смысл произведение
(1 × n)(n × n) =(1 × n).
Не определено также умножение
(n × n)(1 × n) =
?
Перемножение матрицы-строки на матрицу-столбец дает число:
1 
 
(1 × n)  ×  =
×èñëî.
n
 
Например,
 2
 
(5, 2, − 3) ⋅  −1  =5 ⋅ 2 + 2 ⋅ (−1) + (−3) ⋅ 4 =−4.
 4
 
Тензорное произведение матриц: произведение матрицы-столбца порядка n × 1 на матрицу-строку порядка 1 × n также имеет
смысл. Поскольку согласно (2.7)
(n × 1)(1 × n) =n × n,
в рассматриваемом случае получаем квадратную матрицу порядка
n × n:
n
 
 ×  (n × 1) = (n × n).
1 
 
В формуле (2.6) индексы k теперь отсутствуют, а потому никакого суммирования не производится. Иными словами, матрицапроизведение строится из всевозможных попарных произведений
элементов матриц-сомножителей:
Aij =ji φ j .
42
Данная матрица называется тензорным произведением матриц
j и φ и обозначается как j ⊗ φ. Например, тензорное произведение матриц А и В вида
 a11 a12 
 b11
=
A =
, B 
 a21 a22 
 b21
b12 

b22 
имеет вид
 a11b11

 a11b21
A⊗B=
 a21b11

 a21b21
a11b12
a11b22
a21b12
a21b22
a12b11
a12b21
a22b11
a22b21
a12b12 

a12b22 
.
a22b12 

a22b22 
Эти матрицы играют очень важную роль в квантовых вычислениях.
В дальнейшем такую же роль будут играть диагональные матрицы, у которых от нуля отличны только элементы с одинаковыми
индексами:
 a11

0
( Ajk ) = 


 0
0
a22
0
0 ... 0 

0 ... 0 



0 ... ann 
и частный вид этих матриц – единичная матрица I. У этой матрицы
все элементы равны единице. Единичная матрица совпадает с символом Кронекера. Для любой квадратной матрицы справедливо выражение
IA
= AI
= A.
Из матрицы А можно образовать транспонированную по отношению к матрице А матрицу 
A:
(
A) jk = ( A)kj .
Если порядок матрицы А равен m × n , то порядок транспонированной матрицы 
A равен n × m. Так, например, матрица-строка
является транспонированной относительно матрицы-столбца, поA, то такую матрицу настроенной из тех же элементов. Если A = 
зывают симметричной.
43
Из матрицы А можно образовать комплексно-сопряженную матрицу А*, элементы которой подчиняются условию
*
( A* ) jk = ( A) jk  .
Порядки матриц А и А* совпадают. Если А = А*, то матрица А
называется вещественной. Матрица А +, получаемая из А путем транспонирования и последующего комплексного сопряжения, называется эрмитово-сопряженной по отношению к А:
*
* 

=
( A ) jk =
(
A) jk 
( A)kj  .


+
Если порядок матрицы А равен m × n, то порядок матрицы A +
равен n × m. В частности, матрице-столбцу
 j1 
 
j2
j = 
 
 
 jn 
отвечает следующая эрмитово-сопряженная матрица-строка:
j+ =(j1* , j*2 , ..., j*n ).
Произведение этих матриц равно
n
n
2
j+ j = j1* j1 + j*2j2 + ... + j*n jn1 = ∑ j*j j j = ∑ j j .
=j 1=j 1
Если А = А +, то матрица А называется эрмитовой, или самосопряженной. Именно эти матрицы чаще всего и встречаются в квантовой механике. Легко видеть, что у эрмитовой матрицы диагональные элементы вещественны.
Наконец, матрицу A − I , обладающую свойством
AA − I = I,
называют матрицей, обратной к А.
Отметим, что единичная матрица I является наиболее симметричной, так как для нее справедливо соотношение
I −1= I= I*= I += I.
44
В заключение приведем часто встречающиеся формулы для произведения матриц:
*
*
1 −1
=
( AB)−1 B −=
A , ( AB)* A=
B , ( AB)+ B + A + ,
и еще одно для транспонированной матрицы:

.
AB : 
AB = BA
2.5. Обозначения Дирака
Мы видели, что любой вектор гильбертова пространства задается совокупностью его компонент в данном базисе. Его удобно представлять в виде матрицы-столбца
 j1 
 
j =  .
j 
 n
Введем формально сопряженное пространство векторов j+ ,
которые получаются из j в результате эрмитова сопряжения и потому представляют собой матрицы-строки
∗
j+ =(j1∗ , j∗2 , ..., jn
).
Теперь формулу скалярного произведения векторов φ и j можно записать в матричных обозначениях:
(φ, j) =φ+ j.
П. Дирак ввел в квантовую теорию два вида векторов: бравектор и кет-вектор (от англ. bracket – скобка).
Кет-вектор j = j и сопряженный ему бра-вектор» j+ = j . Эти
два вектора из разных пространств, и потому складывать их нельзя. Связь между ними состоит в том, что они эрмитово сопряжены,
т. е. выполняются соотношения
+
+
j = j , j = j .
Из бра- и кет-векторов можно составить следующие комбинации:
j , j , φ|j , j φ , φ j .
45
Первые два вектoра нам уже знакомы – это кет- и бра-векторы.
Третий объект – скалярное произведение векторов φ и j:
φ | j = (φ, j).
Символ φ j определяет линейный оператор. Последний объект имеет смысл тензорного произведения. Мы уже встречали пример матричного представления тензорного произведения, и о нем
будем говорить в последующем. В дираковских обозначениях норма вектора может быть записана в ином виде:
j=
(j, j) =
(j | j).
Можно ввести сопряженные базисы, т. е. базис в пространстве кет-векторов и сопряженный ему базис в пространстве бравекторов. Такие пары базисов называют согласованными ортонормированными базисами. Базисные орты, соответствующие им,
можно обозначать, например, так:
1 , 2 , ..., n è 1 , 2 , ..., n .
Условие ортонормированности базиса записывают в виде
j | k = δ jk .
Сопряженные векторы j и j можно разложить по соответствующим базисам:
j=
n
∑ ji i ,
j=
n
∑ j i
i.
=i 1=i 1
Отсюда нетрудно получить выражение для компонент векторов:
jk=
k | j è j k=
j|k =
*
k | j = j*k .
(2.8)
Подставляя полученные выражения компонент векторов в выражения разложения по базисам, получаем еще одну форму записи
указанного разложения:
j=
n
∑i
i | j è j=
n
∑
=i 1=i 1
46
j|i i.
2.6. Линейные операторы
Под оператором F будем понимать правило, по которому каждому вектору j гильбертова n-мерного пространства ставится
в соответствие вектор φ такого же пространства. Записывают это
следующим образом:
φ= Fj.
Оператор F линеен, если для любой пары векторов j и φ и
любых комплексных чисел α и β
F (α j + β φ ) = α(F j ) + β(F φ ).
К операторам применимы все основные алгебраические действия.
Суммой операторов F и G называется такой оператор F + G, который каждому вектору j ставит в соответствие вектор F j + G j :
( F + G) j = F j + G j .
Произведением оператора F на число α называется такой оператор αF, который переводит вектор j в вектор α(F j ):
(αF) j =α(F j ).
Произведение операторов F и G есть оператор FG, действие которого эквивалентно последовательному применению к вектору j
cначала оператора G, а затем оператора F:
(FG) =
j F (G j ).
Важно отметить, что в общем случае произведение операторов
некоммутативно:
FG ≠ GF.
Наряду с операторами, действующими в евклидовом пространстве, можно определить операторы, работающие в сопряженном
пространстве бра-векторов, – сопряженные операторы.
Так, если в пространстве кет-векторов действует оператор F
χ = Fj,
(2.9)
то можно ввести сопряженный F оператор F + , который действует в сопряженном пространстве, переводя бра-вектор j , сопря47
женный кет-вектору j , в бра-вектор χ , соответствующий кетвектору χ :
χ = j F+.
(2.10)
Умножая (2.9) слева на j , а (2.10) справа на φ , получаем слева в силу эрмитовости скалярного произведения комплексно-сопряженные выражения. С учетом этого можно записать
j F+ φ
∗
=φ F j .
(2.11)
Это выражение можно рассматривать как определяющее для
сопряженных операторов. Данное соотношение в стандартных обозначениях можно переписать в виде
(j, F + φ)* =
(φ, Fj), èëè (F + φ, j) =
(φ, Fj).
Можно показать, что
(αF)+ =
α∗ F + , (F1 + F2 )+ =+
F1+ F2+ , (F1 F2 )+ =
F2+ F1+ , (F + )+ =
F.
Докажите это, используя основные свойства операторов и свойства скалярного произведения.
Правило перехода от некоторого заданного соотношения к сопряженному ему:
1. Заменяем все числа на комплексно-сопряженные, все кетвекторы на бра-векторы и, наоборот, все операторы на сопряженные.
2. Обращаем порядок следования векторов и операторов.
Если оператор F = F + , то такой оператор называется самосопряженным, или эрмитовым. Из (2.11) вытекает основное свойство эрмитова оператора:
∗
φFj = jFφ .
Вектор f , не равный нулю и удовлетворяющий соотношению
F f =f f ,
(2.12)
называется собственным вектором оператора F, а число f – собственным значением этого оператора, отвечающим данному собственному вектору.
Если данному собственному значению f отвечает один с точностью до множителя собственный вектор f , то оно называется невырожденным. Если же собственному значению отвечает несколько собственных линейно независимых векторов, то говорят, что оно
48
является вырожденным. Максимальное число таких векторов называется кратностью вырождения.
Отметим особо, что если вектор f является собственным вектором оператора F с собственным значением f, то вектор α f также
является собственным вектором с тем же собственным значением.
Действительно,
F ( αf ) =
αF ( f ) =
α(f f ) =
(f αf ).
Выделим важные свойства собственных значений и собственных векторов:
1. Все собственные значения эрмитовых операторов вещественны.
2. Собственные векторы эрмитова оператора, соответствующие
разным собственным значениям, ортогональны.
Докажем это.
Пусть f и f ′ – собственные векторы эрмитова оператора F
с соответствующими собственными значениями f и f ′. Тогда выполняются соотношения
=
F f f=
f è F f′ f′ f′ .
Перейдем от первого соотношения к сопряженному ему и учтем
эрмитовость F, а второе оставим без изменений:
∗
=
f F f=
f , F f′ f′ f′ .
Далее умножим первое уравнение справа на f ′ , а второе – слева
на f :
∗
=
f F f ′ f=
f | f′ , f F f′ f′ f | f′ .
Вычтем теперь из первого второе:
=
0 (f ∗ − f ′) f | f ′ .
(2.13)
Положив f = f ′ , получим
f ∗ = f,
т. е. собственные значения эрмитова оператора – вещественные
числа.
Заменив в (2.13) f ∗ на f ′, найдем
0= (f − f ′) f | f ′ ,
откуда следует, что
49
=
f | f ′ 0 ïðè f ≠ f ′,
т. е. собственные векторы эрмитова оператора, принадлежащие
разным собственным значениям, взаимно ортогональны.
Простота приведенного доказательства связана с использованием дираковских обозначений. В дальнейшем их применение приводит к существенному упрощению вывода формул.
Для полноты картины приведем еще несколько фактов, не прибегая к доказательству:
– линейно независимые собственные векторы, принадлежащие
вырожденному собственному значению, не обязательно ортогональны;
– определенные линейные комбинации таких собственных векторов уже взаимно ортогональны. Поэтому можно утверждать, что
собственные векторы, вырожденные и невырожденные, некоторого эрмитова оператора являются взаимно ортогональными;
– согласно линейной алгебре всякий линейный самосопряженный оператор, действующий в n-мерном евклидовом пространстве,
имеет ровно n линейно независимых собственных векторов. Выбирая их взаимно ортогональными и нормированными, из них можно
построить ортонормированный базис в данном пространстве. Его
ортогональные орты будут удовлетворять условию
f ′ | f ′′ = δf ′f ′′ ,
где δf ′f ′′ – символ Кронекера, и условию полноты
n
∑f
f = 1.
(2.14)
Доказательство справедливости последнего выражения приводится далее.
i =1
2.7. Матричное представление операторов
Каждому оператору можно сопоставить матрицу. Нетрудно показать, что каждая матрица порядка n×n задает линейный оператор.
Пусть имеются вектор j с компонентами {j1, j2 , ..., jn } и квадратная матрица А порядка n×n. Определим вектор φ с компонентами
{φ1, φ2 , ..., φn }, которые удовлетворяют следующим равенствам:
50
φ1= a11j1 + a12 j2 + ... + a1n jn ,
φ2= a21j1 + a22 j2 + ... + a2n jn ,

φn= an1j1 + an2j2 + ... + ann jn ,
или в более компактной форме,
=
φj
n
∑ ajk jk ,
i =1
или в матричном виде
φ= Aj.
(2.15)
Таким образом, приходим к выводу, что каждой матрицей порядка n×n в n-мерном гильбертовом пространстве задается некоторый оператор.
Докажем обратное: каждому линейному оператору в n-мерном
гильбертовом пространстве соответствует в заданном базисе квадратная матрица порядка n×n.
Допустим, что в данном пространстве выбран ортонормированный базис 1 , 2 , ..., n , так что любой вектор j задается своими
компонентами j j =
j | j (см. (2.8)). Подействуем на этот вектор
оператором F:
φ= Fj
.
Умножим обе части слева на j и воспользуемся условием полноты:
n
n
j | φ =φ j = j | F | j = j | FI | j =∑ j | F | k k j =∑ fjk jk ,
k 1=
k 1
=
т. е.
=
φj
n
∑ fjk jk .
k =1
Совокупность величин fjk = j | F | k образует квадратную матрицу оператора F в заданном базисе. Эта матрица, сопоставляемая оператору F, однозначно определяет компоненты вектора
j = F φ , что и доказывает наше утверждение.
51
Например, для единичного оператора I, определяемого условием I j = j , получаем
=
Ij
n
∑j
j|j .
j =1
Отсюда следует важное равенство – условие полноты ортонормированного базиса (см. (2.14)):
n
I=∑ j j.
j =1
Рассмотрим теперь часто встречающиеся алгебраические комбинации операторов. Каким будет их матричное представление?
Имеем два оператора: F1 и F2. Образуем следующие выражения:
F=′ F1 + F2 , F ′′ = aF1, F ′′′ = F1 F2 .
Пользуясь линейностью скалярного произведения и условием
полноты базиса, получаем
n
(F1 + F2 ) jk = (F1 ) jk + (F2 ) jk , (aF1 ) jk = a(F1 ) jk , (F1 F2 ) jk = ∑ (F1 ) jl (F2 )lk .
l =1
Для матрицы сопряженного F оператора F + находим
(=
F + ) jk
j|=
F+ | k
∗
+
k |=
F|j
| (=
F)kj |∗ (F ) jk  .
Сформулируем теперь задачу отыскания собственных значений
и собственных векторов оператора F:
F f =f f .
Умножим слева на базисный орт j :
n
∑
j|F|k k f =f j f ,
k =1
т. е.
n
∑ fjk fk = ffj .
k =1
В развернутом виде имеем
f11f1 + f12f2 + ... + f1n fn =
ff1,
f21f1 + f22f2 + ... + f2n fn =
ff2 ,

fn1f1 + fn2f2 + ... + fnn fn =
ffn ,
52
или
(f11 − f )f1 + f12f2 + ... + f1n fn =
0.
f21f1 + (f22 − f )f2 + ... + f2n fn =
0.

(2.16)
fn1f1 + ... + (fnn − f )fn =
0.
Итак, отыскание собственных векторов оператора F сводится
к решению системы алгебраических линейных однородных уравнений. Такие решения существуют. Для этого необходимо, чтобы
определитель этой системы равнялся нулю:
f11 − f
f12

f1n
f21
f22 − f 
f2n
= 0.

fn1
fn2
 fnn − f
Раскрывая определитель, получаем уравнение n-й степени (характеристическое уравнение) для собственных значений f. Подставляя затем эти корни в систему уравнений (2.16) и решая ее, находим собственные векторы f = {f1, f2 , ..., fn } оператора F, отвечающие этим собственными значениям.
Если корень характеристического уравнения не является кратным, то ему соответствует одно (с точностью до произвольного множителя) решение системы, т. е. такое значение f не является вырожденным. Если же корень кратный, то получаем несколько разных решений системы, т. е. такое собственное значение f является
вырожденным. Кратность корня равна степени вырождения.
Из однородности системы уравнений вытекает, что всякое ее
решение определяется с точностью до численного множителя, т. е.
если f – собственный вектор оператора F с собственным значением f , то a f при любом комплексном числе a является собственным вектором оператора F с тем же собственным значением f .
Отметим, что всякий линейный оператор имеет хотя бы один собственный вектор. Это вытекает из основной теоремы алгебры, что любое алгебраическое уравнение n-й степени имеет хотя бы один корень.
Если оператор эрмитов, то он имеет не один, а n линейно независимых собственных векторов, из них можно построить базис, являющийся ортонормированным и полным.
Как выглядит матрица оператора F в его собственном базисе,
т. е. базисе, составленном из его собственных векторов f ?
53
Для матричного элемента справедливо выражение
(F)f ′f ′′ = f ′ | F | f ′′ .
Так как F f = f f , имеем
(F)f ′f ′′ =f ′ | F | f ′′ =f ′ f ′′ | f ′′ =f ′′δf ′f ′′ =f ′δf ′f ′′ .
Таким образом, матрица диагональная, и на диагонали располагаются собственные значения оператора. И чисто математическая
задача диагонализации матрицы данного эрмитова оператора решается одновременно с решением задачи на собственные значения
этого оператора.
Рассмотрим несколько примеров.
1 0 
Пример 1. Докажите, что матрицу 
 нельзя привести к ма1 1 
трице диагонального вида.
Р е ш е н и е. Невозможность такого приведения, по-видимому,
связана с отсутствием двух ненулевых собственных значений. Действительно, характеристическое уравнение в данном примере имеет вид
(1 − λ)2 − 1 =0.
0.
Корни этого уравнения λ1, 2 =
Пример 2. Покажите, что для двух произвольных векторов
v , w справедливо соотношение
( w , v )+ = v w .
Р е ш е н и е. Представим операторы в виде матриц. Для этого воспользуемся выражением (2.6):
cij = ∑ aik bkj .
Произведение матрицы-столбца порядка n × 1 (ей соответствует
вектор v ) на матрицу-строку (ей соответствует вектор w ) порядка 1 × n имеет смысл. Поскольку согласно (2.7) (n × 1)(1 × n) =n × n,
в этом случае получаем квадратную матрицу порядка n × n:
n 
 
×  [n × 1] = [n × n ].
1 
54
В формуле (2.6) индексы k теперь отсутствуют, а потому никакого суммирования не производится. Иными словами, матрицапроизведение строится из всевозможных попарных произведений
элементов матриц-сомножителей. Эта матрица называется тензорным произведением матриц v и w и обозначается v ⊗ w .
В рассматриваемом примере произведение v w приобретает вид
матрицы с элементами cij = viw*j , и матрица этого тензорного произведения имеет вид
v1w1∗ v1w2∗ v1wn∗
cij =
v2w1∗ v2w2∗ v2wn∗

.
vnw1∗ vnw2∗ vnwn∗
Произведение w v
+
приобретает вид
w1v1∗ w1v2∗ w1vn∗
w2v1∗ w2v2∗ w2vn∗

.
wnv1∗ wnv2∗ wnvn∗
Отсюда видно, что матрица, получаемая из последней в результате транспонирования и комплексного сопряжения, т. е. матрица
(( w v )+ )+ , эрмитово-сопряженная и совпадает с матрицей оператора v w , что и требовалось доказать.
В качестве упражнения покажите, что операция сопряжения
антилинейна, т. е.
+
( ∑ ai Ai ) = ∑ ai* Ai* .
В матричном представлении операция сопряжения означает
транспонирование и комплексное сопряжение матрицы.
Важным примером эрмитова оператора является проектор.
Если векторы 1 , ..., k образуют ортонормированный базис пространства W, являющегося подпространством пространства V, то
сумма P = ∑ i i есть проектор (пространства V) на подпространi
ство W. Следует отметить, что Р не зависит от выбора базиса в W.
Оператор: Q= I − P называется ортогональным дополнением
оператора P.
55
Пример 3. Покажите, что для любого проектора Р выполняется
равенство P2 = P.
Р е ш е н и е. P2 =
∑i j j j =
∑ i δij j
∑i
i =
P.
Если AA + = A + A, то оператор называется нормальным. Очевидно, что любой эрмитов оператор является нормальным.
Пример 4. Покажите, что любое собственное число унитарной
матрицы по модулю равно единице, т. е. может быть записано как
eiθ .
Р е ш е н и е. Оператор U (и соответствующая матрица) называет+
ся унитарным, если U U = I.
Унитарный оператор сохраняет скалярное произведение. Действительно,
(U v =
, U w)
U |w )
( v | U +=
=
v| I |w
v|w .
Пусть система находится в собственном состоянии унитарного
оператора U, т. е. справедливо равенство
U v =v v .
Согласно сказанному если v = w , то должно выполняться равенство
v | U +U
=
|v
=
v | v 1.
Вместе с тем
v | U +U | v = v
2
v|v .
Отсюда следует, что v = eiθ .
Пример 5. Покажите, что матрицы Паули
0 1
 0 −i 
1 0 
=
σx 
=
=
, σ y 
, σz 

1 0
i 0
 0 −1 
являются эрмитовыми и унитарными.
Р е ш е н и е. Эрмитовость матрицы означает, что выполняется
условие A = A + .
Рассмотрим матрицу Паули
0 1
σx =

.
1 0
56
Сопряженная матрица имеет вид
0 1
σ+x =

,
1 0
т. е. эрмитовость очевидна. Проверим ее унитарность:
+  0 1   0 1 1 0 
σ=
  =
 I.
 =
x σx 
 1 0  1 0   0 1 
 0 −i 
Пусть матрица σ+y =

. Эрмитовость ее очевидна. Очевидна
i 0
также унитарность:
+  0 −i  0 −i   1 0 
σ=
 =
  =
 I.
y σy 
 i 0  i 0   0 1 
Оставшуюся Z-матрицу предлагается рассмотреть самостоятельно.
Пример 6. Докажите, что два собственных вектора эрмитова
оператора, соответствующие разным собственным значениям, ортогональны.
Р е ш е н и е. Пусть оператор А эрмитов и имеет два собственных
вектора: w и v с собственными значениями w и v, причем v ≠ w:
=
A w w=
w,Av vv .
Тогда с учетом этого и по определению операции эрмитова сопряжения можем записать
w=
| A |v
=
w|v|v v w|v ,
+
=
w | A | v ( A=
w , v ) (=
A w , v ) w w|v .
Поскольку правые части равенств должны быть одинаковыми,
из-за условия v ≠ w это возможно лишь при равенстве нулю скалярного произведения w | v , что и означает ортогональность указанных векторов.
2.8. Представление операторов
с использованием тензорного произведения
Составим тождество
j = φ φ|j ,
57
которое очевидно выполняется для любых ортонормированных
векторов. Эту запись можно рассматривать как произведение величины φ φ на вектор j .
Сравнивая полученный вывод с (2.15), видим, что произведение
j φ есть оператор, который, действуя на бра-вектор φ , переводит его в новый бра-вектор j . Это необычное, на первый взгляд,
скалярное произведение вида j φ является, как принято говорить, представлением с использованием тензорного произведения.
Определим j φ как линейный оператор по правилу
(j
φ ) φ′ = j
( φ | φ′ ) =
φ | φ′ j .
Действие указанного оператора на вектор φ′ сводится к умножению вектора j на комплексное число φ | φ′ .
Рассмотрим теперь линейную комбинацию тензорных произведений вида ji φi :
∑ ai ji
φi | φi′ .
Пусть i – ортонормированный базис в пространстве V. Тогда
для произвольного φ справедливо выражение
φ=
∑ φi i ,
φi =
i|φ .
где
Умножив это выражение слева на
∑i
( ∑ i i ) φ = ∑ φi i
i , получим
=φ.
Последнее равенство отражает условие полноты
∑i
i = I.
(2.17)
В качестве еще одного примера использования условия полноты
рассмотрим квадрат нормы некоторого вектора j :
j
2
2
= j | j = j | I | j = ∑ (j j j | j = ∑ j j j*j = ∑ j j .
Одно из применений условия полноты (2.17) – представление
любого оператора в терминах тензорного произведения. Пусть
А – линейный оператор, отображающий вектор из пространства V
58
в вектор из пространства W. Пусть vi и wi – соответствующие
базисы. Используя дважды условие полноты, получаем
=
A I=
w AIv
∑ wj
wj | A | v=
i vi
∑ wj | A | vi
wj vi .
Это – тензорное представление оператора А. Из этого выражения видно, что оператор А содержит матричный элемент wj | A | vi
в i-м столбце и j-й строке.
Рассмотрим пример представления оператора в виде тензорного
произведения – очень важные для квантовой механики и квантовых вычислений матрицы Паули:
0 1
 0 −i 
1 0 
=
σx 
=
=
, σ y 
 , σz 

1 0
i 0
 0 −1 
(иногда обозначаемые как Х, Y и Z соответственно).
Эти матрицы можно рассматривать как отображение соответствующих операторов в ортонормированном базисе 0 , 1 в двухмерном гильбертовом пространстве.
В качестве примера запишем каждый оператор Паули в тензорном виде.
Так как =
v1
w
=
0, а =
v2
w
=
1 , для операторов Паули
1
2
получаем
1 0+0 1,
σ=
x
σy =−i 1 0 + i 0 1 ,
=
σz 0 0 − 1 1 .
В самом деле, для оператора Х в соответствии с выражением (2.18)
σx 0 =0 0 σx 0 0 + 0 0 σx | 1 1 + 1 1 σx 0 0 + 1 1 | σx 1 1 ) =
= 0 | σx | 0 0 0 0 | σx | 1 0 1 + 1 | σx | 0 1 0 + 1 | σx | 1 1 1 =
= 0 1+ | 1 0 .
Аналогичные представления имеем для Y и Z операторов Паули.
Приведем еще одно определение [22]: линейный оператор М является нормальным, если справедливо равенство
М + М = ММ +.
Существует важная теорема, которую приводим без доказательства.
59
Теорема 1 (о спектральном разложении). Любой нормальный
оператор М, действующий в векторном пространстве V, является
диагональным в некотором ортонормированном базисе пространства V. И наоборот, любой приводимый к диагональному виду оператор является нормальным.
Это, в частности, означает, что нормальный оператор М может
быть записан в виде
M
= ∑ λi i i ,
где λ i – собственные числа оператора Mi; i – ортонормированный
базис в V, а любой вектор из набора i является собственным вектором оператора M, соответствующим собственному числу λ i , либо
в терминах проекторов
M
= ∑ λ i Pi .
Пример 7. Докажите, что нормальная матрица является эрмитовой тогда и только тогда, когда все ее собственные значения действительны.
Р е ш е н и е. Пусть Н – эрмитов оператор (матрица) и пусть λ –
какое-то его собственное значение, а х – соответствующий нормированный собственный вектор. Тогда можно записать
=
λ =
λx x
Hx
=
x
x=
H+ x
x=
Hx λ* ,
т. е. λ – вещественное число.
Допустим теперь, что нормальный оператор Н имеет вещественные собственные значения. Тогда в базисе ортонормированных
собственных векторов оператора Н матрицы операторов Н и H +
совпадают. Следовательно, совпадают и сами операторы, т. е. Н –
эрмитов оператор.
Унитарная матрица U (и оператор) определяется условием
UU + = I,
следовательно, U – нормальный оператор и для него существует
спектральное разложение.
Отметим важное свойство: унитарные операторы сохраняют
скалярное произведение векторов. Действительно,
(U φ , U j ) = ( φ | U +U | j ) =
φ| I |j = φ j .
Из этого факта вытекает возможность представления произвольного унитарного оператора в виде тензорного произведения.
60
Действительно, пусть ji – некоторый ортонормированный базис,
а ji = U φi . Так как унитарный оператор U сохраняет скалярное
произведение, набор ji также является ортонормированным базисом. Умножая это выражение справа на φi и суммируя по i, получаем
U = ∑ ji φi .
i
И наоборот, если ji и φi – ортонормированные базисы, то их
тензорное произведение U = ∑ ji φi есть унитарный оператор.
i
Пример 8. Покажите, что любое собственное число унитарной маiθ
трицы по модулю равно единице, т. е. может быть записано как e .
Р е ш е н и е. Имеем
2
I = x x = x UU + x = Ux Ux = λ + λ = λ ,
т. е. λ =eiθ , где θ – любое вещественное число.
Пример 9. Покажите, что матрицы Паули являются эрмитовыми и унитарными.
Р е ш е н и е. Матрицы Паули имеют следующий вид:
0 1
 0 −i 
1 0 
=
σx 
=
=
, σ y 
, σz 
,
1
0
i
0




 0 −1 
откуда нетрудно видеть, что они эрмитово-сопряженные:
σik =
σ*ik
и удовлетворяют определению унитарности:
σσ* = I.
Особенно важный частный случай эрмитовых операторов – неотрицательно определенные операторы, которые определяются
условием
v A v > 0 для любого v .
Пример 10. Покажите, что собственные числа проектора Р равны нулю или единице.
Р е ш е н и е. Оператор Р по определению равен
k
P=∑ i i .
i =1
61
Он проецирует пространство V c базисом 1 ... d на подпространство W с базисом 1 ... k . Указанные базисы связаны методом ортогонализации Грамма–Шмидта.
Допустим теперь, что v – собственный вектор оператора P, а
vk – компоненты этого вектора в базисе 1 ... d , так что справедливо выражение
P v=
=
(1
k
∑i
i | v=
i =1
(1
1 + ... + k k ) v=
1 + ... + k k )( v1 1 + ... + vk k + vk+1 k + 1 + ... + vd d=
)
= v1 1 + v2 2 + ... + vk k= v ( v1 1 + ... + vk k + ... + vd d ).
Из последних двух равенств вытекает, что размерность собственного вектора проектора Р должна быть не больше k. Отсюда
следует равенство
v1 1 + v2 2 + ... + vk =
k v(v1 1 + ... + vk k ,
возможное лишь при v = 1. Что и требовалось доказать.
Пример 11. Докажите, что неотрицательно определенный оператор является эрмитовым.
Р е ш е н и е. Существует теорема, согласно которой любую матрицу А можно записать единственным образом в виде
A= S + iT ,
где матрицы S и T эрмитовы [19].
Запишем
A=
 i 

1
( A + A + ) + i  −  ( A − A + ) 
2
 2 

и заметим, что обе матрицы
 i 
1(
+ 
S=
A + A+ ) è T =
 −  ( A − A )  и
2
 2 

являются эрмитовыми. Единственность такого разложения вытекает из следующего рассуждения.
Пусть
A= E + iF,
62
где матрицы E и F эрмитовы. Тогда
2S =( A + A + ) =(E + iF) + (E − iF)+ =E + iF + F + =iF + =2E,
и, следовательно, E = S. Аналогично можно установить равенство
F = T.
В завершение доказательства достаточно вспомнить, что для
эрмитовых операторов справедливо утверждение: v | S | v
и
n
v | T | v – вещественные числа для любых векторов v ∈ C . Отсюда следует, что если оператор А является неотрицательно определенным, то его мнимая часть должна равняться нулю и он равен
=
A
1(
A + A + ),
2
где сумма всегда есть эрмитов оператор. Что и требовалось доказать.
В качестве упражнения покажите самостоятельно, что для лю1(
A
A + A + ) оператор AA + является неотрицабого оператора=
2
тельно определенным.
2.9. Тензорное произведение пространств
Тензорное произведение пространств – математическая процедура, позволяющая получать из векторных пространств размерностью m и n пространство размерностью m×n. Это обстоятельство
становится особенно важным при рассмотрении квантовых систем,
состоящих из нескольких частиц, «движение» которых коррелировано.
Пусть V и W – векторные пространства с размерностью m и n,
а v и w – векторы, принадлежащие этим пространствам. Тогда, составив тензорное произведение v ⊗ w , получим элемент
пространства V ⊗ W , являющегося тензорным произведением
пространств V и W. Элементами этого пространства являются и
различные линейные комбинации v ⊗ w . Базисом пространства
V ⊗ W размерностью m×n являются тензорные произведения базисных векторов пространств V и W.
Так, если V – двумерное пространство с базисом 0 , 1 , то базисом пространства V ⊗ V (четырехмерного) будут векторы
0 ⊗0, 1 ⊗0, 0 ⊗1, 1 ⊗1.
63
Основные свойства тензорного произведения:
1. Для любого скаляра C и векторов v ∈ V и w ∈ W выполняется равенство
C ( v ⊗ w ) =C v ⊗ w = v ⊗ C w .
2. Для любых векторов v1 , v2 ∈ V и w ∈ W выполняется равенство
( v1
+ v2 ) ⊗ w = v1 ⊗ w + v2 ⊗ w .
3. Для любых векторов w1 , w2 ∈ W и v ∈ V выполняется равенство
( w1
+ w2 ) ⊗ v = w1 ⊗ v + w2 ⊗ v .
Что касается операторов, действующих в пространстве V ⊗ W,
то поступают следующим образом.
Если А и В – линейные операторы, действующие в пространствах
V и W, а v и w – векторы в пространствах V и W, то оператор
A ⊗ B, действующий в пространстве V ⊗ W, находят по формуле
( A ⊗ B ) ( v ⊗ w )=
(A v
⊗ B w ).
Для остальных векторов «объединенного» пространства V ⊗ W,
полагая, что они могут быть представлены как линейные комбинации векторов vi ⊗ wi , результат действия оператора A ⊗ B определяется выражением


( A ⊗ B)  ∑ ( vi ⊗ w=

)
i


 i

∑ ai ( A vi
i
⊗ B wi ).
Для более сложного случая, когда для операторов A и B пространство значений не совпадает с пространством аргументов, т. е.
A : V → V ′ и B : W → W ′, можно определить оператор С, отображающий V ⊗ W в V ′ ⊗ W ′ в виде линейной комбинации тензорных
произведений операторов Ai и Bi , отображающих Ai : V → V ′ и
Bi : W → W ′:
=
C
∑ ci Ai ⊗ Bi ,
где по определению
=
C


64
∑ ci Ai ⊗ Bi  v
i

⊗w
=
∑ ci Ai v
i
⊗ Bi wi .
И еще одно важное соотношение. Свяжем скалярное произведение в пространствах V и W со скалярным произведением в пространстве V ⊗ W:
 a v ⊗w ,
i
∑ i i

∑ bj wi′
ij
*
′
⊗ vi′′  =
 ∑ aj bj vi | vi
 ij
wi | wi′ .
Образовавшееся пространство V ⊗ W со скалярным произведением наследует всю остальную структуру: сопряжение операторов,
унитарные, нормальные и эрмитовы операторы.
Все приведенные ранее рассуждения носят довольно абстрактный характер. Они могут стать более конкретными, если перейти
к удобному, матричному, представлению операторов. Для конечномерных гильбертовых пространств тензорное произведениe A ⊗ B
сводится к произведению Кронекера.
Пусть A := (aij ) – матрица m×n и В – матрица r×s. Произведение
Кронекера А и В определяется как матрица
 a11 B  a1n B 



A⊗B=


a B  a B
mn 
 m1
порядка mr×ns.
⊗k
, соответствуИ последнее. Введем полезное обозначение ψ
ющее k раз тензорному произведению самого на себя вектора ψ .
Например,
ψ
⊗k
= ψ ⊗ψ ⊗ψ.
Рассмотрим несколько задач, связанных с тензорным произведением.
Задача 2. Задан ортонормированный базис в гильбертовом пространстве C2
 eiφ cos θ 
=
j1 
=
, j2
 sin θ 


 − sin θ 
 −iφ
,
 e cos θ 


Используя этот базис, найти базис в пространстве C4.
0 +1
. Запишите в явном виде векторы
Задача 3. Пусть j =
2
⊗2
⊗3
j
èj
, используя обозначения 0 , 1 и кронекерово произведение.
65
Задача 4. Вычислите матричное представление тензорных произведений операторов Паули X и Z, I и X, X и I. Обладает ли тензорное произведение свойством коммутативности ?
Задача 5. Покажите, что операции транспонирования, комплексного и эрмитова сопряжения дистрибутивны относительно
тензорного произведения:
( A ⊗ B)* = A* ⊗ B* , ( A ⊗ B)ò = A ò ⊗ Bò , ( A ⊗ B)+ = A + ⊗ B + .
Задача 6. Покажите, что тензорное произведение двух унитарных операторов есть унитарный оператор.
Задача 7. Покажите, что тензорное произведение двух эрмитовых операторов есть эрмитов оператор.
Задача 8. Покажите, что тензорное произведение двух неотрицательно определенных операторов есть неотрицательно определенный оператор.
Задача 9. Покажите, что тензорное произведение двух проекторов есть проектор.
Задача 10. Оператор Адамара на одном кубите может быть записан следующим образом:
1
H=
= ( 0 + 1 ) 0 + ( 0 − 1 ) 1  .
2 
Прямым вычислением покажите, что преобразование Адамара
на n кубитах (H ⊗n ) может быть записано в виде
=
H ⊗n
1
2
n
∑ (−1)
XY
x y.
XY
2.10. Функции операторов
Пусть задана функция f, отображающая множество комплексных чисел в себя. Тогда можно определить соответствующую f матричную функцию на нормальных матрицах (в том числе эрмитовых) следующим образом.
Пусть спектральное разложение для некоторого оператора А
имеет вид
A = ∑a a a .
a
66
Тогда функция этого оператора определяется формулой
f ( A ) = ∑ f (a) a a .
a
Применим эту процедуру для нахождения, например, экспоненты нормального оператора Паули Z, матрица которого
1 0 
Z =
.
 0 −1 
Так как собственные значения равны 1 и –1, спектральное разложение имеет вид
=
Z 1 0 0 −1 1 1 ,
а экспонента оператора приобретает вид
exp(
=
Z) e1 0 0 + e−1 1 1 .
Последний результат в матричной форме записываем в виде
 e1
exp(Z) = 
0

0 
.
e−1 
Рассмотрим еще один пример. Найти квадратный корень и логарифм матрицы
4 3
A =
.
3 4
Нетрудно убедиться, что собственные числа этой матрицы 1, –9.
Спектральное разложение функции – корень квадратный от этой
матрицы– имеет вид
=
A 1 0 0 + 3i 1 1 ,
или в матричном выражении:
1 0 
A =
.
 0 3i 
Для функции ln A имеем
0 
0
ln A = 
.
0
ln(
−9) 

67
Выразим натуральный логарифм, используя комплексные числа.
 p
Так как −9 =
9 exp  i , имеем
 2
p
ln(−9)= ln 9 + i ,
2
и последняя матрица может быть записана в виде
0
0


.
ln A =
 0 ln 9 + i p 
2

Задача 11. Пусть v – произвольный действительный единичный трехмерный вектор, θ – действительное число. Докажите, что
exp(iθvσ)= cos(θ) I + i sin(θ) vσ,
где vσ= vi σi (в последнем выражении знак суммы опущен. Это
оправданно, если индексы повторяются).
Важной операторной функцией служит след матрицы. Следом
квадратной матрицы является сумма ее диагональных элементов:
tr( A) = Aii .
Здесь также опущен знак суммы, так выражения становятся
компактнее.
Свойства следа:
1) tr( AB) = tr(BA) (цикличность);
2) tr( A + B=
) tr( A) + tr(B) (линейность);
3) tr(zA) = ztr( A) (А и В – произвольные матрицы, z – комплексное число).
Рассмотрим еще одно важное свойство. Пусть унитарное преобразование переводит оператор А в оператор В:
B = UAU + .
Затем возьмем след от правой и левой частей:
tr(B) = tr(UAU + )
и учтем цикличность следа:
=
tr(B) tr=
(UAU + ) tr
=
(U + UA) tr( A).
Таким образом, след инвариантен относительно унитарного преобразования.
Рассмотрим важный прием, позволяющий из любой системы
линейно независимых векторов построить ортонормированный базис. Это – метод ортонормирования Грамма–Шмидта.
68
Пусть (xi ) – множество из n линейно независимых векторов,
а (zi ) – искомое множество ортонормированных векторов. Тогда
векторы zi можно вычислить рекуррентно следующим образом.
Положим yi = xi и
y1
z1 =
,
1
( y1, y1 ) 2
так что z1 – нормированный вектор.
Далее построим вектoр
y=
2 x2 − x2 , z1 z1.
Вектор y2 ортогонален вектору z1 и, нормируя его, получаем
z2 =
y2
(
1
y2 , y2 2
)
,
так что z2 – нормированный вектор, ортогональный вектору z1.
Процесс продолжается аналогично.
В этой связи рассмотрим важный пример. Пусть ψ – некоторый единичный вектор, а В – некоторый оператор. Для вычисления
следа tr(B ψ ψ ), используя метод Грамма–Шмидта, дополняем
вектор ψ до ортонормированного базиса i , в котором ψ является первым элементом. В результате получаем
tr(B ψ ψ ) =∑ i | B | ψ ψ i = ψ | B | ψ .
i
Задача 12. Покажите, что у всех матриц Паули кроме I след равен нулю.
Задача 13. Докажите свойство цикличности следа
tr( AB) = tr(BA).
Задача 14. Докажите линейность следа
tr( A + B=
) tr( A) + tr(B).
2.11. Пространство операторов
Множество Lv линейных операторов в гильбертовом пространстве V образует векторное пространство. При этом:
69
1) сумма двух линейных операторов есть линейный оператор;
2) если А – линейный оператор, а z – комплексное число, то zA –
также линейный оператор;
3) существует нулевой оператор 0.
В пространстве LV также имеется скалярное произведение, поэтому пространствo LV можно считать гильбертовым.
Задача 15. Покажите, что функция (.,.) на пространстве
LV × LV , определенная соотношением
( A, B) ≡ tr( A* B),
задает скалярное произведение – так называемое скалярное произведение Гильберта–Шмидта, или следовое скалярное произведение.
Докажите, что если размерность пространства V равна d, то размерность пространства LV равна d2 .
Постройте ортонормированный базис в гильбертовом пространстве LV , состоящий из эрмитовых операторов.
2.12. Коммутатор и антикоммутатор
Коммутатор операторов А и В определяется выражением
B]
[ A,=
AB − BA.
Если [ A, B ] = 0, то говорят, что операторы А и В коммутируют
друг с другом.
Антикоммутатор операторов А и В определяется выражением
B}
{ A, =
AB + BA.
В квантовой механике условие [ A, B ] = 0 означает возможность
одновременного измерения физических величин, соответствующих этим операторам (см. главу 3). Математически это означает,
что указанные операторы могут быть одновременно приведены
к операторам диагонального вида, т. е.:
=
A
ai i i , B ∑ bi i
∑=
i
i,
i
гдe i – некоторый общий набор ортонормированных собственных
векторов.
Это подтверждает следующая теорема, которую приводим без
доказательства.
70
Теорема 2 (о возможности одновременного приведения операторов к диагональному виду). Пусть А и В – эрмитовы операторы.
В этом случае [ A, B ] = 0 тогда и только тогда, когда существует такой ортонормированный базис, что оба оператора являются в нем
диагональными.
Удобство этой теоремы состоит в том, что вычислить коммутатор проще, чем собственные значения.
Например, рассчитаем коммутатор операторов Паули X и Z:
 0 1  1 0   1 0  0 1   0 −1   0 1   0 −2 

−

=
−
=
,
0  0 −1   0 −1  1 0   1 0   −1 0   2 0 

[ X, Z ] =  1
т. е. операторы не коммутируют, и, следовательно, их нельзя привести одновременно к операторам диагонального вида.
Рассмотрим несколько задач о коммутаторе и антикоммутаторе.
Задача 16. Проверьте коммутационные соотношения
=
iZ, [ Y, Z ] 2iX
=
, [ Z, X ] 2iY.
[ X, Z ] 2=
Его можно записать в виде
 σ j , σk =
 2i ∑ ξ jki σi .


i
Задача 17. Проверьте антикоммутационные соотношения
{σi , σj }=
0, i ≠ j,
а также, что
σ2i =
I.
Задача 18. Проверьте справедливость равенства
AB =
[ AB] + { A, B} .
2
Задача 19. Докажите, что справедливо выражение
σi σk =δik I + ∑ ξijk σi .
Задача 20. Пусть [AB] = 0, {AB} = 0, A – обратимая матрица. Покажите, что B = 0.
Задача 21. Покажите, что [ AB]+ = [B + , A + ].
Задача 22. Покажите, что [ AB] = −[BA ].
71
Задача 23. Пусть А и В – эрмитовы операторы. Покажите, что
оператор i[AB] также является эрмитовым.
2.13. Полярное разложение по сингулярным числам
Оператор можно разложить на более простые двумя способами.
Первый способ – это полярное разложение, основанное на следующей теореме.
Теорема 3 (о полярном разложении). Пусть А – оператор, действующий в линейном пространстве V. Тогда существуют такой
унитарный оператор U и такие неотрицательно определенные операторы K и J, что можно записать А как в виде правого полярного
разложения
I = KU,
так и в виде левого:
A = UJ.
=
AA + , K
A + A . Если A обратимый оператор, то опеЗдесь K =
ратор U также определен однозначно.
Другой способ разложения представлен следующей теоремой.
Теорема 4 (о разложение по сингулярным числам). Для квадратной матрицы А существуют такие унитарные матрицы U и V и
диагональная матрица D, что выполняется соотношение
A = UDV .
Диагональные элементы матрицы D называются сингулярными
числами матрицы A.
Задача 24. Как выглядит разложение неотрицательно определенной матрицы P, унитарной матрицы U и эрмитовой матрицы H?
Задача 25. Запишите полярное разложение нормальной матрицы в представлении с помощью тензорного произведения.
72
ГЛАВА 3. ОСНОВНЫЕ ПОЛОЖЕНИЯ
КВАНТОВОЙ МЕХАНИКИ
На сегодняшний день имеется несколько прекрасных учебников по квантовой механике [17, 19, 20, 21]. Не претендуя на исчерпывающее изложение предмета, мы вначале все же остановимся
на причинах, приведших к возникновению удивительной физической теории микромира – квантовой механике, и ее отличиях от
теории макромира. Кроме того, мы попытаемся установить преемственность идей классической и квантовой физики. Следуя современному стилю изложения, основные положения квантовой
механики представляем в виде системы аксиом. Некоторые из
этих аксиом формируют физическую основу идеологии квантовых
вычислений.
3.1. О физической теории микромира – квантовой механике
и ее отличиях от теории макромира
Возникновение квантовой механики принято связывать с проблемой теплового излучения. С этой целью рассматривалась задача
об электромагнитном поле в полости, стенки которой поддерживаются при постоянной температуре. Такие стенки в результате
колебаний электронов, содержащихся в их материале, излучают
электромагнитные волны. Число электронов конечно, и поэтому
энергия, излучаемая ими, конечна. Вместе с тем тепловое излучение в полости обладает сплошным спектром и может быть представлено как набор осцилляторов (ортогональных мод), но число этих
осцилляторов бесконечно. На каждый такой осциллятор согласно
статистической физике должно приходиться в среднем kТ тепловой энергии. Возникает вопрос, как в таких условиях может осуществляться обмен энергией между стенками полости при тепловом равновесии, которое, как показывает опыт, достигается спустя
некоторое время после нагревания их до заданной температуры?
Иными словами, как может возникнуть поток энергии от излучения к стенкам полости, если эта энергия отсутствует.
Таким образом, классическая статистическая физика в этом
случае терпит неудачу. В результате было сделано предположение
(М. Планк, 1900 г.), что обмен энергией между стенками и осцилляторами поля осуществляется порциями, кратными hn, где h – постоянная Планка, а n – частота осциллятора.
73
Идея Планка оказалась плодотворной и вскоре позволила
А. Эйнштейну объяснить явление внешнего фотоэффекта. По Эйнштейну (хотя в своей работе он прямо этого не заявлял), свет представляет собой поток частиц. Идея эта получила подтверждение
в опытах А. Комптона в 1927 г. В частности, им было доказано, что
свет состоит из частиц с энергией hn и импульсами
hn h
= ,
c λ
где с – скорость света в вакууме; λ – длина волны.
Возникает вопрос, что собой представляет фотон. Была предпринята попытка представить его как импульс классического электромагнитного поля (волновой пакет). Из теории колебаний известно,
что для импульса поля длиной δ x необходим спектр электромагнитных волн шириной δk ( k = 2p / λ – волновое число) порядка
δk  1 δ x.
Для фотона, у которого k = p / , где
=
 h / (2p), получаем
δk =δp / ,
тогда связь образовавшегося принципиального разброса импульсов
δp и длины волнового пакета δ x приобретает вид
δp /   1 / δ x,
или δ xδp  .
В более реальном трехмерном случае указанное соотношение
выполняется трижды: для осей х, y и z и компонент вектора импульса рх, ру и рz. В результате, перемножив получившиеся отношения, получим
δxδyδzδpx δpy δpz  3
– соотношение неопределенностей Гейзенберга.
Найденное соотношение указывает на то, что фотон в фазовом
пространстве занимает объем, как минимум равный ћ3. Отсюда,
следуя Гейзенбергу, можно сделать вывод, что если мы хотим увидеть частицу, бомбардируя ее фотонами с целью определения координаты q и импульса р, то эти последние будут измерены с точностью, не лучшей точности q и р используемых фотонов. Таким образом, любая частица, исследуемая оптическим методом, должна
удовлетворять неравенству
∏ Dqi Dpi ≥ 3 .
74
Это ограничение вместе с обнаруженным на опыте волновым поведением электронов позволило прийти к заключению, что классическая концепция частиц с точным значением q и p является чистой выдумкой. В результате это наивное классическое описание
было заменено другим, включающим в себя вектор состояния ψ,
обычно представляемый функцией ψ(q1, q2 , , qn ; t).
Наша интуиция, восходящая к каждодневному опыту общения
с макроскопическим миром, терпит поражение при попытке зрительно представить эту комплексную функцию в 3n-мерном пространстве конфигураций. Несмотря на это, некоторые физики пытаются придать волновой функции статус объективной реальности,
который был утрачен q и р. Есть соблазн предположить, что каждая
частица (или система частиц) имеет волновую функцию, которая
является ее объективным свойством.
К сожалению, не существует какого-либо экспериментального
тому подтверждения. Напротив, если принять такую точку зрения, то это приведет к странным следствиям, носящим название
квантовых парадоксов. Эти парадоксы возникают в результате
неправильного понимания квантовой теории. Последняя, будучи
исключительно прагматической, при точном ее использовании не
позволяет получать взаимоисключающие ответы на корректно поставленный вопрос. Только неправильное использование квантовых концепций, поддерживаемое псевдореалистической философией, приводит к парадоксальным результатам.
Мы уже упомянули проблему теплового излучения, открытие
фотонов и установление волновых свойств частиц, что в конечном
итоге привело к уравнению Шредингера и созданию системы квантовой механики.
Эта система строилась на привлечении математического аппарата линейных операторов, выделялся специальный класс данных
операторов, так называемых эрмитовых, исследовались свойства
собственных функций таких операторов.
Далее аксиоматически устанавливалась связь между этими математическими объектами и комплексной функцией ψ – волновой
функцией, описывающей состояние квантовой системы. При этом
линейным операторам придавался смысл динамических переменных (иногда называемых наблюдаемыми) – координаты, импульса, энергии, момента импульса и пр.
Волновая функция в этой системе приобретала статус вероятностной характеристики – плотности вероятностей. При этом постулировалось, что если квантовая система находится в состоянии,
75
описываемом собственной функцией ψ оператора А некоторой динамической переменной, то при измерении соответствующей динамической переменной всегда будет получаться число λ, являющееся собственным значением оператора А, принадлежащим собственной функции ψ.
В квантовой механике особенно большое значение имеет уравнение собственных функций и собственных значений оператора энергии – так называемое стационарное уравнение Шредингера:

Hψ = Eψ,

где H – оператор энергии (гамильтониан) квантовой системы; E –
собственные его значения. Обобщением этого уравнения, описывающим изменение состояния с течением времени, является общее
уравнение Шредингера:
∂ψ 
−i
=ψ
H ,
∂t
представляющее собой основное уравнение нерелятивистской
квантовой динамики.
Отметим, что уравнение Шредингера по структуре ближе всего
к уравнению классической механики Гамильтона–Якоби, что указывает на преемственность в иерархии физических законов. Простейшие задачи на применение уравнения Шредингера (главным
образом, стационарного) рассматриваются в курсе общей физики.
В построенной таким образом схеме квантовой механики решается вопрос о динамических переменных. Как уже указывалось, им
сопоставляются линейные самосопряженные операторы. Замечательным является то обстоятельство, что для динамических переменных квантовой механики можно записать уравнения, полностью аналогичные уравнениям движения классической механики.
При этом используются так называемые квантовые скобки Пуассона – математическая операция, выполняющая ту же роль, что и
скобки Пуассона в классической механике.
Наряду с теорией Шредингера существует другой метод описания квантовых систем. Он был предложен М. Борном, В. Гейзенбергом и П. Иорданом (БГИ). Уравнения этой теории очень похожи
на приведенные уравнения движения из теории Шредингера. Но
сформулированы эти уравнения были не для обычных числовых величин и не для операторов, а для матриц. Какое-то время казалось,
что эти теории различны, но уже в 1926 г. Шредингер показал, что
они эквивалентны и от одной из них можно перейти к другой.
76
Вслед за ним П. Дирак (а независимо П. Иордан и Ф. Лондон)
предложил чрезвычайно краткую и элегантную формулировку
квантовой механики. В ее основу положено некоторое векторное
пространство над полем комплексных чисел. Объекты этого пространства – векторы состояния. Обе теории (волновая Шредингера
и матричная БГИ) вытекают формально из теории Дирака. Эта теория обладает заметными преимуществами и логической простотой
и поэтому все больше входит в научный обиход. И мы будем строить изложение, следуя Дираку.
3.2. Аксиомы квантовой механики
Основываясь на математическом аппарате теории операторов
в гильбертовом пространстве (см. гл. 2), сформулируем основные
положения квантовой механики в виде системы аксиом.
Основой аксиоматики является принцип суперпозиции квантовых состояний. Квантовым состояниям в квантовой теории ставится в соответствие математический объект – вектор гильбертового пространства над полем комплексных чисел. Это и составляет
предмет первой аксиомы.
Аксиома 1. Состояния квантовомеханической системы описываются векторами j гильбертова пространства.
Замечание 1. Если учесть тот факт, что состояния определяются с точностью до произвольного численного множителя (см. замечание к формуле (2.12)), то длина вектора состояния j не играет роли. Можно сказать, что состояниям соответствуют «лучи»
в гильбертовом пространстве.
В выбранном произвольно базисе вектор состояния приобретает
конкретный вид:
j = ∑ ji i ,
где компоненты рассчитываются по формуле
ji =
ij.
Аксиома 2. Динамическим переменным классической физики
в квантовой механике соответствуют линейные эрмитовы операторы F, действующие в гильбертовом пространстве на векторы состояния j .
В заданном базисе операторам динамических переменных соответствуют матрицы с элементами
77
( F ) jk =
jFk.
Если оператор F преобразует вектор j в вектор φ , то матрица
оператора F преобразует компоненты j j в компоненты φ j по формуле
=
φj
n
∑ (F) jk jk .
k =1
Для эрмитова оператора в гильбертовом пространстве существует спектральное представление – его собственные состояния образуют полный ортонормированный базис. Эрмитов оператор F можно представить в виде
F = ∑ fn Pn ,
n
где fn – собственное значение оператора, а Pn – соответствующий
проектор (ортогональный проектор на пространство собственных
векторов, отвечающих собственному значению fn). Если собственное значение не вырождено, то Pn = n n – проектор на соответствующий собственный вектор. Напомним, что проекторы обладают следующими свойствами:
Pn Pm =
δnm Pn , Pn+ =
Pn .
Аксиома 3. Возможными результатами измерения данной динамической переменной (наблюдаемой) в заданном состоянии системы j являются собственные значения сопоставляемого ей
оператора F. Вероятность Wj (fn ) получить при измерении динами2
ческой переменной F в состоянии j значение fn равно αn , где
αn  – коэффициент в разложении j по базису из собственных векторов оператора F:
j=
∑ αn φn
.
n
Для построения теории квантовых вычислений предпочтительнее описание измерения с помощью оператора проектирования Р.
Так, указанная вероятность получить результат fn равна
Wj (fn ) = Pn j = j Pn j ,
и нормированным квантовым состоянием становится состояние
78
Pn j
j Pn j
.
Если измерение повторить сразу, то в соответствии с этим правилом будет получен точно такой же результат (см. далее теорему 2).
Для того чтобы установить, какие значения данной динамической переменной можно получить на опыте, необходимо решить задачу на собственные значения ее оператора:
F f =f f .
Характерной особенностью квантовой механики является то,
что результат измерения данной динамической переменной непредсказуем. Можно лишь точно предсказать вероятность того или
иного результата.
Знание вероятностей W (fn ) получения при измерении некоторой динамической переменной того или иного значения позволяет
вычислить среднее значение F j этой переменной. В классической статистике для таких целей используют формулу
F
j
= ∑ fn W (fn ).
n
В результате несложных выкладок получаем теорему о среднем.
Теорема 1. Среднее значение динамической переменной F в состоянии j дается формулой
F j =j F j .
Читателю предлагается исходя из теоремы 1 доказать, что среднее значение динамической переменной F в состоянии f , являющемся ее собственным состоянием, равно f, т. е. F f = f.
Из теоремы о среднем вытекает также важный результат, который формулируется в виде теоремы.
Теорема 2. Для того чтобы динамическая переменная F имела
строго определенное значение, необходимо и достаточно, чтобы она
находилась в состоянии, описываемом собственным вектором f
оператора F данной переменной.
Еще одно важное дополнение касается совместности измерений различных динамических переменных: несколько динамических переменных могут быть измерены одновременно, если их операторы попарно коммутируют.
79
Максимальное число независимых, одновременно измеряемых
наблюдаемых образует полный набор наблюдаемых. Этот набор
дает максимальную исчерпывающую информацию о данном состоянии квантовой системы.
Для завершения построения схемы квантовой механики следует
решить две проблемы: сопоставить каждой наблюдаемой конкретный эрмитов оператор и установить вид динамических уравнений,
определяющих поведение данной системы во времени.
Что касается первой проблемы, то в квантовой механике существуют основные операторы, которым в классической механике соответствуют такие величины, как координаты и импульсы, а все
остальные могут быть выражены через них. Например, если частица движется вдоль оси х во внешнем поле с потенциальной энергией U(x), то гамильтониан (оператор энергии) частицы имеет вид
=
H
px2
+ U (x),
2m
но в отличие от классической физики координата х и импульс px
являются операторами. В гильбертовом пространстве комплексных квадратично интегрируемых функций эти операторы имеют
следующий вид:
∂


x = x, px = −i .
∂x
Указанные операторы не коммутируют, в то же время операто∂
ры xˆ = x, pˆ y = −i
коммутируют (доказать). Введем еще одну ак∂y
сиому.
Аксиома 4. Координатам и импульсам квантовомеханической
системы соответствуют операторы Xj и Pk, удовлетворяющие перестановочным соотношениям
Xj Pk − Pk Xj =
iδ jk I.
В приведенном аксиоматическом построении квантовой механики впервые появляется фундаментальная постоянная Планка
, которая может служить своеобразным указателем квантового
характера закономерностей. Сформулированная таким образом
(в виде четырех аксиом и нескольких теорем) система квантовой
механики является своего рода ее кинематической основой.
80
3.3. Квантовая динамика
Обратимся теперь ко второй проблеме системы квантовой механики – квантовой динамике.
Уравнения квантовой динамики получим, основываясь на аналогии с классической механикой. Основным уравнением классической механики, описывающим динамику некоторой классической
переменной F, является уравнение
dF ∂F
=
+ [ H, F ],
dt ∂t
где Н – функция Гамильтона, равная для консервативной механической системы сумме кинетической и потенциальной энергии;
[ H, F ] – классические скобки Пуассона. Напомним, что скобки Пуассона – важное понятие аналитической механики, введенное им
в 1809 г. и получившее дальнейшее развитие в гамильтоновой механике. Скобками Пуассона двух динамических величин f и g некоторой гамильтоновой системы называют выражение
=
[ f, g ]
n
 ∂f ∂g
∂f ∂g 
−
,
k =1  k ∂qk ∂qk ∂pk 
∑  ∂p
где f (q, p,t) и g(q, p,t) – некоторые функции гамильтоновых (канонических) переменных q1, , pn (k – число степеней свободы системы). Аналогом этого уравнения в квантовой механике является
уравнения среднего значения динамической переменной F , при
этом скобки Пуассона следует заменить на квантовые скобки Пуассона:
i
H, F ]
(HF − FH).
[=
(3.1)

Аксиома 5. Для любой физической системы изменение среднего
значения динамической переменной F в состоянии j определяется уравнением
d F j
∂F
=
+ [ H, F ] .
(3.2)
j
∂t j
dt
Учитывая формулу среднего значения из теоремы 1
F j =j F j ,
81
записываем (3.2) в явном виде:
d jFj
= j
∂F
i
j + j HF − FH j .
∂t

(3.3)
Если среднее значение данной динамической переменной не зависит от времени, т. е. если для всех векторов состояний j выполняется равенство
d F j
= 0,
dt
dt
то, как и в классической физике, F является интегралом движения. Из (3.3) следует, что для сохранения динамической переменной F необходимо и достаточно, чтобы выполнялось условие
∂F i
+ [ HF − FH ] =
0.
∂t 
В частности, гамильтониан (энергия) сохраняется тогда и только тогда, когда оператор Н не зависит явно от времени.
В большинстве случаев оператор F не включает в себя время как
параметр, так что необходимое и достаточное условие их сохранения сводится к коммутативности F с гамильтонианом:
HF − FH =
0,
что означает одновременную измеримость сохраняющейся величины F с энергией.
Уравнение (3.2), являющееся основным динамическим постулатом квантовой механики, допускает три разных способа введения
зависимости от времени в ее общую схему. Эти способы с позиции
физики эквивалентны.
3.4. Представление Шредингера1
От времени зависят только векторы состояний, а операторы
(в том числе и гамильтониан) не зависят. Это обстоятельство означает, что для среднего значения выполняется равенство
1
 Иногда термин «представление» в современном изложении квантовой механики заменяется термином «картина».
82
F
j
(t) =
j(t) F j(t) .
При этом основной постулат динамики (3.2) выполняется, если
изменение во времени векторов состояния подчиняется уравнению
Шредингера
∂ j(t)
= H j(t) .
i
(3.4)
∂t
В самом деле, запишем производную по времени от среднего значения и, воспользовавшись (3.1), получим
d F
j
dt
(t)
=
d jFj
dt
= j
= j
∂ j
∂j
∂F
j +
Fj + jF
=
∂t
∂t
∂t
i
∂F
j + j (HF − FH) j .
∂t

Отсюда видно, что равенство выполняется, поскольку сопряженное (3.4) уравнение имеет вид
−i
∂ j
∂t
=
j H,
и таким образом уравнение Шредингера согласуется с последней аксиомой. Указанное обстоятельство позволяет строить аксиоматику
квантовой механики иначе: вместо аксиомы 5 о среднем значении
динамической переменной (3.2) постулируется следующая аксиома.
Аксиома 6. Динамика замкнутой квантовой системы подчиняется уравнению Шредингера
i
∂ j(t)
= H j(t) .
∂t
3.5. Представление Гейзенберга
В данном случае зависящими от времени считаются операторы
динамических переменных, а векторы состояний неизменны. Поэтому для среднего значения наблюдаемой должно выполняться
соотношение
F j (t) =
j F (t) j ,
и уравнение (3.2) приобретает следующий вид:
83
dF (t) ∂F (t) i
= + {H(t) F (t) − F (t) H(t)}
∂t

dt
– уравнение Гейзенберга.
Смысл этого уравнения состоит в том, что оно, по сути, является
определением оператора производной по времени от динамической
переменной.
Описания, даваемые этими представлениями, связаны между
собой посредством некоторого преобразования. Касаться этого вопроса мы не будем.
3.6. Представление взаимодействия
В этом случае считается, что от времени зависят как векторы
состояний, так и операторы динамических переменных, т. е. для
среднего справедливо выражение
F
j
(t) =
j(t) F (t) j(t) .
Это представление ввел в теорию П. Дирак, и оно используется
при приближенных расчетах, основанных на методах теории возмущений.
Очень важной является следующая аксиома.
Аксиома 7. Эволюция изолированного квантового состояния
унитарна.
Запишем уравнение Шредингера для изолированной квантовой
системы:
∂ j(t)
= H j(t) .
i
∂t
Так как гамильтониан постоянен во времени, решением уравнения Шредингера являются функции
j(t)=
Оператор
i
Ht

e
i
U (t) = e 
j(0) .
Ht
осуществляет временную эволюцию вектора состояния j :
j(t) = U (t) j(0) .
84
(3.5)
Этот оператор является унитарным. Более того, любой унитарный оператор U может быть представлен в виде
U = e(iK) ,
где K – некоторый эрмитов оператор.
Полученный результат весьма важен: существует соответствие
между описанием динамики в разные моменты времени с использованием унитарных операторов и дифференциальным описанием
с использованием гамильтониана. В дальнейшем при изложении
вопросов, связанных с квантовыми вычислениями, будем пользоваться описанием с помощью унитарных операторов.
Для дальнейшего изложения темы квантовых вычислений важными представляются аксиомы 1, 6, 7 квантовой механики.
Задача 1. Докажите, что если операторы Pn удовлетворяют условиям Pn+ = Pn , то
Pn Pm = δnm ,
а также что любое состояние j =
представить в виде
j=
∑ ji i
∑ αn φn
(чистое состояние) можно
,
n
где αn = p(n); p(n) = j Pn j ;
P j
φn = n
.
p(n)
Задача 2. Пусть А и В – коммутирующие эрмитовы операторы.
Докажите, что e( A) e( B) = e( A + B) .
Задача 3. Докажите, что оператор U в выражении (3.5) унитарный.
Задача 4. Используя спектральное разложение, покажите, что
для любого унитарного оператора U оператор K ≡ −i log(U) является эрмитовым, а следовательно, U = e(iK) для некоторого эрмитова
оператора K.
3.7. Составные системы
Составные системы, т. е. ассоциации квантовых объектов, представляют принципиальный интерес для квантовых вычислений.
Будучи изолированы от внешнего мира, они активно взаимодействуют друг с другом. Как описать эволюцию такой системы и воз85
можность проведения измерений над ней? Для этих целей мы введем еще один постулат.
Аксиома 8. Если две физические системы рассматриваются как
одна объединенная, пространство состояний этой объединенной
системы является результатом тензорного произведения H1 ⊗ H2
пространств состояний H1 и H2, входящих в состав объединенной
системы. Если состояние первой системы j1 (t) , а второй – j2 (t) ,
то состоянием объединенной системы является
j1 (t) ⊗ j2 (t) .
(3.6)
Очень важно отметить, что если подсистемы не взаимодействуют между собой и каждая из них, таким образом, является замкнутой системой, то состояние объединенной системы можно записать в виде простого произведения ( j1 (t) )( j2 (t) ). Если же они
взаимодействуют, то описание в виде простого произведения может оказаться невозможным. В этом случае принято считать, что
состояния запутаны (entangled states) – исключительно важный
для квантовых вычислений класс состояний. На языке математики
состояние системы выражается вектором в 4-мерном пространстве
системы из двух подсистем, построенном с помощью тензорного
произведения (3.6).
Положения этой аксиомы можно распространить на объединенную систему, состоящую из большого (более двух) числа подсистем.
Замечание 2. В дальнейшем нам часто придется иметь дело
с произведениями вида (3.6). Для компактности записи вместо
значка ⊗ в тензорном произведении будем пользоваться общепринятой записью j1 j2 или j1j2 .
В качестве примера рассмотрим состояние системы из двух частиц, каждая из которых может находиться в двух состояниях: 0
и 1 . Эти состояния ортонормированные:
=
j
1
2
0 0 +
1
2
1 1 .
Следует показать, что это состояние запутанное.
Допустим, что состояние не запутанное. Это значит, что его
можно представить в виде произведения одночастичных функций:
j =
( α1 0
+ β1 1
)( α2 0
+ β2 1 ) =
= α1α2 0 0 + α1β2 0 1 + β1α2 1 0 + β1β2 1 1 .
86
Сравнивая полученный результат с функцией из условия, находим условия, которым должны удовлетворять коэффициенты
α1α=
2
1
2
,
α1β=
2 0,
α2β=
1 0,
β1β=
2
1
2
и которые, как нетрудно видеть, невыполнимы. Таким образом,
рассматриваемое состояние запутанное. Это состояние, играющее
большую роль в квантовых вычислениях, называется парой ЭПР
(пара А. Эйнштейна, Б. Подольски, Н. Розена).
Для многочастичных состояний (простейший вариант – две частицы) заявленная ранее аксиома 3 об измерениях может быть дополнена следующим положением.
Дополнение к аксиоме 3. Пусть j = ∑ αn φn γn −– состояние
n
двухчастичной системы, принадлежащее пространству состояний,
H A ⊗ HB ( φn – ортонормированные векторы, γn – нормированные на единицу, но не обязательно ортогональные). Измерение
динамической переменной F, проведенное на системе А, даст ре2
зультат fn с вероятностью αn , а двухчастичная система окажется
в состоянии φn γn .
87
ГЛАВА 4. КВАНТОВЫЙ КОМПЬЮТЕР Р. ФЕЙНМАНА1
Моделирование физических задач – одно из современных направлений как фундаментальной, так и прикладной физики. Решение ряда задач, связанных с моделированием (точным!) квантовых
объектов, таких, например, как молекулы, связано с выполнением
неимоверного по современным меркам объема вычислений. Поэтому важным является вопрос: на каком компьютере можно и нужно
выполнять моделирование.
Ответ на этот вопрос основан на идее внутренней совместимости
компьютера и физического объекта, который мы собираемся моделировать. В пользу этого свидетельствует результат, который был
получен ранее, – вычисления на компьютере можно сделать обратимыми (теорема Беннета). Законы физики также обратимы. Поэтому вместо того чтобы считать трудность задачи моделирования
квантовых явлений препятствием, Р. Фейнман счел ее благоприятной возможностью.
Если, чтобы узнать исход эксперимента с интерференцией фотонов, необходимо выполнить так много вычислений, то сам факт
его проведения и измерения результатов равносилен выполнению
сложного вычисления. Таким образом, следуя Фейнману, можно
было бы эффективно передавать квантовые среды при условии,
что компьютеру позволят проводить эксперименты над реальным
квантовомеханическим объектом. Этот объект становится, следовательно, неотъемлемой аппаратной составляющей квантового
компьютера, его процессором. При этом «общее руководство» вычислением осуществляет обычный компьютер.
Сам процессор представляет собой квантовый объект, передающий квантовомеханические свойства любой среды. Эти устройства
Фейнман определил как совокупность вращающихся атомов, каждый из которых взаимодействует со своими соседями. Весь класс
таких устройств Фейнман назвал универсальным квантовым компьютером. По образному выражению академика В. Осадчего, «бессмысленно надеяться на помощь классических компьютеров в серьезных исследованиях квантовых систем, но можно попытаться
1
 Нобелевский лауреат по физике Р. Фейнман вошел в историю науки, прежде
всего, как творец квантовой электродинамики. По его известным лекциям училось
не одно поколение современных физиков. Имя Р. Фейнмана стоит в одном ряду с
именами великих физиков XX столетия, таких, как А. Эйнштейн, П. Дирак, Н. Бор
и др. Именно Р. Фейнману принадлежит четко оформленная идея квантового компьютера.
88
использовать для этих целей квантовые компьютеры. Так прирученные слоны помогают в охоте на своих диких собратьев».
В 1985 г. физик-теоретик Д. Дойч строго доказал [22], что универсальный квантовый компьютер действительно существует. Это
доказательство основано на новом определении понятия машины
Тьюринга.
Универсальный квантовый компьютер может выполнить любое
вычисление, которое может выполнить любой другой квантовый
компьютер (или любой компьютер типа машины Тьюринга), а также он может передать любую конечную физически возможную среду в виртуальной реальности. Более того, с тех пор было показано,
что время и остальные ресурсы, которые ему понадобятся для осуществления всего этого, не будут увеличиваться экспоненциально
с ростом размеров или числа деталей передаваемой среды, так что
важные вычисления будут легко обрабатываемы в соответствии
с нормами теории сложности.
По Д. Дойчу, классическая теория вычисления, которая в течение полувека оставалась неоспоримым основанием вычисления, сегодня устарела, превратившись разве что, как и остальная классическая физика, в схему аппроксимации. В настоящее время такой
теорией является квантовая теория вычисления.
4.1. Проблема моделирования в физике
Р. Фейнман в 1982 г. одним из первых поставил вопрос о возможности точного моделирования на компьютере объектов физического мира и что оно может дать физике. При этом ставилась
задача поиска устройства, могущего моделировать любую физическую систему, т. е. устройства, которое по праву можно назвать
универсальным компьютером.
В связи с задачей точного моделирования естественным представляется вопрос, какую физику следует моделировать: классическую или квантовую. Что касается моделирования классической
физики, то важно помнить, что она обычно описывается дифференциальными уравнениями. Для приближенного решения этих уравнений строятся численные алгоритмы и затем используются компьютеры для выполнения по ним вычислений. При этом получаем
приближенную картину физического явления.
Но главный интерес состоит в осуществлении точного моделирования. А реальный физический мир управляется законами кванто89
вой механики. Следовательно, и моделирование должно быть квантовомеханическим.
Обратимся к квантовой механике. Известно, что поведение квантовых объектов описывается с помощью волновой функции ψ  –
пси-функции (в нашем изложении вектора состояния ψ ), квадрат
модуля которой является плотностью вероятности обнаружения частицы в данной точке пространства в данный момент времени.
Волновая функция удовлетворяет уравнению Шредингера. Вероятность становится определяющей физической величиной, характеристикой квантовой системы, поведение которой строго детерминировано уравнением Шредингера. В этой связи возникает
вопрос, если квантовая механика использует вероятность, то можно ли моделировать вероятность и как это сделать.
Можно записать уравнение Шредингера для квантовой частицы, описывающее вероятность нахождения ее в точке х в момент
времени t:
i
∂ ψ ( x,t )
= H ψ ( x,t ) .
∂t
Сделав х и t дискретными величинами, можно составить алгоритм и решить данное уравнение. При этом вероятность становится
дискретной. Однако если мы имеем дело не с одной, а с множеством
частиц, возникает серьезная проблема. Если частиц много, например R, то можно было бы описать вероятность событий, задавая вероятность найти эти частицы в точках x1, x2 , ..., xR в момент времени t. Назовем это расположение конфигурацией системы.
Если пространство имеет N точек, то оно может содержать число конфигураций, равное NR, т. е. для описания рассматриваемой
системы частиц понадобится NR чисел (k-значных). Кроме того,
в задачах, представляющих практический интерес, в каждой точке
пространства существует некоторое силовое поле (электрическое,
магнитное и т. д). Тогда число R будет того же порядка, что и N,
и, следовательно, чтобы получить вероятность, требуется описать
около NN конфигураций, а это огромное число. По всей видимости,
приведенные рассуждения показывают, что моделирование природы вычислением вероятности невозможно! Простое удвоение размера этой части природы (переход N → 2N ) потребует экспоненциального роста размеров моделирующего компьютера.
Итак, делаем окончательный вывод: мы не можем вычислять вероятности конфигураций для вероятностной теории.
90
4.2. Квантовые компьютеры – универсальные квантовые
моделирующие устройства
Существует два подхода к решению этой проблемы: первый – построить несколько необычный компьютер, состоящий из квантовомеханических элементов, подчиняющихся квантовым же законам,
и второй – используемый компьютер представляет собой логический универсальный автомат. Можно ли с его помощью имитировать эту ситуацию? Иными словами, можно ли квантовую механику моделировать на классическом компьютере.
Обратимся к первому подходу. Встает вопрос, можно ли сделать
это на новом типе компьютера – квантовом компьютере. Это уже
не машина Тьюринга, а нечто новое. Если в качестве приближения
предположить, что пространство не непрерывно, а дискретно, то
можно увидеть, что все полевые теории ведут себя примерно одинаково и могут быть смоделированы приближенно решеткой из
спинов, т. е. ансамбль спинов (решетка из спинов) является универсальной средой квантового компьютера.
Итак, можно полагать, что с подходящим классом реальных
квантовых устройств можно имитировать любую квантовую систему, включая физический мир.
В случае классического компьютера было установлено, что существует некий универсальный компьютер, который может делать
все, и неважно, как он устроен. Аналогично в случае квантовых
систем необходимо найти такой их особый класс, который бы моделировал все остальные. Иными словами, что может служить универсальным квантовым симулятором.
Допустим, что необходимо проверить, может ли каждая квантовомеханическая система быть точно смоделирована в предположении, что существует другая система, такая, что в каждой
точке пространства-времени она имеет лишь два возможных состояния (двухуровневая система): эта точка или занята, или не
занята.
Математика квантовомеханических операторов, связанная
с этими точками, проста: имеются оператор уничтожения а и оператор рождения а+. Действие оператора а заключается в том, что
если точка занята, то он меняет ее состояние на свободное:
a occ = un .
Если вектор occ записать в виде вектора-столбца
91
1
occ =  ,
0
а вектор un в виде
0
un =  ,
1
то оператор уничтожения в матричном представлении примет вид
0 0
a=
.
1 0 
Сопряженный оператор a + – оператор рождения: если точка
пространства-времени не занята, то он делает ее занятой:
 0 1
a+ = 
.
0 0
Вводится еще один оператор – оператор n:
1 0 
n=
.
0 0
1
Действие оператора n на занятое состояние occ =   не меня0
ет последнего, но его действие на незанятое состояние дает нуль0
вектор: 0 =  .
0
Введем тождественный оператор I:
1 0 
I =
.
 0 1
Операторы a и a+ могут быть записаны в терминах спиновых матриц Паули:
1
1
1
a=
σx − iσy , a + =
σx + iσy , n = a + a = (1 + σz ),
2
2
2
(
)
(
)
где
1 0 
0
=
σz 
=
, σ x 
 0 −1 
1
92
1
 0 −i 
=
, σ y 
. – матрицы Паули.
0
i 0
Возникает вопрос, можно ли, используя этот набор операторов,
имитировать любую квантовомеханическую систему, которая дискретна и имеет конечное число степеней свободы. И Фейнман отмечает, что это можно сделать для любой квантовомеханической системы
бозе-частиц, но нет уверенности, что частицы Ферми можно описать
такой системой… Дальнейшее развитие теории квантовых вычислений показало, что и фермионы описываются сходным образом.
Можно ли моделировать квантовые системы вероятностным образом на классическом компьютере ?
Второй подход, в котором речь идет о классическом вероятностном универсальном компьютере, содержит ответ на этот вопрос.
Нет! Результаты квантовой механики на классическом универсальном компьютере представить невозможно. Это называется проблемой скрытых переменных.
Для понимания этого можно попытаться представить уравнения квантовой физики в форме, наиболее близкой к классическим
уравнениям. Сразу видно, что проблема существует: невозможно
моделировать ψ -функцию из-за очень большого числа переменных. Надежда лишь на то, что моделируются вероятности, т. е. мы
собираемся заставить компьютер в результате вычислений получать в точности те же вероятности и результаты, которые наблюдаются в моделируемом квантовомеханическом объекте.
Здесь мы встречаемся с одним из драматических моментов
в истории квантовой физики. Речь идет о теории скрытых параметров: и о неравенстве Белла, и о существенном различии между
квантовой и классической физикой. Такое понимание необходимо
при обработке информации, получение которой невозможно в рамках классической физики.
4.3. Эксперимент А. Аспека с коррелированными фотонами.
Неравенство Дж. Белла
Проведем эксперимент и подойдем к описанию его результатов
с классических позиций, а затем сравним с результатом, который
позволяет получить квантовая теория и который прекрасно согласуется с опытными данными.
Рассмотрим опыт по пропусканию света через кристалл кальцита (рис. 4.1).
На выходе устройства возникают два пучка света – обыкновенный (О) и необыкновенный (Е). Обыкновенный луч поляризован
93
Ось
Падающий
фотон
Обыкновенный луч
]
O
Необыкновенный луч E
]
Детекторы
Рис. 4.1. Прохождение света
через двулучепреломляющий кристалл
вертикально, вдоль оптической оси кристалла, а необыкновенный – перпендикулярно оси. Если падающий фотон поляризованный, то после кристалла он последует по одному из лучей – О или
Е. Если на пути прошедших лучей поставить детектор фотонов, то
обнаружим фотон в канале О или в канале Е. Вероятность найти
фотон в канале О и в канале Е всегда равна единице. Он никогда не
обнаруживается в обоих детекторах.
Остановимся на опыте по разделению пучка на четыре поляризованных.
Ставим два кристалла на пути пучка так, что их оптические
оси повернуты относительно друг друга на некоторый угол j. На
рис. 4.2 второго кристалла изображены два идентичных, повернутых на одинаковый угол, так что, в принципе, одно и то же. Когда
фотон проходит через установку, срабатывает только один из детекторов фотонов.
Если фотон О поступает из первого кристалла, то на выходе второго кристалла имеем фотон О–О с вероятностью cos2 j или фотон
2
j sin2 j. Подобно этому фотон Е поО–Е с вероятностью 1 − cos=
O–O
O
E
O–E
E–O
E–E
]
]
]
]
Рис. 4.2. Комбинация трех кристаллов кальцита приводит
к возникновению четырех поляризованных световых пучков
94
рождает фотон Е–О с вероятностью sin2 j или фотон Е–Е с вероятностью cos2 j.
Обратимся теперь к опыту по двухфотонной корреляции (рис. 4.3).
Два фотона испускаются в противоположных направлениях,
например, в результате перехода 3s–2p–1s атома водорода. Они
наблюдаются одновременно через две призмы Николя (в терминологии СТО события являются «абсолютно удаленными»). Измеряемыми на опыте величинами являются состояния поляризации
фотонов О или Е.
Опыт состоит в измерении фотона в пучке О либо в пучке Е, причем выбор пучка случайный. Результаты опыта над «левым» фотоном принимают четыре значения: Q =
±1, R =
±1 (знак «+ » можно
отнести к случаю, когда фотон регистрируется, а знак «–» – когда
фотона в пучке нет). Здесь Q относится к обыкновенному лучу, а
R – к необыкновенному. Для «правого» фотона (результатов тоже
будет четыре) S = ±1 для обыкновенного и T = ±1 – для необыкновенного пучков.
Итак, измерения обоих фотонов производятся в один момент
времени и, следовательно, не могут повлиять друг на друга, поскольку физическое взаимодействие не может происходить со скоростью, превышающей скорость света.
Рассмотрим выражение
QS + RS + RT − QT
и преобразуем его в выражение вида
QS + RS + RT − QT = ( Q + R ) S + ( R − Q )T.
Поскольку Q, R = ±1, нетрудно видеть, что последнее выражение
принимает два значения: ±2. А теперь попробуем оценить (в виде
неравенства) среднее значение этого выражения, не конкретизируя
ϕ
ϕ
1
2
О
Е
О
Атом
Е
Рис. 4.3. Схема опыта по корреляции фотонов А. Аспека
95
детали опыта. Для этого обозначим p(q, r , s, t) вероятность того,
что состояние обоих фотонов в момент их рождения таково, что
=
Q q=
, R r=
, S s=
, T t.
Эти вероятности определяются деталями процесса излучения
фотонов, а также шумами регистрирующих устройств и качеством
кристаллов (так называемый экспериментальный шум). Тогда
среднее значение Aw результатов измерений, выраженное в виде
комбинации QS + RS + RT − QT, равно
Aw(QS + RS + RT − QT) =
=
∑
q,r ,s,t
p(q, r , s, t)(qs + rs + rt − qt) ≤
p(q, r , s, t) ⋅ 2
∑=
2.
q,r ,s,t
В то же время из последних двух преобразований вытекает
Aw(QS) + Aw(RS) + Aw(RT) − Aw(QT) ≤ 2.
Это неравенство носит название неравенства CHSH [23] – по
имени открывателей – Клаузер, Хорн, Шимони, Хольт (Clauser,
Horn, Shimony, Holt). Неравенств, подобных этому, существует несколько, и все они известны в литературе под названием неравенства Белла – первого исследователя, обратившегося к этой проблеме. Полученное неравенство знаменательно тем, что входящие
в него величины могут быть измерены: отдельно измеренные значения для «левого» фотона сопоставляются с одновременно полученными для «правого» и вычисляются средние значения указанных
в неравенстве комбинаций. Очевидно, что точность полученных результатов будет возрастать с увеличением числа опытов.
Что дает эксперимент? Результаты тщательных опытов с фотонами, похожими на обсуждаемый нами опыт, со всей определенностью указывают на то, что неравенство Бэлла не выполняется.
Одновременно квантовомеханический расчет дает результат,
полностью согласующийся с опытом. Детали эксперимента и полезные ссылки можно найти в упомянутой работе А. Аспека.
Полученный результат демонстрирует принципиальное расхождение классического и квантовомеханического подходов, хотя
и приводится в виде простого неравенства. На основании подобных
рассуждений Р. Фейнман делает вывод, что невозможно имитировать квантовую механику классическим компьютером.
Завершая эту тему, Фейнман отмечает: «…Квантовая вероятность больше, чем может дать любой логический аргумент. Логич96
но предположить, что есть другие подходы, снимающие эту проблему. Например, такой подход – возможно, это связано с временем,
и может получиться, что наши вероятности в некотором смысле
“иллюзорны”: мы имеем информацию только из прошлого и прогнозируем будущее, следующий шаг, но в реальности он зависит от
ближайшего будущего, которое мы не знаем.
Другой поход: у нас есть иллюзия, что мы можем сделать любой эксперимент, который захотим. Но все мы из одной Вселенной,
связаны с ней и потому никакой “реальной” свободы не имеем! Поэтому мы взаимосвязаны с экспериментом, как говорят – коррелированы с ним, и поэтому проявляющиеся в опыте вероятности имеют значения не такие, что получились бы, если бы они были чисто
случайными. Ответов на эти вопросы в настоящее время нет» [3].
Возможно, существуют иные подходы к проблеме моделирования, чем подход, основанный на квантовой механике. Для того чтобы передать ход рассуждений и манеру изложения, типичную для
Фейнмана, приведем его высказывание: «…кто-то что-то бормочет
о картине многих миров, и эта картина многих миров говорит, что
волновая функция ψ – это то, что реально, и это наше проклятье,
что переменных так много NR. Все эти различные миры и все построение конфигураций так похоже на наше построение конфигураций, просто оказалось, что мы сидим в этом построении конфигураций. Это возможно, но я этим не очень доволен…» [3].
Из сказанного видно, что подход этот, по мнению Фейнмана, не
является лучшим. Но все-таки природа подчиняется законам квантовой механики, и они должны учитываться. Моделирование природы лучше сделать квантовомеханическим. «…и мне не нравятся
анализы, исходящие только из классической теории, поскольку
природа не классическая, черт возьми, и если вы хотите сделать
моделирование природы, лучше сделать ее квантовомеханической,
и, ей богу, это прекрасная проблема, поскольку не выглядит такой
уж простой…» [3].
Но вернемся к нашей основной теме – квантовым компьютерам.
Большим стимулом для Фейнмана послужила ранее обсуждавшаяся нами работа Э. Фредкина и Т. Тоффоли [24].
4.4. Квантовый компьютер Фейнмана
Попытаемся установить ограничения, которые накладывают на
работу компьютера законы физики.
97
NOT
a
FANOUT
AND
a′
EXCHANGE
a
a
b
c′
a
a a′
0 1
1 0
ab
00
01
10
11
a
a′
b
b′
a
ab
00
01
10
11
c′
0
0
0
1
a′ b′
00
10
01
11
Рис. 4.4. Элементарные схемы, выполняющие операции NOT, AND,
FANOUT и EXCHANGE и их таблицы истинности
NAND
+V
NOT
+V
c′
a′
a
a
b
GROUND
GROUND
Рис. 4.5. Транзисторная цепь,
реализующая элемент NOT
Важной особенностью законов квантовой физики является их обратимость во времени. Это значит, что следует рассматривать вычислительные машины, подчиняющиеся таким обратимым законам.
В дальнейшем интерес будет представлять универсальный компьютер – абстрактное устройство, представляющее собой систему
взаимосвязанных логических элементов или просто элементов,
Последние соединяются проводами. Провода используются для
передачи информации, они передают одно из двух стандартных
напряжений, которым соответствуют 1 и 0. Элементы этой информацией манипулируют. Сказанное относится к классическим компьютерам.
Существует минимальный набор элементов, необходимых для
проведения любых логических операций Это четыре логических
98
элемента: NOT, AND, FANOUT и EXCHANGE (иногда именуемый
кроссовер) (рис. 4.4).
В обычном компьютере элемент NOT реализуется в приводимом
варианте транзистора (рис. 4.5).
Какова минимальная энергия, расходуемая на работу компьютера, состоящего из таких простых элементов? Мы уже готовы ответить на этот вопрос (см. гл. 1 о проблеме обратимости вычислений): настоящим минимумом является нуль.
4.5. Обратимая вычислительная машина
Для построения универсального компьютера достаточно трех обратимых простейших элементов: NOT, СONTROLLED NOT (CNOT)
и CONTROLLED CONTROLLED NOT (CCNOT). На рис. 4.6 приведены стандартное (слева) и часто используемое (справа) обозначение
элемента NOT и таблица истинности.
Видно, что этот элемент обратим, т. е. по состоянию на выходе
можно установить состояние на входе. Для этого достаточно применить к биту а элемент NOT дважды.
Следующий элемент CNOT (рис. 4.7) – контролируемое НЕТ.
Здесь имеются две входящие (а и b) и две выходящие ( a′ и b′ ) линии. Линия a′ та же, что и a. Если a = 1 (говорят, что линия активирована), то линия b′ есть NOT от b. Если же a = 0, то b не меняетCONTROLLED NOT
NOT
a
a′
a a′
0 1
1 0
Рис. 4.6. Элемент NOT
и его таблица истинности
а
а′
b
b′
a
b
a′ b′
0
0
0
0
0
1
0
1
1
0
1
1
1
1
1
0
Рис. 4.7. Элемент
контролируемое НЕТ
99
а
а′
а
b
b′
b
Рис. 4.8. Обратимость элемента CNOT
а
а
0
а
FANOUT
Рис. 4.9. Схема, реализующая
элемент FANOUT
a
a′
b
b′
EXCHANGE
Рис. 4.10. Операция EXCHANGE (обмен)
ся. Элемент обратим – его действие обращается просто повторением
элемента (рис. 4.8).
Указанный элемент обеспечивает выполнение операции FANOUT –
ветвление (рис. 4.9), которая при b = 0 копирует a на линию b′.
Этот элемент к тому же обеспечивает выполнение операции
EXCHANGE, совершающей обмен информацией на линиях а и b
(рис. 4.10).
Например, (0 1) на входе на первом этапе переходит в (0 1) на выходе (см. таблицу истинности на рис. 4.7), но управляющей становится
нижняя линия, на которой теперь стоит 1, а на управляемой (верхней) стоит 0, поэтому после второго элемента на обеих линиях получаем по единице. Действие последнего элемента (неперевернутого)
дает на выходе системы (1 0), так что обмен информацией состоялся.
4.6. Элемент Тоффоли
Для осуществления произвольных логических функций, приведенных ранее, элементов недостаточно. Необходим еще один обратимый элемент, который включает в себя уже три линии. Это
100
элемент Тоффоли CCNOT (контролируемый НЕТ), который мы рассматривали в гл. 1 (рис 4.11). Из трех две линии контрольные: a и
b, и они изменяют третью линию с, если обе они активированы (a =
1 и b = 1). В противном случае c′ = c.
Если на вход с подан 0, то он становится 1 (c′ = 1), когда a и b
равны 1, и таким образом получаем функцию AND. Комбинации a
и b, такие, как (0, 0), (0,1) и (1,0) приводят к одному и тому же значению нуль функции AND (a, b), и здесь для сохранения однозначности (и обратимости) требуются два бита. Эти биты сохраняются
на линиях a и b на выходе. Поэтому функция может быть обращена
(повторным действием ее самой).
Элемент Тоффоли может применяться для моделирования элементов NAND, а также для выполнения операции FANOUT (рис. 4.12)
Комбинируя эти элементы, можно создать любой логический
блок, который преобразует n битов в n битов обратимым образом,
например, сумматор. Для этого последовательно включают два элемента: CCNOT и CNOT (рис. 4.12).
Из a и b и 0 на входе получится первоначальное a на первой линии, сумма на второй и перенос на третьей. Из этого примера видно,
что вычисление сопровождается появлением некоторой промежу-
CONTROLLED CONTROLLED NOT
a
a′
b
b′
c
c′
a
b
c
a′
b′
c′
0
0
0
0
0
0
0
0
1
0
0
1
0
1
0
0
1
0
0
1
1
0
1
1
1
0
0
1
0
0
1
0
1
1
0
1
1
1
0
1
1
1
1
1
1
1
1
0
Рис. 4.11. Схема элемента Тоффоли
и таблица истинности
101
точной величины – мусора (garbage). Это весьма типичное явление.
Если решаемая задача сама по себе обратима, то дополнительного
«мусора» может и не быть. В общем же случае необходимы дополнительные линии для сохранения информации, которая понадобится в дальнейшем, чтобы иметь возможность обратить операцию.
Каково количество «мусора»? В общем случае оказывается, что
если искомые выходные данные содержат k битов, то, начиная
с некоторых входных данных и k битов, содержащих 0, в качестве
результата можно получить только входную и выходную информацию, и никакого «мусора». Эта процедура обратима, потому что
знание выходной и входной информации позволяет, разумеется,
аннулировать все проделанные действия (рис. 4.13).
На рис. 13 приведена некоторая машина М, у которой на входе
содержатся некоторая информация и большое число нулей. Машина, произведя вычисления, кроме искомой информации произвоa
a
b
SUM
0
CARRY
Рис. 4.12. Сумматор
Время
В
ы
х
о
д
В
х
о
д
М
Копирование
Выход
В
ы
х
о
д
м
у
с
о
р
Машина
Копирование
В
ы
х
о
д
В
В
ы
х
х
о
о
д
д
М
м
у
с
о
р
Обратная
машина
В
ы
х
о
д
В
х
о
д
Общая машина
(нули для М могут
рассматриваться как
соединяющие внутри
общей машины)
Рис. 4.13. Уборка «мусора»
102
В
х
о
д
дит «мусор». На этом этапе возможна операция копирования, которая может быть проделана последовательностью CONTROLLED
NOT, поэтому если первоначально имеется пустой регистр с k битами для выходной информации, после действия процессора М выходную информацию можно скопировать на новый регистр. Затем
можно построить обратимую машину M (М наоборот), которая
примет эту выходную информацию от М и «мусор» и переведет их
во входную информацию и нули.
Таким образом, все устройство, рассматриваемое как общая машина, начинает с k нулей регистра для выходной информации и
входных данных, а получает в качестве результата k нулей, занятых выходной информацией, и повторение входных данных.
На этом процесс квантового вычисления можно считать завершенным. И, будучи полностью обратимым, он произойдет без диссипации энергии (см. теорему Беннета).
4.7. Логические операции в квантовом компьютере
Рассмотрим теперь, как реализуется указанный компьютер, но
подчиняющийся законам квантовой механики. С этой целью записываем гамильтониан системы взаимодействующих частиц. Этот
гамильтониан будет детально описывать все вычислительные действия, но не будет учитывать взаимодействия с внешней средой,
которое неизбежно происходит на стадии приготовления входа системы (приготавливающим начальное состояние).
Частицы системы (назовем их атомами) могут находиться в двух
состояниях (двухуровневые системы). n-битовое число представляется состоянием регистра, который состоит из n двухуровневых систем.
В зависимости от того, находится ли атом в одном из двух состояний,
которые обозначим 1 или 0 , можно, безусловно, представить любое число. И число это может быть считано с регистра в результате
измерения состояния, в котором атом находится в данный момент
времени. Таким образом, один бит будет представлен одним атомом,
находящимся в одном из двух возможных состояний – 1 или 0 .
В качестве примера рассмотрим операцию CONTROLLED
CONTROLLED NOT и ее таблицу истинности, аналогичную приведенной на рис. 4.14.
Теперь полагаем, что на рис. 4.14 символы а, b, c – три некоторых атома в состояниях, которые мы обозначали 0 и 1 . Операция CNOT рассматривается нами не как физический перенос
103
a
a′
b
b′
c
c′
a
b
c
a′
b′
c′
0
0
0
0
1
1
1
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
0
1
0
0
0
0
1
1
1
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
1
0
Рис. 4.14. Элемент СCNOT
и его таблица истинности
информации из одного места в другое, а как изменение состояния
атомов а, b, c. Обозначим состояние данной системы, используя
символику Дирака, как вектор a, b, c .
В квантовой механике изменение состояния системы есть результат действия на вектор состояния некоторого линейного оператора А. Очевидно, что данная операция обратима. Это математически выражается формулой
A∗ A = 1,
где звездочка обозначает эрмитово сопряжение, т. е. А – унитарная
матрица.
Для построения матрицы А, реализующей операцию CСNOT,
рассмотрим сначала простой пример логической операции NOT.
Будем представлять его оператором Аa. Вид этого оператора (матрицы) можно установить, если воспользоваться методом операторов
рождения и уничтожения. Названия «оператор уничтожения» означает, что, действуя на атом, он переводит его из состояния 1 в состояние 0 , а, с точки зрения логической операции, уничтожает
логическую единицу на атоме и превращает ее в логический нуль.
Матрица оператора уничтожения a имеет вид
 0 1
a =  .
0 0 
104
Действительно,
 0 1  0   1 
=
a =
    .
0 0  1   0 
Видно также, что, действуя на состояние 0 , оператор дает число 0:
 1   0 1  1   0 
a =
   =
 =
 0,
 0  0 0  0   0 
т. е. он не меняет этого состояния, а просто дает численное значение
нуль, действуя на данное состояние.
Оператор рождения является сопряженным оператору уничтожения
0 0 
a* =   .
1 0 
Этот оператор, действуя на состояние 0 , преобразует его в состояние 1 (рождает это состояние). Действуя на состояние 1 , он
дает число нуль, потому что у атома нет дальнейших состояний.
Любой другой 2×2 матричный оператор может быть выражен через
введенные операторы.
Например, произведение
1 0 
0 0 
aa∗ =   , или a∗ a =   .
0 0 
 0 1
Нетрудно видеть, что сумма
aa∗ + a∗ a =
1,
где 1 – единичная матрица.
Составим теперь сумму – элемент Паули Х:
0 1
Aa ≡ a + a* =
1 0  .
 
Ее действие на состояние 0 дает
0 1 1   0 
1 0   0  =  1 
    
105
– состояние 1 . Ее действие на 1 дает
0 1 0   1 
1 0   1  =  0 
    
– состояние 0 .
Таким образом, сумма a + a* – это оператор, который производит элемент NOT.
Нетрудно видеть, что указанный оператор является обратимым
*
Aa Aa = I и унитарным.
Подобным образом может быть получена и матрица Aa,b для
CONTROLLED NOT (СNOT):
(
)
Aa,b= a* a(b + b* ) + aa* .
Первое слагаемое в этом выражении описывает действие оператора на оба атома (a и b). Действие на атом b во втором слагаемом
отсутствует, т. е. состояние этого атома не меняется. Формально это
можно отразить, записав второе слагаемое в виде aa* I, где I – единичный оператор.
Первый сомножитель a* a отличен от нуля для состояния
a = 1 . Тогда второй сомножитель b + b* , т. е. оператор NOT, применяется к b. Второе слагаемое aa* отлично от нуля для состояния
0 (или, иначе говоря, линия a = 0). При этом, как было отмечено
ранее, на b действует единичная матрица.
Действие CNOT с использованием дираковских обозначений
можно записать в виде
0 0 → 0 0 , 01 → 01 , 1 0 → 11 , 11 → 1 0
либо как результат сложения по модулю 2, как это делает классический элемент XOR (исключающее ИЛИ), обратите внимание, – необратимый:
a, b → a, b ⊕ a .
Действие CNOT можно описать унитарной матрицей:
1
0
A=
0

0
106
0
1
0
0
0
0
0
1
0
0 
.
1

0
a
a
s′
b
a = a′
s′
b = b′
c
c
d= 0
a
c′
SUM = c′
CARRY = d′
Рис. 4.15. Логическая схема полного сумматора
Это так называемое матричное представление CNOT для амплитуд ab : 0 0 , 0 1 , 1 0 , 1 1 .
Легко видеть, что первый столбец этой матрицы описывает преобразование состояния 0 0 , второй – преобразование состояния
0 1 и т. д.
Матрица Aa,b,c для CONTROLLED СONTROLLED NOT выглядит следующим образом:
Aa,b,c =1 + a* ab* (c + c* − 1).
Проверьте это утверждение.
Как будет выглядеть матрица совокупности простейших логических элементов, например, полного сумматора (рис. 4.15)?
На схеме четыре провода (линии) представляют рассматриваемую систему, состоящую из атомов a, b, c, d, находящихся исходно
в состоянии abcd . 1 Искомая матрица М изменяет состояние этих
атомов и переводит их в новое состояние a′b′c′d′ , соответствующее
данному логическому блоку. Формально это выглядит так:
M ψm =
ψ out .
1 0 1 0 , то, как слеНапример, если входящее состояние ψm =
дует из таблицы истинности, состояние на выходе долно иметь вид
ψ out =
1001 .
Матрица сумматора М может рассматриваться как произведение
пяти матриц, представляющих собой простые логические блоки:
M = Aa,b Ab,c Abc,d Aa,b Aab,d
(напомним, что матрицы «действуют» справа налево).
1
 Используемая символика, обозначающая тензорное произведение векторов состояния, является общепринятой, и мы будем пользоваться ею в дальнейшем.
107
Первая матрица Aab,d – правая. Она представляет собой простой
блок CONTROLLED CONTROLLED NOT. Здесь a и b служат контрольными линиями, а на лини d появляется NOT.
Самый последний множитель Aa,b представляет собой блок
CONTROLLED NOT c контрольной линией а и NOT на линии b.
Итак, остается ответить на главный вопрос.
Пусть A1, A2 , ..., Ak – требуемая последовательность операций некоторой логической цепи, работающей на n линиях. Необходимая для этого (2n × 2n ) -матрица М является произведением
Ak , ..., A3 , A2 , A1, где каждая А – простая матрица.
Как физически создать матрицу М, если известно, как выполнить более простые элементы?
Напомним аксиому об эволюции: в квантовой механике для системы с гамильтонианом Н состояние на выходе в момент времени t
есть eiHt/ ψ in , где ψ in – состояние системы на входе.
Найти гамильтониан, который бы приводил к данной матрице
M = eiHt/ , – очень непростая задача. Но можно разложить экспоненту в ряд Тейлора:
M=
eiHt/ =
1 + iHt /  − H2t2 / (22 ) − .... ,
и тогда построение матриц А (или М) решаем следующим образом.
Добавим к n атомам в регистре полностью новый набор k + 1 атомов, которые назовем программно считываемыми ячейками. Эти
атомы могут находиться в двух состояниях. Обозначим через qi*
и qi операторы рождения и уничтожения для ячейки с номером i,
i = 0, 1, …, k. В качестве гамильтониана возьмем сумму
=
H
k
c.c.
∑ qi*+1qi Ai+1 + =
i =0
q1* q0 A1 + q2* q1 A2 + ... + q0* q1 A1* + ... ,
где с.с. означает комплексное сопряжение.
Если все программные ячейки не заняты, т. е. соответствующие
атомы находятся в состоянии 0 , то действие на них операторов
уничтожения qi (а все члены в гамильтониане начинаются с оператора уничтожения) дает нуль для всех членов суммы.
Если же занята только одна ячейка (в состоянии 1 ) с номером i,
а все остальные не заняты (т. е. находятся в состоянии 0 ), то в результате действия на нее произведением операторов qi*+1qi , входящим в сумму ряда, состояние 1 передается из ячейки с номером i
в соседнюю ячейку i + 1.
108
Таким образом, если вначале программно считывающие ячейки
все за исключением ячейки с номером 0 находились в состоянии
0 , то спустя некоторое время конечная ячейка k окажется в состоянии 1 , а это означает, что регистр был умножен на матрицу М:
M = Ak  A2 A1.
Чуть подробнее: пусть входной регистр находится в некотором
начальном состоянии ψ in , а начальная ячейка с номером 0 занята. Тогда единственный член суммы, который может действовать, – это первое слагаемое q1* q0 A1 . В самом деле, q0 освобождает
первую (нулевую) ячейку, а оператор q1* загружает ячейку с номером 1, так что произведение q1* q0 сдвигает занятую ячейку из позиции 0 в позицию1, и содержимое ячейки умножается на матрицу
A1. Таким образом, входное состояние атомов регистра умножается
на матрицу A1.
Теперь если гамильтониан подействует еще раз, то оператором, который подействует на этот раз, будет уже второе слагаемое
q2* q1 A2 , поскольку именно оно может сдвинуть занятую ячейку,
которую можно назвать курсором, из ячейки с номером 1 в ячейку
с номером 2, и теперь матрица A2 действует на регистр, в результате чего получается матрица A2 A1.
Действуя гамильтонианом последовательно, наблюдаем постепенное перемещение «курсора» и находим одну за другой матрицы A, действующие на n атомов регистра в том порядке, который
требуется для формирования полной матрицы M. Однако данный
гамильтониан в силу эрмитовости содержит еще и эрмитово сопряжение этих операторов (см. вторую часть суммы). Так, если курсор
оказывается на ячейке номер 2, то имеем матрицу A2 A1, действующую на входной регистр.
Вместе с тем оператор уничтожения q2, который необходим
для перевода курсора в новую позицию 3, может встретиться в сопряженной части суммы в слагаемом q1* q2 A2* , которое приводит
к сдвигу курсора из позиции 2 в позицию 1. Но это означает, что
оператор, действующий на входной регистр, будет A2* A2 A1, что
в силу эрмитовости приводит к A2* A2 A1 = A1.
В итоге по мере того как разные слагаемые в гамильтониане двигают курсор взад-вперед, матрицы A либо накапливаются в произведении, либо их число уменьшается. При этом если курсор оказывается в положении j, то это означает, что все матрицы с номерами
109
от 1 до j действовали на регистр, и неважно, как курсор попал в положение j, – двигался ли он прямо от 0 до j или же проходил дальше
и возвращался к j любым образом.
Итак, если курсор находится в ячейке k, то матрица M действует
на начальное состояние регистра, к чему мы и стремились. И тогда
вычисление на этом компьютере происходит следующим образом:
вначале записываем входные биты в регистр и помещаем курсор
в ячейку с номером k (конечная в программной линии). Состояние
этой ячейки контролируем, например, по рассеянию электронов.
Если ячейка в конце концов окажется занятой (в состоянии 1 ),
т. е. вычисление закончено, то удаляем из ячейки k курсор так,
чтобы он не смог вернуться на программную линию.
Теперь можно быть уверенным, что выходные данные содержатся в выходном регистре, и в любой момент времени их можно измерить. Процесс измерения (как и загрузки в начале вычислений)
предполагает взаимодействие рассматриваемой квантовой системы
с внешним миром (что приводит к необратимым процессам).
Процесс передвижения курсора вверх и вниз по программной
линии сходен с распространением волны, как в задаче о сильносвязанных электронах, или спиновой волны в одном измерении.
Если можно создать любой логический элемент, то можно построить универсальный компьютер. Но при этом возникают некоторые проблемы, которых мы сейчас коснемся.
4.8. Недостатки и необратимые потери
свободной энергии
Первая трудность состоит в том, что связи между ячейками могут слегка отличаться друг от друга. Например, если ячейки представляют собой атомы, то их тепловые колебания будут очевидно
влиять на их связь друг с другом. Это, в конечном счете, приведет
к тому, что курсор необходимо будет проводить вдоль программной
линии, используя некую внешнюю силу.
Эту силу можно попытаться учесть. Например, в случае если
курсор представляет собой электрон, перемещающийся от ячейки
к ячейке под действием электрического поля и преодолевающий
таким образом сопротивление провода, можно попытаться оценить
величину необходимой для этого работы, а также понять, как минимизировать эту работу, т. е. сделать вычисления энергетически
незатратными.
110
Если предположить, что температура постоянна, то оценить такую работу можно исходя из термодинамики, обратившись к функции состояния, называемой свободной энергией Ф [12, т. 1]. Последняя определяется соотношением
Ф = U – TS,
где U – внутренняя энергия; Т – абсолютная температура; S – энтропия.
Необходимая для перемещения курсора работа равна – DФ, т. е.
убыли свободной энергии, которая в случае Т = const (при этом U не
меняется) равна – T∆S т. е. определяется убылью энтропии системы.
Что касается энтропии, то сошлемся на результат, полученный
Ч. Беннетом [14]. Каждый раз, когда курсор (электрон) подвергается рассеянию, полагаем, что он с некоторой вероятностью pFORW
рассеивается вперед и с вероятностью pBACW – назад. Для работы
машины требуется, чтобы выполнялось неравенство
pFORW > pBACW .
Оказывается, что потеря энтропии за один акт рассеяния равна
P
−DS = ln FORW .
PBACW
Эта величина может быть аппроксимирована выражением
pFORW − pBACW
.
pFORW + pBACW
Интерес представляет потеря энтропии на цепи вычислительных шагов, равная произведению вероятности рассеяния p на число
этих шагов. Потерю энтропии за один шаг вычислений можно предv
ставить как p D , где vD – скорость дрейфа курсора, а vR  – его
vR
случайная скорость, а это то же самое, что и произведение p на минимальное время, необходимое для вычисления (т. е. если все шаги
проведены в прямом направлении), деленное на реально требуемое
время. Тогда потери свободной энергии за один шаг будут равны
t
−DΦ = kTp min ,
t
где tmin – минимальное время; t – реальное время, которое отводится на выполнение данной операции. Это и есть формула, полученная Ч. Беннетом.
111
Из приведенного выражения видно, что потеря энергии на каждом шаге не равна kT, а является этой величиной, деленной на два
множителя. Первый множитель 1/р, соответствует тому, насколько совершенной является построенная машина, а второй пропорционален промежутку времени, необходимому для проведения вычислений. Все это очень похоже на машину Карно, в которой, чтобы сделать процессы обратимыми, следует производить действия
крайне медленно. Идеальной является машина, у которой р = 0,
и время, которое можно потратить на вычисления, бесконечно.
В этом случае средние потери энергии равны нулю.
В полученном выражении присутствуют энергия kT и время.
Возникает вопрос, какие ограничения накладывает на этот результат соотношение неопределенностей Гейзенберга для энергии и
времени:
h
δ Eδ t ≥ .
2
В этой связи отметим, что время выполнения вычислений из-за
рассеяния курсора подвержено случайным колебаниям и потому не
является точно определенным, т. е. имеет место существенная неопределенность времени δ t. Следовательно, неопределенность энергии δ E курсора минимальна, а это означает, что если потери энергии курсора и возникают, то они не зависят от числа шагов. Таким
образом, заключает Фейнман, не существует ограничений, исходящих из квантовой природы компьютера, связанных с числом шагов.
В то же время в рассматриваемом компьютере существует ряд
проблем, связанных с его несовершенством. Например, проблема со
считыванием данных в регистрах. Считывая данные, содержащиеся в одном атоме регистра, мы невольно влияем на другие атомы, поскольку взаимодействие атомов друг с другом – вещь неустранимая.
И еще одна проблема: сложно точно учесть все взаимодействия
атомов, происходящие в процессе вычисления. Формально это означает, что в гамильтониане помимо уже имеющихся существуют
малые члены.
Часть этих проблем может быть решена с помощью кодов, исправляющих ошибки, как это делается при работе классических
компьютеров, и может применяться в рассматриваемом случае.
Все, что необходимо на этом этапе, это конкретная реализация компьютера, и тогда станет ясно, что и как следует учитывать.
Перечисленные проблемы исключительно важны с практической точки зрения, ведь рассматриваемый компьютер, возможно,
112
будет очень чувствительной системой, и такие препятствия могут
привести к заметным осложнениям и в его работе.
Теперь можно оценить время одного вычисления. Если предположить, что каждое слагаемое гамильтониана составляет порядка
0,1 эВ, то время, за которое курсор произведет каждый шаг, составит примерно 6 ⋅ 10–15 с. Это означает, что скорость вычисления
примерно в 10000 раз больше скорости вычислений с использованием транзисторов и оптических систем.
4.9. Квантовомеханический компьютер.
В чем его вычислительная привлекательность?
Число может быть представлено битами, состоящими из нулей
и единиц. Предлагается строить такой компьютер из двухуровневых систем, т. е. квантовых частиц (например, атомов), каждая из
которых по аналогии с классическим битом может находиться в одном из двух состояний, одинаковых для всех частиц системы. Одно
состояние обозначим как 1 , а другое – как 0 . Тогда n-битовое
число представляется набором n таких двухуровневых систем (назовем его регистром). И число это может быть считано с данного
регистра путем измерения.
Вычисления в такой среде можно попытаться описать с помощью подходящего гамильтониана. При выводе гамильтониана
следует учитывать взаимодействие только между квантовыми
частицами, рассматривая их как замкнутую систему, не вступающую в контакт с внешним миром. Это означает, что при таком подходе не рассматриваются процессы введения входной информации
и считывания данных. Кроме того, исключаются взаимодействия
частиц с термостатом, что могло бы сделать их поведение необратимым.
И еще одно важное замечание. Несколько забегая вперед, обратим внимание на исключительную привлекательность, с точки
зрения информационной емкости, системы двухуровневых квантовых частиц. И дело здесь в принципе суперпозиции квантовых
состояний.
Сравним классическую систему, состоящую из n битов с квантовой из n частиц. Классический n-битовый регистр может хранить
одно из 2n чисел. В квантовом же регистре, в котором частицы находятся в состоянии, являющемся суперпозицией состояний всех
частиц, одновременно хранятся те же 2n чисел. Если число кван113
товых частиц равно 250, то в квантовом регистре хранится количество чисел, превышающее число атомов в видимой Вселенной.
И это еще заниженная оценка информационной емкости квантовой системы. Дело в том, что коэффициенты, входящие в суперпозицию (амплитуды), могут изменяться непрерывно. Однако если
произвести измерение, то в каждом акте измерения получим только одно из таких чисел. Несмотря на это, в данной системе можно
проводить математические вычисления, в которых одновременно
будут участвовать все числа, входящие в суперпозицию.
Например, если в качестве двухуровневой системы используется ансамбль n частиц со спином 1 2 , то, действуя на них импульсами
магнитного поля определенной длительности, можно осуществлять
поворот спинов, т. е. переводить ансамбль в новую (квантовую) суперпозицию состояний, которая затронет все частицы ансамбля.
Это означает, что можно осуществлять некоторое вычисление сразу над всеми числами-спинами, т. е. реализовать параллельное вычисление, не доступное классическому компьютеру. Последнему
потребовалось бы это вычисление повторить 2n раз или использовать для этого 2n параллельных процессоров. Таким образом, от
квантового компьютера можно ожидать огромного выигрыша в использовании вычислительных ресурсов – времени и памяти, хотя
бы для определенных видов вычислений.
На этом завершим изложение идей Р. Фейнмана, которые, несомненно, важны для понимания логики становления предмета
квантовых вычислений как раздела современного естествознания,
и остановимся на работах другого физика-теоретика, профессора
Оксфордского университета Д. Дойча.
Д. Дойчу принадлежит строгое определение квантового компьютера как универсальной вычислительной машины, работающей обратимым образом по законам квантовой механики. Им был
предложен квантовый алгоритм, демонстрирующий уникальную
способность квантового компьютера производить параллельные
вычисления.
4.10. Развитие теории квантового компьютера
в работах Д. Дойча
В работе Р. Фейнмана по моделированию квантовомеханических свойств любой среды было предложено конкретное устройство, состоящее из вращающихся атомов, каждый из которых взаи114
модействует со своими соседями. Весь класс таких устройств он назвал универсальным квантовым имитатором.
Однако этот имитатор не может называться универсальным компьютером. Взаимодействия, которым пришлось бы подвергнуться
атомам имитатора в процессе всевозможных вычислений, нельзя
было установить раз и навсегда, как в универсальном компьютере,
их необходимо было переустанавливать для каждой передаваемой
среды. Однако смысл универсальности состоит в том, что можно
запрограммировать отдельную машину, точно определенную раз
и навсегда, для выполнения любого возможного вычисления или
имитации любой возможной среды.
В 1985 г. Д. Дойч доказал [22], что в квантовой физике существует универсальный квантовый компьютер. Для этого пришлось
скопировать устройства Тьюринга, но для определения лежащей
в их основе физики воспользоваться не классической механикой,
которую неявно принимал Тьюринг, а квантовой теорией.
Универсальный квантовый компьютер может выполнить любое вычисление, которое доступно любому другому квантовому
компьютеру (или любому компьютеру типа машины Тьюринга), а
также он может точно моделировать любую конечную физически
возможную среду. Более того, было показано, что время и остальные ресурсы, которые ему понадобятся для осуществления всего
этого, не будут увеличиваться экспоненциально с ростом размеров
или числа деталей передаваемой среды, так что важные вычисления будет легко обрабатывать в соответствии с нормами теории
сложности.
Классическая теория вычислений, которая в течение полувека
оставалась неоспоримым их основанием, к настоящему времени
устарела, превратившись разве что, как и остальная классическая
физика, в схему аппроксимации. На сегодняшний день такой теорией является квантовая теория вычислений. Можно определенно заявить, что даже классическая теория вычислений не полностью соответствовала классической физике и содержала серьезные
черты квантовой теории.
Но вернемся к машине Тьюринга. В чем же состоит польза этой
модели? Возьмем, к примеру, следующую ситуацию: у разработчика вычислительного устройства не возникает препятствий для построения все более мощных машин, и тут может возникнуть ощущение беспредельных возможностей: кажется, что не существует
функции, которую нельзя вычислить. Но одно дело логика, а другое – физические ограничения. Хорошо известно, что разработчик
115
вычислительной машины быстро достигает точки, когда добавление нового оборудования не увеличивает множества вычислимых
функций (при идеализации неограниченной памяти).
А. Черч и А. Тьюринг (1936 г.) независимо друг от друга предположили, что ограничения на то, что может быть вычислено, не
зависят от технологических деталей, а являются универсальными.
Данное предположение называется принципом Черча–Тьюринга.
По Тьюрингу, можно утверждать следующее.
Утверждение 1. Любая функция, вычислимая в естественном
смысле, может быть вычислена универсальной машиной Тьюринга.
Обычно утверждение 1 интерпретируют как квазиматематическое утверждение того, что все возможные формализации интуитивного математического понятия «алгоритм» или «вычисление»
эквивалентны друг другу. Иными словами, если можно составить
алгоритм решения данной задачи (вычисления функции), значит
задача решаема (вычислима).
Д. Дойч предлагает рассматривать утверждение 1 как новый
физический принцип, называемый принципом Черча–Тьюринга,
дает иную формулировку, имеющую, по его мнению, ясный физический смысл и однозначность. При этом предлагается интерпретировать тьюрингово понятие «функций, вычислимых в естественном смысле», как функций, которые, в принципе, могут быть вычислены реальной физической системой.
Далее Д. Дойч определяет понятие идеального моделирования
(perfect simulation): вычислительная машина может полностью моделировать физическую систему Y относительно данной разметки
их входов и выходов, если для машины М существует программа
п(Y), которая делает М вычислительно эквивалентной Y относительно этой разметки. Иными словами, п(Y) превращает М в «черный ящик», функционально неотличимый от Y.
Сформулируем теперь физическую версию принципа Черча–
Тьюринга.
Утверждение 2. Каждая конечно реализуемая физическая система может быть полностью моделирована универсальной модельной
вычислительной машиной, оперирующей конечными средствами.
Эта формулировка точнее и имеет более определенный физический смысл, чем утверждение 1, так как она ссылается исключительно на физические понятия, такие, как «измерение», «подготовка» и «физическая система», и избегает неясных терминов
типа «естественно определенный», которые не укладываются в существующую структуру физики. Понятие «конечно реализуемая
116
физическая система» должно включать в себя любой физический
объект, над которым возможно проведение эксперимента. Понятие
«универсальная вычислительная машина» – это, конечно, идеализация, модель. Разметки, на которые есть неявная ссылка, также
должны быть конечно определимыми.
Принцип Черча–Тьюринга в форме утверждения 2 сильнее того
же принципа в форме утверждения 1. Он действительно настолько
силен, что не удовлетворяется машиной Тьюринга в классической
физике. Действительно, классическая физика, динамика предполагают непрерывность, что означает наличие континуума состояний классической системы. Но существует только счетное множество способов подготовки конечного входа для машины Тьюринга.
Следовательно, она не может полностью моделировать любую классическую динамическую систему, а лишь реализует последовательные дискретные аппроксимации. Д. Дойч строго доказал, что реальная (диссипативная) конечная система может быть полностью
моделирована универсальным квантовым компьютером Q. Поэтому именно квантовая теория совместима с сильной формой принципа Черча–Тьюринга (утверждение 2).
Далее Дойч доказывает, что утверждение 2 представляет собой
эмпирическое утверждение. Это очень важное обстоятельство позволяет в дальнейшем опираться на данный принцип при конструировании новых теорий, и он становится средством более глубокого
понимания этих теорий.
Итак, вслед за Д. Дойчем мы приходим к выводу, что классическая универсальная машина Тьюринга не обеспечивает принципа
Черча–Тьюринга в строгой форме утверждения 2. Таким образом,
необходима истинно квантовая модель.
Одна из первых попыток построения модели вычислений в рамках квантовой механики была предпринята в 1982 г. П. Беневом.
Это квантовомеханические модели машин Тьюринга. Модель содержит решетку из спинов 1 2 , при этом некоторые их конфигурации соответствуют частям машины Тьюринга. Динамика системы
спинов описывается операторами поворота спина.
В рассмотренной ранее работе Р. Фейнмана был сделан шаг в направлении настоящего квантового компьютера. Он представляет
собой решетку, состоящую из спиновых систем, в которой взаимодействуют ближайшие соседи. Но это еще не вычислительная машина, хотя она и может моделировать любую систему с конечным
пространством состояний. Исследование, проведенное Фейнманом,
носило принципиальный характер: им ставилась задача предъ117
явить некоторый гамильтониан для системы, которая могла бы
служить в качестве компьютера. При этом не ставился вопрос об
эффективности этой системы и способе ее реализации.
Строгие доказательства, приведенные в работе Д. Дойча, связаны с применением сложного математического аппарата. Мы постараемся передать идеи и выводы, по возможности избегая сложных выкладок, и изложим в несколько упрощенном варианте идею
квантового компьютера.
4.11. Идея квантового компьютера проста
Допустим, что требуется найти некоторое неизвестное натуральное число p. Это может быть код разложения данного натурального
числа на простые множители или решение некоторого целочисленного уравнения, или еще что-нибудь, но для нас важно, что данное
число не известно и соответствует какому-то базисному состоянию
некоей квантовой системы. Допустим также, что известен гамильтониан Н, описывающий эту систему, так что если система начинает эволюцию с состояния ψ0 , то к моменту времени t она будет
находиться в состоянии (см. гл. 3)
ψ ( t=
) e−iHt/ ψ0 . Разложим это состояние по базису e0 , e1 , ..., eN −1 , так, чтобы получилось
ψ ( t ) =∑ λ j (t) ej ,
j =0
т. е. весь закон эволюции отражается функциями λ j (t).
Будем считать, что число р найдено, если при измерении состояния данной системы с высокой вероятностью получено состояние
2
e p . Вероятность того, что ответ верный, равна λ p .
Построим график зависимости этой функции от времени, и
пусть она имеет пик в некоторый момент tq , причем tq < tcl , где tcl
есть время, которое классический компьютер тратит на поиск р.
Оказывается, что, имея такую квантовую систему и запустив
требуемое взаимодействие, а также подождав время tq , обнаружим ее в состоянии, соответствующем максимуму модуля амплитуды искомого состояния, и получим р раньше, чем конкурент, во118
оруженный классическим компьютером. Это есть квантовое ускорение для классических алгоритмов.
Для ряда очень важных задач, например, для задачи перебора
или задачи поиска собственных чисел операторов, это ускорение
так велико, что для его демонстрации достаточно небольшой квантовой системы, содержащей несколько десятков квантовых частиц.
Для иных классов задач, например, для задачи определения равновесия значений данной булевой функции (PARITY), это ускорение
небольшое – всего в два раза.
Существуют и такие задачи, для которых применение квантового компьютера не может дать ускорения вовсе. Это, например,
задача нахождения результата итерации (последовательного приближения) выбранной наугад классической функции F, т. е. нахождение F (F (...F (x0 )...).
Важно то, что для огромного числа практически значимых задач возможно серьезное квантовое ускорение, и именно это сулит
в обозримом будущем настоящий переворот в информатике.
Конкретизируем приведенную схему, построив, пусть абстрактную, схему квантового компьютера. Прежде всего следует выделить в нем классическую и квантовую части. Классическая часть
используется для управления, а квантовая служит для собственно
вычислений. Классическая часть может влиять на квантовую, задавая гамильтониан эволюции квантовой части. Влияние же квантовой части может проявляться только путем получения результата ее измерения. Как известно, измерение неминуемо разрушает
состояние квантовой части, поэтому оно должно производиться
только после завершения вычислений. Таким образом, классическая часть компьютера изменяется самостоятельно по классическим законам и не зависит от квантовой.
Однако возможно существование компьютера более общего типа –
с обратной связью. Тогда обе части влияют друг на друга. В ходе вычислений этот компьютер использует промежуточные измерения,
результат которых он использует на последующих этапах вычислений. В любом случае ясно, что программа для квантового компьютера
всегда является классической программой, предназначенной для его
управляющей классической части. В такой программе должно четко
указываться, как приготовить начальное состояние обеих частей компьютера, какое преобразование и над какими квантовыми частицами
необходимо совершить и в какой момент времени, когда следует измерить квантовую часть и как использовать результат этого измерения,
и, наконец, когда необходимо остановить вычисления и выдать ответ.
119
Рассмотрим в общем виде работу одностороннего компьютера.
Пусть его квантовая часть содержит n идентичных квантовых частиц, называемых кубитами. Можно свободно обращаться к каждому кубиту, причем все они могут находиться в произвольной суперпозиции состояний:
ψ(t) = ∑ λ j (t) ej ,
j =0
где базисные состояния имеют вид
e0 = 0000 ,
e1 = 0001 ,

eN −1 = 1111 .
Обратим внимание на то, что N = 2n и из этого числа состояний может быть доступна только некоторая часть, так что сумма
в правой части носит чисто теоретический характер и может быть
доступна лишь при измерениях квантовой части компьютера.
Определим далее набор из унитарных операторов, в котором
присутствуют как одно- так и многокубитовые операторы. Этот набор назовем элементарным в том смысле, что их комбинация позволит произвести любую, в том числе сложную, унитарную операцию над кубитами. (В принципе достаточно воспользоваться всеми
однокубитовыми и одним произвольно выбранным двухкубитовым
оператором.)
Управлением унитарными операторами и назначенными для преобразований кубитами занимается классическая часть компьютера.
Можно считать, что каждой элементарной операции соответствует
ее двоичный код и аналогичный код указывает на кубит, предназначенный для операции. Тогда набор таких кодов однозначно определяет рабочее преобразование. Этот набор хранится в классической
части компьютера и шаг от шага меняется под действием какого-то
классического алгоритма. Можно считать, что классическая часть
представляет собой обыкновенный классический компьютер, на
котором запущена некая программа, причем состояние его памяти всякий раз указывает, какую манипуляцию требуется произвести с квантовой системой. Кроме того, управляющая классическая
часть указывает, в какой момент времени необходимо производить
измерения квантовой части и как использовать результаты измерений, если этот квантовый компьютер обладает обратной связью.
120
Для вычислений на квантовом компьютере приложимы те же
меры сложности по времени и объему памяти, что и в классических
вычислениях. Однако следует отметить, что смысл этих понятий
здесь несколько иной. Этот новый смысл обусловлен основной особенностью квантовой механики – явлением интерференции амплитуд. Вследствие интерференции за один такт квантового вычисления рабочее преобразование производит гораздо большую работу,
чем за один такт классического. Это чисто квантовый эффект, не
имеющий классического аналога. Он лежит в основе так называемых быстрых квантовых алгоритмов.
121
ПРИЛОЖЕНИЯ
ПРИЛОЖЕНИЕ 1
ОПТИЧЕСКИЙ ПИНЦЕТ [25]
Каждому знаком пинцет – нехитрый инструмент, которым удерживают и перемещают мелкие детали. Но как быть, если приходится иметь дело с частицами размером порядка 1 мкм или, скажем,
хромосомами в живой клетке, к которым нельзя прикасаться, иначе они разрушатся? Использовать обычный, даже сверхминиатюрный пинцет нельзя. А возможность захватить и переместить микрообъект – насущная задача современной микро- и нанотехнологии.
Решение этой задачи пришло из лазерной техники последних лет.
Механическое устройство для управления микроскопическими
объектами создать невозможно. Но достаточные для этого усилия
способны создавать лазерные лучи. Сама идея лазерных методов
манипулирования атомами восходит к работам российских физиков: в 1979 г. в Институте спектроскопии АН СССР доктор физикоматематических наук В. С. Летохов с сотрудниками осуществили
первый удачный эксперимент по торможению светом пучка атомов
натрия. Однако устройство, названное оптическим пинцетом, впервые продемонстрировали в 1986 г. американские исследователи из
научного центра BellLab.
Принцип действия оптического пинцета основан на том, что световой поток обладает импульсом и при изменении его направления
возникает сила, связанная с этим изменением.
Понятие импульса (количества движения) пришло из механики, где импульсом называют произведение массы тела на скорость
его движения. Скорость – вектор, который характеризует не только величину, но и направление. А поскольку движение любого тела
происходит под действием силы, изменение направления скорости
связано с изменением направления действия силы.
Фотон характеризуется энергией Е и импульсом р, который по
аналогии с механическим случаем есть произведение его массы на
скорость света:
р = mc
(здесь имеется в виду масса движущегося фотона, так как масса покоя фотона равна нулю).
Если фотон падает на непрозрачную (поглощающую или отражающую) поверхность, то сообщаемый ей импульс есть, по сути
122
дела, давление света на эту поверхность. Но если осветить лазером
прозрачную частицу, то световой пучок испытает на ней преломление – направление вектора скорости света, и, следовательно,
направление импульса фотонов изменится. Пользуясь механической аналогией, можно сказать, что при этом возникает изменение
силы, которое подействует на частицу так, что она двинется в сторону наибольшей интенсивности лазерного пучка.
Интенсивность лазерного пучка максимальна на его оси и плавно спадает к краям. Закон изменения интенсивности соответствует так называемому нормальному, или гауссову, распределению,
которому подчиняются все природные процессы. Поэтому частица
удерживается на оси пучка, а при фокусировке его линзой она втягивается в точку фокуса и оказывается «пойманной» в трех измерениях. Для того чтобы создать силы, способные осуществить такую
трехмерную ловушку, требуется излучение мощностью порядка
нескольких милливатт.
Если на пути пучка лазерного света поставить специальную
линзу – аксикон, то отклоненные ею лучи станут интерферировать.
В результате, перемещая линзу, можно передвигать частицы, выстраивая из них самые разнообразные конструкции. Современная
технология рисует совершенно фантастическую картину: луч лазера движется, и под его воздействием в пространстве материализуется требуемый объект.
Объединяя метод оптического пинцета с использованием дополнительных лазерных пучков, исследователи могут, например,
захватить пинцетом отдельную хромосому и «разрезать» ее дополнительным лазерным лучом на кусочки для дальнейшего анализа. Для захвата можно применить инфракрасное излучение с длиной волны λ = 1,064 мкм, а вторую его гармонику – зеленый свет
(λ = 0,532 мкм) – для разрезания в качестве «оптических ножниц»:
биологические объекты почти прозрачны в инфракрасной области,
но сильно поглощают зеленый свет.
Оптический пинцет представляет собой удобный инструмент,
имеющий, однако, ряд недостатков. Во-первых, чем сильнее пучок
стянут в фокус, тем быстрее он расходится после него. Это означает, что сила, удерживающая частицу, очень быстро уменьшается
по мере удаления от зоны захвата, и уже на расстоянии порядка
10 мкм от фокуса оказывается недостаточной, чтобы снова захватить частицу. Однопучковая ловушка реально полезна лишь для
захвата одиночной частицы и только в области фокуса. Во-вторых,
лазерный пучок после встречи с объектом отличается от исходного
123
из-за дифракции, преломления, отражения и поглощения. Это также ограничивает расстояние, на котором он может действовать как
оптический пинцет.
Существует и еще одно обстоятельство, связанное с расходимостью самого лазерного пучка. Чем сильнее он расходится, тем
хуже его фокусирует оптическая система, но получить идеально
параллельный пучок принципиально невозможно из-за дифракции. И долгое время не возникала даже мысль о том, что можно
как-то обойти это ограничение. Но в 1987 г. американские физики
Дж. Дарнин, Дж. Майсели и В. Эберли показали, что существует
класс световых пучков, фактически свободных от дифракции. Их
проекция на экран выглядит как яркое пятно, окруженное системой концентрических колец (такое распределение интенсивности
описывает известная в математике функция Бесселя, и поэтому
сами пучки называют бесселевыми).
Обычный гауссов пучок превращают в бесселев с помощью
упомянутого аксикона, который фокусирует параллельный пучок лучей не в точку, а в отрезок прямой линии на оптической оси
(рис. 1.1). (Существуют и другие методы, основанные на использовании голограмм или пространственных модуляторов света.) Этот
центральный луч подобен нерасходящемуся «световому шнуру»
с постоянной интенсивностью.
Бесселеву пучку присуще одно замечательное свойство. В отличие от гауссова пучка, который искажается после прохождения
через частицу, он обладает способностью самостоятельно восстанавливаться. Часть волн, выходящих из конической поверхности
аксикона, проходит мимо препятствия и сходится позади него. Их
Зона интерференции
Гауссов пучок
Аксикон
Бесселев
пучок
Рис. 1.1. Изменение распределения интенсивности
лазерного пучка после прохождения аксикона
124
интерференция образует неискаженный пучок. Это позволяет преодолеть ограничение, присущее оптическому пинцету на гауссовом
пучке, способному захватить лишь частицы, расположенные очень
близко друг к другу.
В недавних работах было показано, что оптический пинцет, использующий бесселев пучок, способен захватывать частицы, разнесенные на расстояние 3 мм и лежащие в отдельных независимых
ячейках. В этих экспериментах использовалось лазерное излучение с длиной волны 1,064 мкм, образующее бесселев пучок с ярким
центральным пятном, окруженным 19 кольцами. Общая мощность
излучения составляла 700 мВт, из которой на центральное пятно
приходилось примерно 35 мВт. Захватывалась полая сфера диаметром около 5 мкм между центральным пятном и первым кольцом
пучка. Сфера искажала пучок, который за ней восстанавливался и
работал как оптический пинцет, сводящий вместе три кварцевые
сферы диаметром 5 мкм. После этого пучок восстанавливался.
Другое отличие оптических пинцетов на бесселевом пучке заключается в их способности захватывать сразу несколько разных
частиц. Например, в экспериментах производился одновременный
захват сплошной кварцевой сферы в первой ячейке, полой сферы
во второй и частицы из двупреломляющего материала в третьей.
Полая сфера имеет меньший показатель преломления, чем вода,
заполняющая ячейки, и поэтому выталкивается из областей с высокой интенсивностью света. Ее захват происходил в темных зонах
бесселева пучка между кольцами.
С помощью оптических пинцетов измеряли механические свойства молекул ДНК, прицепляя к их концам полистирольные бусинки
и растягивая их. Исследователи из Гарвардского университета укладывали эритроциты (клетки крови) на белковое основание в кольца,
цепочки и тетраэдры, создавая модели клеточных «датчиков», настроенных на обнаружение определенных химических веществ. Оптический пинцет уже сейчас используют для пересадки генов в клетки, а также при искусственном оплодотворении в пробирке.
Весьма интересные эксперименты выполнены в венгерском
Биологическом исследовательском центре. Там разработана методика получения микроскопических объектов произвольной формы
в результате полимеризации клейкой массы под действием света. Оптический пинцет на основе инфракрасного (λ = 0,994 мкм)
полупроводникового лазера захватывал и удерживал в фокусе
микрочастицы. Далее использовалась так называемая двухфотонная методика: клей освещали ультрафиолетовым лазером, гене125
рирующим две слегка различающиеся длины волны в окрестности 0,340 мкм, а необходимая для полимеризации интенсивность
достигалась фокусировкой в нужной точке излучения аргонового
лазера (λ = 0,514 мкм). В результате воздействия света образовывался твердый полимер. Высокоточный трехкоординатный пьезоэлектрический манипулятор, управляемый компьютером, перемещал материал относительно фокуса, создавая микроскопические
детали – роторы, шестеренки, пропеллеры. А дальше начинается
самое интересное.
Было обнаружено, что при сдвиге точки фокуса свет, отклоняясь от частицы, приводит ее во вращение. Величина и направление
момента вращения зависят от ориентации ротора или шестеренки
в фокусе. Если ротор оснащался центральной осью, устойчивость
его захвата в пинцете повышалась, а при увеличении числа зубцов
шестеренки вращение становилось более равномерным. При мощности излучения 20 мВт конструкция равномерно вращалась с частотой до нескольких оборотов в секунду. Отсюда один шаг до создания действующих микромашин, управляемых светом. Авторы
сконструировали две сцепленные шестеренки, сидящие на фиксированных осях, и свободно плавающий ротор. Ротор захватывали
лазерным пинцетом, приводили во вращение и затем подводили
к паре шестеренок, заставляя их крутиться.
Изобретение оптического пинцета совершило подлинную революцию в микротехнике. В настоящее время во множестве лабораторий ведется отработка методов его использования в различных
областях. Можно с уверенностью сказать, что оптический пинцет –
это инструмент, который сыграет чрезвычайно важную роль в научных исследованиях ХХI столетия.
126
ПРИЛОЖЕНИЕ 2
КОНСЕРВАТИВНАЯ ЛОГИКА ТОФФОЛИ И ФРЕДКИНА.
КОМПЬЮТЕР НА БИЛЬЯРДНЫХ ШАРАХ
Р. Ландауэр показал, что в процессе вычислений выделяется некоторое количество теплоты, и этого не избежать, если операции
компьютера необратимы. Естественно, возникает вопрос, возможны ли вычисления, в которых все операции обратимы.
Ч. Беннет в 1973 г. предложил создать обратимый компьютер.
Э. Фредкин и Т. Тоффоли показали [2], что можно смоделировать
полное множество булевых операций на сверхпроводящем компьютере, не нарушая условий Ландауэра.
Отметим особо, что чтение исходных данных и результатов вычислений по своей природе – необратимые операции, т. е. на этом
этапе обязательно будет выделяться теплота. И этого не избежать и
в случае квантовых вычислений, которые сами по себе обратимы.
Несмотря на это досадное обстоятельство, обратимые вычисления –
направление современной информатики, тесно связанное с идеей
сверхпроводящих и энергосберегающих высокопроизводительных
вычислений.
Консервативная логика (КЛ) – это новая математическая модель вычислений, которая органически связана с фундаментальными принципами физики, такими, как обратимость законов
динамики и сохранения некоторых аддитивных величин, в ряду
которых энергия играет главную роль. Поскольку она более точно
отражает физику, чем традиционные модели вычислений, КЛ находится в лучшем положение при реализации высокопроизводительных вычислений, так как очень эффективно использует «вычислительные ресурсы», предлагаемые природой. В частности, КЛ
показывает, что в идеале можно построить вычислительные схемы
с нулевой диссипацией энергии.
После установления общих рамок рассмотрим две конкретные
модели вычислений. Первая использует бинарные переменные и
консервативно-логический аналог теории переключателей. Эта
модель доказывает, что универсальные вычислительные возможности совместимы с физической обратимостью и ограничениями,
налагаемыми законами сохранения.
Вторая модель, которая является усовершенствованием первой,
устанавливает соответствие между вычислениями и физикой. Эта
модель основана на упругих столкновениях одинаковых шаров,
127
что делает ее формально эквивалентной атомной модели, лежащей
в основе (классической) кинетической теории идеального газа. Таким образом, функциональное поведение универсального цифрового компьютера может быть смоделировано поведением ансамбля
атомов идеального газа, начальные условия которого заданы.
Подход, предложенный консервативной логикой, позволяет избежать некоторых тупиковых ситуаций, которые возникают в традиционной модели, и открывает новые перспективы. В частности,
он позволяет исследовать в рамках самой модели вопросы эффективности и производительности вычислительных процессов.
Расчет, выполняемый человеком или машиной, – это физическое
действие, и оно, в конечном счете, регулируется законами физики.
Математические теории вычислений в своих аксиомах отражают
непременную физическую реализуемость вычислительных процессов. Имея в распоряжении такую основу, пользователь теории
в дальнейшем может сосредоточиться на абстрактном моделировании сложных вычислительных процессов без того, чтобы на каждом шагу проверять физическую реализуемость модели. Таким образом, например, проектировщик схем может систематически мыслить в терминах булевой логики (с помощью, например, таких примитивов, как AND, NOD и FANOUT), будучи уверенным, что любая
сеть, которую он проектирует, сразу становится транслируемой
в рабочую схему, требующую только хорошо понятых, доступных
компонентов из любого подходящего семейства цифровой логики.
Для большинства обычных приложений вовсе не обязательно
быть в курсе физического смысла математических аксиом. Однако
для того, чтобы прокладывать новые пути, поначалу необходимо выяснить, какие аспекты физики отражены в аксиомах: может быть,
пытаться представить в аксиомах более продвинутую физику и, следуя таким путем, обнаружить новые и неожиданные возможности.
П2.1. Физические принципы, содержащиеся в аксиомах
Машина Тьюринга воплощает в эвристическом виде аксиомы
теории вычислимости. Из обсуждения, приведенного А. Тьюрингом в его работе 1936 г. [26], видно, что он намеревался использовать некоторые общие физические ограничения, которые накладываются на все конкретные вычислительные процессы, а также
некоторые общие физические механизмы, которые, несомненно,
могут применяться в вычислительных процессах. В основе аргу128
ментов Тьюринга или в более общем случае тезисов А. Черча, лежат следующие физические предположения:
1. Скорость распространения информации конечна. (Нет «действия на расстоянии»: при рассмотрении причинных воздействий
действие распространяется через локальные взаимодействия.)
2. Объем информации, который может быть закодирован в виде состояния конечной системы, ограничен. (Это предполагается как при
термодинамическом, так и при квантовомеханическом рассмотрении.)
3. Можно построить макроскопические, диссипативные физические устройства, которые реализуют логические функции AND,
NOT и FANOUT.
П2.2. Некоторые физические принципы,
еще не включенные в систему аксиом
Предположения 1 и 2 устанавливают четкие границы физически
достижимых вычислительных схем. Одновременно предположение 3 пока может служить лишь отправной точкой для поиска. Дело
в том, что, как хорошо известно, AND, NOT и FANOUT представляют
собой универсальный набор простейших логических элементов, и,
таким образом, с точки зрения математики, нет никаких убедительных причин, чтобы искать иные примитивы в качестве такого набора. Однако функция AND не является обратимой и, следовательно,
требует для реализации некоторого необратимого устройства. Это
приводит к тому, что в процессе выполнения логического AND стирается определенное количество информации о прошлом системы.
В отличие от необратимой функции AND и других простых логических операций основные динамические законы, лежащие в основе всех физических явлений, строго обратимы. В физике только
макроскопические системы, состоящие из огромного числа частиц,
могут демонстрировать необратимое поведение.
Как было показано в гл. 1, стирание одного бита информации
с механических степеней свободы системы должно сопровождаться
выделением количества энергии, равного kTln2. В современных компьютерах диссипация энергии все еще на восемь-двенадцать порядков больше этого теоретического минимума. Тем не менее технология
развивается быстро, и kТ-барьер становится наиболее существенным
препятствием для увеличения производительности компьютера.
На данный момент легко обнаружить некоторые недостатки
традиционного подхода к цифровой логике. Аксиомы вычислений,
129
основанных на необратимых логических элементах, могут отражать аспекты только макроскопической физики. Хотя они порой
удобны для работы на формальном уровне, многие важные аспекты микроскопической физики находятся вне их досягаемости. Для
исправления этих недостатков аксиомам вычислений требуется
сообщить некоторые «факты жизни» микромира. Это одна из целей консервативной логики. В то же время существует опасение,
что даже если все новые «микроскопические» аксиомы оказались
в конце концов физически и математически адекватными, не приведут ли они к построению гораздо более сложных структур с целью получения по существу тех же результатов.
Для демонстрации полезности консервативно-логического подхода рассмотрим примеры конструкций, которые наглядно продемонстрируют некоторые преимущества КЛ-подхода к вычислениям.
Центральным результатом консервативной логики является то,
что в идеале можно построить последовательные цепи с нулевым
рассеянием внутренней энергии.
Вычисления, проводимые без потерь, требуют, чтобы информационные степени свободы были надежно изолированы от тепловых
степеней свободы. В настоящее время эта цель достигнута лишь
для тривиальной булевой функции, а именно, для функции тождество. Она реализована в виде сверхпроводящих петель, используемых в качестве элементов памяти.
Для того чтобы реализовать функцию более сложную, чем тождество, не требуется особой технической изобретательности, но
можно столкнуться с трудностями принципиального характера,
связанными со вторым началом термодинамики. Эти трудности наглядно продемонстрированы в работе Р. Ландауэра [11].
Показывая, как реорганизовать вычисления на логическом уровне таким образом, чтобы это было совместимо с фундаментальными
физическими принципами, КЛ обеспечивает необходимый теоретический прорыв. К тому же это означает также начало более глубокого и конструктивного диалога между информатикой и физикой.
П2.3. Консервативная логика:
единичный провод и элемент Фредкина
Мир макрофизики предлагает важные преимущества системному дизайнеру. До тех пор пока желательно использовать масштабные эффекты, основанные на коллективном действии очень боль130
шого числа частиц, имеется возможность создания конкретных
вычислительных устройств, соответствующих достаточно искусственным абстрактным спецификациям. Например, имея в распоряжении эксцентрики подходящей формы и необходимое затухание, можно реализовать значительное число функций, включающих в себя инвертирующие усилители, сумматоры и переходные
элементы и в конце концов элемент NAND.
Однако именно макроскопический характер этих устройств накладывает ограничение на их производительность. Правда, что
миниатюризация электронных компонентов добилась больших
успехов в сокращении объема и рассеиваемой мощности и увеличила скорость вычислений. Тем не менее хорошо известно, что попытки повысить производительность благодаря миниатюризации,
доведенной до крайности, в конечном итоге приводят к проблемам
шума и ненадежности устройств. Устройства становятся совершенно бесполезными, когда число частиц мало настолько, что статистические флуктуации становятся значительными.
Напротив, в мире микроскопической физики взаимодействия
осуществляются без диссипации энергии, и, кроме того, будучи
точно предсказуемыми, эти взаимодействия могут происходить
в значительно меньшей по размеру области пространства и времени. Так как точность законов взаимодействия теперь не зависит от
усреднений, необходимых в случае систем, состоящих из большого
числа частиц, то микрофизика, судя по всему, намного привлекательнее для создателя эффективных алгоритмов. Вместе с тем выбор функций становится более ограниченным – каталог функций
ограничивается теперь только функциями, реализуемыми в микрофизике. Когда будет выбран определенный набор логических
примитивов и они будут признаны удовлетворительными с точки
зрения их вычислительных возможностей, последует попытка проверить их физическую реализуемость. Этому плану будем следовать при изложении консервативной логики.
П2.4. Примитивы, необходимые для вычислений
Вычисление основывается на хранении, передаче и обработке
дискретных сигналов. Поэтому любой выбор примитивов должен
включать в себя блоки, подходящие для этих вычислительных действий. Следуя принятой логике, укажем на ограничения, носящие
физический характер:
131
1. Идентичность передачи и хранения. Это ограничение оправданно с релятивистской точки зрения: нет никаких различий между внутренним хранением и передачей сигналов. Поэтому будем искать единый примитив для хранения и передачи.
2. Обратимость. На микроскопическом, детерминированном,
уровне, динамические законы обратимы, т. е. различные начальные состояния всегда приводят к различным конечным состояниям (это верно как в классической, так и квантовомеханической
формулировке этих законов). Поэтому будем искать абстрактные
примитивы в виде обратимых функций.
3. Композиция один к одному. В соответствии с обычными правилами композиции функций одна функция может служить входной переменной для любого числа других функций, т. е. разрешается FANOUT (ветвление) любого числа линий.
В большинстве схем логические элементы соединяются друг
с другом, образуя более сложные цепи, при этом принято выход
логического элемента соединять с несколькими входами других
элементов. Это соединение, как правило, производят «напрямую»,
т. е. соединяют вход с выходом без промежуточных устройств.
Идеальный логический элемент имеет бесконечный входной
импеданс и нулевой импеданс на выходе. Однако из-за неидеальности технологии возникает ситуация, когда с выхода логического
элемента уже нет возможности получить ток достаточной силы для
управления еще одним логическим элементом, что, в свою очередь,
приводит к возникновению ошибок. FANOUT – это и есть число входов, которые могут быть присоединены к выходу, обеспечивая правильную логику (необходимую силу тока в каждом присоединяемом
элементе), и это число сильно зависит от типа логических элементов: от 2–10 для TTL-элементов до 34000 в случае CMOS-элементов.
Вместе с тем входы реальных элементов имеют как сопротивление, так и емкость. Эта емкость замедляет переход от элемента
к элементу и соответственно увеличивает время задержки, ограничивая тем самым максимальную скорость передачи информации
всей системы. Такой эффект менее выражен для систем TTL, что
дает им заметное преимущество в скорости перед CMOS-системами.
Таким образом, видим, что процесс создания нескольких копий
данного сигнала, с точки зрения физики, далеко не прост и должен
рассматриваться с особой осторожностью, если важна обратимость.
На самом деле этот процесс предполагает взаимодействие несущего информацию сигнала с определенным источником энергии (питание) в усилителе. Поэтому требуется, чтобы любое разветвление
132
сигналов – FANOUT, осуществлялось в конкретном устройстве обработки сигналов.
4. Сохранение аддитивных величин. Одним из выдающихся достижений физики является открытие законов сохранения и
установление того факта, что эти законы обусловлены наличием
у пространства и времени определенных свойств симметрии. Так,
например, законы сохранения энергии и импульса являются следствием таких свойств симметрии пространства-времени, как однородность времени и пространства, т. е. «нечувствительности» системы к ее временному и пространственному переносу. Например,
в случае энергии U (r1, r 2 ,...) системы материальных точек однородность пространства математически выражается требованием
U (r1, r 2 ,...) =U (r1 + R, r2 + R,...) для любых r и R.
Во многих физических системах можно определить некоторый
набор сохраняющихся величин, с которыми удобно работать, а
именно, они являются аналитическими и, что более важно, аддитивными, т. е. эти величины определяют для отдельных частей системы, и их вклады для всей системы просто складывают.
Однако встречается симметрия, которая не имеет классического аналога, но может быть найдена в квантовой динамике элементарных частиц. Не будем пытаться явно учитывать все симметрии
микроскопической динамики, и, следовательно, все законы сохранения природы. Скорее необходимо требовать, чтобы наши абстрактные модели вычислений обладали хотя бы одной аддитивной
сохраняющейся величиной, которую будем рассматривать как прототип многих подобных величин в физике.
П2.5. Единичный провод
Остановимся на ограничении 1. В этой связи рассмотрим сигнал,
связывающий два пространственно-временных события: P0 и P1.
Если в данной системе отсчета эти события пространственно разделены, то говорят, что сигнал передавался из Р0 в Р1. Вместе с тем если
в данной системе отсчета Р0 и Р1 находятся в одной и той же точке
пространства, то говорят, что сигнал хранился в этой точке. Например, можно послать сообщение по телефону (передача) или оставить
его для кого-то до утра (хранение). Заметим, что во втором случае послание, с точки зрения наблюдателя, покоящегося относительно солнечной системы как целого, переместилось на миллионы миль.
133
Таким образом, заключаем, что хранение и передача, с точки
зрения наблюдателей, в разных системах отсчета представляют собой один и тот же физический процесс. В консервативной логике
эти две функции были выполнены одним хранящим-передающим
примитивом, называемым единичный провод1 (в дальнейшем именуемым проводом), роль которого состоит в перемещении одного бита информации из одной пространственно-временной точки
в другую, отстоящую от первой на единицу времени.
Единичный провод можно определить таблицей
xt
yt +1
0 → 0 ,
1
1
где верхние индексы соответствуют абстрактному «времени» события в дискретной динамической системе. Изображение такого провода в момент времени t называют его состоянием в момент времени t:
xt → −yt =xt −1.
Из единичного провода можно составить провод более общего
вида произвольной длины. Так, провод длиной i(i ≥ 1) представляет собой пространственно-временной путь сигнала, начало и конец
которого разделены временным интервалом из i единиц.
Обратим внимание на то, что единичный провод обратим, консервативен (т. е. сохраняет на выходе число нулей и единиц, поданных на
вход) и переходит в обратный себе в результате преобразования t → −t.
П2.6. Консервативные логические элементы.
Элемент Фредкина
После введения примитива, роль которого состоит в представлении сигнала, появляется необходимость в примитиве, который
представляет событие в стилизованном виде – акт физического вычисления.
Консервативный логический элемент – это любая булева функция, которая является обратимой и консервативной
Хорошо известно, что элемент NAND с двумя входами является
универсальным элементом для всех булевых функций (рис. П2.1).
1
 В отечественное литературе повторитель.
134
a)
a
б)
Элемент AND
&
c
b
(отечественный
стандарт)
ab
00
01
10
11
a
c
b
(европейский
стандарт)
Элемент NAND
a
&
c
b
(отечественный
стандарт)
c
0
0
0
1
a
c
b
(европейский
стандарт)
ab
00
01
10
11
c
1
1
1
0
Рис. П2.1. Элементы AND и NAND
и их таблицы истинности
Для сравнения и запоминания там же вначале приводятся элемент
AND и их таблицы истинности.
В консервативной логике ту же роль, что и NAND, играет единственный обрабатывающий сигнал элемент, а именно, элемент
Фредкина, таблица истинности которого приведена ниже.
u
x1
x2
v
y1
y2
0
0
0
0
1
1
1
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
0
1
0
0
0
0
1
1
1
1
0
1
0
1
0
0
1
1
0
0
1
1
0
1
0
1
Eго графическое представление и некоторые возможности приводятся на рис. П2.1.
К примеру элемент Фредкина в случае, когда управляющий сигнал установлен в нуль, выполняет условное перекрестное переключение двух сигналов данных – a и b (рис. П2.2, б). Когда управляющий сигнал установлен в единицу, эти два сигнала данных следуют
параллельными путями. Отметим, что логический элемент Фредкина нелинеен и совпадает с обратным ему.
В консервативной логике вся обработка сигналов в конечном
счете сводится к условной их маршрутизации. Проще говоря, сигa) u
x1
x2
ν
y1
y2
1
a
1
a
b
b
б)
0
a
b
0
b
a
Рис. П2.2. Элемент Фредкина
135
налы рассматриваются как неизменные объекты, которые могут
быть перемещены в ходе вычислений, при этом новые объекты не
создаются, а прежние не уничтожаются.
П2.7. Консервативно-логические схемы
Введем схему для подключения сигналов. Она представлена
блоком проводов с событиями в виде консервативно-логических
элементов.
Консервативно-логическая схема представляет собой направленный граф.1 Узлами графа являются консервативно-логические
вентили и провода любой длины (рис. П2.3). Любой выход любого
логического элемента может быть соединен только с входом любого
провода, и наоборот. Интерпретация такой цепи в понятиях общепринятого последовательного вычисления является делом простым, потому что логический элемент играет роль как «мгновенного» комбинационного элемента, так и провода элемента задержки,
вмонтированного в соединительную линию.
В закрытой КЛ-схеме все входы и выходы любого элемента соединяются в пределах цепи (рис. П2.3, а). Такая схема соответствует
тому, что в физике называют замкнутой (изолированной) системой.
Открытые КЛ-схемы обладают рядом внешних входных и выходных портов (рис. П2.3, б). Будучи замкнутой, такая схема может рассматриваться как преобразователь (как правило, с памятью), который в зависимости от ее исходного состояния будет отвечать конкретной выходной последовательностью на некоторую
конкретную последовательность сигналов на входе.
Заметим, что в КЛ-схемах число выходных портов всегда равно
числу входных.
Соединение между двумя соседними единичными проводами
может рассматриваться как узел, состоящий из тривиального КЛэлемента – тождества. Из этого следует, что всякий раз, когда речь
идет о реализуемости функции через определенный набор консерва-
1
 Граф направленный (сигнальный) есть диаграмма прохождения сигнала, состоящая из совокупности узлов (сумматоров) и соединяющих их ветвей. Стрелки на
ветвях указывают направление передачи сигнала или воздействия от одного узла к
другому. Ветви в направленном графе характеризуются передаточными функциями. Такой граф является графической формой записи системы уравнений, описывающих динамическую систему.
136
a)
б)
Рис. П2.3. Замкнутая (а) и открытая (б) КЛ-цепи
тивно-логических элементов, молчаливо предполагаем, что провод
блока и логический элемент «тождество» включены в этот набор.
Консервативно-логическая цепь – это дискретная по времени
динамическая система. Повторители представляют собой индивидуальные переменные системы, в то время как все элементы (в том
числе тождество) являются ее переходной функцией.
Число N единичных проводов в схеме может рассматриваться как
число ее степеней свободы. Из этих N повторителей в любой момент
времени N1 находятся в состоянии 1, а оставшиеся N0 = N – N1 –
в состоянии 0.
Величина N1 – аддитивная функция состояний системы, т. е.,
будучи определенной для любой части системы, для всей цепи она
является суммой всех частей системы. Более того, поскольку как
единичный провод, так и логические элементы на своих выходах
возвращают единицу столько раз, сколько она присутствует на их
входах, величина N1 является (как бы) интегралом движения системы, т. е. остается неизменной вдоль любой траектории. (Аналогичные соображения применимы и к величине N0, но очевидно,
что N0 и N1 не являются независимыми интегралами движения.)
Именно по этому «закону сохранения» для величин, кодирующих
сигналы, консервативная логика и получает свое название. Следует отметить, что обратимость (в смысле математической обратимости) и сохранение суть независимые свойства, т. е. существуют вычислительные схемы, которые являются обратимыми, но не «битсохраняющими» [27], и наоборот [28].
П2.8. Вычисления с помощью консервативно-логических схем.
Константы и «мусор»
Выразим выходные переменные элемента Фредкина в виде явных функций входных переменных (рис. П2.4, а). Общее функци137
ональное соотношение между входом и выходом, как мы видели,
является обратимым. Вместе с тем функции, представляющие интерес для вычислений, зачастую необратимы. Поэтому при использовании элемента Фредкина или иной обратимой логической функции, которую предполагается применять для обработки сигнала,
должны быть предприняты специальные усилия.
Допустим, что необходимо вычислить функцию AND, которая
не является обратимой. На рис. П2.4, б на входы u и x1 подаются
произвольные значения а и b, в то время как на вход x2 подается
постоянное значение 0. В этом случае выход y1 обеспечит требуемое
значение ab (a AND b), в то время как на двух других выходах v и у2
будут находиться незапрашиваемые величины a и ab. Таким образом, AND-функция может быть реализована с помощью элемента
Фредкина, для этого в элемент наряду с аргументом поставляются
«константы». При этом наряду с результатом образуется «мусор».
Такая ситуация является общей при вычислениях с обратимыми
элементами, поэтому удобно ввести определенную терминологию
(источник, сток, константы, «мусор»).
Для любой функции j получим новую функцию f, «встроенную» в нее, присвоив определенные значения некоторым входным
линиям, объединенным под общим названием источник (source),
и прогнозировав некоторые выходные линии, в совокупности называемые стоками (sink). Остальные входные линии являются аргументом (argument), а оставшиеся линии выхода – результатом
(result). Эта конструкция (рис. П2.5) называется реализацией f через j с использованием источников и стоков.
При реализации функции f через функцию j линия источника
будет содержать постоянные величины, т. е. такие, которые не зависят от аргумента. Вместе с тем линии стока в общем случае имеют
значения, которые зависят от аргумента и поэтому не могут быть
0
a) u
б)
v =u
x1
y = u x + ux
1
x2
y = u x + ux
2
2
1
1
a
ab
b
2
ab a
Рис. П2.4. Элемент Фредкина с произвольными входами а и b,
когда входу x2 присвоено значение 0, что позволяет
реализовать функцию AND
138
c
ϕ
x
y
g
Рис. П2.5. Реализация функции f через j с использованием
источника с и стока g. Функцию j: (c, x) → (y, g) выбирают так,
что для определенного значения c, y = f(x)
a)
б)
1
a
в)
0 1
a
a+b a
a
a
a+b
b
0 1
a
a a
a
a
Рис. П2.6. Реализация вентилей OR (a), NOT (б) и FANOUT
(разветвитель сигнала) (в) с использованием элемента Фредкина
использованы в качестве входных констант для нового вычисления.
Такие величины будем называть мусором. Как и в обычной жизни,
«мусор» не является совершенно бесполезным материалом. Покажем, что тщательная «переработка мусора» не только возможна, но
и имеет важное значение для достижения определенных целей.
Соответствующим выбором линий источников и стоков, а также
констант из элемента Фредкина можно получить другие элементарные булевы функции, такие, как OR, NOT и FANOUT (рис. П2.6).
Для синтезирования более сложных функций необходимы цепи,
содержащие несколько элементов Фредкина.
П2.9. Вычислительная универсальность
консервативной логики
Важным результатом применения консервативной логики является сохранение вычислительных возможностей, обеспечиваемых обычной цифровой логикой при сохранении таких физических свойств, как обратимость и сохранение.
139
Рассмотрим последовательную сеть, построенную из таких
обычных логических элементов, как AND и OR, инверторов (или
что то же – элементов NOT), узлов FANOUT и элементов задержки.
Для определенности воспользуемся схемой сумматора (рис. П2.7),
заменив его элементы (за исключением элемента задержки) на такие же элементы в рамках консервативной логики (как показано,
например, на рис. П2.4, б, П2.6). В результате получим КЛ-сеть,
которая выполняет те же вычисления (рис. П2.8).
Такая реализация может повлечь за собой некоторое замедление, так как путь, который в оригинальной сети содержал только
один элемент задержки, теперь может проходить через несколько
проводов блока. Так, например, реализация, представленная на
рис. П2.8, замедляет вычисление в пять раз. Отметим, однако, что
только каждый пятый слот времени используется для данного вычисления, а остальные четыре временных интервала доступны для
других независимых вычислений в режиме временного мультиплексирования (англ. Time Division Multiplexing – TDM).
xt
Delay
FANOUT
NOT AND OR
y t = x t–1⊕ y t–1
FANOUT
Рис. П2.7. Обычная последовательная цепь, вычисляющая
прямую сумму (по модулю 2) потока двоичных цифр
при a ( +) b = ab + ab
xt
yt = xt–5 ⊕ yt–5
FANOUT
NOT
AND
OR
FANOUT
Рис. П2.8. Реализация цепи, изображенной на рис. П2. 7,
с использованием консервативной логики
140
xt
yt = yt–1 ⊕ xt–2
FANOUT
XOR
Рис. П2.9. Более простая реализация серийного сумматора
по модулю 2, работающего в консервативной логике
Технология TDM представляет собой технологию аналогового или
цифрового мультиплексирования, в котором несколько сигналов или
битовых потоков передается одновременно как подканалы в одном
коммуникационном канале. Передача данных в таком канале разделена на временные интервалы (таймслоты) фиксированной длины,
отдельные для каждого канала. Например, некоторый блок данных,
или подканал 1, передается в течение временного интервала 1, подканал 2 – во временной интервал 2 и т. д. Один фрейм TDM состоит
из временного интервала, выделенного одному определенному подканалу. После передачи фрейма последнего из подканалов происходит
передача фрейма 1 подканала и т. д.). При этом должно быть обеспечено определенное число входов для аргументов и констант, и кроме
вывода результата требуется целый ряд «мусорных» выходов.
Данная конструкция демонстрирует факт существования консервативно-логических цепей, имеющих необходимые вычислительные возможности и не уступающих сетям, оптимизированным
по числу логических элементов, элементов задержки, а также по
числу линий источников и стоков. Конечно, схемы, разработанные
непосредственно в КЛ, а не имитирующие обычные последовательные сети, обычно выполняют те же вычисления гораздо более простым способом (рис. П2.9).
В заключение отметим, что любое вычисление, которое может
осуществляться с помощью обычной последовательной сети, также
может быть реализовано с помощью соответствующей консервативнологической сети при условии, что доступны внешний источник констант и внешний сток для «мусора». Можно показать (без доказательства), что даже эти требования могут быть существенно снижены.
П2.10. Вычисления без диссипации
Вопросы, обращенные к теории, во многом зависят от ее предполагаемого применения. Поскольку одной из основных проблем
141
является эффективность физических вычислений, имеет смысл
обратиться к физической интерпретации консервативной логики,
в частности, обсудить связи между вычислениями, теорией информации и термодинамикой.
Изолированная физическая система, состоящая из значительного количества (скажем, 1 г) вещества, обладает огромным числом степеней свободы, или мод (нормальных колебаний), порядка
числа Авогадро NА = 6 ⋅ 1023. В общем случае начальные условия и
взаимодействия между таким огромным числом мод не могут быть
получены и детально проанализированы. Тем не менее в специально приготовленных системах, в высокой степени регулярных, имеется несколько мод (это механические, включая электрические,
магнитные, химические и другие степени свободы), для которых
имеются точные или приближенные уравнения движения в отличие от всех других (тепловых) мод. Эти уравнения описывают экспериментально доступные функциональные соотношения между
начальными и конечными состояниями системы, и в этом смысле
система может мыслиться как механический компьютер.
Один из случаев, в которых можно добиться такого разделения
в описании системы, это когда механические моды взаимодействуют между собой гораздо сильнее, чем с тепловыми модами, например, волчок в гравитационном поле. В идеальном случае, когда
связь между механическими и тепловыми модами исчезает, механические моды образуют совершенно изолированные и, конечно,
обратимые подсистемы. Заметим, что в данном случае в то время
как средняя энергия тепловых мод имеет величину порядка kТ, не
существует никакой априорной связи между этой энергией и энергией любой механической моды, которая, в принципе, произвольна. Конечно, придется считаться с «присутствием» kТ в момент
инициализации механических мод, так как этот процесс предполагает некоторую форму связи с остальным миром.
Существует и иной способ получения отдельных уравнений механических мод, не похожий на рассмотренный для предыдущего
случая. Этот способ годится только для специальных начальных
условий.
Предположим, что от подсистемы, включающей в себя механические моды, потребовалось быть необратимой. Как таковая эта
подсистема не может существовать изолированно, но должна быть
связана с тепловыми модами. Кажется естественным, что информация, которую потеряли механические моды в процессе необратимой эволюции, не может просто исчезнуть (на нижнем уровне
142
физика строго обратима). Необходимо, так сказать, открыть дверь
между механической и тепловой модами, так что информация, потерянная механическими модами, будет передана тепловым, и этот
процесс называется затуханием. Но опять же на нижнем уровне
физики не существует односторонних дверей, да и вообще нежелательная информация или шум будут поступать через дверь из тепловых мод в механические, делая механические подсистемы недетерминированными.
По словам Р. Фейнмана, «…если мы знаем, откуда затухание
происходит, то оказывается, что это также источник флуктуаций…» [3]. Выходом из этой дилеммы будет кодирование информации в механической подсистеме чрезвычайно избыточным способом (многословно) так, чтобы недетерминированная ее (системы)
компонента поведения могла быть легко отфильтрована.
Обычно каждая механическая мода связана с очень большим
числом тепловых мод и имеет начальную энергию Е, гораздо большую, чем энергия одной тепловой моды, т. е. Е >> kT. С такой асимметрией начальных условий энергия будет течь преимущественно
от механических мод к тепловым и с ней как-то будет переноситься
информация. (Хотя этот эмпирический подход и работает, все же
следует признать, что связь энергии и обмена информацией в физических системах еще плохо изучена.) Конечно, для стабильной
работы затухающей системы необходимо регулярно пополнять механические моды энергией, заимствованной из тепловых мод. Этот
процесс носит название регенерации сигнала.
Современные цифровые компьютеры используют второй подход, основанный на процессах затухания. Главной причиной служит то, что технически гораздо проще «приручить» трение, так
что оно будет работать контролируемым, предсказуемым образом,
нежели ликвидировать его полностью. Более того, любое малое отклонение механизма от номинала обычно приводит к шуму, который в первом приближении неотличим от теплового. Другими словами, несовершенное знание динамических законов приводит к неопределенности в поведении системы, сопоставимой с той, которая
вытекает из несовершенного знания ее начальных условий. Таким
образом, те же регенеративные процессы, которые помогают преодолеть тепловые шумы, также позволяют реализовать надежную
работу, несмотря на существенные допуски при изготовлении.
В сложившейся ситуации, когда поток необратимых процессов уже встроен в компьютер исключительно по технологическим
причинам, весьма просто приспособить любую дополнительную
143
необратимость, вытекающую из самой природы необходимых логических элементов, как, например, в функции AND. На самом
деле, два связанных процесса, а именно, взаимодействие сигналов
(собственно вычисление) и затухание сигнала и его регенерация,
обычно находятся в такой тесной связи друг с другом в рамках одного физического устройства (например, транзистора), что не могут быть отделены и рассматриваться независимо. Вследствие этого сегодняшние алгоритмы и цепи организуют вычисления через
последовательности «заранее приготовленных» необратимых шагов (таких, как AND, CLEAR REGISTER и т. д.), даже если общая
функция, которую необходимо вычислить, является обратимой
или почти обратимой. Те преимущества, которые присущи затухающим механизмам, с точки зрения шумов и неточностей при их
изготовлении и работе, позволяют забывать о их собственной неэффективности. Во многих случаях эта неэффективность проявляет
себя лишь со стороны потребления энергии. Причем становится
важной не стоимость электроэнергии, а то, как утилизировать выделяющуюся теплоту.
Для краткости обсудим только один ограничивающий фактор.
Так как сигнал не может распространяться со скоростью, большей
скорости света в вакууме, более высокая пропускная способность
компьютера в конечном счете может быть достигнута только путем более плотной упаковки элементов схемы. В цепи с затуханием скорость тепловыделения пропорциональна числу вычислительных элементов и, таким образом, примерно пропорциональна
полезному объему, и одновременно скорость отвода теплоты также пропорциональна свободной поверхности цепи. Следовательно, вычислительные цепи, использующие затухание, могут увеличиваться сколь угодно только в двух измерениях, что не позволяет использовать гораздо более жесткие упаковки, возможные
в трех измерениях.
По этой и другим причинам (см. раздел 2), обратимся к идее компьютеров на базе консервативных механизмов. В этой связи возникают четыре фундаментальных вопроса:
1. Существуют ли обратимые системы, способные выполнять
вычисления общего вида?
2. Имеются ли какие-то конкретные физические объекты (а не
просто математические конструкции), на которых можно реализовать обратимые вычисления?
3. В разделе «Вычислительная универсальность консервативной логики» мы достигли обратимости благодаря сохранению
144
в механических модах информационного мусора. Не возникнет ли
в процессе выполнения сложных вычислений ситуация, при которой «мусор», если мы не можем диссипировать его в окружающую
среду, станет «неуправляемым», и не приведет ли необходимость
сброса «мусора» к тому, что сбереженная вследствие обратимости
вычислений энергия не будет утеряна?
4. И, наконец, не возникнет ли ситуация, при которой в схеме
без затухания и регенерации сигнала из-за начальных условий или
влияния окружающей Вселенной появится пусть слабый остаточный шум? Этот шум может быть усилен во много раз и сделает результат вычислений бессмысленным.
Как уже было установлено в разделе П2.9, ответ на вопрос 1 является однозначным – «да».
В следующем разделе сделаем важный шаг в направлении получения положительного ответа на вопрос 2, введя модель вычислений, основанную на упругих столкновениях твердых шаров.
Эта модель, безусловно, представляет собой идеализацию такого
сложного физического явления, как удар. Тем не менее подобные
столкновения являются прототипом более реалистичного явления,
такого, как закон обратных квадратов (например, электромагнитного взаимодействия).
Раздел П2.16 содержит положительный ответ на вопрос 3. Для
этого потребуется лишь доказать, что число линий данных, участвующих в преобразовании констант в «мусор», возрастает в худшем случае пропорционально числу линий аргумента, а не числу
логических элементов (заметим, что в общей комбинационной
схеме число элементов возрастает экспоненциально с увеличением
числа линий аргументов). Для этого потребуется небольшое увеличение сложности схем по сравнению с обычными.
Не будем пытаться ответить на вопрос 4, который связан со многими теоретическими и экспериментальными проблемами. Однако
необходимо отметить, что уже сегодня существуют физически реализуемые сверхпроводящие системы, в которых достигнута эффективная развязка между механическими и тепловыми модами.
П2.11. Бильярдная модель вычислений
Введем модель вычислений (модель бильярдного шара), основанную на стилизованном, но вполне узнаваемом физическом явлении: речь пойдет об упругих столкновениях с участием шаров и
145
фиксированных отражателей. «Правила игры» для этой модели
идентичны тем, которые лежат в основе классической кинетической теории идеального газа, в которой шары интерпретируются
как молекулы газа, а отражатели – как участки стенок сосуда. Покажем, что, имея контейнер подходящей формы (что соответствует
аппаратному обеспечению компьютера) и учитывая, что на шары
наложены определенные начальные условия (что соответствует
программному обеспечению и входным данным), можно выполнять любые указанные вычисления.
Очевидно, что любая конфигурация физических тел развивается в соответствии с определенными законами взаимодействия, что
может быть интерпретировано как выполнение какого-то расчета
(это, конечно, вычисление своего собственного состояния в последующие моменты времени). В целом, однако, определить, как произвести желаемое вычисление исходя из заданного закона взаимодействия, очень сложно.
Вместе с тем системы, в которых обычно проводят вычисления
(время и состояния – дискретные «динамические системы», основанные на логических переменных и логических функциях), –
достаточно абстрактные объекты и в целом имеют мало общего
с физическими системами. Схемы, основанные на консервативной
логике, являются булевыми динамическими системами, но в то
же время они построены так, чтобы удовлетворить ограничениям 1–3. Это делалось с целью более тесного соответствия с физикой
и в конечном счете с естественной физической реализацией таких
схем. Полученные ниже результаты позволяют установить прямое
соответствие между примитивами и правилами консервативной
логики и некоторыми элементарными чертами модели бильярдного шара. С этого момента создание недиссипативного физического
компьютера сводится к разработке подходящей консервативно-логической сети.
П2.12. Основные элементы модели
бильярдных шаров
Рассмотрим двумерную сетку (рис. П2.10, а) (за единицу примем расстояние между соседними точками сетки) и идентичные
жесткие шары радиусом 1 / 2, движущиеся по основным направлениям сетки со скоростью одна единица пространства за единицу
(единичный интервал) времени.
146
a)
б)
Рис. П 2.10. Шары радиусом 1 / 2, перемещающиеся по единичной
сетке (а), и упругое столкновение под прямым углом (б)
В момент времени t = 0 центр каждого шара лежит в точке сетки, а в процессе перемещения их центры совпадают с узлами сетки в моменты времени t = 1, 2, 3, ... В силу выбора r = 1 / 2 указанные кинематические особенности сохраняются после упругих
столкновений под прямым углом (рис. П2.10, б). В дальнейшем
ограничимся рассмотрением таких столкновений. Заметим, что на
рис. П2.10, б горизонтальная составляющая скорости шара в процессе удара не меняется.
Наличие или отсутствие шара в данной точке (узле) сетки может быть интерпретировано как двоичная переменная, принимающая значения 1 или 0 (для «есть мяч» и «нет мяча» соответственно) в каждый целочисленный момент времени. Корреляции между
такими переменными отражают движение самих шаров. В частности, можно говорить о двоичных «сигналах», путешествующих по
сетке и взаимодействующих друг с другом.
П2.13. Элемент взаимодействия
Элемент взаимодействия – это консервативно-логический примитив (рис. П 2.11, а ), который также является его графическим
представлением. Следует отметить, что элемент взаимодействия
имеет четыре выходные линии и только четыре (а не 24) выходных
состояния. Иными словами, выходные переменные ограничены.
Если теперь рассмотреть обратный элемент (рис. П2.11, б), то те же
ограничения появятся для входных переменных. При составлении
такой функции необходимо следить за тем, чтобы эти ограничения
были соблюдены.
147
pq
P
pq
Q
pq
pq
Рис. П2.11. Элемент взаимодействия (а) и обратный ему (б)
P
A
A pq
B pq
C pq
Q
D pq
Рис. П2.12. Реализация бильярдной модели
элемента взаимодействия
В модели бильярдных шаров элемент взаимодействия реализуется просто как возможное место столкновения двух шаров. Так,
в случае, представленном на рис. П2.12, р, q – значения двоичных
переменных в некоторый момент времени, связанные с точками P,
Q, и рассмотрим значения этих переменных через четыре шага в четырех точках: A, B, C, D. Ясно, что эти значения в порядке, указанном на рис. П2.12, соответствуют pq, pq, pq, pq. Другими словами,
шар будет находиться в точке А тогда и только тогда, когда один
шар будет расположен в точке Р, а другой – в точке Q, аналогично
шар будет находиться в точке В, если и только если он находился
в точке Q, но его не было в точке P, и т. д.
П2.14. Взаимосвязь.
Временные задержки и переключатели
Благодаря своим AND- и NOT-возможностям элемент взаимодействия – явно универсальный логический примитив. Это
означает, что шары можно перевести по некоторому маршруту
148
a)
б)
в)
г)
Рис. П2.13. Зеркала, обозначенные толстой линией, могут
использоваться для отклонения (а), сдвига траектории вбок (б),
организации временной задержки (в) и реализации функции
нетривиальный кроссовер (г)
из одного места столкновения в другое с требуемой временной задержкой. Для этого дополнительно к столкновениям между двумя
шарами необходимо ввести столкновения между шаром и фиксированной зеркальной плоскостью. Таким образом, можно легко
отклонить траекторию шара (рис. П2.13, а), сместить ее в сторону
(рис. П2.13, б), ввести задержку на произвольное число временных шагов (рис. П2.13, в) и поменять местами значения двух битов, реализуя функцию нетривиальный кроссовер (англ. crossover)
(рис. П2.13, г).
Отметим, что поскольку шары имеют конечный диаметр, как
элементы, так и провода требуют определенного «зазора», с тем
чтобы функционировать должным образом.
П2.15. Элемент-коммутатор и элемент Фредкина
При разработке консервативно-логических схем в бильярдной
модели удобно иметь в распоряжении более широкий набор примитивов. Такие примитивы могут быть созданы «с нуля» c использованием столкновений или синтезированы, начиная с элемента
взаимодействия как строительного блока. Возможны различные
компромиссы между общей задержкой, числом столкновений,
числом кроссоверов и т. д. Например, элемент-переключатель, показанный на рис. П2.14, осуществляет условную маршрутизацию
одного сигнала данных одним управляющим сигналом и в ряде случаев является более удобным примитивом.
Бильярдная реализация элемента Фредкина (предложена
Р. Фейнманом и А. Ресслером) представлена на рис. П2.15.
149
a)
c
c
б)
cx
x
cx
Рис. П2.14. Элемент-переключатель и обратный ему.
Входной сигнал х направляется по одному из двух путей
в зависимости от величины сигнала с
cx
c
cx
x
c
Рис. П2.15. Реализация рассматриваемого элемента
в бильярдной модели
Таким образом, мы показали, что примитивы и правила композиции консервативной логики просто реализуются в бильярдной
модели вычислений.
П2.16. Консервативно-логические цепи без «мусора»
В разделе П2.9 было показано, что универсальные вычислительные возможности могут быть достигнуты в обратимом устройстве
при условии, что наряду с аргументом, вероятно, придется подать
на его вход константы, а на выходе наряду с результатом можно
150
получить «мусорный» сигнал. Если каждый раз при новом расчете поставлять в схему «свежие» константы и выбрасывать «мусор»
(т. е. рассматривать «мусорные» сигналы как тепловые моды), то
будет наблюдаться диссипация энергии.
Во избежание этого поставим задачу сохранения отходов, с тем
чтобы использовать их в качестве вклада в последующие вычисления. Для этого необходимо точно понять их зависимость от аргумента, но для этого может, вообще говоря, потребоваться второй
компьютер, такой же сложный, как и создавший биты «мусора».
Таким образом, даже при стремлении сохранить «мусор», порожденный в исходном компьютере, новый компьютер, в свою очередь,
будет создавать новый «мусор», который будет зависеть от входных
аргументов еще более сложным образом. Существует ли альтернатива этой дилемме?
Рассмотрим для начала самый «дорогой» способ решения проблемы «мусора». В разделе П2.9 мы уже произвели замену обычных элементов один к одному, большинство из которых необратимы, консервативно-логическими элементами, используя линии источников и линии стоков. В реализации, представленной ранее на
рис. П2.8, число линий источников и стоков непременно пропорционально числу элементов и, таким образом, по-видимому, возможны сложности производимого вычисления.
Консервативная логика предсказывает, что физический компьютер должен рассеивать мощность со скоростью, пропорциональной числу элементов. Заметим, что в общем случае число элементов возрастает экспоненциально с ростом числа линий входа.
Это происходит из-за того, что большинство булевых функций случайные, т. е. они не могут быть реализованы с помощью цепи проще той, которая содержит исчерпывающую таблицу истинности.
Таким образом, в «дорогом» подходе количество «мусора» возрастает экспоненциально с увеличением размера аргумента. Можно ли
значительно улучшить ситуацию? В частности, можно ли достичь
линейного роста количества «мусора»? Очевидно, что тщательное
проектирование в ряде случаев может существенно улучшить ситуацию. В этом смысле консервативная логика предсказывает существование физических цепей, имеющих значительно более низкие
требования к питанию, чем традиционные. Вместе с тем интерес
представляют общие принципы проектирования, а не отдельные
решения. В этом разделе мы покажем, что в целом «мусор» может
быть не только такого же размера, как аргумент (таким образом достигнув линейного роста), но и идентичен ему по величине.
151
П2.17. Цепи, обратные консервативно-логическим,
комбинированные цепи
Обратной консервативно-логической сети является сеть, которая формально получена заменой элемента на обратный ему (отметим, что элемент Фредкина совпадает со своим обратным), и каждый единичный провод работает в противоположном направлении,
тем самым превращая входы в выходы, и наоборот (рис. П2.16).
Обратная сеть выглядит как ее зеркальное отражение и, так сказать, отменяет ее вычисления. КЛ-сеть является комбинационной,
если она не содержит обратных связей, и любой путь от любого входа на любой выход проходит одинаковое число единиц провода.
Рассмотрим произвольную булеву функцию у = f(x), реализуемую комбинационной консервативно-логической сетью (рис. П2.17).
Для вычисления в качестве линий источника выделим несколько входных линий. По ним поступают заданные константы, которые обобщенно обозначим через с, а остальные входные линии содержат участвующий в расчете аргумент x. Кроме того, выделим
несколько линий на выходе. Они будут выполнять функцию стока,
производя «мусор», который будем обозначать символом g. Оставшиеся выходные линии содержат результат вычислений y.
a)
б)
Рис. П2.16. Консервативно-логическая (а)
и обратная ей (б) цепь
a)
б)
g
c
x
c
g
ϕ
ϕ–1
y
y
x
Рис. П2.17. Вычисление функции y = f(x)
с использованием комбинационной консервативно-логической сети (а)
и отмена результата вычисления универсальной сетью j−1 (б)
152
−1
Рассмотрим теперь сеть j (рис. П2.17, б), которая является обратной. Если g и y используются в качестве входных данных для
j−1, то сеть «отменяет» вычисления и возвращает с и х как выходные данные. Объединив две сети, как показано на рис. П2.18, получим новую сеть, которая очевидно рассчитывает функцию-тождество и, следовательно, в терминах вход-выход аналогична пучку
параллельных проводов. Мало того, аргумент х и константы с также возвращаются без изменений. Искомый же результат y оказывается «похороненным» в центре этой сети.
Следующая задача – наблюдение этого значения без нарушения
системы.
Рассмотрим в консервативно-логической цепи произвольную
внутреннюю линию, несущую некоторую величину а (рис. П2.19).
«Жучок» (шпион), на вход которого подаются 0 или 1, позволяет получить копию величины а вместе с ее отрицанием ¬a, не влияя при
этом на производимые расчеты. Применяя это устройство в каждой
линии результатов, приведенных на рис. П 2.19, получим цепь,
изображенную на рис. П2.20.
Как и прежде, результат у, полученный сетью j, передается
в сеть j−1, однако копия у (а также его отрицание ¬ у) теперь становится доступной. «Цена» каждой такой копии – всего лишь использование n новых констант (где n – ширина результата).
c
c
g
ϕ–1
ϕ
y
x
x
Рис. П2.18. Цепь, полученная
в результате объединения j и j−1
a)
б)
a
a
a
0
1
a
a
Рис. П 2.19. Величина a, переносимая некоторой линией (a),
может быть измерена неразрушающим образом с помощью «жучка» (б)
153
...
...
ϕ–1
ϕ
...
...
y
y
n
n
...
...
0
1
сh
x1
xm
y1
0
1
y1
«Жучок»
...
xm
gh+m–n
y
n
y1
...
...
x1
y1
...
...
сh
...
с1
g1
...
с1
y
n
Рис. П2.20. Вычисления без «мусора»
На рис. П2.20 представлена цепь, позволяющая производить вычисление функции y = f(x) без «мусора». Входные значения c1,...,
ch и x1,..., xm возвращаются без изменений, хотя постоянные 0,...,0
и 1,..., 1 в нижней части цепи заменяются результатами y1,..., yn и
их отрицаниями y1,..., yn .
П.2.18. Другие физические модели
обратимых вычислений
Т. Тоффоли [29] предложил модель обратимых вычислений, совместимую с правилами классической аналитической механики.
В этой модели двоичные величины кодировались в виде углов поворота вращающихся валов, и нелинейная, хотя и обратимая связь
между валами достигалась с помощью соответствующих следящих
камер. Такой механизм обеспечивает простую, интуитивно понятную реализацию универсального, обратимого, неконсервативного
элемента AND/ NAND.
Микроскопический подход к вычислению, менее защищенный
от тепловых шумов, чем рассмотренный здесь, обсуждался в работе
Ч. Беннетта [30]. В ней изоляция между механической и тепловой
модой достигается только в среднем по времени, и вычисление мо154
жет быть выполнено без диссипации в пределе t → ∞, где t – временной промежуток между началом и концом вычисления.
Сходными диссипативными свойствами обладает электронная
реализация консервативной логики – активная RLC-цепь, в которой переключение осуществляется MOS-транзисторами. Сопротивления и конденсаторы – «паразитные» элементы. По мере увеличения L / (CR 2 ) вычисление замедляется, но и энергия, диссипированная в каждом элементарном шаге вычисления, приближается
к нулю сколь угодно близко.
В заключение отметим, что П. Бенёв [31] предложил идею реализации универсальной обратимой машины Тьюринга, работающей на принципах квантовой механики.
155
ПРИЛОЖЕНИЕ 3
ИНФОРМАЦИЯ И ЭНТРОПИЯ
П3.1. Информация
Существует точное математическое определение объема информации. Рассмотрим страницу печатного текста. Она несет определенную информацию, которая заложена в символах (буквах),
пробелах между ними и знаках препинания. Упростим ситуацию.
Допустим, что этот текст передается с помощью азбуки Морзе – набора точек и тире. Более того, допустим, что текст следует подряд
без всяких пробелов. Мы увидим сплошную линию, состоящую из
точек и тире, т. е. всего из двух символов. Каждому символу, как
принято говорить, соответствует один бит информации. Вся лента Морзе несет, к примеру, N символов, т. е. N бит информации.
Можно сказать, что такая лента запомнила определенный текст,
и в каждой из N ее ячеек памяти заложен один бит информации.
Общее число различных текстов, которые можно записать на ленте
из N ячеек, очевидно равно 2N.
Условимся измерять объем информации в битах. Тогда для соответствующей величины информации Ib можно записать
Ib ≡ N ≡ log2 MN ,
где MN = 2N – общее число возможных текстов. Таким образом,
объем информации равен минимальному числу двоичных ячеек,
с помощью которых эту информацию можно представить.
Это соотношение можно записать несколько иначе, если вспомнить, что вероятность PN того, что читаемый текст совпадет с одним наугад выбранным из MN разных текстов, равно
PN =
1
.
MN
Поэтому предыдущее выражение примет вид
 1 
log2 
Ib ≡ N ≡ log2 MN =
− log 2 PN .
=
 PN 
Отсюда вытекает, что чем больше N, тем меньше величина PN
и тем больше объем информации Ib, содержащийся в данном конкретном тексте.
156
В привычном для нас буквенном тексте ситуация, в принципе,
такая же, но число знаков уже не 2, а 32. Так как 32 равно 25, каждой букве соответствует единственная комбинация из точек и тире,
располагаемая в пяти ячейках. Таким образом, объем информации,
приходящийся на одну букву (знак), равен Ib = 5. Дальнейшая необходимость учета заглавных букв удваивает их число до 64. Тогда
объем информации, приходящийся на одну букву, равен Ib = 6.
Такой расчет информации на один знак неточен. Дело в том, что
разные буквы в тесте по-разному востребованы. Например, очень
редко встречается буква Щ. В азбуке Морзе на такие буквы можно
потратить больше точек и тире, а вот на часто встречающихся можно сэкономить, оставляя им более короткие «отрезки» ленты.
Точное определение количества информации было дано Шенноном:
(П3.1)
I = −∑ pi ln pi ,
i
где pi – вероятность появления символа с номером i. Это общее выражение охватывает как часто используемые буквы, так и те, вероятность появления которых в тексте мала. В нем используется
натуральный логарифм, поэтому соответствующую единицу информации называют нат. Между битами и натами существует простая связь:
I
=
Ib
≅ 1,44I.
ln 2
В физике предпочтение отдается определению Шеннона. Информация по Шеннону может использоваться не только для текстов, но
и для любой иной дискретной (цифровой) информации. Например,
черно-белое изображение на экране телевизора можно разложить
на множество дискретных точек белого и черного цвета, а также
несколько промежуточных серых оттенков.Тогда формула (П3.1)
будет определять объем информации для данного мгновенного изображения на экране.
Информация играет большую роль в сложных физических процессах. Дело в том, что физик при анализе сложных систем в условиях сильного отклонения от термодинамического равновесия должен
учитывать совместное значение воздействия на систему сил и информации. Нелинейные динамические процессы в таких системах
очень часто приводят к самоорганизации, когда и динамическое, и
информационное содержание процесса оказывается согласованным
с большой точностью, и складываются в «единый организм».
157
П3.2. Энтропия
Энтропия – это одно из фундаментальных понятий физики. Содержание данного понятия раскроем на примере одноатомного идеального газа.
Пусть имеется одноатомный идеальный газ, концентрация молекул которого n, температура Т и занимаемый объем V. Каждый
атом газа имеет среднюю кинетическую энергию теплового движе3
ния, равную kT, поэтому полная тепловая энергия газа (обычно
2
именуемая внутренней энергией) равна
3
U = kTnV .
2
Давление газа, как известно, равно p = nkT. Если газ может
обмениваться теплотой Q с внешней средой, то закон сохранения
энергии (первое начало термодинамики) выглядит так:
dU =
− pdV + dQ.
(П3.2)
При этом предполагается, что газ находится в состоянии термодинамического равновесия, т. е. давление p и температура Т одинаковы по всему объему сосуда. А это означает, что в состоянии теплового равновесия изменение параметров состояния системы происходит крайне медленно (квазистатически). Именно для таких
процессов и вводится понятие энтропии S с помощью соотношения
dS =
dQ
.
T (П3.3)
Для идеального газа справедливо выражение [12]
dV 
 3 dT
=
dS N  k
+k
.
V 
2 T
Отсюда, интегрируя, получаем
3



=
S N  k ln  VT 2  + const .








Из полученного выражения следует, например, что если произведение
158
3
VT 2 = const. (П3.4)
остается постоянным, то и энтропия S газа не меняется. А согласно (П3.3) это означает, что газ не обменивается теплотой с внешней
средой, т. е. он отделен от нее теплонепроницаемой стенкой. Такой
процесс называется адиабатическим. В адиабатическом процессе
выполняется условие
pV γ = const,
5
– показатель адиабаты одноатомного газа.
3
Этот результат вытекает из (П3.4) и равенства p = nkT. Таким
образом, видим, что при адиабатическом процессе температура и
давление изменяются с концентрацией по закону
где γ =
T=
const ⋅ n γ−1, p =
const ⋅ n γ .
(П3.5)
П3.3. Цикл Карно. Теорема Карно
Рассмотрим идеальную тепловую машину, работающую по циклу
Карно. Имеются два тепловых резервуара: нагреватель с температурой T1 и холодильник с температурой T2, причем T2 > T1. Рабочим
телом машины Карно может служить одноатомный идеальный газ.
Допустим, что при температуре T1 объем газа V1, а давление
=
p1 nkT
=
1
N
kT1.
V1
P
1
A
T1
2
4
T2
3
V
Рис. П3.1. Цикл Карно
159
В результате адиабатического расширения газ можно охладить
до температуры T2, что вытекает из (П3.5):
T = const ⋅ n γ−1 = const ⋅ N γ−1V 1−γ ,
5

что для одноатомного газа  γ =  дает
3

T∞V
−
2
3.
Таким образом, на этапе адиабатического расширения имеем
V2  T2 
= 
V1  T1 
−
3
2
.
Из первого начала термодинамики (П3.2) вытекает, что при адиабатическом переходе из первого состояния во второе газ совершает
работу А, равную уменьшению внутренней энергии −DU:
3
A = −DU = Nk(T1 − T2 ).
(П3.6)
2
Если теперь произвести обратное сжатие газа от объема V2 до
объема V1, то над газом придется совершить работу, равную (П3.6),
и энергия газа восстановится, т. е. на этом этапе какой-либо цикл
отсутствует. В системе совершены прямой и обратный процессы,
и в окружающей среде ничего не изменяется. Цикл появляется на
этапе получения Q1 и отдачи Q2 на изотермических участках цикла
(см. рис. П3.1) с температурой T1 и T2 соответственно. Для Q1 имеем
=
Q1 T1 (S* − S), (П3.7)
где S – начальная энтропия газа (точка А на рис. П3.1), а S* – ее
значение после подогрева. Для Q2 (она отдается!)
Q2 =
−T2 (S* − S).
(П3.8)
Далее, из первого начала термодинамики, примененного к изотермическим участкам 1–2 и 3–4 цикла Карно, следует, что работа,
совершаемая газом на изотермических участках цикла, равна
A1–2 = Q1, A3–4 = Q2 (меньше нуля).
Отсюда полная работа, совершаемая газом за цикл, равна
A1–2–3–4
= Q1 + Q2 ,
160
что с учетом (П3.7) и (П3.8) дает
A1–2–3–4 =
(T1 − T2 )(S* − S),
и отсюда для КПД устройства получаем известную формулу
η=
T
A
= 1− 2 .
Q1
T1
(П3.9)
Важной особенностью машины Карно является ее полная обратимость, т. е., пустив машину в обратном направлении, можно
создать холодильную машину, осуществляющую перенос теплоты
от холодного тела к горячему вследствие совершаемой над газом работы, осуществляемой внешними силами. Именно это обстоятельство в сочетании со вторым началом термодинамики позволяет утверждать, что (П3.9) представляет собой максимально возможное
значение КПД.
Второе начало термодинамики гласит: невозможно создать такую тепловую машину (процесс), которая позволяла бы совершать
работу за счет теплоты, и при этом в окружающих телах не происходили бы какие-либо изменения.
Что происходит с внешним миром после того, как машина Карно совершила один цикл? Она отбирает у нагревателя (внешней
среды) тепловую энергию Q1 при температуре T1 и, следовательно,
забирает у внешней среды энтропию S1 = Q1 / T1, а затем передает
холодильнику Q2 при T2, т. е. отдает во внешнюю среду энтропию
S2 = Q2 / T2 . Поэтому полное изменение энтропии
DS = S2 − S1,
вносимое машиной Карно равно нулю. Машина Карно, будучи
полностью обратимой, не меняет энтропии внешнего мира, хотя и
переводит часть теплоты в работу.
П3.4. Учет необратимости реальной тепловой машины
В реальном устройстве всегда происходят необратимые процессы. В чем смысл такой необратимости? Вернемся к машине Карно:
на адиабатических участках цикла процессы расширения и сжатия
идут почти обратимым образом. Обратимость обеспечивается тем
лучше, чем медленнее по сравнению со скоростью звука осуществляются эти процессы и чем лучше теплоизоляция. Проблемные
участки цикла, на которых можно сильно потерять в КПД, – изо161
термическое расширение и сжатие газа. В частности, если расширение и сжатие здесь производить быстро, то не сможем реализовать всю амплитуду нагревания до температуры T1 и охлаждения
до температуры T2.
Далее рассмотрим подробнее передачу (отвод) теплоты вследствие теплопроводности стенок сосуда с газом, играющим роль
рабочего тела машины. Проанализируем этот процесс на примере
стержня длиной L концы которого поддерживаются при температуре T1>T2. Уравнение теплопроводности для теплового потока q
(количества теплоты через единицу поперечного сечения стержня
в единицу времени) дает
q= λ
T1 − T2
,
L
где l – коэффициент теплопроводности.
Если температура стержня линейно зависит от расстояния х, то
на расстоянии х от его горячего конца температура Т равна
= T1 −
T
(T1 − T2 ) x
L
,
и, следовательно, поток энтропии, равный qS = q / T, как функция
х имеет вид
qS =
qL
( L − x )T1 + T2 x
.
qS / q ⋅ 10−3
10
9,5
9
8,5
8
7,5
7
6,5
6
5,5
5
0
0,2
0,4
0,6
0,8
1
x/L
Рис. П 3.2. График зависимости qS /q от x/L
для случая Т1 = 200 К, Т2 = 100 К
162
Этот поток возрастает при движении от холодного конца стержня к горячему. Иными словами, внутри стенки производится избыточная энтропия, которая затем направляется в сторону холодильника. Для иллюстрации этого положения на рис. П 3.2 представлен
график зависимости отношения qS /q от x/L , когда температура горячего конца стержня 200 К, а холодного – 100 К.
В дополнении к входящему в стенку в единицу времени потоку
энтропии q1 / T1 внутри стержня производится дополнительная энтропия, и после чего наружу выбрасывается больший поток q / T2 .
Известно, что работа А, совершаемая обратимой машиной с коэффициентом полезного действия η за один цикл, и подведенное
к газу от нагревателя количество теплоты Q1 связаны соотношением
 T2 
A=
µQ1 =−
1
 Q1.
 T1 
Следовательно, отданное холодильнику количество теплоты
Q2 равно
T 
Q2 = Q1 − A =  2  Q1,
 T1 
что означает отсутствие изменения энтропии при переходе из первого состояния во второе. Если же реальный КПД будет меньше
КПД идеальной машины (работающей по обратимому циклу), то
произойдет возрастание энтропии на величину
Q2 Q1 1
Q1 Q1
− =
( Q1 − ηQ1 ) − =
( ηC − η).
T2 T1 T2
T1 T2
T 
Здесь ηC = 1 −  2  – коэффициент полезного действия цикла
 T1 
Карно, а η – реальный коэффициент полезного действия. Если
η =0, то машина работы не совершает, и в этом случае Q2 = Q1 = Q.
Тогда тепловой поток, не производя никакой работы, «занимается»
просто тепловым загрязнением среды, увеличивая в ней энтропию
на величину
 1 1 
D
=
S Q  − .
 T2 T1 
163
П3.5. И наконец, энтропия и информация
Рассмотрим идеальный газ, состоящий из одной молекулы. Рано
или поздно частица придет в состояние равновесия со стенками сосуда, находящимися при температуре Т. Это означает, что частица
за конечное время успеет побывать во всех точках сосуда и многократно поменять скорость в результате неупругих соударений с его
стенками, т. е. координаты и скорости частицы будут такими же,
как и у большого числа таких частиц, если бы их запустили в этот
сосуд. Все что нам требуется знать о частице, так это, что она соударяется со стенками и оказывает на них среднее давление и ее скорость подчиняется закону распределения скоростей ансамбля частиц в состоянии теплового равновесия (распределение Максвелла).
Среднее давление частицы на стенку при N = 1 очевидно равно
p = kT / V , а концентрация такого «газа» n = 1 / V . Для этой частицы можно организовать цикл Карно и создать полностью обратимую машину с КПД η = 1 − T2 / T1. Теперь с помощью некоторых
идеальных устройств и второго начала термодинамики попытаемся установить связь между энтропией и информацией.
На этом этапе мы вынуждены произвести некоторую корректировку формул применительно к энтропии. Введем систему единиц,
в которой как энтропия, так и информация являются безразмерными величинами и представляются отвлеченными числами (это заслуга Д. Белла – автора известного неравенства Бэлла – см. главу 6). Для этого требуется измерять температуру в единицах энергии. Тогда в привычных для физика формулах, содержащих постоянную Больцмана k, заменим ее на единицу. Эту замену осуществим
несколько позже на этапе сравнения энтропии и информации.
Итак, продолжим. Начнем с изотермического процесса:
Т = сonst. Из первого начала термодинамики и соотношения
p = kT / V находим
dV
TdS
= pdV
= kT
.
V
Отсюда для энтропии S получаем выражение
S = k ln
V
,
V0
где V0 – небольшой объем V0  V , введенный просто для нормировки. Величина V0 должна быть гораздо больше размера частицы,
чтобы не нарушалось приближение идеального газа.
164
Выражение работы, совершаемой при изотермическом процессе, имеет вид
=
A
2
V2
dV
pdV kT=
∫=
∫ V kT ln V1 .
1
Сравнивая две последние формулы, видим, что
=
A T (S2 − S1 ).
Подчеркнем, что мы имеем в виду очень медленный обратимый
процесс.
Допустим теперь, что существуют невесомые перегородки, с помощью которых без всяких усилий можем разделить сосуд на части.
Разделим с помощью такой перегородки сосуд на две равные части.
Частица окажется в одной из половин сосуда, какой именно, пока
не знаем. Предположим далее, что имеется прибор, позволяющий
определить, где именно находится частица, например, осветив ее
пучком света, или по силе тяжести, с которой она действует на пружинные весы, или по факту исчезновения давления на перегородку
со стороны пустой части объема. Если это так, то при начальных
одинаковых вероятностях, равных 1 2,, получим вероятность 100 %.
Происходит «стягивание» или, иначе говоря, «коллапс» распределения вероятностей. Соответственно и новая энтропия
=
S2 k ln
V
+C
2
отличается от исходной на величину
DS =k ln
V
− k ln V =−k ln 2.
2
Таким образом, энтропия уменьшилась, и этим можно воспользоваться, чтобы выполнить механическую работу. Для этого достаточно сдвинуть перегородку в обратном направлении – в сторону
пустого объема вплоть до его заполнения так, чтобы частица вновь
заняла полный объем. Соответствующая работа равна
A = kTDS = kT ln 2.
Если бы при этом во внешнем мире ничего больше не менялось,
то, повторяя эти циклы, можно построить вечный двигатель второго рода. Так как это невозможно, во внешнем мире что-то должно
происходить. Что именно?
165
Обнаружение частицы в одной из половин сосуда меняет информацию о частице. А именно из двух возможных его половин указывается одна, в которой находится частица. Это знание соответствует ровно одному биту информации. Процесс измерения уменьшает
энтропию частицы и ровно настолько же увеличивает информацию
измерительного устройства. Если продолжить деление полученных
ранее половин, четвертей и т. д., то энтропия будет последовательно уменьшаться, а информация – последовательно увеличиваться.
Другими словами,
S+I =
const. (П3.10)
Чем больше известно о частице или в целом о физической системе, тем меньше ее энтропия. Отсюда можно сделать вывод, что появление информации во внешнем мире (во внешних приборах) невозможно без возрастания энтропии внешнего окружения на величину,
не меньшую ΔI. В противном случае с помощью обратимой тепловой
микромашины можно было бы черпать энергию прямо из тепловой
энергии. Другими словами, информация, т. е. определенная порция
порядка, может быть усвоена внешними приборами, автоматами
или просто внешним миром только вследствие появления во внешнем окружении дополнительного беспорядка (теплового движения)
с возрастанием энтропии, не меньшим, чем усвоено информации.
Согласно (П3.10) сумма S и I постоянна. Если в рассматриваемой модели удастся поместить частицу в элементарную ячейку объемом V0, то при этом S = 0, а информация достигнет максимального
значения
 V 
− ln pmin =
ln 
I max =
.
 V0 
Для того чтобы зафиксировать частицу в элементарном объеме,
т. е. усвоить эту информацию, потребуется произвести не меньшее
количество энтропии в приборе или за его пределами. Если в последующем частица начнет заполнять больший объем, то информация
будет постепенно утрачиваться, а энтропия частицы возрастать.
Подчеркнем еще раз: за информацию приходится платить увеличением энтропии S внешних систем, причем DS ≥ I.
Если бы дело обстояло не так, если бы за один бит информации
прибор увеличивал свою энтропию на величину DS, меньшую одного бита, то можно было бы обратить тепловую машину. А именно, расширяя полуобъем, занятый частицей, мы увеличили бы ее
энтропию на величину ln2, получая работу kTln2, а суммарная эн166
тропия системы частица–прибор уменьшилась бы. Но по второму
началу термодинамики это невозможно.
И еще одно важное дополнение. Из курса общей физики известна формула Больцмана [12]
S = k ln W,
где W – термодинамическая вероятность, равная числу способов,
с помощью которых данное число молекул может распределиться
по фиксированному числу состояний. Предполагается, что при тепловом движении все состояния приблизительно равновероятны, и
тогда вероятность состояния i очевидно равна
pi ≈ 1/ W.
Если все-таки вероятности различаются, то точным будет выражение
S = −∑ pi ln pi .
(П3.11)
Для идеального газа вероятности pi распадаются на вероятности
распределения в пространстве и по скоростям. Не останавливаясь
на вычислении этих вероятностей, отметим, что уравнение энтропии (П3.11) и уравнение информации (П3.1) формально совпадают.
Но они имеют совершенно разный смысл.
Информация соответствует одной единственной выборке из огромного, скажем W, числа состояний. И мера этой информации есть
I = lnW.
Энтропия же соответствует возможности нахождения системы
с некоторой вероятностью 1/ W в каждом из доступных состояний.
Величина
S = klnW
соответствует максимальному заполнению всех состояний. Величины S и I оказались формально равными именно потому, что I соответствует максимальной информации только одного состояния, а
S определена по множеству состояний.
Так, к примеру, объем информации I соответствует объему некоторой рукописи. А энтропия этого текста равна нулю, так как
имеем только одну фиксированную последовательность написания
букв и других знаков и, стало быть, W = 1.
Допустим теперь, что весь текст пришел в «тепловое» движение,
в результате которого буквы начинают быстро меняться местами.
167
Очень скоро вся информация будет полностью утрачена, но зато
в тепловом движении буквы будут пробегать все возможные состояния из общего числа W, т. е. S = lnW.
В варианте, когда часть текста сохраняется, а другая часть приходит в полностью хаотическое «тепловое движение», получаем соотношение (П3.10).
Энтропия и информация замкнутой системы оказываются взаимно обусловленными: «забывание» (стирание) информации автоматически приводит к увеличению энтропии.
168
ПРИЛОЖЕНИЕ 4
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ БЕННЕТА
Известно [32], что, имея обычную (стандартную) машину Тьюринга S, можно построить обратимую трехленточную машину Тьюринга R. Последняя ничуть не хуже машины S при любых стандартных входных данных и в конце вычислений даже превосходит
ее, оставляя только эти входные данные и требуемые выходные.
Вычисления на машине R происходят в три этапа. Третий этап касается описания работы первого.
Обычная одноленточная машина Тьюринга состоит из контрольного модуля, головки чтения-записи и бесконечной ленты, разделенной на клетки. Ее поведение определяется конечным набором
формул перехода (так называемыми пятерками) типа ввод-выводсдвиг. Эти пятерки имеют следующий вид:
AT → T ′σA ′. (П4.1)
Это означает, что если контрольный модуль находится в состоянии А и головка сканирует на ленте символ Т, то головка сначала
запишет T ′ на месте T, затем сдвинется на одну клетку влево, на
одну клетку вправо или останется на месте согласно значению σ (–,
+ или 0 соответственно) и контрольный модуль перейдет в состояние A ′. В общем случае n-ленточной машины все T, T ′, σ в пятерке
представляют собой совокупность n-индексов – n-плеты.
Каждая пятерка определяет (частичное) взаимно однозначное
отображение настоящего состояния машины (т. е. содержимого
ленты, положения головки и состояния контрольного модуля) на
ее последующее состояние, и это отображение детерминированное
и обратимое.
Следовательно, машина Тьюринга будет детерминированной в том
и только том случае, если ее пятерки определены в неперекрывющихся областях, а обратимой она будет в том и только том случае, если
не будут перекрываться значения. Первое обычно обеспечивается требованием, чтобы части слева от стрелки были разными для каждой
пятерки. Вместе с тем обычная машина Тьюринга необратима.
Для того чтобы сделать ее обратимой, следует добавить переходы, которые напоминают инверсии уже имеющихся переходов. Однако поскольку операции записи и сдвига не коммутируют, инверсия пятерки ввод-вывод-сдвиг хотя и существует, но имеет другой
вид, а именно, сдвиг-ввод-вывод.
169
При конструировании обратимой машины необходимо иметь
пятерки обоих типов или использовать формализм, в котором переходы и их инверсии имеют одну и ту же форму. В рассматриваемом случае будет использована вторая возможность – в обратимой
машине применен простой тип формул перехода, при котором во
время данного перехода каждая лента подвергается операции ввода-вывода или операции сдвига, но ни одна лента не подвергается
обеим операциям одновременно.
Определение 1. Квадруплетом (для n-ленточной машины Тьюринга, имеющей по одной головке на ленту) называется выражение
вида
A [t1, t2 , ..., tn ] → [t1′ , t2′ , ..., tn′ ] A ′,
где A, A ′ – положительные целые числа, обозначающие внутренние состояния контрольного модуля до и после перехода соответственно; t1′ , ..., tn′ – положительные числа.
Каждое tk может быть или положительным целым числом, обозначающим символ, который должен быть прочитан на k-й ленте,
или косой чертой «/», означающей, что при переходе считывания
с k-й ленты не происходит: каждое tk′ является или положительным целым числом, обозначающим символ, который должен быть
написан на k-й ленте, или элементом набора (–, +, 0), который обозначает левый, нулевой или правый сдвиг головки на k-й ленте.
Для каждой ленты tk′ ∈ (−, 0, +) тогда и только тогда, когда tk = /.
Таким образом, машина делает запись на ленте в том и только том
случае, если она ничего «не читала» перед этим.
Как и пятерки, квадруплеты определяют взаимно однозначные отображения глобальных состояний машины. Любую пятерку
ввод-вывод-сдвиг можно разделить на ввод-вывод и сдвиг, которые
можно представить как квадруплеты. Например, пятерка (П4.1)
эквивалентна паре квадруплетов
AT → T ′A ′′,
A ′′[//.../] → σA ′,
где A ′′ – новое состояние контрольного модуля, отличное от A и A ′.
Когда различные пятерки разбиты таким образом, для каждого необходимо использовать различные состояния A ′′, чтобы избежать трудностей, связанных с неопределенностью ввода.
Квадруплеты имеют важные свойства, справедливость которых
можно проверить непосредственно.
170
Пусть
α ≡ A [t1, ..., tn ] → [t1′ , ..., tn′ ] A ′,
β ≡ B [u1, ..., un ] → u1′ , ..., un′  B′
– n-ленточные квадруплеты.
Тогда:
1)  α è β взаимно обратны (определяя обратные отображения
глобальных состояний машины) в том и только том случае, если
′ либо
A = B′ и B = A ′ и для каждого k либо t=
k u=
k / и tk′ = −uk
tk ≠ / и tk′ = uk , и tk = uk′ . Другими словами, обращение квадруплета достигается в том случае, если меняются местами начальное и
конечное состояния контрольного модуля, символы ввода и вывода
и знаки всех сдвигов;
2) области определения α è β перекрываются тогда и только
тогда, когда A = B и для каждого k tk = / или uk = /, или tk = uk . Непересечение областей определения требует различных начальных
состояний контрольного модуля или различных сканируемых символов на какой-нибудь ленте, читаемой обоими квадруплетами;
3) области значений α è β перекрываются тогда и только тогда,
когда A ′ = B′ и для каждого k tk = / или uk = /, или tk′ = uk′ . Это свойство аналогично предыдущему, но зависит от конечного состояния
контрольного модуля и записанных на ленту символов.
Обратимая детерминированная n-ленточная машина Тьюринга
может быть определена как конечный набор n-ленточных квадруплетов, области определения и значений которых не пересекаются
для любой пары лент. Теперь важно показать, что такие машины
можно построить по образцу обычных (необратимых) машин Тьюринга. Уместно потребовать, чтобы при этом выполнялись определенные требования стандартизации формата, что, однако, не ограничивает существенно вычислительных возможностей машин.
Определение 2. Выходные или входные данные называются
стандартными, если они размещены на пустой до этого ленте и
не содержат вставленных пробелов, когда ее головка сканирует
пробел непосредственно слева от нее и когда они включают в себя
только буквы, принадлежащие алфавиту ленты сканирующей машины.
Определение 3. Стандартной машиной Тьюринга называется
набор одноленточных пятерок
AT → T ′σA ′,
171
удовлетворяющих следующим условиям:
1) детерминизм – не существует двух пятерок, отвечающих одним и тем же А и Т одновременно;
2) формат – начав с контрольного состояния А1 при любых стандартных исходных данных, машина, если она остановится, окажется в контрольном состоянии Af, где f – номер контрольного состояния, не выйдя из стандартного формата;
3) особые пятерки – в машине содержатся следующие пятерки:
A1b → b + A2 ,
Af −1b → b0 Af ,
и контрольные состояния A1 и Af больше ни в каких других пятерках не встречаются. Таким образом, эти состояния выполняются
первым и последним соответственно в любом законченном вычислении при стандартных выходных данных. Буква b обозначает пробел.
Фраза «машина М при вводе стандартного набора входных данных I вычисляет набор стандартных выходных данных P» будет
заменяться записью M : I → P. Для n-ленточной машины это выглядит как
M : (I1, I2 , ..., In ) → (P1, P2 , ..., Pn ),
где Ik è Pk – стандартные входные и выходные данные на k-й ленте. Пустую ленту будем обозначать как В.
Теперь можно сформулировать основную теорему.
Теорема. Для каждой стандартной одноленточной машины Тьюринга S существует трехленточная обратимая детерминированная
машина Тьюринга R, такая, что если I и P – потоки алфавита машины S, не содержащие пробелов, то S останавливается на I в том
и только том случае, если R останавливается на (I, B, B) и S : I → P
в том и только том случае, если R : (I, B, B) → (I, B, P).
Более того, если S имеет f контрольных состояний, N пятерок и
алфавит ее ленты состоит из z букв, включая пробелы, то R будет
иметь 2f + 2N + 4 состояний, 4N + 2z + 3 квадруплета и алфавиты лент из z, N + 1 и z букв соответственно. Наконец, если при
каком-нибудь вычислении на S требуется n шагов, используется s
клеток ленты, и это порождает выходные данные длиной λ, то для
R потребуется 4n + 4λ + 5 шагов и s, n + 1 и λ + 2 клеток на ее трех
лентах соответственно. (Далее будет доказано, что когда n  s, общее требуемое пространство может быть уменьшено до величины,
меньшей, чем 2 nz. )
172
Д о к а з а т е л ь с т в о. Для того чтобы построить машину R, следует начать с упорядочения N пятерок машины S так, чтобы первая и
последняя пятерки имели вид
1) A1b → b + A2 ,

m) AjT → T ′σAk ,

N) Af −1b → b0 Af .
Разобьем каждую из пятерок на пару квадруплетов, как описано
ранее. В этом случае m-я пятерка превратится в
′ ,
AjT → T ′Am
′ / → σAk .
Am
′ отличаются от старых состоДополнительные состояния Am
яний и друг от друга: каждое A ′ появляется только в одной паре
квадруплетов.
Затем добавляются две дополнительные ленты: одна для записи истории, другая – для дублирования выходных данных. Лента
вывода (третья) остается пустой и не сдвигается на настоящий момент, а лента истории (вторая) используется для записи индекса m
как только выполнена пара переходов.
Тогда m-я пара квадруплетов принимает вид
′ ,
 Aj [T / b ] → [T ′ + b ] Am

′ [/b /] → [ σm0] Ak .
 Am
Заметим, что лента записи истории (вторая) не совпадает по
фазе с двумя другими – запись на нее идет, когда те сдвигаются, и
наоборот. Такая корреляция фаз необходима, чтобы обеспечить обратимость – она служит для сбора информации, которая в противном случае была бы потеряна, когда специфическое контрольное
′ переходит в более общее состояние Ak .
состояние Am
Положительный сдвиг ленты истории обеспечивает готовность
пустой клетки воспринять следующую величину m. Если вычисления машины S, равно как и вычисления машины R, не остановлены, машина будет продолжать печать ленты истории неограниченно. Вместе с тем если (при стандартном вводе) машина S останавливается, то машина R в конце концов выполнит N-ю пару квадру173
Структура и действие трехленточной обратимой машины Тьюринга
Стадии
Вычисления
Содержание
Лента
Лента
истории
вывода
Квадруплеты
Рабочая
лента
 A1 [ b / b ] → [ b + b′] A1′ ,
1) 
 A1′ [/b /] → [ +1 0] A2;
 
Ввод
–
–
Вывод
История
–
Вывод
История
Вывод
Ввод
–
Вывод
 Aj [T / b] → [T′ + b] Am
′ ,
m) 
′ [/b /] → σ m 0  Ak ;
 Am

 Af −1 [/b /] → [ b + b] An′ ,
N) 
′ [/b /] → [0 N 0] Af ;
 AN
Af [ bNb ] → [ bNb] B1′ ,
B ′ / / / → +0 + B ;
] [ ] 1
{B1 [ xNb] → [ xNx] B1′ },
B1 [ bNb] → [ bNb] B2′,
B2′ [/ / /] → [ −0 − ] B2;
{B2 [ xNx] → [ xNx] B2′ },
B2 [ bNb] → [ bNb] Cf ;
1
x≠b
Копирование
вывода
x≠b
[
C / N /] → [0b0] CN
′ ,
N)  f [

′ [ b / b] → [ b − b] Cf −1;
CN

Восстановление
C /m /] → [ σb0] CmN
′ ,
m)  k [
′
CN [T / b] → [T − b] Cj ;

C2 [/1 /] → [ −b0] C1′ N ,
1) 
C1′ [ b / b] → [ b − b] C1;
Примечание. Метки 1) ... m) … N) не являются частью машины. Они отражают
соответствие пятерок оригинальной необратимой машины, которую моделирует обратимая машина. На стадии 2 квадратные скобки обозначают набор квадруплетов для
каждой непустой литеры ленты х.
174
плетов, находясь в состоянии Af, со стандартным выводом данных
на ленту 1. Головка истории будет сканировать ячейку с номером
N, который был только что записан в самую крайнюю правую позицию ленты истории 2 (см. таблицу).
Контрольное состояние для этой стадии обозначено через B′ и отличается от всех контрольных заданий типа A. Заметим, что процесс
копирования можно сделать обратимым, при этом на ленте истории
больше ничего писать не следует. Это означает, что создание (или уничтожение) дубликата данных не требует отбрасывания информации.
Вычисления производятся в три стадии с использованием различных наборов квадруплетов и контрольных состояний, связь
проявляется через состояния Af и Cf. Подчеркивание показывает
положение головки: начальное состояние – А1, конечное состояние
для выполненного вычисления – С1.
Третья стадия отменяет работу первой и состоит в инверсии всех
переходов первой стадии с заменой А на С. В конечном состоянии С1
лента истории снова пуста, и другие ленты содержат восстановленные входные и требуемые выходные данные.
Как показано в таблице, общее число контрольных состояний
равно 2N + 2f + 4, число квадруплетов 4N + 2z + 3, при этом вычисление требует столько клеток, сколько было упомянуто в начале доказательства.
Неперекрываемость областей определения и значения для всех
квадруплетов обеспечивает детерминизм и обратимость машины R.
На первой стадии верхние переходы каждой пары не перекрываются
в их областях определения из-за принятой за аксиому детерминированности машины Тьюринга S, чьи пятерки также начинаются с AjT.
Области значений верхних квадруплетов (как и области определения
нижних) предохраняются от перекрывания единственностью состоя′ . Наконец, область значений нижних квадруплетов защищена
ния Am
от перекрывания единственностью выходных данных m на ленте истории. Состояние Af не доставляет хлопот, даже если оно появляется как
на стадии 1, так и на стадии 2, потому что по определению машины S
оно не появляется слева на стадии 1; то же относится и к состоянию Сf.
Неперекрываемость на стадии 2 можно проверить, в то время как детерминизм и обратимость стадии 3 следуют из этих свойств стадии 1.
В заключение отметим, что приведенное доказательство справедливо не только в случае трехленточной машины Тьюринга, но
может быть применено к любым детерминированным автоматам,
конечным или бесконечным, при одном лишь условии, что их временная память достаточно велика для хранения истории.
175
Литература
1. Прескилл Дж. Квантовая информация и квантовые вычисления.
М.: НИЦ «Регулярная и хаотическая динамика». 2008. Т. 1. 462 с.
2. Поплавский Р. П. Термодинамические модели информационных процессов // Успехи физич. наук. 1975. Т. 115. Вып 3. C. 465–
501.
3. Фейнман Р. Моделирование физики на компьютерах // Квантовый компьютер и квантовые вычисления. 1999. Т. 2. C. 96–125.
4. Манин Ю. И. Вычислимое и невычислимое. М.: Советское
радио, 1980. 128 c.
5. Wooters W. K., Zurek W. H. A single quantum cannot be cloned //
Nature. 1982. Vol. 299. P. 802–803.
6. Dieks D. Communication by EPR devices // Phys. Lett. A. 1982.
Vol. 92. N 6. P. 271–272.
7. Bell J. S. Speakable and unspeakable in quantum mechanics //
Rev. Mod. Phys. 1966. Vol 38. P. 447–452.
8. Ожигов Ю. И. Квантовые вычисления: учеб.-метод. пособие.
M.: Макс Пресс, 2003.
9. Сейсян Р. П. Нанолитография в микроэлектронике: обзор //
Журн. теор. физики. 2011. Т. 81. Вып. 8. С. 1–14.
10. Landauer R., Swanson J. A. Frequency factors in the thermally
activated process // Phys. Rev. 1961. 1668.
11. Ландауэр P. Необратимость и выделение тепла в процессе
вычислений // Квантовый компьютер и квантовые вычисления.
1999. Т. 2. С. 9–33.
12. Савельев И. В. Курс физики. М.: Наука, 1989. Т. 1. 350 с.
1987. Т. 3. 317 с.
13. Еxperimental verification of Landauer’s principle linking
information and thermodynamics / A. Berut, A. Arakelyan,
A. Petrosyan, S. Gilberto, R. Dillenschneider, E. Lutz // Nature.
2012. Vol. 483. P. 187–189.
14. Bennet C. H. Thermodynamics of computation – a review//
Intern. J. Theor. Phys. 1982. Vol. 21. P. 905–940.
15. Китаев A., Шень A., Вялый M. Классические и квантовые
вычисления. М.: МЦИМО: ЧеРо, 1999. 192 c.
16. Benioff P. Quantum mechanical Hamiltonian models of Turing
machins // J. Statist. Phys. 1982. Vol. 2 9. N 3. P. 515–546.
17. Шпольский Э. В. Атомная физика. М.: Наука, 1984. Т. 2. 438 с.
18. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989. 655 с.
19. Липкин Г. Квантовая механика. М.: Мир, 1977. 592 с.
176
20. Peres А. Quantum theory: concepts and methods. Dordrecht:
Kluver Acad. Publ., 2002. 464 p.
21. Кайе Ф., Лафламм Р., Моска М. Введение в квантовые вычисления. М.: НИЦ. Регулярная и хаотическая динамика», 2009. 346 с.
22. Deutsch D. Quantum theory, the Church – Turing principle and
the universal quantum Turing computer // Proc. Roy. Soc. London.
Ser. A. 1985. Vol. 400. P. 97–117.
23. Clauser J. F., Shimony A. Bell`s theorem: experimantal tests
and implications // Rep. Progr. Phys. 1978. Vol. 41.P. 1881–1927.
24. Fredkin E., Toffoli T. Design principles for achieving highperformance submicron digital technologies // Defence Adv. Res.
Project Agency. MIT Lab. for Comp. Sci. 1978.
25. Голубев А. Оптический пинцет // Наука и жизнь. 2003. № 6.
26. Turing A. M. On computable numbers, with an application to
the entscheidungs problem // Proc. London Math. Soc. (2). 1936.
Vol. 58. P. 544–546.
27. Kinoshita T. On magnetic bubble circuits // IEEE Trans. Comp.
1976. Vol. C-25. P. 247–253.
28. Bennett C. H. Logical reversibility of computation // IBM J.
Res. Develop. 1973. Vol. 6. P. 525–532.
29. Toffoli T. Bicontinuous extensions of invertible combinatorial
functions // Math. Systems Theory. 1981. Vol. 14. P. 13–23.
30. Bennett C. H. Dissipation-error tradeoff in proofreading //
BioSystems. 1979. Vol. 11. P. 85–91.
31. Benioff P. The computer as a physical system: a microscopic
quantum mechanical Hamiltonian model of computers as represented
by Turing machines //J. Statist. Phys. 1980. Vol. 22. P. 563–591.
32. Тьюринг А. Может ли машина мыслить? М.: Физматгиз,
1960. 67 c.
177
Содержание
Предисловие.............................................................................. 3
Глава 1. Классические пределы.................................................... 1.1. Проблемы микроэлектроники............................................. 1.2. Принцип Ландауэра........................................................... 1.3. Доказательство принципа Ландауэра.................................... 1.4. Прямое экспериментальное подтверждение принципа
Ландауэра............................................................................... 1.5. Логическая необратимость.................................................. 1.6. О возможности обратимых вычислений................................ 1.7. Теорема Беннета................................................................ 1.8. О реализации обратимого компьютера.................................. 7
7
9
10
Глава 2. Математический аппарат квантовой механики.................. 2.1. Векторная алгебра............................................................. 2.2. Линейное n-мерное пространство над полем комплексных
чисел..................................................................................... 2.3. Гильбертово n-мерное пространство...................................... 2.4. Алгебра матриц................................................................. 2.5. Обозначения Дирака.......................................................... 2.6. Линейные операторы......................................................... 2.7. Матричное представление операторов................................... 2.8. Представление операторов с использованием тензорного
произведения.......................................................................... 2.9. Тензорное произведение пространств.................................... 2.10. Функции операторов........................................................ 2.11. Пространство операторов.................................................. 2.12. Коммутатор и антикоммутатор.......................................... 2.13. Полярное разложение по сингулярным числам.................... Глава 3. Основные положения квантовой механики........................ 3.1. О физической теории микромира – квантовой механике
и ее отличиях от теории макромира............................................ 3.2. Аксиомы квантовой механики............................................. 3.3. Квантовая динамика.......................................................... 3.4. Представление Шредингера................................................ 3.5. Представление Гейзенберга................................................. 3.6. Представление взаимодействия........................................... 3.7. Составные системы............................................................ 15
16
18
19
21
31
31
34
36
39
45
47
50
57
63
66
69
70
72
73
73
77
81
82
83
84
85
Глава 4. Квантовый компьютер Р. Фейнмана................................. 88
4.1. Проблема моделирования в физике...................................... 89
4.2. Квантовые компьютеры – универсальные квантовые
моделирующие устройства........................................................ 91
178
4.3. Эксперимент А. Аспека с коррелированными фотонами.
Неравенство Дж. Белла............................................................ 4.4. Квантовый компьютер Фейнмана......................................... 4.5. Обратимая вычислительная машина.................................... 4.6. Элемент Тоффоли.............................................................. 4.7. Логические операции в квантовом компьютере...................... 4.8. Недостатки и необратимые потери
свободной энергии................................................................... 4.9. Квантовомеханический компьютер.
В чем его вычислительная привлекательность?............................ 4.10. Развитие теории квантового компьютера
в работах Д. Дойча................................................................... 4.11. Идея квантового компьютера проста................................... Приложения.............................................................................. Приложение 1. Оптический пинцет [25]......................................... Приложение 2. Консервативная логика Тоффоли и Фредкина.
Компьютер на бильярдных шарах................................................. Приложение 3. Информация и энтропия ........................................ Приложение 4. Доказательство теоремы Беннета............................ Литература ................................................................................ 93
97
99
100
103
110
113
114
118
122
122
127
156
169
176
179
Учебное издание
Прилипко Виктор Константинович
Коваленко Иван Иванович
ФИЗИЧЕСКИЕ ОСНОВЫ
КВАНТОВЫХ ВЫЧИСЛЕНИЙ:
ОТ БИТОВ К КУБИТАМ
Учебное пособие
Редактор А. А. Гранаткина
Компьютерная верстка С. Б. Мацапуры
Сдано в набор 04.07.16. Подписано к печати 29.11.16.
Формат 60×84 1/16. Бумага офсетная. Усл. печ. л. 10,4.
Уч.-изд. л. 11. Тираж 50 экз. Заказ № 444.
Редакционно-издательский центр ГУАП
190000, Санкт-Петербург, Б. Морская ул., 67
Документ
Категория
Без категории
Просмотров
11
Размер файла
3 085 Кб
Теги
prilipko
1/--страниц
Пожаловаться на содержимое документа