close

Вход

Забыли?

вход по аккаунту

?

Пуаза Б. - Курс теории моделей (2001).pdf

код для вставкиСкачать
ВВЕДЕНИЕ В СОВРЕМЕННУЮ МАТЕМАТИЧЕСКУЮ ЛОГИКУ
Казахский национальный университет им. аль-Фараби
Бруно Пуаза
КУРС ТЕОРИИ МОДЕЛЕЙ
Электронный учебник.
Перевод с французского
по заказу AMS
Е.Р. Байсалова и
К.А. Мейрембекова
Алматы
{ 2001
Автор:
Bruno Poizat Universite Claude Bernard
43, boulevard du 11 novembre 1918 69622
Villeurbanne-cedex, France
poizat@desargues.univ-lyon1.fr
Е.Р. Байсалов и К.А. Мейрембеков, 480012
Казахстан, Алматы, Масанчи{Богенбай батыра
39/47
механико-математический факультет КаПеревод: захского
Национального университета им. альФараби,
meirembekov@mail.ru
c Байсалов & Мейрембеков
Bruno Poizat
COURS DE
THEORIE
DES MODELES
Une introduction a la Logique
Mathematique contemporaine
NUR AL-MANTIQ WAL-MA'RIFAH
Содержание
Введение
ix
1 Элементарные классы отношений
1
1.a Локальные изоморфизмы
между отношениями . . . . . . . . . .
1.b Примеры . . . . . . . . . . . . . . . .
1.c Бесконечный "челночный" метод . .
1.d Исторические и библиографические
примечания . . . . . . . . . . . . . . .
2 Язык одного отношения
2.a
2.b
2.c
2.d
Формулы . . . . . . . . . . . . . . . .
Связи с "челноком" . . . . . . . . . .
Модели и теории . . . . . . . . . . . .
Элементарные расширения :
тест Тарского, теорема Левенгейма .
2.e Исторические и библиографические
примечания . . . . . . . . . . . . . . .
3 Расширение языка, структуры
3.a Мультиотношения,
реляционные структуры . . . . . . .
3.b Функции . . . . . . . . . . . . . . . .
3.c Снова о теореме Левенгейма . . . . .
3.d Исторические и библиографические
примечания . . . . . . . . . . . . . . .
4 Компактность
4.a Ультрапроизведения . . . . . . . . . .
4.b Компактность, теорема
Левенгейма-Сколема, теорема
об общем элементарном расширении
4.c Метод Генкина . . . . . . . . . . . . .
4.d Исторические и библиографические
примечания . . . . . . . . . . . . . . .
iv
................. 2
................. 5
. . . . . . . . . . . . . . . . . 11
. . . . . . . . . . . . . . . . . 14
15
. . . . . . . . . . . . . . . . . 16
. . . . . . . . . . . . . . . . . 24
. . . . . . . . . . . . . . . . . 25
. . . . . . . . . . . . . . . . . 27
. . . . . . . . . . . . . . . . . 29
31
. . . . . . . . . . . . . . . . . 32
. . . . . . . . . . . . . . . . . 33
. . . . . . . . . . . . . . . . . 36
. . . . . . . . . . . . . . . . . 37
38
. . . . . . . . . . . . . . . . . 39
. . . . . . . . . . . . . . . . . 43
. . . . . . . . . . . . . . . . . 48
. . . . . . . . . . . . . . . . . 53
v
Содержание
5 Челночный метод в !-насыщенных моделях
5.a
5.b
5.c
5.d
Пространство типов . . . . . . . . . .
!-насыщенные модели . . . . . . . . .
Элиминация кванторов . . . . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . .
6 Иллюстрации челночного метода
6.a
6.b
6.c
6.d
6.e
Алгебраически замкнутые поля . . .
Дифференциально замкнутые поля .
Булевы алгебры . . . . . . . . . . . .
Ультраметрические пространства . .
Модули, экзистенциально
замкнутые модули . . . . . . . . . . .
6.f Исторические и библиографические
примечания . . . . . . . . . . . . . . .
7 Арифметика
7.a
7.b
7.c
7.d
7.e
7.f
7.g
7.h
7.i
7.j
7.k
7.l
7.m
Функция следования . . . . . . . . .
Порядок . . . . . . . . . . . . . . . . .
Сумма . . . . . . . . . . . . . . . . . .
Сумма и произведение : кодирование
конечных множеств . . . . . . . . . .
Кодирование формул,
теорема Тарского . . . . . . . . . . .
Иерархия арифметических множеств
Некоторые аксиомы, модели
фрагментов арифметики . . . . . . .
Нестандартные модели в
арифметическом определении . . . .
Арифметический перевод
метода Генкина . . . . . . . . . . . .
Понятие доказательства,
разрешимые теории . . . . . . . . . .
Теорема Геделя . . . . . . . . . . . .
Немного математической фикции . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . .
8 Ординалы и кардиналы
8.a
8.b
8.c
8.d
Вполне упорядоченные множества
Аксиома выбора . . . . . . . . . . .
Кардиналы . . . . . . . . . . . . . .
Конфинальность . . . . . . . . . . .
.
.
.
.
55
. . . . . . . . . . . . . . . . . 56
. . . . . . . . . . . . . . . . . 57
. . . . . . . . . . . . . . . . . 60
. . . . . . . . . . . . . . . . . 64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
65
66
72
80
87
. . . . . . . . . . . . . . . . . 92
. . . . . . . . . . . . . . . . . 100
103
. . . . . . . . . . . . . . . . . 104
. . . . . . . . . . . . . . . . . 105
. . . . . . . . . . . . . . . . . 106
. . . . . . . . . . . . . . . . . 111
. . . . . . . . . . . . . . . . . 117
. . . . . . . . . . . . . . . . . 119
. . . . . . . . . . . . . . . . . 129
. . . . . . . . . . . . . . . . . 135
. . . . . . . . . . . . . . . . . 136
. . . . . . . . . . . . . . . . . 140
. . . . . . . . . . . . . . . . . 145
. . . . . . . . . . . . . . . . . 148
. . . . . . . . . . . . . . . . . 152
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
154
. 155
. 159
. 166
. 172
vi
СОДЕРЖАНИЕ
8.e Исторические и библиографические
примечания . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
9 Насыщенные модели
9.a Теорема Свенониуса . . . . . . . . . . . . . . . .
9.b Компактные, насыщенные, однородные,
универсальные модели . . . . . . . . . . . . . .
9.c Блестящие модели . . . . . . . . . . . . . . . . .
9.d Свойства сохраняющиеся при интерпретациях .
9.e Рекурсивно насыщенные модели . . . . . . . . .
9.f Исторические и библиографические
примечания . . . . . . . . . . . . . . . . . . . . .
10 Простые модели
10.a Теорема об опускании типов . . . . .
10.b Простые модели, атомные
модели: счетный случай . . . . . . .
10.c Теории с конечным
числом счетных моделей . . . . . . .
10.d Конструируемые модели . . . . . . .
10.e Минимальные модели . . . . . . . . .
10.f Неединственность простой модели . .
10.g Исторические и библиографические
примечания . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 180
. 185
. 190
. 191
. . . . . . . . . . . 197
. . . . . . . . . . . . . . . . . 199
. . . . . . . . . . . . . . . . . 201
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 204
. 205
. 209
. 211
. . . . . . . . . . . . . . . . . 217
Наследники . . . . . . . . . . . . . . . . . . .
Определимые типы . . . . . . . . . . . . . .
Типы концевых расширений в арифметике
Стабильные типы и теории . . . . . . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . . . . . .
.
.
.
.
Особые сыновья . . . . . . . . . . . . . .
Конаследники . . . . . . . . . . . . . . .
Последовательности Морли . . . . . . .
Свойство независимости . . . . . . . . .
Неделимые последовательности Морли .
Один пример : теории порядков . . . . .
Особые последовательности . . . . . . .
Нестабильность и порядок . . . . . . . .
Добавление: теорема Рамсея . . . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
218
. 219
. 223
. 224
. 226
. . . . . . . . . . . . . 230
12 Особые сыновья, последовательности Морли
12.a
12.b
12.c
12.d
12.e
12.f
12.g
12.h
12.i
12.j
. . . . . . . . . . . 178
198
11 Наследники
11.a
11.b
11.c
11.d
11.e
176
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
232
. 233
. 236
. 239
. 243
. 248
. 256
. 262
. 264
. 267
. . . . . . . . . . . . . . . 269
vii
Содержание
13 Фундаментальный порядок
13.a
13.b
13.c
13.d
272
Фундаментальный порядок . . . . . .
Спектр стабильности . . . . . . . . .
Некоторые примеры . . . . . . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . 273
. . . . . . . . . . . . . . . . . 277
. . . . . . . . . . . . . . . . . 281
14 Стабильность и насыщенные модели
286
14.a
14.b
14.c
14.d
Теорема существования . . . . . . . .
Теоремы несуществования . . . . . .
Блестящие модели . . . . . . . . . . .
Достаточно насыщенные
расширения данной модели . . . . . .
14.e Исторические и библиографические
примечания . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . 284
. . . . . . . . . . . . . . . . . 287
. . . . . . . . . . . . . . . . . 288
. . . . . . . . . . . . . . . . . 290
. . . . . . . . . . . . . . . . . 292
. . . . . . . . . . . . . . . . . 294
15 Отклонение
15.a Теорема о грани . . . . . . . . . . . . . . .
15.b Сыновья с отклонением, сыновья
без отклонения . . . . . . . . . . . . . . . .
15.c Кратность . . . . . . . . . . . . . . . . . . .
15.d Стабильные типы в нестабильной теории .
15.e Исторические и библиографические
примечания . . . . . . . . . . . . . . . . . .
16 Сильные типы
16.a Теорема о конечной эквивалентности .
16.b Пространства сильных типов;
теорема об открытом отображении . .
16.c Последовательность Морли сильного
типа; снова о насыщенных моделях . .
16.d Воображаемые элементы . . . . . . . .
16.e Элиминация воображаемых элементов
16.f Теория Галуа для сильных типов . . .
16.g Исторические и библиографические
примечания . . . . . . . . . . . . . . . .
17 Понятия ранга
17.a
17.b
17.c
17.d
17.e
Ранг Ласкара . . . . . . . . . . . . . .
Ранг Шелаха . . . . . . . . . . . . . .
Ранг Морли . . . . . . . . . . . . . . .
Локальные ранги . . . . . . . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . .
18 Стабильность и простые модели
.
.
.
.
296
. . . . . . . . . . . . . . 297
. . . . . . . . . . . . . . 300
. . . . . . . . . . . . . . 303
. . . . . . . . . . . . . . 305
. . . . . . . . . . . . . . 306
307
. . . . . . . . . . . . . . . . 308
. . . . . . . . . . . . . . . . 311
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 313
. 317
. 319
. 327
. . . . . . . . . . . . . . . . 330
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
331
. 332
. 335
. 340
. 344
. . . . . . . . . . . . . . . . . 349
350
viii
СОДЕРЖАНИЕ
18.a Теорема единственности . . . . . . .
18.b Простые модели тотально
трансцендентной теории . . . . . . .
18.c Теория Галуа
дифференциальных уравнений . . . .
18.d Простые jT j+-насыщенные модели .
18.e Модели Эренфойхта . . . . . . . . . .
18.f Теорема о двух кардиналах ;
!1-категоричные теории . . . . . . . .
18.g Исторические и библиографические
примечания . . . . . . . . . . . . . . .
19 Стабильность, неразличимые
последовательности и вес
19.a
19.b
19.c
19.d
19.e
Неразличимые последовательности .
Неравенства Ласкара . . . . . . . . .
Вес суперстабильного типа . . . . . .
Независимость и поглощение . . . . .
Исторические и библиографические
примечания . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . 351
. . . . . . . . . . . . . . . . . 352
. . . . . . . . . . . . . . . . . 357
. . . . . . . . . . . . . . . . . 364
. . . . . . . . . . . . . . . . . 367
. . . . . . . . . . . . . . . . . 369
. . . . . . . . . . . . . . . . . 372
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 374
. 376
. 380
. 384
. . . . . . . . . . . . . . . . . 393
20 Размерность в моделях тотально трансцендентной теории
20.a Порядок Рудин{Кейслера . . . . . .
20.b Типы и размерностные теории . . . .
20.c Классификация моделей
размерностной теории . . . . . . . .
20.d DOP . . . . . . . . . . . . . . . . . . .
20.e Глубина и основной скачок . . . . .
20.f Исторические и библиографические
примечания . . . . . . . . . . . . . . .
Библиография . . . . . . . . . . . . . . .
Список обозначений . . . . . . . . . . .
Алфавитный указатель . . . . . . . . .
История публикации . . . . . . . . . . .
Индекс цитат . . . . . . . . . . . . . . . .
373
394
. . . . . . . . . . . . . . . . . 395
. . . . . . . . . . . . . . . . . 403
. . . . . . . . . . . . . . . . . 410
. . . . . . . . . . . . . . . . . 416
. . . . . . . . . . . . . . . . . 418
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 419
. 421
. 436
. 439
. 454
. 456
Введение
Роскошные книги, что к нам поступают из-за океана одеты в глянцевую
суперобложку, на обороте которой виден портрет улыбающегося молодого человека в галстуке { автора, поданного в полной упаковке престижных университетских титулов; там вы найдете замечание, расхваливающее достоинства и
универсальное значение его книги, которую он рекомендует купить всем без
исключения, и в особенности тем, кто интересуется предметом, рассмотренным
в ней.
Мне тоже следует убедить вас в полезности моей книги; я начну с уточнения того, кому адресован этот курс : он адресован математикам . Я его писал
думая о тех моих собратьях, которые однажды испытали чувство любопытства,
иногда доброжелательного, а порой снисходительного, к математической логике и, которые не смогли найти в вводных книгах, существующих в продаже,
достаточного побуждения, заставившего их глубоко проникнуть в область этой
науки; я хотел, чтобы с первых страниц этой книги они узнали свою излюбленную деятельность, состоящую в доказательстве теорем. Я старался избегать
затянутых начал, нагромождений определений, мотивации которых будут ясны лишь намного позже, последовательностей лемм, лишенных существенного
математического содержания, которые сбивают с толку неискушенного в этом
предмете читателя точно так же как и более весомые теоремы, и, которые его
глубоко раздражают когда он понимает, что поломал голову лишь над тем,
чтобы прояснить некоторые банальности.
Я пытался вводить определения объектов только одновременно с полученными по их поводу результатами, для того, чтобы как можно быстрее прийти к предложениям, которых требовательный читатель признает как теорему,
например теорему 1.14, доказываемую на нескольких страницах и утверждающую, что две счетные 1-эквивалентные структуры являются изоморфными. И
я хотел по мере возможности иллюстрировать методы теории моделей примерами, использующими общепринятые математические понятия ( алгебраически
замкнутые поля и т.п. ) , которые составляют повседневный мир современного математика, и которые для него являются более мотивирующими, чем
тривиальные примеры, которые очень часто можно найти в вводных книжках
по логике ( "тривиальный" здесь понимается в математическом смысле, что
впрочем является и этимологическим смыслом ) .
Составляя этот курс я думал прежде всего о другой категории математиков { о начинающих математиках, студентах наших университетов, которые
имеют будущее, но которые не смогли ещё занять место под солнцем науки.
Возможно, они найдут некоторые подъемы немножко трудными для восхоix
x
СОДЕРЖАНИЕ
ждения; они должны быть спокойны, эта трудность, которую они испытывают
при чтении математического текста из незнакомой для них области, а он, как
правило, содержит пробелы, не происходят от недостатка интеллекта : опытные математики испытывают то же самое. Холодная невозмутимость, которая
им присуща, когда они присутствуют на докладах, выражая тем самым все
внешние признаки совершенного понимания сюжета, первоосновы которого им
неизвестны, происходят не из-за превосходной быстроты мышления, а из-за
обыкновения, с которым они посещают коллоквиумы и семинары.
Впрочем, эта книга адресована именно студентам, поскольку речь идет о
курсе, который был на самом деле прочитан по частям и несколько раз на уровне DEA1. Таким образом, я не думаю, что этот курс может быть полезным для
начинающего, не имеющего никакой математической культуры, если только он
не является патологически одаренным : читатель должен быть на уровне бакалавра или магистранта по математике ; на самом деле нужно определенное
знакомство с обычными соглашениями, методами доказательства, принятыми
в современной математике, которые как и повсюду, применяются в этом курсе,
а также с примерами служащими для их иллюстрации ; равным образом, необходимо иметь достаточно ясное представление о компактных пространствах.
По этому поводу, я все ещё помню себя, заявляющего лицом к доске, в одной из моих лекций : "Возьмем поясняющий пример, пусть K { алгебраически
замкнутое поле : : : " и поворачиваясь к аудитории, по виду моих студентов я
понял, что свет исходящий из этого примера был бы действительно проясняющим, если бы они знали о чем идет речь. Если, таким же образом, начинающий читатель запутается в примерах, которые предназначены для того, чтобы
указывать ему дорогу, он может их пропустить, или обратиться к ближайшему
учебнику по алгебре или топологии, или просто обратиться за помощью к более
опытному товарищу. Но за исключением приемлемого уровня математической
культуры, не требуется никаких специфических знаний чтобы приступить к
чтению этого курса, являющегося прежде всего вводной книгой, которая рассматривает математическую логику с самого начала.
Наконец, я думал о третьей категории читателей { математиках-специалистах в логике. Прежде всего, потому что им приходится преподавать этот предмет и они могут, если найдут приемлемой, предложить мою книгу своим студентам как гид, если они читают курс по теме, рассматриваемой здесь, или
как ссылку, если они превышают этот уровень. А также, (и здесь я должен
признаться, что проявляю большую самонадеянность) я верю, что моя книга
сможет дать некоторые новые знания даже профессиональным логикам ; на
самом деле, её вторая часть, состоящая из глав с 11 по 20 , трактует то, что
теперь называется "теорией стабильности" ; именно её специалисты рассматривают как сердцевину теории моделей. Именно у неё наибольший шанс выйти
за тесноватые рамки математической логики. Но это объем знания, возраст
которого по существу только десять лет. Он распространялся только ограниченным тиражом и многие считают, по разным причинам, его очень трудным
; не было доступной книги, излагающей эту теорию достаточно глубоко. ПуАббревиатура уровня образования, принятого во Франции, Dipl^ome d'E tudes Approfondies, соответствующего нашей магистратуре
1
Содержание
xi
бликация этого курса, хочет восполнить этот пробел.
Кроме того, те же профессиональные логики приглашаются к внимательному изучению первых глав, поскольку я намеренно выбрал неординарный
подход к основам логики. Понятие, которое я выбрал исходным, есть понятие
"челнока" в стиле Фраиссе, а не понятие выполнимости формулы. Я поступил
так, чтобы не повторять лишний раз то, что можно найти на первых страницах предшествующих учебников ( и часто, к сожалению, не только на первых
страницах ; я буду охотно упрекать моих предшественников, как правило из-за
нудного введения в предмет ) , а также потому, что я думаю этот подход является удовлетворительным для математика , я дам объяснения позже по этому
поводу. Таким образом мой читатель-логик не узнает ничего нового из глав
1 { 10 , которые составляют то, что можно назвать "классической" теорией
моделей, но только если он уже не обратится в религию Фраиссе. Он наверняка удивится представлению этой теории моделей под особым освещением, с
другими приоритетами ; полезно сравнивать и оценивать различные подходы
к любимому предмету. Это несомненно полезно, если он преподает предмет,
и дает возможность размышлять над природой объектов, которые ему хорошо знакомы и они возможно обретут немного другие черты под другим углом
зрения.
Впрочем, чтение этой книги трудно будет начинать с 11-ой главы, поскольку я хотел составить эту книгу по единому дидактическому замыслу, который
разворачивается с самого начала до конца, следуя нескольким направляющим
идеям ( я оставляю самому читателю право судить насколько это мне удалось) .
По этому поводу, я заметил, что в шикарных книгах, о которых речь шла в самом начале, любят рисовать между предисловием и содержанием граф, по возможности не планарный, указывающих порядок, в котором можно, или нужно
читать различные главы. Я воздержался от рисования такого графа, который
был бы здесь прискорбно линейным, поскольку главы этой книги написаны,
чтобы их читать в естественном порядке их следования ; и добавлю, что для
книги это не является слишком странным свойством.
Я дошел теперь до содержания этой книги ; как вы уже поняли, речь идет
о введении в предмет ; что это за предмет ? Вы заметите, что его название { "Курс теории моделей", а не "Курс математической логики" ; однако,
по моему, его первые главы могут быть прочитаны всяким, кто хочет приобщиться к какой бы ни было области математической логики. Это потому, что
теория моделей в логике, имеет почти тот же статус, что и арифметика { среди математических дисциплин : теория чисел является престижной и очень
специализированной ветвью современной математики. Хотя не бывает математики без чисел, однако математик, умеющий безошибочно считать до ста и
даже далее не может тем не менее рассматриваться как специалист по теории
чисел. Можно сказать также, что основы теории моделей ( здесь главы с 1-ой
по 10-ю ) относятся к сегодняшней логике так же, как арифметика относится
к математике ; далее ( главы с 11-ой по 20-ю ) теория моделей обособляется
как и теория чисел. Теория моделей является, таким образом, самой "нелогической", нетипичной ветвью математической логики. В то же время ни
один логик не может игнорировать её фундаментальные движущие силы. Не
нужно, однако, из этого делать вывод, что все логики одинаково хорошо зна-
xii
СОДЕРЖАНИЕ
комы с понятиями изучаемыми в первых десяти главах этой книги. Не все их
рассматривают одинаково фундаментальными ; можно быть более или менее
либеральным когда понятие именуется "основным" : некоторые включают теорему о распределении простых чисел в элементарную арифметику, другие её
ограничивают простыми свойствами НОД и НОК .
До сих пор речь заходила достаточно часто о моделях, и может быть вы
спрашиваете себя, о чем идет речь ? В прикладной математике модель есть
абстрактное представление некоторой осязаемой действительности. Логики
же используют слово "модель" почти в обратном смысле : для них, модели являются конкретными объектами ( если только математические объекты
могут быть таковыми ) , которые иллюстрируют, интерпретируют некоторые
абстрактные идеи ; например, вы конечно знаете как записать аксиомы, выражающие, что некоторый закон бинарной композиции определяет группу ; если
дано множество аксиом, логик называет его теорией : в настоящем случае, это
будет теория групп. Модель теории { это структура, которая подтверждает все
аксиомы этой теории. Модель теории групп (абстрактное представление) , это
значит просто напросто некоторая группа (конкретный объект) .
Чтобы писать аксиомы, используются формулы, которые являются последовательностями символов, подчиненных определенным правилам построения ;
всё то, что касается манипуляций с формулами, логик называет синтаксисом ;
понятие модели относится к другой области, поскольку оно предполагает определенную интерпретацию символов, фигурирующих в формулах (например,
символ бинарной функции интерпретируется умножением вполне конкретной
группы) , придающую смысл этим формулам, превращая их в истинные и ложные сентенции : логик скажет, что это семантическое понятие.
Теория моделей очень мало занимается синтаксисом, сущность этой науки
держится на семантическом уровне ; с этой точки зрения она есть противоположность тому, что называется теоретической информатикой, существенной
компонентой которой является алгоритмическое изучение языков, являющееся главным образом синтаксическим исследованием. Понятно, что естественно
приступить к логике через теорию моделей, поскольку обычно в математике дают живому содержанию приоритет над формальными рассуждениями. Однако
этот метод познания, достаточно нов, поскольку, для наших отцов объектом логики было не изучение того, что выполняется на данной структуре, а изучение
того, что может быть истинно ("моделью" которого был недостижимый мир
нашего разума) , а также способа, с помощью которого можно доказать то, что
истинно ; следовательно, они должны были заботиться о формализации языка,
выделив важное место символу импликации, играющему центральную роль в
дедуктивных системах ; аксиоматизации, формальные правила для проведения доказательства, "эффективный" характер некоторых методов { вот всё,
что было в центре их внимания.
Позже они отдали себе отчет в том, что прямая атака на проблему истинности в математике наталкивается на некоторые трудности, и, что лучше, в
первое время, умерить амбиции и начать сначала с попыток классификации,
сравнения структур, являющихся моделями одной и той же теории T : это и
есть теория моделей. И они заметили, что такие исследования приводит к ин-
Содержание
xiii
тересным и совсем нетривиальным результатам; впрочем, честно говоря, там
от логики мало что остается : как во многих разделах математики, побудительные мотивы потерялись из виду и новая область знаний развилась автономным
образом.
Добавим, что в теории моделей накладываются ограничения на язык (или
скорее на его семантику : он должен быть финитарным и первого порядка) ;
это явный признак автономности этой ветви, поскольку нет никаких логических причин предпочтения этого языка над другим, а также тщетно стараться
его обосновать, опираясь на более или менее естественную интуицию ; если это
так, то это в конце концов из-за технических причин потому, что рассматриваемый язык единственный или почти единственный, допускающий приличную
теорию моделей. Я сказал "или почти" , потому что некоторые думают, вот
уже несколько лет, что всё, что можно доказать в "обычной" теории моделей,
доказано и, чтобы получить новые теоремы следует усложнить правила игры,
прибегая к разновидностям бесконечных языков, необычных кванторов и т.д. ;
эта ориентация, против которой я всегда энергично боролся в меру моих слабых
возможностей, поскольку я верю, что самая обычная теория моделей показала
себя источником глубоких результатов, общезначимость которых просто потрясает и, что она в этом себя ещё не исчерпала и , что бесполезно её искусственно
усложнять.
Как бы там ни было с теперешним положением теории моделей, её прошлое оставляет, к сожалению, много пятен на первых страницах традиционных учебников, претендующих на введение в эту теорию через рассмотрения,
не имеющие ничего общего с повседневной практикой в теории моделей. Там
вы найдёте туманные рассуждения, нечёткие определения, неадекватные доказательства, призывы к псевдо-естественной интуиции, отравленной метафизическими отбросами, в то время как именно метафизика наводит на математика
самый инстинктивный ужас!
Следовательно, поскольку я писал книгу для математика, то избрал другой путь, чтобы его полностью убедить в том, что логика является частью
математики, а не метафизики ; вот почему в первой главе его учат сравнивать две структуры посредством локальных изоморфизмов подобно Роланду
Фраиссе ; здесь ничто его не потревожит, всё произойдет в знакомой среде, в
привычной манере рассуждения. Если скрыть от него название и предисловие
этой книги, он даже не будет подозревать, что его стараются затащить в мутные топи проклятой науки ; его подозрения пробудятся во второй и третьей
главах, где он поймет связь этого челнока с определенными предложениями
подходящего языка ; но будет уже слишком поздно отступать, поскольку он
почувствует, что эти лингвистические рассмотрения основаны на важном математическом содержании. Он снисходительно заметит поспешность и неудовлетворительность изложения, где его самого иногда просят восполнить пробел.
Здесь избегают мельчайших подробностей, жертвуя совершенной строгостью
доказательств. Только в этих главах язык, формулы, предложения, одним
словом синтаксис рассматриваются как объект изучения, а в других { как
иллюстрация, как некоторое внешнее проявление локальных изоморфизмов.
Это выгодный для нас способ изучения, поскольку он избавляет от длинных
скурпулёзных рассуждений, граничащих с педантизмом, без математической
xiv
СОДЕРЖАНИЕ
сущности, что загромождают первые страницы учебников, сделавших из синтаксиса сводный замок их сооружения.
Логик, возможно, удивится этому пристрастию автора: почему с самого
начала так отдаляться от "интуиции" ? Я отвечу тем, что это не так уж
странно для современного математика. Он имеет обыкновение сначала определять достаточно вычурные объекты (посмотрите, что такое точка или кривая в учебнике по алгебраической геометрии), в которых он после размышления с удовольствием обнаруживает адекватные выражения "интуитивных" или
скорее неформальных понятий. Во-вторых, автор не проявил непримиримый
фраиссеизм, так как ему не претит говорить о формулах, вернуться к более
традиционному изложению начиная со второй главы. Наконец, само существование более классических учебников, пусть даже заслуживающих критики по
его мнению, дает ему возможность проявить оригинальность (оригинальность
необходима, если он хочет заинтересовать профессиональных логиков) , поскольку читатель решительно не переносящий локальные изоморфизмы, может изучить логику в другом месте, а не браться за этот курс.
В главе 4 вы узнаете, что некоторые пространства являются компактными и найдете некоторые следствия этой компактности. Что касается главы
5 , она подводит итог знаниям приобретенным до неё. Она вас убедит, что
"челночный" метод не является странным и искусственным введением в логику. Напротив, он важный и незаменимый инструмент теории моделей. И эти
очень короткие пять глав составляют сами по себе маленький трактат внутри
курса, поскольку они уже содержат все существенные понятия теории моделей.
Остальное является лишь более или менее утонченным их развитием.
В качестве иллюстрации совершенно новой для вас науки и, чтобы дать
немного плоти к скелету, который вам показали, глава 6 применяет принципы
классификации теории моделей к алгебраическим примерам. Иногда они { не
самые наглядные и не самые известные. Некоторые из них рассмотрены здесь
только для того, чтобы получить примеры и контрпримеры для следующих
глав.
Логика, изгнанная из первых глав, властвует в полной мере в главе 7, посвященной арифметике (так называется теория структуры, образованной натуральными числами со сложением и умножением) ; это единственная глава
книги, дающая сведения о законности доказательств и рассуждений в математике. На первый взгляд кажется, что она немного неуместна в работе по
чистой теории моделей. И все-таки эта глава включена в книгу потому, что
понятия приведенные в ней слишком классические и лежат в основе слишком многих ветвей логики, что нельзя их совершенно игнорировать. Впрочем,
мы увидим, что их можно изучать семантически, т.е. теоретико-модельным
способом : здесь арифметика представлена не списком аксиом, а изучением
структуры образованной натуральными числами.
Логика тут проявляется главным образом через определение понятия доказательства, полученного арифметизацией метода Генкина, уже введенного
в главе, посвященной компактности. Автор не захотел его представлять неформально без ссылки на арифметическую кодировку, так же как и понятия
рекурсивности, разрешимости, рекурсивной аксиоматизации теорий и т. д. : : : ,
Содержание
xv
вопреки распространенной, но докучливой практике ; равным образом он восстает против чрезмерного и искусственного смешения рекурсивности и теории
моделей. Вершиной главы является, очевидно, знаменитая теорема Геделя,
о которой все кое-что слышали, но мало-кто знает точную формулировку :
также вы узнаете какое место в ней занимают кодировки.
По поводу основ математики, большой недостаток этого курса это теория
множеств. Читатель, возможно надеявшийся на полное освещение этой области в этом курсе логики, будет удивлен : с первых строк книги ему говорят
о множествах, об отношениях и даже об ординалах с той же свободой и с
той же неточностью как в обычных математических трудах (я хочу сказать
: нелогических) . Порой думается, что было бы более приемлемым для ума
зафиксировать правила игры, рамки математической, пусть даже логической,
деятельности. Затем, как уже стало традицией в течение пятидесяти или больше лет, { переводить всю математику на язык множеств, начинать все трактаты
с изложения теории множеств.
Немного размышления показывает, что такая точка зрения иллюзорна и
строгость, которую вы хотите здесь увидеть, несколько обманчива. Как обосновывать науку, прежде чем ею заниматься, как оправдывать область знаний
прежде чем её исследовать ? И никто не знает в сущности, что такое множества и логики, внимательно изучавшие их больше всего, знают ещё меньше, чем
другие. Этот подход, в лучшем случае, приводит к разработке системы аксиом, чтобы дать список свойств, по поводу которых уверяется, что достигнут
общий консенсус среди математиков. Естественно это придаёт значение догмы
некоторым весьма относительным вещам ; это также выпячивание кодировки {
хитрости { во вред понятию, глубокой идее. Вообще говоря, логичен совершенно противоположный путь : изучаются обычные математические дисциплины
{ алгебра, анализ и затем спросить себя в какой множественной теории, аксиоматической или нет, они могут быть определены.
Следовательно, в первых главах я безбоязненно обращался к теоретикомножественным понятиям (главным образом индукции по бесконечным ординалам) , неизвестных определенному кругу читателей. Надеюсь, что это их побудит попытаться узнать про них больше. И только теперь, когда нам нужны
счетно бесконечные аргументы и арифметика ординалов, я ввожу эту главу 8,
изучающую очень неформально теорию, (скорее даже "практику") множеств.
Я верю, что именно тут её место, а не в прологе книги : я знаю по опыту,
что студенты убегают, если курс начинается с немотивированного изложения
"теории множеств".
Добавим, что теория множеств, собственно говоря, является очень специализированной ветвью логики, к рассмотрению которой мы в этом курсе не
приступаем ; в ней с большой виртуозностью манипулируют с системами аксиом и моделями, и она имеет очень мало общего с занятиями в средней школе
под тем же названием, связанными больше с каким-то умением, чем с какойто теорией. Так же как и маленькие дети, мы интересуемся в этой книге
множествами не для того, чтобы их изучить (или задаваться вопросом об их
существовании) , а для того, чтобы ими манипулировать, поскольку мы живем
среди них.
xvi
СОДЕРЖАНИЕ
После главы 8 , которая не содержит теорию моделей, читатель узнает в
главе 9, посвященной насыщенным моделям, как реализовать типы ; в главе
10 , посвященной простым моделям, он научится их опускать.
Как я уже сказал, эти первые десять глав составляют изложение "классической" , или "элементарной" теории моделей, т.е. без введения понятия
стабильности. Освоивший эту первую половину, читатель может приступить
к изучению любой области математической логики. Будет заметно, что от
страницы к странице я становлюсь все свободнее, максимально ограничивая
формализм в ущерб священной строгости. Это является частью обдуманного
плана, поскольку поистине математика наука, скорее хорошо использующая
язык, чем строгая, и скорее краткая, чем прозрачная, а математический дух
формируется только деформируясь. Цель этого курса будет достигнута тогда, когда читатель будет чувствовать себя непринужденно в теории моделей
вместе со стилем её языка, с её недомолвками и соглашениями так же, как в
любой другой привычной ему обстановке.
Таким образом, если вы решили изучить поглубже теорию моделей, то вы
подходите к 11-той главе о наследниках, которая дает так называемый "парижский" подход к теории стабильности. Будьте очень внимательны к главе 12, в
которой изучаются неразличимые последовательности и всё то, что их окружает. Далее вы найдете главу 13 , посвященную фундаментальному порядку,
несомненно более размеренной.
Что касается главы 14, то она там помещена несколько преждевременно,
чтобы вы почувствовали значение гипотез о стабильности, и увидели, что они
существенны в построение насыщенных моделей. Из-за этого придется иногда
откладывать на более поздний срок окончательных версии некоторых теорем.
Чтобы их получит вы должны освоить ещё три главы абстрактных исследований : первая посвящена ответвляемости над произвольным множеством параметров, вторая { сильным типам, и третья { различным видам рангов, которые
затрагиваются в этих контекстах.
Вся совокупность этих знаний применяется в главе 18 для построения простых моделей и в главах 19, 20 для "теории размерности" , т.е. по существу,
для классификации всех моделей тотально трансцендентной размерностной теории. В этих двух последних главах, читатель оценит мощь и адекватность
развиваемой теории. Честно говоря, о ней можно говорить намного больше,
чем в последних двух главах. Если я этого не сделал, то только потому, что
хотел сохранить относительно элементарный характер этого курса, и нужно же
когда-нибудь остановиться. К тому же я не могу сказать ничего оригинального
по этому поводу, а читатель, прочитавший мою книгу до конца может свободно
погружаться в литературу по этому направлению.
Я не снабдил систематически каждую главу серией упражнений по теме.
Вы найдете только несколько легких лемм в начале курса, оставленные читателю из-за громоздкости их доказательств. Библиографические ссылки и исторические примечания помещены в отдельный параграф каждой главы. Это
потому, что мне хотелось предложить читателю текст без нарушения целостности, а также из-за условий, в которых был написан этот курс, без необходимых
материалов под рукой.
Содержание
xvii
На самом деле, я написал существенную часть этого курса во время одного
скитания через Индию, так что в моем сознании метод Генкина неразрывно
связан со стадами диких слонов, к которым я приблизился, ползая в болотных лугах Кералы ; элиминация воображаемых элементов { со скольжением
грифов над огромными гималайскими соснами ; теорема о границе { с обнаженными телами женщин-мориа, которых путешественник заметил неожиданно на
тропинке джунглей прежде, чем они успели спрятаться под укрытием. Я смею
лишь надеяться, что эта книга наведет на моего читателя такие же приятные
образы. Я только пожелаю, чтобы она стала для него тем же, чем она была
для меня { приятной спутницей.
Глава 1
Элементарные классы
отношений
{ Eh bien, mon prince, G^enes et Lucques ne
sont plus que des apanages, des поместья, de
la famille Buonaparte. Non, je vous previens,
que si vous ne me dites pas que nous avons la
guerre, si vous vous permetez encore de pallier toutes les infamies, toutes les atrocites de
cet Antichrist (ma parole, j'y crois), je ne vous
connais plus, vous n'^etes plus мой верный раб,
comme vous dites. : : :
Л.Н. Т.
1.a Локальные изоморфизмы
между отношениями : : : : : : : : : : : : : : : : : : : : 2
1.b Примеры : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5
1.c Бесконечный "челночный" метод : : : : 11
1.d Исторические и библиографические примечания : : : : : : : : : : : : : 14
1
2
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
1.a Локальные изоморфизмы
между отношениями
Если E { множество и m { целое положительное число, то m-арным
отношением на E называется подмножество R декартовой степени E m . Множество E назовем носителем этого отношения. Если m-ка a = (a1; : : :; am) из
E m принадлежит R , то говорят, что она удовлетворяет отношению R ; в противном случае a не удовлетворяет R . Число m называется арностью этого
отношения.
Изоморфизмом двух m-арных (для о??ного и того же m) отношений R на R0
соответственно на E и E 0 называется любая биекция s между E и E 0, такая,
что для любой m-ки a = (a1; : : :; am) из E кортеж sa = (sa1; : : :; sam) удовлетворяет R0 тогда и только тогда, когда a удовлетворяет R . Если существует
некоторый изоморфизм между R и R0 , то говорят, что эти отношения изоморфны. Очевидно, что обратное отображение к изоморфизму, точно так же, как и
композиция двух изоморфизмов, само является изоморфизмом.
Ограничение m-арного отношения R на подмножество E 0 его носителя E
есть, по определению, m-арное отношение R0 на E 0 , образованное m-ками из
E 0 удовлетворяющими R . Как синоним говорят также, что R0 { ограничение
R или, что R { расширение R0 . Вложением R0 в R называется изоморфизм R0
на некоторое ограничение R .
По определению мощность отношения есть число элементов его основного
множества (а не число удовлетворяющих ему кортежей, как можно подумать) .
Следовательно, будем говорить, что отношение конечно, если таковым является его носитель. Информацию о кардиналах и ординалах читатель, найдет в
начале главы 8 . Мы вводим эти понятия тогда, когда нам будут нужны более
точные вычисления с бесконечными мощностями.
Локальный изоморфизм из R в R0 есть по определению изоморфизм между конечными ограничениями R и R0 . Для локального изоморфизма s через
Dom(s) обозначим его область определения, а через Im(s) { его образ. Если
R и R0 имеют одну и ту же арность, то множество S0(R; R0 ) локальных изоморфизмов из R в R0 всегда содержит пустой локальный изоморфизм ? (поскольку для любого m > 0 , существует единственное m-арное отношение с
пустым носителем само являющееся пустым множеством) . Возможно, оно состоит только из последнего, например, если R { рефлексивное бинарное (т.е.
двухместное) отношение, а R0 { антирефлексивное бинарное отношение.
Теперь определим индукцией по натуральным числам p множества Sp(R; R0 )
(локальных) p-изоморфизмов из R в R0 : поскольку семейство S0(R; R0 ) определено выше, то достаточно объяснить как построить Sp+1(R; R0) при предположении, что S0(R; R0 ); : : :; Sp(R; R0) уже построены. Локальный изоморфизм
s принадлежит Sp+1(R; R0 ) тогда и только тогда, когда он удовлетворяет двум
следующим условиям :
{ (челнок вперед) для любого a из носителя E отношения R существует
продолжение t отображения s (т.е. Dom(s) Dom(t) и s есть ограничение
t на Dom(s) ) , определенное на a , лежащее в Sp(R; R0) ;
1.a
3
Локальные изоморфизмы
{ (челнок назад) для любого b из носителя E 0 отношения R0 , существует
продолжение t отображения s , образ которого содержит b , лежащее в
Sp(R; R0 ) .
Так как множества Sp определены индукцией по p , то изучение их свойств
может быть сделано лишь рекурсией по этому натуральному числу. Мы собираемся доказать некоторые из них.
Факт Если p < q , то каждый q-изоморфизм является и p-изоморфизмом
(т.е. Sp (R; R0 ) Sq (R; R0 ) ) .
Доказательство. Достаточно доказать, что для любого p Sp(R; R0) Sp+1(R; R0 ) ; это верно для p = 0 , поскольку каждый 1-изоморфизм является
по определению локальным изоморфизмом. Итак, предположим, что p = q + 1
и утверждение истинно для q : если s (p + 1)-изоморфизм, то для любого a из E он имеет продолжение на a являющееся p-изоморфизмом, которое
следовательно, является (p ? 1)-изоморфизмом по предположению индукции ;
точно так же, условие челнока вперед выполняется для всех b из E 0 . Значит,
s является p-изоморфизмом.
Факт Любое ограничение p-изоморфизма само является p-изоморфизмом.
Доказательство. Пусть s { p-изоморфизм и s0 { ограничение s . Если
p = 0 , то s0 { локальный изоморфизм и поэтому будет 0-изоморфизмом. Если
p = q + 1 , то для любого a из E существует изоморфизм t , определенный на
a продолжающий s и являющийся q-изоморфизмом. Этот t продолжает также
отображение s0 . Так как мы имеем аналогичное условие челнока назад, то это
означает, что s0 является p-изоморфизмом.
Оставляем читателю проверку того, что обращение p-изоморфизма из R в
есть p-изоморфизм из R0 в R и, если t будет p-изоморфизмом из R0 в R00 , с
Dom(t) = Im(s) , то композиция s и t есть p-изоморфизм из R в R00 .
Факт Если s { изоморфизм R на R0 , то любое конечное ограничение s является p-изоморфизмом из R в R0 для любого p .
Доказательство. Пусть t { конечное ограничение s . Для p = 0 оно является локальным изоморфизмом. Если p = q +1 , то для любого a из E ограничение s на Dom(t) [fag является по предположению индукции q-изоморфизмом;
те же рассуждения проходят и для обратного челнока и, значит, t будет pизоморфизмом.
R0
Локальные изоморфизмы, которые продолжаются до изоморфизма, являются в некотором роде тривиальными p-изоморфизмами; мы увидим среди них
совершенно другие, позволяющие сравнивать неизоморфные отношения!
Множества Sp(R; R0 ) образуют тем самым убывающую цепь :
S0(R; R0 ) S1(R; R0 ) Sp(R; R0) Sp+1(R; R0) : : : . Я предоставляю
снова читателю проверку того, что если Sp(R; R0) = Sp+1(R; R0 ) , то для всех
q > p , Sp(R; R0 ) = Sq (R; R0) , это имеет место, в частности, если множество
4
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
Sp(R; R0 ) { пустое!
Локальный изоморфизм s из R в R0 называется !-изоморфизмом или ещё
элементарным локальным изоморфизмом, если он является p-изоморфизм для
любого натурального p , и через S! (R; R0 ) обозначим множество всех таких изоморфизмов: здесь ! обозначает наименьший счетный ординал, который идет
непосредственно за всеми натуральными числами; читатель, не имеющий сейчас никакого представления об ординалах, может рассматривать его пока только как простое удобное обозначение.
Если S! (R; R0) пусто, значит, Sp(R; R0 ) пусто для некоторого p; действительно, если для каждого p существует p-изоморфизм, то S! (R; R0 ) содержит
по крайней мере пустое отображение. Два случая возможны для локального
изоморфизма s : s 2 Sp(R; R0); s 62 Sp+1(R; R0) для некоторого p, и в этом случае говорят, что его ранг Фраиссе равен p; иначе s принадлежит всем Sp(R; R0 ),
тогда говорят, что его ранг Фраиссе больше или равен !.
Мы ввели до настоящего момента три равнозначных выражения: " s 2
Sp(R; R0 ) " , "s { p-изоморфизм" и "ранг Фраиссе s больше или равен p ". И мы
собираемся обогатить наш словарь: будем говорить, что кортежи элементов
a = (a1; : : :; ak ) из носителя R и b = (b1; : : :; bk ) из носителя R0 p-эквивалентны,
если они соответствуют друг другу при некотором p-изоморфизме. В других
терминах можно сказать, что они удовлетворяют одним и тем же равенствам:
ai = aj () bi = bj ; и отображение s , определенное как sa1 = b1; : : : ; sak = bk
является p-изоморфизмом из R в R0 . Разумеется, речь идёт об отношении
эквивалентности, т.е. рефлексивном, симметричном и транзитивном бинарном
отношении. Мы обозначим этот факт через (a; R) p (b; R0) , где указание
отношения, для которого берётся кортеж a , является особенно необходимым,
если, например, R0 { расширение R , так как в этом случае a может быть
рассмотрен как кортеж из носителя R0 . Когда контекст достаточно ясен,
можно ограничиться записью a p b . Если a и b p-эквивалентны для всех p
то говорят, что они !-эквивалентны или, что они имеют одинаковый тип.
Если пустое отображение является p-изоморфизмом из R в R0 для всех p
(что равносильно тому, что S! (R; R0) не пусто), то говорят, что R и R0 элементарно эквивалентны, и обозначают R ! R0. В более общих терминах, говорят,
что R и R0 p-эквивалентны и пишут R p R0, если ? является p-изоморфизмом
из R в R0.
Теперь предположим, что R0 { расширение R и носитель E отношения R
{ подмножество носителя E 0 отношения R0 . Скажем, что это расширение
элементарно, если для любого a из E (a; R) и (a; R0) имеют одинаковый
тип: другими словами тождественное отображение, ограниченное на любую
конечную часть Е, является p-изоморфизмом из R в R0 для любого p. Тот
факт, что R0 { элементарное расширение R обозначается через R R0 . В
этом случае также говорят, что R элементарное сужение R0 Изоморфизм R
на элементарное сужение R0 называется элементарным вложением R в R0 .
Естественно, если R элементарно вкладывается в R0 , то R и R0 элементарно
эквивалентны.
Теперь можно сделать паузу, поскольку мы определили на нескольких
страницах два основных понятия теории моделей, главной деятельностью кото-
1.b
5
Примеры
рой является изучение класса отношений, элементарно эквивалентных данному отношению R , а также элементарных вложений одного отношения в другое
из этого класса.
Упражнение 1.1 Докажите, что если R и R0 элементарно эквивалентны,
то для любого кортежа a элементов из носителя отношения R и для любого
p , существует кортеж b элементов из носителя отношения R0 , такой, что
(a; R) p (b; R0) .
Упражнение 1.2 Если a = (a1; : : : ; ak ) ; b = (b1; : : :; bl) , тогда их сочле-
нением называется кортеж a_b =def (a1; : : : ; ak ; b1 ; : : :; bl ) . Докажите, что
если R0 { элементарное расширение R и a из базы отношения R , а b из базы
отношения R0 , то для любого p найдется c из базы отношения R, такой, что
(a_ c; R) p (a_b; R0) .
1.b Примеры
Тривиальным случаем элементарной эквивалентности является изоморфность. Как показывает следующая теорема это единственно возможный
случай для конечных отношений.
Теорема 1.3 Если R { конечное отношение, определенное на p элементах, то
любое (p + 1)-эквивалентное ему отношение S ему же изоморфно.
Доказательство. Пусть a1; : : :; ap является полным списком всех элементов носителя отношения R . Так как ? является (p + 1)-изоморфизмом
между R и S , то существует его продолжение S1 на fa1g , являющееся pизоморфизмом. Последнее имеет продолжение s2 на fa1; a2g , являющееся
(p ? 1)-изоморфизмом. Продолжая дальше, получим 1-изоморфизм s из R
в S , определённый на всех точках носителя отношения R . Значит s вложение
R в S . Если бы существовал элемент b в носителе отношения S , лежащий вне
образа s , то мы не смогли бы продолжить s?1 до локального изоморфизма t
определенного на b , так как t(b) должно отличаться от a1; : : : ; ap . Как следствие, s { сюръективное отображение и, значит, оно является изоморфизмом
между R и S .
В частности, конечное отношение не имеет элементарных расширений кроме самого себя.
Теперь рассмотрим натуральное число m и два m-арных пустых отношения
R и R0 , соответственно на носителях E и E 0 . Значит, R и R0 не удовлетворяются никакой m-кой с их носителей; R и R0 изоморфны тогда и только тогда,
когда E и E 0 имеют одинаковое "число элементов" ( это число может быть
конечным или бесконечным; более точно говорят, что они имеют один и тот же
кардинал). По теореме 1.3, если они элементарно эквивалентны и одно из них
конечно, то они изоморфны; докажем, что, напротив, если оба бесконечны, то
они элементарно эквивалентны (в этом случае, они не обязательно изоморфны,
6
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
например, если E { множество натуральных чисел, а E 0 { множество действительных чисел). На самом деле, в данном случае любой локальный изоморфизм из R в R0 является p-изоморфизмом для любого p ( это влечёт, что ?
является !-изоморфизмом из R в R0 ! ) . Для этих отношений, локальный
изоморфизм есть нечто иное, как инъекция конечной части E в E 0 ; покажем
переход от p к p + 1 . Если я добавлю к Dom(s) элемент a , то поскольку E 0
бесконечно, можно найти вне Im(s) элемент b и продолжать s до t , полагая
t(a) = b ; доводы для "челнока назад" аналогичны.
Тот же результат остаётся в силе, если R и R0 совпадают со всеми m-ками
своих носителей. Как и в предыдущем случае, ситуация сводится к определению на множествах E и E 0 структуры, связанной только с равенством.
Теперь изучим, чуть менее тривиальный случай унарных отношений ( т.е.
одноместных). Такому отношению R на носителе E , припишем символ (x; y),
называемый его характером, где x полагается равным числу элементов E удовлетворяющих R , если это число конечно и символу 1 в противном случае, а y равно числу элементов E не удовлетворяющих R , если это число
конечно и символу 1 в противном случае. Например, если !1 обозначает
наименьший несчётный кардинал, то существуют, с точностью до изоморфизма, три унарных отношения с характером (1; 1) , соответствующие делениям
(!; !1) ; (!1; !) ; (!1; !1) .
Теорема 1.4 Два унарных отношения R и S элементарно эквивалентны то-
гда и только тогда, когда они имеют одинаковый характер, и в этом случае
каждый локальный изоморфизм из R в S является p-изоморфизмом для любого p .
Доказательство. То, что s { локальный изоморфизм из R в S , значит,
что если a 2 R , то sa 2 S и если b 62 R , то sb 62 S . Предположим, что характер
R равен (p; y) и , что S (p + 1)-эквивалентно R и обозначим через a1; : : :; ap
элементы носителя отношения R , удовлетворяющие R . Так как ? (p + 1)изоморфизм, то после p шагов получим 1-изоморфизм s , определенный на
a1; : : :; ap . Элементы sa1; : : :; sap удовлетворяют S и невозможно найти другой
элемент b носителя отношения S , удовлетворяющий S , поскольку иначе не
сможем продолжить s?1 на b . Следовательно, характер S имеет вид (p; z). Тем
же способом показывается, что если R и S (q + 1)-эквивалентны и характер
R имеет вид (x; q) , то такой же вид имеет характер S .
Это доказывает, что если R и S элементарно эквивалентны, то они имеют
одинаковый характер. Обратно, пусть они имеют одинаковый характер и s
является локальным изоморфизмом из R в S . Теперь если, например, добавить
элемент a, удовлетворяющий R к Dom(s), то всегда можно найти и добавить
к Im(s) элемент b, удовлетворяющий S , откуда и следует утверждение.
Начиная с арности 2 , задача определения классов элементарной эквивалентности достигает своей общей сложности. Здесь можно обсудить только
несколько простых случаев бинарных отношений. Бинарное отношение R называется рефлексивным, если ему удовлетворяют все пары (a; a) для любого a
из носителя. Если S 1-эквивалентно рефлексивному отношению, то оно само
1.b
7
Примеры
рефлексивно, действительно если S не содержит пару (b; b) , то невозможно
определить локальный изоморфизм из S в R , определенный на b . Отношение
R называется симметричным, если вместе с каждой парой (a; b) , содержащейся в нем, оно содержит и пару (b; a) ; оно называется антисимметричным если
оно не содержит одновременно (a; b) и (b; a) , когда a отличен от b . Оставляем
читателю проверку того, что отношение, 2-эквивалентное симметричному (соответственно антисимметричному) отношению, само является таковым. Оно
называется транзитивным, если как только (a; b) и (b; c) удовлетворяют R ,
ему удовлетворяет также (a; c) . Отношение 3-эквивалентное транзитивному
отношению само является транзитивным. Наконец, R называется тотальным, если для всех a и b из его носителя, по крайней мере одна из пар (a; b)
и (b; a) принадлежит R . Отношение, 2-эквивалентное тотальному отношению,
тотально.
Каждый знает с первого курса университета, что отношение эквивалентности это рефлексивное, симметричное, транзитивное бинарное отношение и
что отношению эквивалентности на носителе E соответствует разбиение множества E на попарно дизъюнктные классы. Мы увидели, что бинарное отношение, 3-эквивалентное отношению эквивалентности, само является отношением
эквивалентности. Достаточно легко характеризовать отношения эквивалентности, с помощью одной "характеристической функции", связанной с ними. Но
это { предмет упражнения 1.6 . Я же довольствуюсь подробным рассмотрением
частного случая :
Теорема 1.5 Если R; R0 два отношения эквивалентности с бесконечным числом бесконечных классов, то они элементарно эквивалентны; и любой локальный изоморфизм между R и R0 является p-изоморфизмом для любого p .
Обратно, если R; R0 два элементарно эквивалентных отношения эквивалентности и R состоит из бесконечного числа бесконечных классов, то таковым
является и R0 .
Доказательство. Пусть s { локальный изоморфизм из R в R0 , если добавить a к области его определения, то независимо от того, конгруэнтен a
некоторому элементу из Dom(s) по модулю R или он лежит в новом классе,
всегда можно продолжить s до локального изоморфизма, определенного на a,
поскольку R0 состоит из бесконечного числа бесконечных классов, откуда и
следует утверждение.
Обратно, легко видеть, что если R имеет по крайней мере p классов и R0
ему p-эквивалентно, то оно также имеет по крайней мере p классов. Если
каждый класс отношения R имеет по крайней мере p элементов и R0 ему pэквивалентно, то оно обладает тем же свойством.
Упражнение 1.6 С каждым отношением эквивалентности R связана функция fR , которая числу p приписывает число p-элементных классов, если оно
конечно, иначе символ 1 . Она приписывает символу 1 число бесконечных
классов, если это число конечно, иначе символ 1 .
1. Докажите, что если fR(q ) = p и R0 (p + q + 1)-эквивалентно R , то
fR0 (q) = p .
8
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
2. Докажите, что если R имеет по крайней мере p классов, каждый из
которых имеет по крайней мере p элементов, и R0 p + q-эквивалентно
R , то оно имеет такое же свойство.
3. Пусть Rp отношение эквивалентности, полученное из R заменой каждого класса мощности, не меньшей p , на p-элементный класс ; докажите, что R и Rp p-эквивалентны.
4. Докажите, что R и R0 элементарно эквивалентны тогда и только тогда, когда fR и fR0 равны за исключением, возможно бесконечности, в
том случае когда они принимают бесконечное число раз ненулевые значения.
5. Предположим, что R и R0 элементарно эквивалентны и R0 расширение
R . Докажите, что это расширение элементарно тогда и только тогда,
когда каждый конечный класс R0 , содержащий элемент из носителя R
является классом R .
Если участь отношений эквивалентности легко решается, то проблема классификации цепей (рефлексивные, антисимметричные, транзитивные и тотальные бинарные отношения; их называют также линейными порядками ) с точностью до элементарной эквивалентности, является намного более сложной, и
здесь можно дать только некоторые простые, но тем не менее поучительные,
частные случаи. Локальный изоморфизм между цепями есть просто напросто
возрастающая функция : если a < b , то обязательно sa < sb .
Цепь, имеющая по крайней мере два элемента, называется плотной , если
между любыми её двумя точками всегда найдется третья; говорят также, что
она не имеет концевых элементов, если она не имеет ни наименьшего ни наибольшего элементов.
Теорема 1.7 Бинарное отношение, 3-эквивалентное плотной цепи без кон-
цевых элементов, само является плотной цепью без концевых элементов;
обратно две плотные цепи без концевых точек C и C 0 элементарно эквивалентны, так как любой локальный изоморфизм из C в C 0 является элементарным.
Доказательство. Пусть C { плотная цепь без концевых элементов. Мы
знаем, что бинарное отношение C 0 , 3-эквивалентное C , является цепью. Если
цепь C 0 была бы не плотной, то существовали бы последовательные a и b из C 0 .
Пусть s { 1-изоморфизм из C 0 в C , определенный на a и b , пусть c из C таков,
что s(a) < c < s(b) . Тогда невозможно продолжить s?1 на c , что противоречит
гипотезе. Если цепь C 0 имела бы наименьший элемент a , то 1-изоморфизм s
из C в C 0 , содержащий в своем образе a , не смог бы продолжаться на точке
b < s?1(a) , что является противоречием. Аналогично показывается, что C 0 не
имеет наибольшего элемента.
Обратно, предположим, что C и C 0 { плотные цепи, без концевых элементов. Локальный изоморфизм s из C в C 0 отображает a1 < < ak на
b1 < < bk . Если добавим, например, a к первой цепочке, то можно выбрать
1.b
Примеры
9
b в соответствующем сегменте второй цепи, который всегда непуст, так как
C 0 { плотный порядок без концевых элементов. Значит, любой 0-изоморфизм
является 1-изоморфизмом. Это влечет, что каждый 0-изоморфизм является
p-изоморфизмом для любого натурального p .
Следовательно, в частности, цепь R действительных чисел элементарно
эквивалентна цепи Q рациональных чисел.
Противоположностью к плотным цепям являются дискретные цепи, которые не содержат точек сгущения; каждый элемент, кроме наибольшего, имеет последователя ( b называется последователем a и a называется предшественником b , если a < b и между ними ничего нет) , и каждый элемент, за
исключением наименьшего, имеет предшественника. Легко видеть, что бинарное отношение, 3-эквивалентное дискретной цепи без концевых элементов само
является таковым. Будет доказано и обратное, что две дискретные цепи без
концевых элементов (например, цепь Zцелых чисел и цепь Z+ Z, полученная
из двух копий Z, идущих одна за другой) элементарно эквивалентны.
Пусть a и b взяты из такой цепи и a < b . Полагаем d(a; b) = q , если строго
между a и b находятся q элементов и d(a; b) = 1 если таковых бесконечное
число. Тогда d(a; b) = 0 означает, что a и b последовательные элементы. Обещанный результат является следствием следующей теоремы, которая среди
прочих утверждает, что ? является p-изоморфизмом для любого p .
Теорема 1.8 Пусть C и C 0 { две бесконечные дискретные цепи без концевых
элементов и a1 < < ak { возрастающая последовательность из первой,
а b1 < < bk { возрастающая последовательность из второй цепи. Для
их p-эквивалентности необходимо и достаточно, чтобы d(ai ; ai+1) и d(bi ; bi+1 )
были равными или оба были 2p ? 1 для любого i; 1 i k ? 1.
Доказательство. Проведем доказательство индукцией по p . Это очевидно для p = 0 , поскольку по условию теоремы обе последовательности одинаково упорядочены. Докажем переход от p к p + 1 , и сначала, что если
две последовательности удовлетворяют поставленному условию, то они p + 1эквивалентны.
Добавим, например, a к первой последовательности. Предположим сначала, что a < a1 . Если d(a; a1) = q , то можно ответить таким элементом b < b1,
что d(b; b1) = q . Если d(a; a1) = 1 ответим таким элементом b < b1 , что
d(b; b1) = 2p ? 1 . Аналогично рассматривается случай a > ak . Предположим
теперь, что ai < a < ai+1 , и рассмотрим два случая :
(i) d(ai; ai+1) < 2p+1 ? 1 , в этом случае d(ai; ai+1) = d(bi; bi+1) и отвечаем
таким b ; bi < b < bi+1 , что d(ai; a) = d(bi; b) .
(ii) d(ai; ai+1) 2p+1 ? 1 = (2p ? 1) + 1 + (2p ? 1) ; если d(ai; a) = q < 2p ? 1 ,
ответим таким b , что d(bi ; b) = q и так как d(bi ; bi+1) 2p+1 ? 1 , то
d(b; bi+1) 2p ? 1 . Аналогично, если d(a; ai+1) = q < 2p ? 1 , ответим
таким b , что d(b; bi+1) = q ; и если d(ai; a) 2p ? 1 и d(a; ai+1) 2p ? 1 ,
то можно ответить таким b , что d(bi; b) 2p ? 1 и d(b; bi+1) 2p ? 1 .
Докажем теперь, что условие теоремы является необходимым для того, чтобы
две последовательности были (p + 1)-эквивалентны. Рассмотрим три случая
10
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
(i) d(ai; ai+1) 2p+1 ? 1 = (2p ? 1) + 1 + (2p ? 1) ; выберем a таким, что
ai < a < ai=1 ; d(ai; a) 2p ? 1 ; d(a; ai+1) 2p ? 1 ; должен существовать
b между bi и bi+1, такой, что (ai; a; ai+1) и (bi; b; bi+1) были p-эквивалентны,
значит, по предположению индукции d(bi; b) 2p ? 1 ; d(b; bi+1) 2p ? 1 и
d(bi; bi+1) 2p+1 ? 1
(ii) d(ai; ai+1 2p+1 ? 3 = (2p ? 2) + 1 + (2p ? 2) ; если ai и ai+1 являются последовательными элементами, то таковыми должны быть и bi; bi+1 ,
иначе можно найти a между ai и ai+1, такой, что d(ai; a) и d(a; ai+1) оба
строго меньше 2p ? 1 . Тогда по предположению индукции, существует b в другой цепи такой, что d(ai; a) = d(bi; b) ; d(a; ai+1) = d(b; bi+1) и
d(ai; ai+1) = d(bi; bi+1) .
(iii) d(ai; ai+1) = 2p+1 ? 2 = (2p ? 2) + 1 + (2p ? 1) ; итак, существует b между
bi и bi+1, такой, что d(bi; b) = 2p ? 2 ; d(b; bi+1) 2p ? 1 и d(bi ; bi+1) 2p+1 ? 2 . Но на самом деле d(bi; bi+1) = 2p+1 ? 2 , поскольку иначе по
первому случаю, примененному в другом направлении (от bi до ai ) , если
d(bi; bi+1) 2p+1 ? 1 , то это же верно и для d(ai; ai+1) .
Таким образом, мы видим, что расширение дискретной цепи без концевых
элементов является элементарным, если значение d сохраняется для любых
двух элементов из меньшей цепи; например, цепь Z целых чисел и цепь Z
целых чисел без нуля элементарно эквивалентны, поскольку они изоморфны;
однако Z не является элементарным сужением Z , так как ?1 и 1 { последовательные элементы в Z , но не в Z .
Напротив, расширения плотных цепей без концевых элементов, или отношений эквивалентности с бесконечным числом бесконечных классов, или унарных отношений с одинаковым характером, всегда элементарны, поскольку в
этих случаях локальные изоморфизмы являются элементарными.
Упражнение 1.9 Докажите, что две плотные цепи с наименьшим элемен-
том, но без наибольшего элемента (соответственно : с наибольшим элементом, но без наименьшего; с наименьшим и наибольшим элементами) элементарно эквивалентны.
Упражнение 1.10 Докажите, что две дискретные цепи с наименьшим эле-
ментом (он обозначается символом 0 ) , но без наибольшего элемента (например, цепь ! натуральных чисел) элементарно эквивалентны. Классифицируйте дискретные цепи с точностью до элементарной эквивалентности.
Упражнение 1.11 1) Если C { цепь, то через C ? обозначим обратную цепь,
где a < b в смысле C тогда и только тогда, когда b < a в смысле C ? . Докажите, что если C и C 0 элементарно эквивалентны, то таковыми являются
и C ? ; C 0? .
2) Если C и D { цепи с дизъюнктными носителями (если это не так, то
можно заменить C и D их изоморфными копиями с дизъюнктными носителями) , цепь C + D является общим расширением C и D , где считается, что
1.c
Бесконечный "челночный" метод
11
каждый элемент C меньше каждого элемента из D . Докажите, что если
цепи C и C 0 элементарно эквивалентны так же, как и D и D0 , то таковыми
являются C + D и C 0 + D0 .
Упражнение 1.12 Для данных двух цепей C и D , лексикографическим про-
изведением C на D называется цепь, определенная на декартовом произведении их носителей и такая, что (a; b) < (c; d) в смысле C D , если b < d
в смысле D , или b = d и a < c в смысле C . Если оба множества C и
D являются множеством букв русского алфавита, то это обычный порядок
расположения слов из двух букв в в любом словаре русского языка.
1) Докажите, что дискретные цепи без концевых точек и только они
представимы в виде Z C . Аналогично, только те, которые имеют наименьший элемент, но не имеют наибольшего элемента представимы в виде
! + Z C .
2) Докажите что, если C и C 0 , точно так же как и D и D0 , элементарно эквивалентны, то таковыми являются C D и C 0 D0 .
1.c Бесконечный "челночный" метод
У нас нет никакой причины останавливаться на ! . Используя "челнок" ещё один раз, определяем понятие (! + 1)-изоморфизма, потом (! + 2)изоморфизма и т.д., пока не дойдем до ! + ! и далее рекуррентно определяем
понятие -изоморфизма для всех ординалов . Пока нам не нужно знать много
об ординалах, за исключением того, что они являются объектами, призванными для обозначения моментов ожидания. Они позволяют делать рассуждения
по индукции, а также построения по индукции, которые содержат не только
конечное число этапов. После всех натуральных чисел идет ординал ! , потом
! + 1; : : :; ! + n; : : : . После всех ! + n идет ! + ! = ! 2; : : : ; ! n; : : : и после
всех ! n идет ! ! и т.д. Пока довольствуемся замечанием, что имеется
два вида ординалов { последователи, которые имеют вид + 1 , и другие, как
0; !; ! n; ! !; : : : , которые называются предельными. Определим индукцией
по семейство S(R; R0) -изоморфизмов из R в R0 следующим образом:
{ если предельный, то s принадлежит S(R; R0) тогда и только тогда,
когда он принадлежит S (R; R0) для всех , строго меньших чем .
{ если = + 1 , то s принадлежит S(R; R0) тогда и только тогда, когда
для для любого расширения области определения или области значения
одним элементом s продолжается на это расширение до -изоморфизма
из R в R0 .
Нетрудно проверить, что -изоморфизм является -изоморфизмом для любого , меньшего, чем , значит, для локального изоморфизма возможны только два случая :
{ существует , такой, что s 2 S(R; R0 ); s 62 S+1(R; R0 ) , в этом случае
говорят, что s имеет ранг Фраиссе .
12
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
{ s 2 S(R; R0 ) для всех ординалов , тогда говорят, что ранг Фраиссе для
s не определен, или ещё, что он равен 1 , и через S1(R; R0 ) обозначается
пересечение всех S(R; R0 ) .
Так же, как в конечном случае определяются понятия -эквивалентности и 1эквивалентности. Так как всегда ординалов больше, чем элементов S0(R; R0) ,
то существует на самом деле 0 , зависящий от R и R0 , такой что S1(R; R0) =
S0 (R; R0) (это множество, конечно, может быть пустым) , который равен первому ординалу , для которого S+1(R; R0) = S(R; R0 ) . Точно так же 1изоморфизм обладает следующим свойством : для любого расширения области
определения или области значения одним элементом он продолжается на это
расширение до 1-изоморфизма.
Не надо путать 1-изоморфизм, например, с !-изоморфизмом. Вы можете
предпочесть формулировку Эренфойхта челнока Фраиссе, где элементарная
эквивалентность характеризуется следующим образом : рассматриваются два
игрока, первый из которых каждый раз выбирает элемент из R и R0 , второй отвечает выбором элемента в другом отношении. По определению второй
игрок выигрывает игру из n ходов, если в конце игры получили два (локально)
изоморфных кортежа длины n . Два отношения элементарно эквивалентны,
если для любого p второй игрок имеет стратегию выигрыша в игре из p шагов,
т.е. стратегию, меняющуюся вместе с p , действенную при условии, что он заранее уведомлен о том, что игра продлится только p ходов. Напротив, в случае
1-эквивалентности, второй игрок имеет выигрывающую стратегию, одну и ту
же, приносящую ему выигрыш независимо от числа игровых ходов.
Возвращаясь к примерам параграфа 1.b , мы видим, что любой локальный изоморфизм между двумя элементарно эквивалентными унарными отношениями, или также между двумя отношениями эквивалентности с бесконечным числом бесконечных классов, или ещё между двумя плотными линейными порядками без концевых точек, является 1-изоморфизмом. Противоположный случай : дискретные непустые порядки без концевых точек могут не
быть 1-эквивалентными, например, Z и Z+ Z (! + 1)-эквивалентны, но не
(! + 2)-эквивалентны, так как пара (a; b) из второго порядка с d(a; b) = 1 , не
имеет !-эквивалентную пару из первого.
Главной целью теории моделей является изучение !-изоморфизмов или
элементарных изоморфизмов; однако очень полезно выделить среди них 1изоморфизмы, и мы собираемся их определять заново без помощи ординалов,
для того чтобы не пугать читателя плохо знакомого с ними. Эта иерархия
локальных изоморфизмов похожа на иерархию Кантора{Бендиксона, которая
исторически побудила введение ординалов, и о которой собираюсь сказать несколько слов, как я надеюсь, помогающих прояснить ситуацию.
Пусть E { топологическое пространство и E1 получено удалением из E всех
изолированных точек . Пространство E1 { замкнутое, возможно пустое, оно
называется производным от E . Пусть E2 { производное от E1 и т.д. Возможно,
En+1 = En для некоторого n , в этом случае процесс прерывается, поскольку
дошли до множества без изолированных точек. Но в противном случае можно
продолжать, полагая E! = \En , потом E!+1 есть производное от E! и т.д.
Таким образом, определяем убывающую цепь подмножеств E пространства
1.c
13
Бесконечный "челночный" метод
E индукцией по ординалу . Если { предельный, то E { пересечение E
для < (в частности, поскольку нет таких , что < 0; E0 = E ) , если
= + 1 , то E { производное от E , т.е. E за вычетом его изолированных
точек. По определению E1 есть пересечение всех E . На самом деле E1
совпадает с E для некоторого достаточно большого , зависящего от E , и это
{ самое большое подмножество E без изолированных точек (естественно, E1
может быть пустым) . Но существует другой более простой, или по крайней
мере, более элементарный способ построения : это брать объединение всех
подмножеств E , не содержащих изолированных точек!
Вернемся к нашим локальным изоморфизмам. Для данных двух n-арных
отношений R и R0 , назовем семейством Карпа семейство K всех локальных
изоморфизмов из R в R0 , имеющих следующее свойство : для любого элемента
s из K , для любого расширения области определения или области значений
одним элементом, s имеет продолжение из K на это расширение. Очевидно, что объединение семейств Карпа само является семейством Карпа и, что
объединение всех семейств Карпа образует множество, возможно пустое, всех
1-изоморфизмов из R в R0 . Наконец, сказать, что R и R0 1-эквивалентны
значит, что ? есть 1-изоморфизм из R в R0 , или ещё, что существует непустое
семейство Карпа локальных изоморфизмов из R в R0 .
Упражнение 1.13 Докажите, что два отношения эквивалентности 1-эк-
вивалентны тогда и только тогда, когда они имеют одну и ту же характеристическую функцию.
Теорема 1.14 Два счетных 1-эквивалентных отношения изоморфны.
Доказательство. Пусть a1; : : : ; an; : : : и b1; : : : ; bn; : : : { перечисление носителей R и R0 соответственно. Построим последовательность s0; s1; : : : ;sn; : : :
1-изоморфизмов из R в R0 и последовательность t0; t1; : : : ; tn; : : : 1-изоморфизмов из R в R0, таких, что s0 = t0 = ?; sn+1 определен на an+1 и продол?1
жает t?n 1; tn+1 определен на bn+1 и продолжает sn+1 . Заметим, что тогда sn+1
определен на a1; : : : ; an+1 и продолжает sn ; положим s(an) = sn (an); на самом
деле s(an) = sm (an) для всех sm , определенных на an ; точно так же полагаем
t(bn) = tn(bn). Ясно, что s и t взаимно обратные изоморфизмы между R и R0.
Например два счетных плотных порядка без концевых точек изоморфны;
результат неверен для несчетных мощностей: порядки R и R + Q 1-эквивалентны, но не изоморфны. Философия всего этого то, что два 1-эквивалентных
отношения намного больше похожи друг на друга чем те, которые элементарно
эквивалентны.
14
Глава 1
ЭЛЕМЕНТАРНЫЕ КЛАССЫ ОТНОШЕНИЙ
1.d Исторические и библиографические
примечания
Одно ораторское предостережение перед началом этого первого примечания: математическая книга { это книга не об истории науки, и эти примечания
не претендуют ни на полноту, ни на четкое отражение зарождения и современных тенденций математической логики. Напротив, они приведены для того, чтобы снабдить читателя, желающего узнать откуда все это произошло,
какими-то ссылками и посоветовать ему некоторые труды о темах, продолжающих этот курс, но которые здесь будут только слегка задеты.
Разработка логики с помощью локальных изоморфизмов, с условиями "челнока" принадлежат Фраиссе; обычно ссылаются на [ФРАИССЕ, 1954а], а также
на [ФРАИССЕ, 1953], но эти результаты содержатся в его диссертации, защищенной несколько раньше; наиболее доступное изложение имеется в его курсе [ФРАИССЕ, 1971/72/75 ], чтение которого я настоятельно рекомендую. То,
что называется здесь p-изоморфизмом, означает (p; p)-изоморфизмы Фраиссе,
его понятие (k; p)-изоморфизма призвано охватить не только кванторный ранг
формулы (см. главу 2), но также её "ранг чередования".
Ссылки по поводу элементарной эквивалентности и элементарного расширения будут приведены в следующей главе. Примеры параграфа 1.b являются
настолько элементарными, что их можно рассматривать как часть фольклора
теории моделей; воздержимся от выяснения того, кто первым их охарактеризовал с точностью до элементарной эквивалентности. Отметим лишь, что случай
унарных отношений был разобран в [СКОЛЕМ, 1919].
Представление челнока Фраиссе в форме игры двух лиц обязано Эренфойхту [ЭРЕНФОЙХТ, 1961]; он это сделал после Фраиссе много лет спустя и с четкой ссылкой на работу последнего. Однако это не помешало многим логикам,
европейским и американским, приписать только Эренфойхту авторство "челнока" Фраиссе.
Понятие производного топологического пространства есть отправная точка
теории множеств; именно для этого Кантор изобрел ординалы; по этому поводу можно консультироваться у ( [МУР, 1982] стр. 32 и следующие ) . Первое
систематическое рассмотрение бесконечных языков и связанных с ними бесконечных "челноков" было предпринято Кэролом Карпом [КАРП, 1964]; отсюда
происходит выражение "семейство Карпа", предложенное Фраиссе.
Теорема 1.14 приписывается Дэну Скотту [СКОТТ, 1965]; однако заметим,
что она появилась на одиннадцать лет раньше в [ФРАИССЕ, 1954]; одной из
её прародительниц является теорема из [КАНТОР, 1895], утверждающая, что
с точностью до изоморфизма существует только один счетный плотный линейный порядок без концевых точек; этот результат был доказан с помощью
"челнока" Хаусдорфом [ХАУСДОРФ, 1914].
Глава 2
Язык одного отношения
C'est pour qui, le bon lolo? Pour le Poupousse
a sa Dadame? Oh, que c'est bon le miammiam! L'avait faim le petit chat! Mais que
tu est mimine! Tu fais des ronrons et des
doudouces! : : :
Madame Durand, professeur
de Francais
P.C.
2.a Формулы : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16
2.b Связи с "челноком" : : : : : : : : : : : : : : : : : : : : 24
2.c Модели и теории : : : : : : : : : : : : : : : : : : : : : : : 25
2.d Элементарные расширения, тест
Тарского, теорема Левенгейма : : : : : : : 27
2.e Исторические и библиографические примечания : : : : : : : : : : : : : 29
15
16
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
2.a Формулы
Мы объяснили во введении почему язык (т.е. формулы) не был введен
как начальное примитивное понятие. Именно "челнок", изложенный в 1-ой
главе, достаточен для эффективного выражения основных понятий теории моделей. Для фанатичного фраиссеиста эти формулы { сущие безделушки, в
лучшем случае он их рассмотрит как эвристическое облачение для локальных изоморфизмов. Можно провести аналогию с преподавателем, который в
элементарном курсе об интегралах, вводит пространство L1 Лебега как пополнение, не помню уже, какого-то нормированного пространства и только в конце
курса замечает, как бы мимоходом, что точки L1 соответствуют интегрируемым функциям. Не принимая столь крайнюю позицию, я теперь буду говорить
о формулах: они порой также удобны, чтобы понять являются ли два отношения элементарно эквивалентными или нет! Но, так как формулы для нас не
являются первичным понятием, позволим себе их беглое определение, пренебрегая мелкими деталями, лишенными всякого математического содержания
и вызывающими полное отвращение читателей первых страниц учебников по
логике.
Чтобы построить язык, прежде всего нужно обзавестись "алфавитом", т.е.
списком символов; любая конечная последовательность, в том числе и пустая,
элементов алфавита называется словом. Вообще, не все слова представляют
одинакового интереса и из них выделяют некоторые, полученные применением
определенных правил образования.
Возьмем простой пример: алфавит состоит только из двух символов открывающей скобки { ( и закрывающей скобки { ) ; определим по индукции
множества P0; P1; : : :; Pn ; Pn+1 ; : : : слов в этом алфавите следующим образом :
{ P0 состоит из пустого слова,
{ Pn+1 образован из слов вида (A) , где A 2 Pn , или вида (A)(B ) , где A и
B принадлежат объединению P0; P1; : : : ; Pn и , по крайней мере, одно из
них принадлежит Pn .
Объединение P всех Pn называется множеством расстановок.
Теорема 2.1 Каждая расстановка либо пуста, либо представима единственным образом в виде (A) , где A { расстановка, либо в виде (A)(B ) , где A и B
{ расстановки, и эти три случая исключают друг друга.
Доказательство. По определению расстановка представляется в одном
из вышеуказанных видов; нужно понять, что представление единственно и что
случаи { взаимоисключающие; для пустой расстановки это очевидно.
Назовем весом слова натуральное число, равное разности чисел открывающих и закрывающих скобок присутствующих в этом слове. Индукцией по длине
слова (т.е. по числу его символов) легко доказать, что расстановки всегда имеют нулевой вес и что начальный сегмент расстановки имеет неотрицательный
вес. Действительно, расстановка A ненулевой длины имеет вид (B ) или вид
(B )(C ) , где B и C имеют меньшую длину, чем A .
2.a
17
Формулы
Из этого следует, что если A { расстановка, то никакой начальный сегмент
(A) за исключением ? и самого (A) не является расстановкой. Действительно, такое слово имеет строго положительный вес из-за первой открывающей
скобки.
Теперь докажем сформулированный результат. Если (A) = (B ) , то ясно,
что A = B независимо от того, является ли A расстановкой или нет. Предположим, что (A)(B ) = (C )(D) , где A; B; C; D { расстановки. Если длина A
была бы строго меньше, чем длина C , то расстановка (A) была бы собственным начальным сегментом расстановки (C ) , что невозможно; по симметрии
A и C должны иметь одинаковую длину, значит, A = C; B = D . Если бы (A)
равнялось слову (B )(C ) , где A; B; C расстановки, то (B ) был бы собственным
начальным сегментом (A) , что невозможно.
Эта теорема является утверждением об "однозначности чтения" ; она говорит, что расстановка может быть получена единственным путем из пустой
расстановки с помощью последовательных применений двух правил: "из A получить (A)" , "из A и B получить (A)(B ) ". Тогда легко понять, что множества
Pn попарно не пересекаются: если A принадлежит Pn , то число n называется сложностью A ; оно определено корректно и можно законно рассуждать о
расстановках индукцией по их сложности.
Теперь введем выражения чуть более сложные, соответствующие языку
одного m-арного отношения. Алфавит содержит следующие группы символов:
{ открывающая скобка { ( , закрывающей скобка { ) и запятая ,
{ r (символ для обозначения отношения), = (символ равенства) ,
{ : (отрицание, "не"), ^ (конъюнкция, "и"), _ (дизъюнкция, "или") : эти
три символа называются связками или булевыми символами
{ 9 (квантор существования "существует") , 8 (квантор всеобщности, "для
всех") ; некоторые вместо квантора говорят квантификатор .
{ и, наконец, счетный список символов, называемых переменными,
v0; v1; : : :; vn; : : : .
Как в предыдущем случае, индукцией по n определяются множества F0; : : :; Fn; : : :
следующим образом ,
{ множество F0 называется множеством атомных формул , или формул
сложности 0 , и оно состоит из слов вида x1 = x2 , где x1 и x2 { переменные, различные или одинаковые, и слов вида r(x1; : : :; xm) , где x1; : : :; xm
переменные, не обязательно различные (здесь, число m { фиксированное:
оно соответствует арности отношения, о котором идет речь) .
{ множество Fn+1 , называемое множеством формул сложности n + 1 ,
состоит из слов вида :(f ); (9x)(f ); (8x)(f ) , где x { переменная и f из Fn,
а также слова (f ) ^ (g); (f ) _ (g) , где f и g принадлежат объединению
F0; : : :; Fn и, по крайней мере, одно из них из Fn .
18
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
Объединение F всех множеств Fn называется множеством формул . Заметим, что если в формуле стереть все символы кроме скобок, то получаем
расстановку. Из однозначности чтения расстановок ( теорема 2.1 ) следует однозначность чтения формул : каждая формула либо атомна, либо представима
единственным образом в виде :(f ) или (9x)(f ) или (8x)(f ) или (f ) ^ (g) или
(f ) _ (g) , где f и g { формулы, и эти случаи взаимно исключают друг друга. Множества Fn попарно не пересекаются, поэтому каждая формула имеет
вполне определенную сложность , позволяющая рекуррентные рассуждения.
Например, определим множество S (f ) подформул формулы f индукцией
по сложности :
{ если f атомна, то S (f ) = ff g ;
{ если f = :(g) или f = (9x)(g) или f = (8x)(g) , где g { формула неизбежно
меньшей сложности, чем f , то S (f ) = S (g) [ ff g .
{ если f = (g) ^ (h) и f = (g) _ (h) , где g и h { формулы меньшей сложности,
чем f , то S (f ) = S (g) [ S (h) [ ff g .
Эти правила вполне однозначно определяют множество S (f ) для любой
формулы f , поскольку они его определяют однозначно для формулы нулевой
сложности, и они позволяют определить S (f ) для каждой f сложности n + 1
при предположении, что S (g) известно для любой g сложности, меньшей или
равной n. Это { то, что называется конструкцией по индукции (ещё говорят,
рекуррентно), и впредь будем более кратки, когда проводим подобную конструкцию.
Как видно, подформулами формулы f являются те формулы, которые появляются в процессе её образования из атомных формул. Точно так же, индукцией по сложности, определим кванторный ранг формулы :
{ если f атомна, то RQ(f ) = 0 ;
{ если f = :(g) , то RQ(f ) = RQ(g) ;
{ если f = (g) ^ (h) или f = (g) _ (h) , то RQ(f ) = max(RQ(g); RQ(h)) .
{ если f = (9x)(g) или f = (8x)(g) , то RQ(f ) = RQ(g) + 1 .
Формулы с нулевым кванторным рангом, т.е. те, которые не содержат кванторов, называются булевыми формулами или свободными формулами.
Наконец определим множество свободных переменных формулы :
{ если f атомна, то V L(f ) совпадает со множеством всех переменных, присутствующих в формуле f ;
{ если f = (g) ^ (h) или f = (g) _ (h) , то V L(f ) = V L(g) [ V L(h) ;
{ если f = :(g) , то V L(f ) = V L(g) ;
{ если f = (9x)(g) или f = (8x)(g) , то V L(f ) получается из V L(g) выбрасыванием переменной x , если она там присутствует (когда пишем (9x)(g) ,
то не предполагаем, что x обязательно даже присутствует в записи g ) .
2.a
Формулы
19
Если V L(f ) = ; , то говорят, что формула f есть предложение. Переменная
x , которая находится в области действия квантора называется связанной; одна
и та же переменная может входить несколько раз, и свободно и связанно, в одну
и ту же формулу.
Отметим, что здесь символы ( ; =; ) использовались двояко : как элементы нашего алфавита и также для выражения математических фактов (как в
выражении RQ(f ) = RQ(g) + 1 , которое не является формулой в нашем смысле, но является способом высказывания чего-либо по поводу формул f и g !)
Надеемся, что это не вызовет душевную сумятицу у читателя.
До настоящего времени, мы только строили цепочку выражений, не придавая никакого смысла, никакой интерпретации нашим формулам. Можно
развить целую теорию о формальном языке, введя "правила образования",
более сложную или более интересную "грамматику" для наших формул. Это
исследование имеет много приложений, но мы к нему не приступим, поскольку
оно почти не в духе теории моделей. Все, что касается формальных аспектов
языка, называется синтаксисом.
В теории моделей интересуются в основном семантикой, т.е. приданием
смысла формальным предложениям, и потом её исследованием. Мы увидим,
что её семантика достаточно элементарна: она состоит в приписывании "значения истинности", истинной или ложной, формуле. Для этого, сначала нужно
уточнить, как отношение R представляется символом r , и также, если формула содержит свободные переменные, уточнить, какими элементами носителя
R интерпретируется эти переменные.
Когда пишем формулу в виде F (x) , где x { n-ка переменных (x1; : : :; xn) , то
подразумеваем, что все свободные переменные f присутствуют среди x1; : : :; xn ,
но, возможно, не все x1; : : :; xn лежат в V L(f ) . Итак, рассмотрим m-арное
отношение R , формулу f (x), n-ку a = (a1; : : : ; an) элементов носителя R .
Индукцией по сложности f определим выражение " R удовлетворяет f (a) ",
ещё говорят " f (a) истинно для R ", в обозначении R ` f (a);. Честно говоря,
f (a) не является формулой нашего языка: если точно, оно получается из f (x)
заменой свободных вхождений x1 на a1; : : :; xn на an .
Сначала предположим, что f (x) атомна:
{ если f имеет вид x = y , то R ` a = b тогда и только тогда, когда a и b
равны;
{ если f имеет вид r(x1; : : :; xn) , то R ` r(a1; : : :; an) тогда и только тогда,
когда (a1; : : : ; an) 2 R .
Перейдем теперь к индукции :
{ R ` :(f )(a) , если R не удовлетворяет (f )(a) ,
{ R ` (f ) _ (g)(a) , если R удовлетворяет (f )(a) или R удовлетворяет (g)(a)
("или" не исключительно : R может удовлетворять обе формулы одновременно) ,
{ R ` (f ) ^ (g)(a) , если R удовлетворяет (f )(a) и удовлетворяет (g)(a) ,
20
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
{ R ` (9x)(f )(a; x) , если существует b из носителя R, такой, что R удовлетворяет f (a; b)
{ R ` (8x)(f )(a; x) , если для любого b из носителя R; R ` f (a; b) .
Одно из главных опасений автора при преподавании основ логики, как бы
не представить специалистов теории моделей дураками! "Не f " истинно, если
f не истинно, "существует x, такой, что f " истинно, если существует некоторый x, такой, что : : : . Тяжкий формализм для воспроизведения, в конечном
итоге, здравого смысла! И все же, понятие истинности (многострадальная истина!) должно его нести ; в частности, вы должны убедиться, что определение
истинности предложения неизбежно требует выяснения этого для его подформул, которые не являются предложениями.
Всё равно кажется, что ещё не совсем все аккуратно для совершенной строгости, и некоторые моменты надо уточнить. Это { то, что, как уже было сказано, при записи f (x) , где (x) = (x1; : : : ; xn) , не предполагается, что все x1; : : :; xn
присутствуют в f в качестве свободных переменных; с x1 связано a1, : : : , с xn
связано an и некоторые из этих соответствий могут быть ненужными: вы заметите (в принципе, для этого надо проводить индукцию!), что R ` f (a) зависит
только от тех ai , что соответствуют некоторым свободным переменным f .
Значит, если y отсутствует в x , то по определению (9y)(f (x)) удовлетворяется кортежом a из R тогда и только тогда, когда f (x) удовлетворяется им,
и тогда и только тогда, когда (8y)(f (x)) удовлетворяется им. Другой случай:
(a; b) удовлетворяет формулу (f (x)) ^ (g(y)) , если f (a) удовлетворяется так
же, как и g(b); для сравнения, a удовлетворяет (f (x)) ^ (g(x)), если f (a) и g(a)
удовлетворяются.
Надеемся, что эти несколько запутанные объяснения, а также все общепринятые лингвистические соглашения и обозначения, которые используются
здесь молчаливо, вызовут у читателя лишь недолгую тревогу. Его математическое чувство успокоится, как только он увидит связь между выполнимостью
формул и локальными изоморфизмами.
Две формулы f (x) и g(x) называются синонимами или эквивалентными,
если они имеют всегда одинаковое значение: для любого кортежа a и для
любого отношения R R ` f (a) тогда и только тогда, когда R ` g(a) .
Например, легко видеть, возвращаясь к определению выполнимости, следующие эквивалентности:
1)
2)
3)
4)
5)
6)
7)
8)
9)
f
(f ) _ (g)
(f ) ^ (g)
[(f ) ^ (g)] ^ (h)
[(f ) _ (g)] _ (h)
(f ) _ (g)
(f ) ^ (g)
f
f
:[:(f )]
:[:(f ) ^ :(g)]
:[:(f ) _ :(g)]
(f ) ^ [(g) ^ (h)]
(f ) _ [(g) _ (h)]
(g) _ (f )
(g) ^ (f )
(f ) _ (f )
(f ) ^ (f )
2.a
Формулы
21
10)
(f ) ^ [(g) _ (h)]
[(f ) _ (g)] ^ [(f ) _ (h)]
11)
(f ) _ [(g) ^ (h)]
[(f ) ^ (g)] _ [(f ) ^ (h)]
12)
(9x)(f )
:[(8x)(:(f ))]
13)
(8x)(f )
:[(9x)(:(f ))]
14)
(9x)[(f ) _ (g)]
(9x)(f ) _ (9x)(g)
15)
(8x)[(f ) ^ (g)]
(8x)(f ) ^ (8x)(f )
16) Если x { переменная, не входящая свободно в g :
(9x)((f ) ^ (g))
((9x)(f )) ^ (g)
17) Если x { переменная, не входящая свободно в g :
(8x)((f ) _ (g))
((8x)(f )) _ (g)
18) Если y; z не встречаются в x :
(9y)(f (x; y))
(9z)(f (x; z)) ;
где f (x; z) { формула, полученная из f (x; z) заменой каждого
свободного вхождения y на z .
19) Если y; z не встречаются в x :
(8y)(f (x; y))
(8z)(f (x; z)) :
Поскольку мало смысла различать две эквивалентные формулы по очевидным причинам, введем в практику определенные соглашения о сокращениях,
которые делают удобным чтение и запись формул:
{ по правилу 4 (ассоциативность дизъюнкции) пишем (f ) _ (g) _ (h) вместо ((f ) _ (g)) _ (h) или вместо её эквивалента, поскольку порядок, в котором
берётся дизъюнкция не влияет на выполнимость. И для того, чтобы писать
дизъюнкцию формул f1; : : :; fn пишут (f1) _ _ (fn) или ещё __ni=1 (fi) ;
{ точно так же используются записи (f1) ^ ^ (fn) и ^ ni=1 (fi);
{ введём запись (f ) ! (g) как сокращение для (:(f )) _ (g) ; читается " f
влечёт g "; выполнимость (f ) ! (g) означает, что либо f не выполняется, либо
g выполняется. Будьте внимательны: (f ) ! (g) формула, которая может быть
истинной или ложной; простой факт записи этой формулы не предполагает
никакой связи между f и g , в частности, не говорит, что f влечёт g : это имеет
место только, если (f ) ! (g) истинна! Нужно остерегаться психологических
последствий простого обычая, который заключается в математике, как и везде,
в записи предложений, которые рассматриваются как истинные;
{ также вводится символ двойной импликации (f ) $ (g) как сокращение
для ((f ) ! (g)) ^ ((g) ! (f )) ;
{ по правилу 2 (f ) _ (g) можно было ввести как сокращение :((:f ) ^ (:g)),
и по правилу 13 квантор 8 можно было ввести как сокращение :9: ; с противоположной точки зрения, можно было наоборот ввести ! как первичный
символ, добавляя подходящие правила для выполнимости формул , в которых
он появляется. Все эти способы представления в общем эквивалентны и не
стоит долго их обсуждать.
22
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
{ до сих мы были немного неуклюжи со скобками: мы их ввели с избытком, чтобы просто доказать однозначность чтения. Однако на практике скобки
убираются с помощью разбиения символов на три группы: 1-ая группа состоит
из :; (9x); (8x) ; 2-ая { из ^; _ ; 3-я { из !; $ ; и применяем к ним правила
приоритета, которые совпадают с теми, что применяются для выражений элементарной арифметики, где 1-ая группа состоит из ? , 2-ая { из + , а 3-я { из
. Оставляю читателю заботу о точной формулировке правил приоритета и
доказательство того, что они сохраняют однозначность чтения.
Пример.
Сокращенный вид
:f _ g
:f ^ g
(8x)f ! g
(9x)(f $ g)
f !g^h
(f ! g ) ^ h
Полный вид
(:(f )) _ (g)
(:(f )) ^ (g)
((8x)(f )) ! (g)
(9x)((f ) $ (g))
(f ) ! ((g) ^ (h))
((f ) ! (g)) ^ (h)
{ иногда будем применять (9!x) для "существует единственный х"; значит,
(9!x)f (x) является сокращением (9x)f (x)^(8x)(8y)(f (x)^f (y) ! x = y). Наконец, имеется ряд соглашений касающихся бинарных отношений; часто пишут
xry вместо r(x; y) , x r= y вместо :r(x; y) . Например, x = y; x 6= y; x 2 y;
x 62 y; x y; x 6 y; x y; x < y и т.д. Когда символом r является 2 , подразумевается, что отношение которое он представляет, похоже на принадлежность между множествами (мимоходом заметим, что часто путают символ r и
отношение R , которое он представляет) , когда это символ или , подразумевается, что речь идёт об отношении эквивалентности; когда это символ ,
то он представляет некоторый порядок (или, по крайней мере, предпорядок) .
В этом последнем случае надеемся, что записи x y для y x и x < y для
x y ^ x 6= y хорошо знакомы читателю.
Большинство авторов отказываются от рассмотрения отношений с пустым
носителем и говорят, что две формулы эквивалентны, как только они выполняются на одних и тех же кортежах, взятых с непустого носителя отношения.
Несомненно, эта позиция полна мудрости, ловко избегающая ненужных хлопот, но она никак не устраивает автора этих строк: пустое m-арное отношение (с m > 0 ; позднее узнаем соглашения, которые должны принять относительно нульместных отношений), пустой локальный изоморфизм, который
был отправной точкой любого "челнока", играют слишком важную роль в его
изложении, чтобы так просто их обойти.
Итак, будем говорить здесь, что две формулы f (x) и g(x) являются почти
эквивалентными , если для любого a взятого из носителя отношения R с непустым носителем, R ` f (a) () R ` g(a) . Проблема выполнимости формулы
на кортеже для отношения с пустым носителем стоит только для предложений:
если f и g имеют свободные переменные, то они эквивалентны тогда и только
тогда, когда они почти эквивалентны. Но, если внимательно присмотримся к
правилам определяющим выполнимость, то увидим, что предложение начинающиеся с 8 , всегда истинно для отношения с пустым носителем, в то время,
2.a
Формулы
23
как предложение, начинающиеся с 9 , всегда ложно для такого отношения, а
также, что следующие две почти эквивалентности не являются эквивалентностями:
20) Если x не входит свободно в f
(9x)f
f:
21) Если x не входит свободно в f
(8x)f
f;
а также две следующие, которые можно получить комбинируя 14), 15) с 20),
21) :
22) Если x не входит свободно в g
(8x)(f ^ g)
((8x)f ) ^ g
23) Если x не входит свободно в g
(9x)(f _ g)
((9x)f ) _ g ;
в отличие от 16), 17), относительно которых читатель убедится, что они верны
даже для отношений с пустым носителем.
Последнее понятие перед завершением этого параграфа: формула называется пренексной или говорят, что она в пренексной форме , если все её кванторы
стоят впереди. Например, если f и g без кванторов, то (8x)f ^ (9y)g не пренексна, в то время как (8x)(9y)(f ^ g) и (9y)(8x)(f ^ g) пренексны; эти три
формулы почти эквивалентны, если x не входит свободно в g , а y в f . Привести формулу к пренексной форме означает найти пренексную формулу, ей
почти эквивалентную. Это всегда возможно, поскольку видно, что используя
эквивалентности 14), 15), 22), 23) можно пропустить квантор вперед, перенеся
его через ^ или _ , при условии, что в некоторых случаях переименуем некоторые связанные переменные, что нам позволяют 17) и 18) ; а когда встречается
: , применяем правила 12) и 13), чтобы пропустить квантор вперед.
Таким образом, индукцией по сложности из этого выводим, что каждая
формула имеет некоторую почти эквивалентную пренексную форму. На самом деле она имеет бесконечное число таковых; и нужно сказать, что пренексная формула, полученная с помощью вышеописанной процедуры, часто бывает хуже для чтения, чем оригинал. Приведение к пренексной форме является
неисчерпаемым источником идиотских упражнений для начинающих логиков
(например, приведите к пренексной форме (9y)r(x; y) () (8x)r(x; x) ; единственное разумное действие начинать с замены двойной импликации на его интерпретацию, выраженную через :; ^; _ ) . Пренексная форма особенно важна
для формальной арифметики (см. главу 7) .
Поскольку речь идет о трудоемких вещах, лишь отметим, что любая формула имеет эквивалентную ей пренексную формулу, т.е. эквивалентную даже
для пустых отношений. Это очевидно проблем, если существует свободная переменная; если речь идет о предложении, то навешиваем перед его пренексной
24
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
формой квантор 8 , если оно истинно для пустого отношения, и квантор 9 ,
если оно ложно для такого отношения!
Булева часть формулы также допускает различные преобразования; например, можно её привести к "дизъюнктивной форме", записывая как дизъюнкцию конъюнкций атомных формул или их отрицаний (воспользуйтесь правилами с 1) по 11) ) .
2.b Связи с "челноком"
Некоторые понятия о формулах зависят от определения, но существенный факт, который не зависит от выбора определения, следующий :
Теорема 2.2 (Фраиссе) Две n-ки элементов a и b из баз m-арных отношений R и S являются p-эквивалентными тогда и только тогда, когда a в R
и b в S удовлетворяют одним и тем же формулам языка одного m-арного
отношения, кванторный ранг которых не превышает p .
Вот непосредственные следствия теоремы: два m-арных отношения элементарно эквивалентны () когда на них выполняются одни и те же предложения; если R расширение S , то это расширение элементарно () любая
n-ка из носителя отношения S удовлетворяет одним и тем же формулам в S и
в R ; два кортежа реализуют одинаковый тип в своих отношениях () они
удовлетворяют одним и тем же формулам.
Доказательство, часть первая. Сначала докажем, что если и a и b
p-эквивалентны, то они удовлетворяют одним и тем же формулам кванторного
ранга не превышающего p . По определению два кортежа 0-эквивалентны, если
они удовлетворяют одним и тем же бескванторным формулам, которые являются булевыми комбинациями атомных формул (действительно, истинностное
значение булевой комбинации зависит только от истинностных значений членов этой комбинации) .
Покажем переход от p к p + 1 . Пусть f (x; y) { формула кванторного ранга,
не превышающего p , и предположим, что a удовлетворяет (9y)f (x; y) . Значит, существует такой, что f (a; ) истинно. Кроме того, с другой стороны
существует элемент , такой, что a_ и b_ p-эквивалентны. По индукционной гипотезе a_ и b_ удовлетворяют одним и тем же формулам кванторного
ранга не выше p . Значит, f (b; ) истинно так же, как и (9y)f (b; y), и b удовлетворяет (9y)f (x; y) . По симметрии a и b удовлетворяют одним и тем формулам
вида (9y)f (x; y) , где f имеет кванторный ранг не выше p , и также одним и
тем же формулам кванторного ранга не выше p + 1 , которые эквивалентны
булевым комбинациям формул предыдущего вида.
Конец первой части.
Чтобы доказать обратное, нам нужна следующая лемма :
Лемма 2.3 При фиксированной арности m отношения, для фиксированных
натуральных чисел n; p , существует лишь конечное число C (n; p) классов pэквивалентности n-ок.
2.c
Модели и теории
25
Доказательство индукцией по p . Существует лишь конечное число
m-арных отношений определенных на n элементах a1; : : :; an (не обязательно
различных), значит, число классов 0-эквивалентности n-ок конечно. Покажем
переход от p к p + 1 : две n-ки (p + 1)-эквивалентны, если каждый раз когда добавляется один элемент к одной из них, то можно ответить добавкой
элемента к другой n-ке так, чтобы получились p-эквивалентные (n + 1)-ки.
Значит, класс (p + 1)-эквивалентности n-ки определяется множеством классов
p-эквивалентности (n + 1)-ок, которые можно получить из неё добавлением
одного элемента : C (n; p + 1) 2C(n+1;p) .
Доказательство теоремы 2.2 , часть вторая. Мы теперь покажем
индукцией по p , что каждому классу C p-эквивалентности может быть сопоставлена формула fC кванторного ранга p, такая, что все кортежи из C и
только они удовлетворяют fC .
Для данной n-ки a = (a1; : : :; an) и переменных x1; : : : ; xn существует лишь
конечное число атомных формул от n переменных x1; : : : ; xn . Пусть fC { конъюнкция тех из них, которые удовлетворяются кортежом a , и отрицаний остальных атомных формул от x1; : : :; xn ; очевидно, что fC характеризует класс
0-эквивалентности кортежа a .
Чтобы перейти от p к p + 1 , добавим к x новую переменную y , и выпишем
все формулы f1(x; y); : : :; fk (x; y) , которые характеризуют классы
p-эквивалентности на n +1 элементах (по лемме этих классов конечное число) .
Пусть fC { конъюнкция формул вида (9y)fi(x; y) истинных на a , и отрицаний
формул такого вида, ложных на a ; fC характеризует класс p-эквивалентности
кортежа a .
Конец доказательства теоремы 2.2
Как следствие конечности числа классов p-эквивалентности выводим, что с
точностью до эквивалентности существует лишь конечное число формул кванторного ранга p от свободных переменных x1; : : : ; xn : такая формула эквивалентна дизъюнкции формул вида fC . Только булевы избыточности и избыточность кванторов или ещё переименование связанных переменных порождают бесконечное число таких формул. Формула fС , характеризующая класс
С , является совсем не пренексной; приведение её к пренексному виду сильно
повысило бы её кванторный ранг. В "челночном" методе Фраиссе стараются
наоборот привести формулу как можно менее пренексному виду.
2.c Модели и теории
Если отношению R удовлетворяет предложение f , то говорят также,
что R является моделью f ; R { модель данного множества A предложений,
если R { модель каждого из них. Если A имеет модель, то говорят, что A
совместно.
Следствие A , это предложение, выполнимое на всех моделях A ; например,
если A несовместно (также говорят: противоречиво), то всякое предложение
является следствием A , поскольку A не имеет моделей. Напротив, совместное
множество A не может иметь в качестве следствия одновременно и f и :f .
Глава 2
26
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
Тот факт, что f следствие A , обозначается через A ` f ; если A = fgg , то
пишут вообще g ` f ; используемый символ совпадает с тем, что обозначает
выполнимость. Не надо путать ` и ! , их взаимосвязь такова
g ` f () ? ` g ! f .
Некоторые называют тезисами, а другие теоремами предложения, следующие из ? , т.е. истинные для всех отношений; антитеза { это отрицание
тезиса, т.е. предложение, ложное для любого отношения.
Теорией называется совместное множество предложений, содержащее все
свои следствия (в языке одного m-арного отношения, где m фиксировано).
Если A { совместное множество предложений, то множество TA следствий из
A является теорией порожденной A ; также говорят, что A { множество аксиом для TA или аксиоматизация для TA . На практике смешивают A и TA
(например, часто говорят, что A полно { смотрите чуть ниже { вместо того,
чтобы сказать TA полна) . Элементы теории T называются аксиомами или
теоремами T , при этом различие между аксиомами и теоремами носит чисто
психологический характер (список аксиом соответствует начальным данным;
теорема { это предложение, которое может быть доказано как следствие аксиом). Максимальная относительно отношения включения множеств теория
называется полной теорией. Каждая теория T продолжается до полной теории : возьмите модель M теории T и множество TM предложений истинных
на M ; TM { тоже теория, теория отношения M , и она полна, поскольку для
любого предложения f она содержит либо f , либо :f : значит, если f 62 TM ,
то :f 2 TM и TM [ ff g несовместно. Полнота теории означает, что любые две
её модели элементарно эквивалентны; или ещё, это { такое совместное множество A предложений, что для любого предложения f; f или :f принадлежит
A.
Как господин Журден1 , мы уже сами того не зная, изучили несколько
полных теорий в разделе 1.b , которые теперь собираемся аксиоматизировать.
Рассмотрим сначала следующие аксиомы:
VV x 6= x :
Ap = (9x1) : : : (9xp)1i<j
j
p i
Пусть теперь отношение R определено на p элементах a1; : : :; ap и пусть f (x)
конъюнкция всех атомных и отрицаний атомных формул, удовлетворяющихся
кортежом a ; теория отношения R аксиоматизируется следующей единственной
аксиомой:
((9x1) : : : (9xp)f (x1; : : : ; xp)) ^ :Ap+1 ;
и она, как мы уже знаем, характеризует его с точностью до изоморфизма,
Для аксиоматизации теории пустого унарного отношения над бесконечным
множеством, берём (8x):R(x) и бесконечный список всех Ap . Оставим читателю заботу аксиоматизаций других полных теорий унарных отношений. Выразим, что R отношение эквивалентности:
(8x)R(x; x) (8x)(8y)(R(x; y) ! R(y; x))
Персонаж комедий великого французского драматурга Ж.Б. Мольера "Мизантроп" и
"Мещанин во дворянстве" (имеется русский перевод сочинений Мольера) , который очень
удивился, узнав что всю жизнь говорил прозой, сам не подозревая об этом.
1
2.d
Элементарные расширения
27
(8x)(8y)(8y)(R(x; y) ^ R(y; z) ! R(x; z))
Для того, чтобы выразить бесконечность числа классов, требуется бесконечный список следующих аксиом (одна аксиома для каждого n) :
VV :R(x ; x )
(9x1) : : : (9xn)1i<j
i j
n
и , равным образом, бесконечное число аксиом для выражения того, что каждый класс бесконечен:
(8x)(8y1) : : : (8yn)(9z)(R(x; z) ^ 1VVinyi 6= z) :
Следующие аксиомы выражают, что отношение R { линейный порядок:
(8x) x x ; (8x)(8y)(x y ^ y x ! x = y) ;
(8x)(8y)(8z)(x y ^ y z ! x z) ; (8x)(8y)(x y _ y x) :
Как обычно, x < y служит сокращением формулы x y ^ x 6= y . Выразим, что нет наибольшего элемента: (8x)(9y) x < y ; что нет наименьшего:
(8x)(9y) y < x ; что отношение непустое : (9x)(x = x) ; что порядок плотный:
(8x)(8y)(9z)(x < y ! (x < z ^ z < y)) :
Этот конечный список аксиом, которых можно заменить одной их конъюнкцией, порoждает (или, более точно: аксиоматизирует) полную теорию плотных
линейных порядков без концевых точек. Равным образом, получим полную
теорию, заменяя аксиому плотности на аксиому дискретности:
(8x)(9y)(8z)(x < y ^ :(x < z ^ z < y))^
^((8x)(9y)(8z)(y < x ^ :(y < x ^ z < x)) :
Те, кто не допускают отношений с пустым носителем, рассматривают
(9x)(x = x) , а также её следствия как тезис. Мы не разделяем этого (не
очень логичного) страха пустоты.
2.d Элементарные расширения :
тест Тарского, теорема Левенгейма
Если отношение S является расширением отношения R , то элементарность
этого расширения R означает, что любой кортеж элементов из носителя отношения R ("меньшее" отношение) удовлетворяет одним и тем же формулам в
R и в S ; это свойство выражается следующей очень полезной теоремой, где,
заметим, выполнимость подразумевается относительно "большего" отношения
28
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
Теорема 2.4 (тест Тарского.) Если S { расширение R , то это расширение
элементарно тогда и только тогда, когда для любого a из носителя отношения R и любой формулы f (x; y ) , если S ` (9y)f (a; y) , то существует b из
носителя R , такой, что S ` f (a; b) .
Доказательство. Необходимость очевидна. Достаточность докажем индукцией по кванторному рангу p формулы f : если a из носителя R , тогда
S ` f (a) () R ` f (a) . Это очевидно для p = 0 , поскольку по определению
самого понятия расширения a удовлетворяет одним и тем же формулам в R
и S : Предположим, что f имеет вид (9y)g(x; y) , где кванторный ранг формулы g меньше p . Если S ` (9y)g(a; y) , то по предположению существует
b из носителя R, такой, что S ` g(a; b), и по индукционному предположению
R ` g(a; b) , следовательно, R ` (9y)g(a; y) . Если S 6` (9y)g(a; y) , то для всех
b из носителя S и, в частности, для всех b из носителя R имеем S 6` g(a; b) : По
предположению индукции R 6` g(a; b) ; значит, R 6` (9y)g(a; y) . Это завершает доказательство, поскольку формула кванторного ранга p является булевой
комбинацией формул рассмотренного вида (9y)g(x; y) .
Теорема 2.5 (теорема Левенгейма.) Каждое отношение R имеет конеч-
ное или счётное элементарное ограничение; более точно, если A { бесконечное
подмножество носителя R , то существует элементарное ограничение R ,
носитель которого содержит A и равномощен A .
Доказательство. Пересчитаем все формулы f (a; y) с параметрами в A :
существует счётное множество формул f (x; y) ; в каждой нужно заменить x
n-кой из A , и так как A бесконечно, то существует card(A) таких n-ок (поскольку, если A бесконечно, то множество конечных подмножеств A имеет ту
же мощность, что и A ); значит, существует ! card(A) = card(A) формул с
параметрами из A ( позднее мы уточним эту арифметику кардиналов ). Для
каждой формулы такой , что R ` (9y)f (a; y) , добавляем к A элемент b из носителя R, такой, что R ` f (a; b) ; Так как нужно самое большее добавить card(A)
элементов, то получим в итоге множество A1, содержащее A и имеющее ту
же мощность, что и A . Повторим эту операцию, заменив A на A1 , получим
множество A2 и т.д. Пусть B { объединение множеств A; A1; A2; : : :; An; : : : :
это { множество мощности ! card(A) = card(A) , и ограничение R на B
удовлетворяет условиям теста Тарского.
Мы видим, в частности, что каждая совместная теория языка m-арного отношения имеет конечную или счётную модель. Пусть I { носитель линейного
порядка < ; цепью расширений, индексированной множеством I , называется
семейство отношений Ri с базой Ei; i 2 I , такое что Rj расширение Ri для
любых i < j . Пределом (индуктивным !) цепи расширений называется единственное отношение R с базой E = [Ei , являющееся расширением всех Ri : a
удовлетворяет R , если для достаточно большого i ( на самом деле, как только
a попадает в Ei ) a удовлетворяет Ri .
Очень часто на практике < полный порядок ( например, порядок натуральных чисел ! , как в доказательстве теоремы 2.5) , так как расширение
2.e
Исторические и библиографические примечания
29
строятся одно за другим; но это предположение не нужно для доказательства
следующей теоремы.
Теорема 2.6 Если (Ri; i 2 I ) { цепь элементарных расширений ( т.е. Ri Rj
для i < j ) , то её предел R будет элементарным расширением каждого Ri .
Доказательство. Покажем индукцией по кванторному рангу p формулы
f , что если a из Ei , то R ` f (a) () Ri ` f (a) . Это очевидно для
p = 0. Пусть f (x) = (9y)g(x; y) и g имеет кванторный ранг p . Если R ` f (a) ,
то существует b из E , такой, что R ` g(a; b) . Этот b принадлежит Ej для
некоторого j i , и по гипотезе индукции Rj ` g(a; b) . Значит, Rj ` (9y)g(a; y)
и, поскольку Rj есть элементарное расширение Ri , имеем Ri ` (9y)g(a; y) .
Если R 6` f (a) , то для любого b из E и, в частности, для любого b из Ei R 6`
g(a; b) , следовательно, по предположению индукции Ri 6` g(a; b) , что влечёт
Ri 6` f (a) .
2.e Исторические и библиографические
примечания
Я воздержусь от конкретных ссылок по поводу синтаксиса и всего того,
что вокруг определения формул. На самом деле речь идёт о появлении современного математического символизма { явлении, далеко выходящим за рамки
настоящей книги.
Индукционное определение выполнимости формулы кортежом в произвольной структуре появилось очень поздно лишь в [ТАРСКИЙ-ВОТ, 1957]. Некоторые рассматривают эту статью как стержневую работу, определившую последующую ориентацию логики; но скорее можно говорить о четкой записи идей,
существовавших до этого в некотором беспорядке. Если в выдающихся работах, написанных за несколько десятилетий до этого такими математиками,
как Сколем, Гёдель или сам Тарский, относящихся бесспорно к теории моделей, не объясняли это понятие выполнимости, то это только потому, что его
рассматривали как само собой разумеющимся.
По поводу теоремы Фраиссе, отсылаем к библиографическим замечаниям
главы 1. Лексика из 2.c в основном зародилась в [ТАРСКИЙ-ВОТ, 1957] ; понятие "противоречивое множество предложений" появилось ещё раньше, но
оно обозначало скорее множество предложений, из которого можно вывести
противоречие с помощью формального вывода. В этой статье элементарные
эквивалентность и расширение назывались "арифметическими" по аналогии
с работами Гёделя, где формулы были закодированы в арифметике (см. гл.
7). Поскольку это прилагательное звучало несколько странно, некоторое время спустя его заменили на более удачный термин { "элементарный". Фраиссе безуспешно пытался привить "логическую эквивалентность" и "логическое
расширение" .
30
Глава 2
ЯЗЫК ОДНОГО ОТНОШЕНИЯ
В древности отличали аксиомы от постулатов; аксиомы были логической
природы и применялись для обоснования законности способов рассуждения; в
то время как постулаты были разновидностями примитивных свойств выделенных объектов (точек, прямых и т.д.) изучения. Таким образом то, что сегодня
называется "аксиомами", является скорее "постулатами".
Тест Тарского и теорема о цепях элементарных расширений исходят также из [ТАРСКИЙ-ВОТ, 1957]. Что касается теоремы Левенгейма, то { она
прародитель теории моделей. Более точно, в [ЛЕВЕНГЕЙМ, 1915] было доказано, что предложение имеющее модель, имеет конечную или счётную модель; для случая, когда A счётно, она появилась в вышеприведенном виде в
[СКОЛЕМ, 1920].
Глава 3
Расширение языка, структуры
En second lieu, les deux memoires sont courts et nullement proportionnes aux titres ; et puis il y a au moins autant de francais
que d'algebre a tel point que l'imprimeur, quand on lui a porte les
manuscrits, a cru de bonne foi que c'etait une introduction ... Il eut
ete si facile encore de substituer successivement toutes les lettres de
l'alphabet dans chaque equation, en les numerotant par ordre pour
pouvoir reconnaitre a quelles combinaisons de lettres appartiennent
les equations subsequentes ; ce qui eut multiplie indeniment le
nombre d'equations, si l'on reechit qu'apres l'alphabet latin, il y
a encore l'alphabet grec, que celui-ci epuise, il reste les caracreres
allemands, que rien n'emp^eche de se servir des lettres syriaques, et
au besoin des lettres chinoises! Il eut ete si facile de transformer dix
fois chaque phrase, en ayant soin de faire preceder chaque transformation du mot solennel theoreme ...
E.G.
3.a Мультиотношения, реляционные
структуры : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 32
3.b Функции : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 33
3.c Снова о теореме Левенгейма : : : : : : : : : 36
3.d Исторические и библиографические примечания : : : : : : : : : : : : : 37
31
32
Глава 3
РАСШИРЕНИЕ ЯЗЫКА, СТРУКТУРЫ
3.a Мультиотношения,
реляционные структуры
Вместо одного единственного отношения можно рассматривать структуру, образованную конечным множеством отношений R1; : : :; Rk , арности соответственно m1; : : :; mk с одним и тем же носителем ; такая структура называется мультиотношением , последовательность арностей m1; : : :; mk сигнатурой (ещё говорят тип подобия) мультиотношения. При данном втором
мультиотношении (S1; : : :; Sk ) той же сигнатуры с носителем F , изоморфизмом
(R1; : : : ; Rk ) на (S1; : : : ; Sk ) называется отображение E на F , являющееся изоморфизмом R1 на S1; : : :; Rk , на Sk . Так же как и для отношений определяется понятие расширения, вложения, локального изоморфизма, p-изоморфизма
и т.д. Что касается языка мультиотношения, на этот раз нужно ввести k символов отношений, а не один, арности m1 для обозначения R1; : : :; арности mk
для обозначения Rk .
Добросовестный читатель без труда проверит, что все теоремы, доказанные
до этого для отношений, верны и для мультиотношений.
Это не было настоящим обобщением; теперь сделаем более тонкий шаг,
рассматривая реляционные структуры R , образованные не обязательно конечным семейством отношений Ri арности mi с одним и тем же носителем E .
Список mi арностей будет называться сигнатурой или типом подобия структуры; язык, связанный с типом подобия, содержит по одному символу для обозначения каждого отношения. Таким же образом как в предыдущем случае определяются понятия расширения, ограничения, изоморфизма, p-изоморфизма и
т.п. между реляционными структурами одного типа подобия.
Но здесь появляется одно существенное изменение : если первая часть
теоремы Фраиссе 2.2 остается верной, т.е. совершенно точно, что два p-эквивалентных кортежа удовлетворяют одним и тем же формулам кванторного ранга
не превышающего p , то обратное уже нельзя доказать по той простой причине,
что лемма 2.3, утверждающая, что существует лишь конечное число классов
p-эквивалентности, ложна. Если захотим спасти это обратное утверждение, то
необходимо ввести бесконечные конъюнкции и дизъюнкции в наши формулы,
одним словом, ввести инфинитарный язык. Мы не ступим на этот путь и сохраним финитарный характер формул, с которым связаны очень существенные
свойства компактности, которые будут показаны в следующей главе.
Итак, скажем по определению , что две структуры R и J одной сигнатуры
элементарно эквивалентны, если на них выполняются одни и те же предложения; и если J { расширение R , то по определению это расширение элементарно,
если любой кортеж элементов из носителя R удовлетворяет одним и тем же
формулам в R и в J .
Как же быть, если мы дорожим обращением теоремы Фраиссе и локальными изоморфизмами ? Говорим, что R1 есть обеднение (не путать с ограничением) R , если она структура с той же базой, полученная из R стиранием
некоторых отношений; также говорят, что R обогащение { R1. Обогащение получается расширением языка, а расширение самой структуры { расширением
носителя. И так как в формулу входит лишь конечное число элементов сиг-
3.b
Функции
33
натуры, то R и J элементарно эквивалентны, если для любой конечной части
сигнатуры их соответствующие обеднения !-эквивалентны.
Замечание. Иногда бывает удобным рассмотрение 0-арных отношений.
Так как отображение из X в Y сопоставляет каждому элементу X единственный элемент из Y , всегда существует отображение ? в E , независимо от того
E { пустое или нет, с пустым графиком, т.е. всегда существует 0-ка элементов E . Как следствие, всегда существуют два нульарных отношения с базой
E : f?g и ? . Первое можно назвать истиной, вторую ложью. Напротив,
если m > 0 , не существует m-ок элементов пустого множества, значит существует единственное m-арное отношение с пустой базой, которое само есть ? (и
мы часто повторяли, что ? есть всегда локальный изоморфизм между двумя
m-арными отношениями при m > 0 ) .
Таким образом, в структуре символ нульарного отношения всегда интерпретируется либо истиной либо ложью. Эти нульарные отношения сами по
себе не представляют большого интереса, но являются естественным вспомогательным инструментом исчисления: если формула, имеющая n свободных
переменных, представляет некоторое n-арное отношение ( множество n-ок, ей
удовлетворяющих), то предложение представляет 0-арное отношение { истину
или ложь.
3.b Функции
Если мы, например, хотим говорить о группе G как о реляционной структуре, то можно ввести символ тернарного отношения R для обозначения множества троек (x; y; z) таких, что z есть произведение x и y . Это отношение { функциональное относительно z , то есть оно удовлетворяет формуле
(8x)(8y)(9!z)R(x; y;z) . Например, равенство x = y2zy выражается формулой
(9u)(9v)(R(y; y; u) ^ R(z; y; v) ^ R(u; v; x)) . Это обозначение значительно хуже
обычного и кроме того, немного неестественно введение с помощью квантора
такого единственного z , что R(x; y; z) .
Из-за этого обычно предпринимают особое рассмотрение функций, отказываясь от их систематической замены графиками (графиком m-местной функции будет некоторое (m + 1)-местное отношение) . Теперь определим понятие
структуры в самом общем смысле : сигнатура, или тип подобия, дается как
множество, возможно пустое, константных символов ci (также говорят индивиды вместо констант) , символов fj для функций , где fj { арности (арность
= местность) mj и символов rk для отношений , где rk { арности nk (можно
также рассматривать константы как 0-местные функции) .
Структура J сигнатуры и с носителем E задается сопоставлением каждому символу константы ci из одного элемента из E , который его интерпретирует, каждому символу функции fi некоторого отображения из E mj в E ,
каждому символу отношения rk некоторое подмножество E nk . Часто смешивают константу, функцию, отношение с символами, которые они обозначают;
если нужно уточнить структуру, к которой они относятся, можно обозначать
34
Глава 3
РАСШИРЕНИЕ ЯЗЫКА, СТРУКТУРЫ
через cJi ; fjJ ; rkJ интерпретации символов в структуре J .
Сразу опишем язык, соответствующий данной сигнатуре; прежде чем образовать формулы, нужно образовать термы , обозначающие индивиды по следующим правилам :
{ термы сложности 0 : переменные и константы,
{ термы сложности n+1 : слова вида f (t1; : : :; tm) , где f { функциональный
символ арности m , и где t1; : : :; tm { термы сложности не более n и хотя
бы один из них имеет сложность n .
И что касается формул :
{ атомные формулы или формулы сложности 0 : t1 = t2; r(t1; : : :; tm) , где
t1; : : :; tm { термы и r { символ m-арного отношения,
{ формулы сложности n + 1 : :f; (9x)f; (8x)f , где f { формула сложности
n ; f ^ g; f _ g , где f и g { формулы сложности не более n , хотя бы одна
из которых имеет сложность n .
Множество подформул, свободных переменных в формуле, её кванторный
ранг и т.д. определяются как и в случае языка одного отношения. Оставляем
мужественному читателю проверку того, что существует теорема об однозначном чтении термов и формул, на которую опирается дальнейшее изложение.
Перейдем к интерпретации : если формула с n свободными переменными
создается для обозначения подмножества E n (n-ки из E , удовлетворяющие
ей) , терм с n переменными создается для обозначения функции из E n в E . Для
терма t(x1; : : :; xn ) со свободными переменными x1; : : :; xn и для n-ки (a1; : : :; an)
элементов из базы E структуры J , элемент t(a1; : : :; an) из E определяется
индукцией по сложности t так :
{ если t = ci , то этот элемент есть cJi ; если t = xk , то этот элемент есть
ak ,
{ если t(x) = f (t1(x); : : :; tm(x)) , то t(a) = f J (t1(a); : : :; tm(a)) .
Определяем выполнимость атомной формулы на a следующим образом :
J ` t1(a) = t2(a); если t1(a) равен t2(a) ;
J ` r(t1(a); : : :; tn(a)); если (t1(a); : : :; tn(a)) 2 rJ :
Для формул большей сложности поступаем так же, как и в случае одного
отношения.
Мы говорим, что структура J 0 есть ограничение или подструктура J ,
если :
{ база E 0 структуры J 0 содержится в базе E структуры J ,
{ для каждого константного символа ci; cJi 0 = cJi 2 E 0 ,
3.b
Функции
35
{ для каждого0 символа функции fj ; E 0 { множество, замкнутое относительно fjJ и fjJ { ограничение fjJ на E 0 ,
{ для каждого символа отношения rk ; rkJ 0 { ограничение rkJ на E 0 .
Расширение элементарно, в записи J 0 J , если каждый кортеж из меньшей структуры удовлетворяет одним и тем же формулам в меньшей и большей
структурах. Обратим внимание на следующий факт: если мы аксиоматизируем понятие группы введя только одну бинарную функцию умножения, то
подструктура группы не всегда является подгруппой, это просто множество,
замкнутое относительно умножения. Если дополнительно введем константу
для нейтрального элемента и унарную функцию для обращения, то мы получим нечто более богатое, поскольку мы меняем понятие подструктуры, хотя
в языке с одним только умножением имеются синонимы: x = x2 для x = 1 и
xy = xyxy для x = y?1.
Если дано подмножество A носителя структуры J , то подструктурой J ,
порожденной A , является ограничение J на замыкание A относительно функций из J (включая константы, рассматриваемые как 0-местные функции).
Структура называется конечно порожденной или конечного типа , если она
обладает конечным множеством порождающих.
Изоморфизмом двух структур J и J 0 одной и той же сигнатуры называется
биекция s между их носителями E и E 0 , такая, что :
{ s(cJ ) = cJ 0 для каждой константы c ,
{ s(f J (s?1(b1); : : : ; s?1(bn))) = f J 0 (b1; : : :; bn) для каждой функции f ,
{ (a1; : : :; an) 2 rJ () (s(a1); : : : ; s(an)) 2 rJ 0 для каждого отношения r .
Локальный изоморфизм из J на J 0 есть изоморфизм между ограничением
конечного типа J и ограничением конечного типа J 0 : сказать, что (a1; : : :; an)
и (b1; : : :; bn) локально изоморфны или 0-эквивалентны значит, что отображение переводящее a1 на b1; : : :an на bn , продолжается единственным образом, до
изоморфизма между подструктурами, порожденными этими кортежами; другими словами, a и b удовлетворяют одним и тем же атомным формулам.
Мы определяем, как в случае языка одного отношения, понятие p-изоморфизма, где p { натуральное число или, в большей общности, ординал, и также
без труда доказывается обобщение первой части теоремы Фраиссе, а именно,
что два p-эквивалентных кортежа удовлетворяют одним и тем же формулам кванторного ранга не выше p . В частности, два p-эквивалентных и тем
более 1-эквивалентных кортежа имеют одинаковый тип.
Что касается обратного утверждения, которое опирается на лемму 2.3 ("число классов p-эквивалентности конечно") , её обобщение верно лишь для сигнатуры, состоящей из конечного числа констант и отношений. На самом деле,
уже только одна функция ненулевой арности позволяет образовывать бесконечное число термов, и значит, бесконечное множество атомных формул.
Таким образом, если захотим несмотря ни на что свести элементарную
эквивалентность к конечному "челноку" (что может быть необходимым в опре-
36
Глава 3
РАСШИРЕНИЕ ЯЗЫКА, СТРУКТУРЫ
деленных деликатных случаях) , то нужно спуститься на конечную сигнатуру, и заменить каждую n-местную функцию её графиком, являющимся n + 1местным отношением. При этом сохраняется элементарная эквивалентность,
но конечно меняется понятие атомной формулы, формулы кванторного ранга
p; p-изоморфизма и т.д.
Но в большинстве случаев, действительно необходима лишь прямая теорема Фраиссе, которая всегда верна, и даже чаще применяются лишь 1изоморфизмы (смотрите главу 5) .
3.c Снова о теореме Левенгейма
Так как введенные структуры обобщают отношения из глав 1 и 2 , нам
нужно понять как обобщаются доказанные там теоремы. Это мы уже обсудили
для "челнока" Фраиссе. Без труда можно понять, что теорема 1.14 остается в
силе: две 1-эквивалентные структуры со счетными базами изоморфны. Эквивалентности с 1) до 21) из раздела 2.a остаются в силе так же, как и приведение
к пренексной форме, целиком зависящее от них. Равным образом переносятся
такие понятия, как модели, следствия, совместное множество предложений,
теории полной теории (понятие теории или полной теории определяется относительно фиксированного языка) и т.п. из раздела 2.c. Тест Тарского 2.4 ,
теорема 2.6 о цепях элементарных расширений из раздела 2.d остаются верными; что касается теоремы Левенгейма, то она требует легкого видоизменения.
Мощностью языка L по определению называется число его формул : если
L содержит конечное или счетное множество символов констант, функций и
отношений, то это { счетная мощность, в записи card(L) = ! ; если L содержит
бесконечное число { таких символов, то card(L) = { . Очень часто, для теория T в языке L пишут бесцеремонно card(T ) вместо card(L) (таким образом,
card(T ) есть число формул языка теории T , а не число аксиом, участвующих
в аксиоматизации T ; впрочем, это не так уж незаконно, поскольку card(T )
есть в действительности число теорем в T , а число тезисов в L совпадает в
точности с card(L) !)
В доказательстве теоремы Левенгейма для одного отношения, мы использовали то обстоятельство, что число формул без параметров счетно и, следовательно, число формул с параметрами из A равно Max(card(A); !) ; в общем
случае этим числом будет Max(card(A); card(L)) и то же самое доказательство
дает следующую теорему:
Теорема 3.1 (Левенгейм.) Пусть J { структура в языке L , и пусть A {
подмножество носителя этой структуры. Тогда существует элементарное
ограничение структуры J 0 , носитель которого содержит A , мощности не
более Max(card(A); card(L)) .
Мы видим в частности, что каждая теория T имеет модель мощности не более
чем card(T ) .
3.d
Исторические и библиографические примечания
37
3.d Исторические и библиографические
примечания
Я не могу сказать что-нибудь по поводу этой короткой главы за исключением лишь того, что, как утверждают историки, появление структур
восходит к Шредеру [ШРЁДЕР, 1895] ; слово "мультиотношение" происходит
из [ФРАИССЕ, 1971/72/75 ] . Для остального отсылаем к замечаниям двух предыдущих глав.
Глава 4
Компактность
Et por l'achaison de celle bataille et de celle
ghere nulo home ne pooit aler per chemin qui
ne fust pris : et ce estoit deverc dont il estoient
venu ; mes avant pooient il bien aler. Et adonc
les deus frers distroient entr'aus "puis que nos ne
poons retorner a Gostantinople con notre mercaandie, or alon avant por la voie dou levant ...
M.P.
4.a Ультрапроизведения : : : : : : : : : : : : : : : : : : : 39
4.b Компактность, теорема
Левенгейма-Сколема
теорема об общем
элементарном расширении : : : : : : : : : : : : 43
4.c Метод Генкина : : : : : : : : : : : : : : : : : : : : : : : : : 48
4.d Исторические и библиографические примечания : : : : : : : : : : : : : 53
38
4.a
Ультрапроизведения
39
4.a Ультрапроизведения
Всякий изучающий топологию слышал о фильтрах : если I { непустое
множество, то фильтром называется семейство F подмножеств I , такое, что:
{ I 2 F; ; 62 F ,
{ если X и Y из F , то X \ Y 2 F ,
{ если X 2 F и X Y , то Y 2 F .
Примеры фильтров:
{ семейство FfAg подмножеств I , содержащих непустое подмножество A I;
{ семейство, называемое фильтром Фреше, коконечных подмножеств бесконечного множества I .
Предбаза фильтра B { семейство подмножеств I , содержащееся в некотором фильтре. Это означает, что любое конечное пересечение элементов из B
не пусто. Фильтр FB , образованный всеми подмножествами I , содержащими
некоторое конечное пересечение элементов B , есть наименьший фильтр, содержащий B : это { фильтр, порождённый семейством B . Если, кроме этого
пересечение любых двух элементов B есть снова элемент B , то говорят, что B
{ база фильтра: тогда FB { семейство подмножеств I , содержащих некоторый
элемент B .
Примеры баз фильтров:
{ fAg , где A 6= ;; A I ,
{ пусть J { множество, и пусть I { множество конечных подмножеств J ;
для любого i 2 I пусть Ii = fj : j 2 I; j ig , и пусть B { семейство всех
Ii ; так как Ii \ Ij = Ii[j ; i 2 Ii то В замкнуто относительно конечных
пересечений и не содержат ; , значит оно есть база фильтра. Фильтр FB
или его близкие родители часто используются в теории моделей.
Ультрафильтр по определению, есть максимальный фильтр.
Теорема 4.1 Фильтр F над I является ультрафильтром тогда и только
тогда, когда для любого подмножества A I либо A , либо его дополнение
I n A содержится в F .
Доказательство. Пусть F { ультрафильтр и предположим A 62 F ; по
максимальности F , F [ fAg не является предбазой фильтра и существует B
из F , такой, что A \ B = ; ; и так как B I n A , то I n A 2 F . Если F { фильтр,
удовлетворяющий предположению, и A 62 F , то F [fAg не является предбазой
фильтра, поскольку I n A 2 F и (I n A) \ A = ; . Значит, F { ультрафильтр.
40
Глава 4
КОМПАКТНОСТЬ
Теорема 4.2 Пусть U { ультрафильтр над I ; если fA1; : : :; Ang { конечное
покрытие I , т.е. I = A1 [ : : :An то одно из Ai принадлежит U , если,
сверх того, множества Ai попарно не пересекаются, то только одно лишь
Ai , принадлежит U .
Доказательство. Если Ai 62 U , то I n Ai 2 U , и невозможно, чтобы все
I n Ai были в U , поскольку их пересечение пусто. И, если Ai 2 U и Aj 2 U , то
Ai \ Aj 6= ; .
В качестве примеров ультрафильтров, нам почти нечего предложить, кроме Ua { семейства всех подмножеств I , содержащих элемент a из I : эти ультрафильтры называются главными. Для них характерно, что пересечение любого
множества элементов из Ua, даже бесконечного, снова принадлежит Ua . Эти
ультрафильтры, очевидно, не представляют никакого интереса. По теореме
4.2 , если ультрафильтр содержит конечное множество A = fa1; : : : ; ang , то
он главный : примените разбиение I n A; fa1g; : : :; fang . Неглавные ультрафильтры могут существовать только над бесконечным множеством I , и в этом
случае неглавными ультрафильтрами являются в точности те ультрафильтры,
которые содержат фильтр Фреше.
Трудность приведения "явного" примера неглавного ультрафильтра будет
понятна лишь читателю, который будет углубляться в теорию множеств. Одна
из аксиом этой теории, являющаяся ослабленной версией аксиомы выбора,
такова :
Аксиома ультрафильтра. Каждый фильтр содержится в некотором
ультрафильтре.
Мы допускаем эту аксиому, подтверждающую существование многочисленных ультрафильтров; она используется в "обычной" математике. Мы обсудим
её законность, когда будем говорить об ординалах. Польза ультрафильтров
для теории моделей заключается в том, что они позволяют строить новые
структуры из первоначально заданных.
Пусть I { непустое множество, U { ультрафильтр над I . Выберем для
каждого i из I структуру Si с непустым носителем Ei , имеющую один и тот
же тип подобия . Мы собираемся определить структуру S типа подобия ,
называемую
ультрапроизведением Si по ультрафильтру U и обозначаемую
Q
через S = Si=U .
Прежде всего определим базу E структуры;
Q мы рассмотрим следующее
отношение над множеством произведения Ei : говорим, что I -последовательность a = (: : :; ai; : : : ) и I -последовательность b = (: : :; bi; : : : ) равны по модулю
U , если fi : ai = big принадлежит U . Это равенство по модулю U , очевидно,
рефлексивно и симметрично; оно транзитивно, поскольку
fi : ai = cig fi : ai = big \ fi : bi = cig :
Значит, это { отношение
Q эквивалентности, и мы в качестве E возьмем фактормножество E = Ei=U , т.е. множество его классов. Таким образом, элементом множества E Q
является класс по модулю U некоторой I -последовательности
a = (: : : ; ai; : : : ) из Ei ; на практике мы естественно, хоть и несправедливо,
отождествляем a и .
Теперь определим интерпретацию символов сигнатуры в структуре S .
4.a
Ультрапроизведения
41
{ если c { константный символ, то обозначим через ci его интерпретацию в
Si ; по определению, cS есть класс I -последовательности (: : :; ci; : : : ) .
{ если f { символ n-местной функции, то обозначим через fi его интерпретацию в Si ; для данных 1; : : : ; n из E мы определим f (1; : : : ; n) в
смысле S ; выберем представителей a1; : : :; an в классах 1; : : :; n , пусть
a1 = (: : : ; a1i; : : : ); : : :; an = (: : : ; ani; : : : ); и определим в качестве значения
f (1; : : :; n)
класс
по
модулю
U I -последовательности
(: : :; fi(a1i; : : : ; ani); : : : ). Мы должны проверить, что это значение не зависит от представителей, т.е. что, если a1 и b1, : : :; an и bn равны по модулю
U , то так же равны (: : :; fi(a1i; : : : ; ani); : : : ) и (: : : ; fi(b1i; : : :; bni); : : : ). Это
мы оставляем читателю.
{ если r { символ n-арного отношения, мы обозначим через ri его интерпретацию в Si и мы определим его интерпретацию в S следующим образом:
если 1; : : : ; n из E , мы выберем представителей с каждого i и скажем, что (1; : : :; n ) удовлетворяет rS , если множество таких i , что
(1i; : : : ; ni) удовлетворяет ri принадлежит U . Мы оставляем читателю
проверку того, что это не зависит от выбора представителей, т.е. если a1
и b1, : : : ; an и bn равны модулю U ,то
fi : (a1i; : : :; ani) 2 rig 2 U () fi : (b1i; : : :; bni) 2 rig 2 U :
Заметим, что эта конструкция не представляет никакого интереса,
Q если U
{ главный ультрафильтр: если U порождается элементом j , то Si=U изоморфно Sj . Определение ультрапроизведения естественно и, в целом, легко
усваивается. То, что его делает немного трудным для восприятия, { это многочисленные индексы и обозначения, необходимые для его введения. Если вам
трудно понять, чему соответствует это понятие,Qто может помочь следующий
пример: пусть Si являются группами Gi и G = Gi , и пусть GU { множество
элементов из G , равных 1 по модулю U ; другими словами, (: : :; ai; : : : ) лежит
в GU , если fi : ai = 1g лежит в U ; GU { нормальная подгруппа в G и ультрапроизведение
групп Gi изоморфно G=GU . Или ещё Si являются кольцами
Q
Ai; A = Ai; AU { множество элементов A , равных нулю по модулю U; AU {
двусторонний идеал кольца A и ультрапроизведение колец Ai изоморфно A=AU
.
Следующая теорема { смысл существования ультрапроизведений1 .
Теорема 4.3 (Лось) Пусть U { ультрафильтр над I , структуры Si индек-
сированные элементами I , имеют одну и ту же сигнатуру
; пусть f (x) {
Q
формула языка , Q= (1 ; : : :; n ) { кортеж элементов из Si=U; a1 ; : : :; an {
представители
из Si для классов (1; : : : ; n ) ; тогда f (1 ; : : :; n ) истинна
Q
в Si =U () fi : Si ` f (a1i; : : : ; ani )g принадлежит U .
Доказательство. Утверждение теоремы верно по определению ультра-
произведения, если f { атомная формула. Докажем общий случай индукцией
по сложности формулы f .
1
Прим. переводчика : автор пишет, что "Los" произносится как "Уош"
42
Глава 4
КОМПАКТНОСТЬ
Если f (x) = :g(x) , то множество fi : Si ` f (a1i; : : :; ani)g { дополнение к
fi : Si ` g(a1i; : : : ; ani)g. Если первое множество принадлежит U , то второе
{ нет, по гипотезе индукции S 6` g() , значит S ` f (). Иначе, так как U {
ультрафильтр, его дополнение { второе множество принадлежит U , значит,
по предположению индукции S ` g() и S 6` f () .
Если f (x) = g(x) ^ h(x) , то
fi : Si ` f (a1i; : : : ; ani)g = fi : Si ` g(a1i; : : : ; ani)g \ fi : Si ` h(a1i; : : : ; ani)g
и пересечение этих двух множеств лежит в U () оба множества лежат в U
(и по предположению индукции) () S ` g() и S ` h() .
Если f (x) = Q
(9y)g(x; y) , то предположим сначала, что S ` f () ; значит,
существует из Si=U , представимое I -последовательностью b = f: : :; bi; : : : g
и такое, что S ` g(; ) ; по гипотезе индукции fi : Si ` g(a1i; : : : ; ani; bi)g
лежит в U , а вместе с ним его надмножество fi : Si ` 9yg(a1i; : : :; ani; y)g.
Обратно, если множество fi : Si ` 9yg(a1i; : : :; ani; y)g лежит в U , то для
каждого i 2 X мы можем найти bi, такой, что Si ` g(a1i; : : :; ani; bi) ; для i вне
X в качестве bi берём любой элемент из Ei ( мы предположили в определении
ультрапроизведения, что все структуры Si имеют непустую базу Ei ) ; пусть { класс по модулю U I -последовательности (: : :; bi; : : : ) ; по предположению
индукции S ` g(; ) , значит, S ` 9yg(; y) . Пункты для _ и 8 оставляем
читателю; впрочем, можно их просто заменить булевой комбинацией :; ^; 9 .
Q
Мы видим, в частности, что предложение f истинно в Si=U если и только,
если fi : Si ` f g принадлежит U ; часто в этом случае говорят, что f "истинно
почти для всех i по модулю U или "множество индексов, для которых f ложно,
ничтожно по модулю U ".
Предположим, что все Si { копии одной и той же структуры S , их ультрапроизведение называется ультрастепенью S по U и обозначается S U ;
если элементу a 2 S мы поставим в соответствие класс по модулю U для
I -последовательности, состоящей только из элементов, равных a , мы получаем вложение S в S U , называемое каноническим диагональным вложением S
в S U ; очень часто S отождествляется со своим образом в S U при этом включении. В качестве непосредственного следствия теоремы Лося имеем, что это
каноническое диагональное вложение элементарно и S U элементарное расширение S .
Читатель заметил, что мы дали определение ультрапроизведения только
для структур с непустыми базами; если он не хочет исключить случай пустых
баз и при этом сохранить теорему 4.3, то нужно поступить так :
{ если множество J индексов i таких, что база Si непуста, принадлежит
ультрафильтру U , то обозначим через V ультрафильтрQнад J , являющийся
Q Sj =V ,следом U над J , и полагаем, по определению Si=U равным
{ иначе, если множество индексов
Q i таких, что база Si пуста, принадлежит ультрафильтру, тогда Si=U будет иметь пустую базу; функциональные символы, а также символы отношений положительной арности
4.b
Компактность и теоремы о расширениях
43
будут иметь единственную возможную интерпретацию на пустой базе; и
если r { символ 0-арного отношения, он будет интерпретироваться как
"истина", если множество таких i , что ri истина, принадлежит ультрафильтру, и как "ложь" в противном случае, в соответствии с предыдущим
определением ультрапроизведений (для непустых баз).
Читатель без труда убедится, что с этим соглашением теорема Лося остается
в силе во всей общности.
4.b Компактность, теорема
Левенгейма-Сколема, теорема
об общем элементарном расширении
Зафиксируем язык L , соответствующий сигнатуре ; мы собираемся снабдить множество J всех полных теорий в языке L топологией: любому предложению f этого языка поставим в соответствие множество hf i всех полных
теорий, содержащих f ; таким образом T 2 hf i означает f 2 T или ещё T ` f
(читается " f следствие T " или ещё " f выводимо из T "; чтобы не злоупотреблять символом 2 , мы остановимся на последнем обозначении). Так как
hf i\hgi = hf ^ gi множества hf i образуют базу топологии, которой мы снабжаем J . Множество J с этой топологией образует сепарабельное пространство;
на самом деле, если T 6= T 0 , поскольку T; T 0 { полные теории, то для некоторого предложения f; T ` f; T 0 ` :f и hf i и h:f i { непересекающиеся
окрестности соответственно T и T 0 .
Так как дополнением для hf i будет h:f i , открытые множества из базы
будут одновременно закрытыми: J есть так называемое вполне несвязное пространство (пространство, допускающее базу открыто-замкнутых множеств);
как следствие каждое непустое связное подмножество J состоит из одной точки.
Итак, по определению, открытое подмножество J является объединением
множеств вида hf i, а замкнутое { пересечением таковых. Непустые замкнутые
подмножества J соответствуют в точности неполным теориям в языке L : если
F { пересечение множеств hfii , то ему ставится в соответствие теория ,
аксиоматизируемая предложениями hfii ; F есть в точности множество полных
теорий, содержащих (заметим, что f выводимо из A () каждая полная
теория, содержащая A , содержит f ).
Следующая теорема компактности является одной из самых существенных
для теории моделей; всё было сделано для того, чтобы обеспечить финитный
характер формул, который обеспечивает её законность.
Теорема 4.4 (компактности ) Пространство J полных теорий в языке L
является вполне несвязным компактом.
Доказательство. Мы уже показали, что J сепарабельно и вполне несвязно. Остается показать, что любой ультрафильтр над J сходится, т.е. является утончением фильтра окрестностей некоторой точки. Для каждой T из J
44
Глава 4
КОМПАКТНОСТЬ
Q
выберем модель MT для T , и пусть { теория модели MT =U ; если A {
окрестность ; A содержит некоторое множество hf i такое, что ` f , то по
теореме Лося fT : MT ` f g = hf i принадлежит U , так же как и A . Вполне несвязный компакт часто называют стоуновским или пространством Стоуна; это { самое естественное обобщение понятия конечного пространства с дискретной топологией. Другая, может быть, более выразительная
формулировка теоремы 4.4 { следующая :
Теорема 4.5 (компактности ) Для совместности бесконечного множества
A формул достаточна совместность каждой конечной части A .
Доказательство. Действительно, для сепарабельного пространства компактность эквивалентна следующему свойству : если Fi { семейство замкнутых
окрестностей, пересечение любого конечного подсемейства которого непусто
(тогда говорят, что это семейство замкнутых имеет "свойство конечного пересечения"), тогда пересечение всех Fi также непусто; и мы можем естественно,
предполагать, что Fi из базы и имеет вид hfii . Это в точности то, что утверждает теорема.
Другое, более прямое доказательство : пусть I { множество конечных подмножеств A ; мы знаем, что для i 2 I множества Ii = fj : j 2 I; i j g образуют
базу фильтра, содержащегося в некотором ультрафильтре U . Для каждого i
из I , существует
модель Mi для i . Теперь с помощью теоремы Лося легко
Q
видеть, что Mi=U является моделью для A .
Теорема 4.6 1) Если A { противоречивое множество формул, то существует конечная противоречивая часть A .
2) Если f { следствие A , то существует конечная часть A , из которой
следует f .
Доказательство. 1) эквивалентно предыдущему утверждению; чтобы доказать 2), заметим, что f { следствие A () A [ f:f g противоречиво.
Можно сказать, что теорема компактности находит постоянное применение в
теории моделей; здесь мы начнем с поразительных примеров этого применения.
Теорема 4.7 Открыто-замкнутыми подмножествами J являются множества вида hf i , где f { предложение, и только они.
Доказательство. По определению топологии в J множество hf i одно-
временно открыто и замкнуто. Обратно, пусть A { открыто-замкнутое подмножество J . Поскольку A открыто, оно является объединением непустого семейства множеств hfii (даже если A { пустое множество, потому что
; = hf ^ :f i для любого предложения f ) ; и так как оно замкнуто, то является компактным, значит, совпадает с объединением конечного подсемейства
A = hf1i [ : : : hfn i = hf1 _ _ fni .
4.b
Компактность и теоремы о расширениях
45
Теория (не обязательно полная) называется конечно аксиоматизируемой,
если она обладает конечной системой аксиом, или то же самое, что она обладает системой состоящей из одной аксиомы (возьмите конъюнкцию предыдущих). Значит, мы видим, что конечно-аксиоматизируемая теория соответствует открыто-замкнутому подмножеству J : конечная аксиоматизируемость полной теории означает, что она изолированная точка в J (если f аксиоматизирует
T , то T { единственная точка hf i ) .
Примеры полных, конечно аксиоматизируемых теорий :
{ теория конечной структуры в конечном языке,
{ в языке одного бинарного отношения, теория плотных линейных порядков без концевых точек.
Действительно, списки аксиом, данные в разделе 2.c, конечны.
Вот одно из следствий теоремы компактности : если конечно аксиоматизируема, то из любой аксиоматизации можно выделить конечную аксиоматизацию . Действительно, предположим, что , с одной стороны, аксиоматизируема через f , а с другой { через множество аксиом gi ; f { следствие
предложений gi , следовательно, по компактности f следует из конечной части
gi , аксиоматизирующих .
Это позволяет легко понять, что некоторые теории, которые мы уже изучали, не являются конечно аксиоматизируемыми; например, если язык L не содержит никаких символов
кроме равенства, то рассмотрим аксиомы
V
V
An = (9x1) : : : (9xn)0<i<jn(xi 6= xj ) . Теории Tn с аксиомами An ^:An+1 и теория
T1 , содержащая все An, полны. Теория T1 не является конечно аксиоматизируемой потому, что конечный набор его аксиом A1; : : : ; An не влечет никогда
An+1. Последовательность Tn сходится к T1 (легко видеть, что в этом языке
теориями T1; : : : ; Tn; : : : и T1 исчерпываются все полные теории) ; J получается добавлением бесконечной точки T1 для компактификации дискретного
пространства из T1; : : : ; Tn; : : : .
Упражнение 4.8 Докажите, что одно унарное отношение конечно аксиоматизируемо () его носитель конечен. Опишите пространство J языка
одного унарного отношения. Каковы первые три производных пространства
от J ?
Упражнение 4.9 Докажите, что отношение эквивалентности конечно аксиоматизируемо (т.е. его полная теория конечно аксиоматизируема) ()
его носитель конечен.
Теорема 4.10 (Левенгейм { Сколем) Если T { теория, не обязательно полная, имеющая бесконечную модель или сколь угодно большие конечные модели,
тогда T имеет модель мощности { для любого кардинала { card(T ).
Доказательство. Пусть L { язык теории T и L0 { язык, полученный добавлением к L новых { константных символов, и пусть T 0 { множество предложений, образованное из T и предложений ci 6= cj для всех пар (ci; cj ) различных
46
Глава 4
КОМПАКТНОСТЬ
новых констант. Конечный фрагмент теории T 0 включает в себя лишь конечное
число c1; : : :; cn этих констант и мы получаем для него модель из модели Mn
теории T , содержащей по крайней мере n элементов (такая модель существует по предположению), интерпретируя в ней c1; : : :; cn различными элементами
Mn , а другие ci как угодно.
Как следствие, по компактности T 0 имеет модель M 0 (вообще говоря, T 0 не
полная теория, даже если T полна в языке L ); если мы ограничим структуру
M 0 на первоначальный язык L , забыв про добавленные константы, получим
модель M теории T , имеющую по крайней мере { элементов; и чтобы получить
модель мощности { , применяем теорему Левенгейма 3.1.
Рассмотрим теперь модель M полной теории T в языке L. Пусть L(M ) {
язык, полученный добавлением к L константного символа для каждого элемента M , и пусть T (M ) { множество предложений, истинных в этом новом языке.
Принадлежность f (a1; : : :; an) к T (M ) , где f (x) { формула языка L означает
что a из M удовлетворяет f (x), т.е. что M ` f (a) ; T (M ) называется диаграммой M . Некоторые называют диаграммой M множество бескванторных
предложений L(M ) истинных в M , его мы назовём "свободной диаграммой"
M . Мы видим, что по определению элементарное расширение M есть не что
иное, как модель T (M ) и также, что из теоремы Левенгейма-Сколема следует,
что если M бесконечна, то она имеет элементарное расширение мощности {
для любого кардинала { Max(card(M ); card(L)) .
Все это показывает, что элементарная эквивалентность может характеризовать с точностью до изоморфизма только конечные структуры; например,
счетная структура счетного языка имеет элементарное расширение в любой
бесконечной мощности.
Лемма 4.11 Если M и N { две элементарно эквивалентные структуры, то
они имеют общее элементарное расширение : существует структура P и
элементарные вложения M и N в P .
Доказательство. Образуем теории T (M ) и T (N ) таким образом, что име-
на ai элементов M были совершенно другими, чем имена bi элементов N ;
общее элементарное расширение M и N { это модель теории T (M ) [ T (N ) .
(Заметим, что две различные константы могут вполне интерпретироваться одним элементом!) Итак, мы должны доказать, что это множество предложений
совместно. Поскольку мы можем заменить конечное множество предложений
их конъюнкцией, то конечный фрагмент T (M ) [ T (N ) состоит из одного предложения f (a) из T (M ) и одного предложения g(b) из T (N ). Так как N ` g(b) ,
то N ` 9yg(y), и поскольку последнее { предложение языка L , а M и N по
определению элементарной эквивалентности удовлетворяют одним и тем же
предложениям этого языка, оно так же верно в M и существует b0 в M , такой, что M ` g(b0). Интерпретируя b через b0 мы получаем из M модель для
f (a) ^ g(b) ; следовательно, по компактности T (M ) [ T (N ) совместно.
Следующая лемма чуть более точна; на самом деле, эти две леммы являются двумя версиями одного и того же результата; их доказательства слегка
4.b
47
Компактность и теоремы о расширениях
отличаются, и читатель выберет тот метод, который ему больше по вкусу.
Лемма 4.12 Если M и N элементарно эквивалентны, то M элементарно
вкладывается в некоторую ультрастепень N .
Доказательство. Пусть I { множество локальных изоморфизмов из M в
N ; если f (a) { формула с параметрами a из M и M ` f (a) , то обозначим через
If (a) множество локальных изоморфизмов s, таких, что его область определения содержит a и N ` f (sa) ; If (a) всегда непусто, поскольку M ` f (a1; : : :; an)
и, значит, M ` (9x1) : : : (9xn)f (x1; : : :; xn) ^ D(x1 ; : : :; xn) , где D { конъюнкция
формул xi = xj , если ai равен aj , xi 6= xj , если ai и aj различны, и N удовлетворяет равным образом этой формуле. С другой стороны, If (a) [Ig(b) = If (a)^g(b)
, значит, множества If (a) образуют базу фильтра, содержащегося в некотором
ультрафильтре U .
Мы определим отображение S модели M в N U следующим образом : если
a 2 M , i-ая координата Sa есть ia , если i определен на a , иначе { произвольный элемент N (мы исключаем случай пустых баз, который очевиден) ;
заметим, что fi : i определен на ag = Ia=a , также что изменение координат
за пределами Ia=a не меняет Sa по модулю U , откуда следует корректность
определения S . Если a отличен от b , то Ia6=a лежит в ультрафильтре, что
легко влечет инъективность S . Теперь с помощью теоремы Лося читатель без
труда докажет, что S { элементарное вложение M в N U .
На самом деле, верен намного более сильный результат : если две структуры M и N элементарно эквивалентны, то существует ультрафильтр U ,
такой, что M U и N U изоморфны. Но вот это { трудная теорема, последний
этап доказательства которой потребовал вмешательство Шелаха ; она требует
глубоких знаний в теории моделей и об ультрафильтрах. Впрочем, она почти
не применяется специалистами в теории моделей : можно было бы, разумеется, наличие изоморфных ультрастепеней принять за определение элементарной
эквивалентности. Это было бы приятным для математика с алгебраическим
складом ума, и позволило бы не говорить (по крайней мере в определении) о
формулах, о локальных изоморфизмах и т.п., но сделало бы ужасно трудным
доказательство простейших свойств элементарной эквивалентности! Поэтому
мы обойдемся без этого результата, хотя он мог бы незначительно упростить
некоторые из дальнейших доказательств.
Эта теорема Шелаха отвечает на проблему нахождения "алгебраической"
характеризации (т.е. не использующей логику, формулы, выполнимость, понятия, происхождение которых может показаться подозрительным для определенных математиков) элементарной эквивалентности. На совершенно ином
и значительно более простом уровне локальные изоморфизмы вместе с рангом
Фраиссе дают один такой ответ. Но ответ Фраиссе, в отличие от ответа Шелаха, снабжает эффективным и непосредственным методом доказательства того,
что две структуры элементарно эквивалентны.
48
Глава 4
КОМПАКТНОСТЬ
Упражнение 4.13 Докажите, что порядок действительных чисел не изоморфен никакой ультрастепени порядка рациональных чисел (указание: QU
не полна) .
Теорема 4.14 Если Mi семейство элементарно эквивалентных структур,
то они имеют общее элементарное расширение : существует структура M
и элементарные вложения Mi в M для каждого i .
Доказательство. Итерируя лемму 4.11 , доказываем теорему, если семейство структур Mi конечно. Если оно бесконечно, то теорема компактности
сводит вопрос о совместности [T (Mi) , где множество имен элементов предполагается дизъюнктным, к конечному случаю.
4.c Метод Генкина
Хотя ультрапроизведения являются достаточно эффективным средством
для доказательства сходимости ультрафильтра, мы дадим другое доказательство теоремы компактности, следуя так называемому методу Генкина. Он состоит в сведении вопроса совместности одного множества предложений в языке к вопросу совместности другого множества бескванторных предложений в
в некотором расширенном языке LH (по этому методу одно предложение заменяется на бесконечное множество бескванторных предложений в LH ) ; это
сводит общую теорему компактности к теореме компактности для бескванторных предложений, доказательство которой несколько проще. Его отличительная черта { выделение для формул новых константных символов, называемых
ихними свидетелями, и допущение аксиом, гарантирующих, что если если формула f (x) выполнима, то свидетель для f (x) удовлетворяет ей.
Здесь мы рассмотрим только случай счетного языка, наиболее употребительного, но метод остается в силе и для несчетных языков и читателю будет
дано короткое указание по поводу обобщения на этот случай. Преимущество
этого метода в том, что для счетного языка вводятся только конечные или
счетные структур, чего не было в случае ультрапроизведений. Из-за этого,
мы увидим, что он подходит для кодирования в арифметике (смотрите главу
7 ) ; он также очень полезен для доказательства теоремы об опускании типов
(смотрите главу 10 ) .
В действительности, этот метод старше, чем определение ультрапроизведений. Вот как наши отцы доказывали теорему компактности : они объявляли
правила вывода, позволяющие получить из конечного множества предложений
("антецендентов" или посылок) другое предложение ("консеквент" или заключение) ; говорят, что f доказуемо из A , если существует последовательность
S1; : : : ; Sn выводов, такая, что для любого i n каждая посылка для Si либо
лежит в A , либо есть заключение из одного Sj ; j < i, и f { заключение из Sn ;
A называется п??отиворечивым, если f ^ :f доказуемо из A для некоторого
f . Поскольку доказательство затрагивает лишь конечное число элементов A ,
4.c
Метод Генкина
49
ясно что A непротиворечиво () каждая конечная часть A непротиворечива.
Простая проверка правил доказательства показывала, что если f доказуема из
A , то f { следствие A (напомним, что это означает, что каждая модель A есть
модель и для f ) . Труднее было доказать обратное : если A непротиворечиво,
то A имеет модель. Это они могли доказать с помощью метода Генкина, позволяющего шаг за шагом строить модель для f , если только не сталкиваются с
противоречием. Все это будет детально изложено в главе об арифметике.
Мы сначала разберемся со случаем теоремы компактности для предложений без кванторов. Рассмотрим счетное множество E = fa0; : : :; an; : : : g и для
определенного m множество R всех m-арных отношений на E ; для данной
бескванторной формулы f (x) языка одного m-арного отношения и a из E по
определению hf (a)i обозначает множество отношений r из R , удовлетворяющих f (a) . Эти множества образуют базу открыто-замкнутых множеств топологии на R, которая называется топологией простой сходимости на m-арных
отношениях на E . Базу окрестностей отношения r образуют множества On (r) ,
где On (r) { множество отношений, имеющих то же ограничение на множество
fa0; : : :; an?1g , что и r .
Для любого конечного подмножества F E , через RF обозначим множество m-арных отношений на F , а через F { отображение-ограничение R на RF ;
и если F F 0, то обозначим через F 0F отображение-ограничение RF 0 на RF 0 .
Если мы снабдим множества RF дискретной топологией, то F 0F непрерывны,
и R становится проективным пределом фильтрующейся системы, образованной пространствами RF : следовательно, R { вполне несвязное компактное
пространство.
Если вы хотите почувствовать более "конкретно" этот проективный предел,
то можете доказать компактность R так: пусть i семейство замкнутых множеств, имеющее свойство конечных пересечений; вы хотите найти отношение,
принадлежащее всем i . Тогда можно предполагать, что каждое i имеет вид
hf (a)i, поскольку каждое замкнутое множество есть по определению пересечение множеств такого вида. Обозначим через n пересечение всех замкнутых
множеств среди i, имеющих вид hf (a1; : : :; an?1)i, т.е. тех которые затрагивают только первые n элементов E . Так как таких множеств только конечное
число и семейство обладает свойством конечного пересечения, то мы можем
найти отношение в каждом n , и далее требуется найти таковое, принадлежащее всем n . Заметим, что 1 2 n : : : и тот факт, что отношение
принадлежит n , зависит только от его ограничения на fa0; : : :; an?1g . Так как
существует лишь конечное число m-арных отношений на этом множестве, мы
можем построить индукцией по n последовательность rn m-арных отношений
таким образом, что
{ fa0; : : :; an?1g { носитель отношения rn ,
{ rn+1 расширение rn ,
{ для любого n0 n существует отношение из R , лежащее в n0 , ограничение которого на fa0; : : :; an?1g есть rn .
После этого, отношение r из R , ограничение которого на каждое fa0; : : :; an?1g
совпадает с rn , решает нашу проблему.
50
Глава 4
КОМПАКТНОСТЬ
Мы можем также предполагать, что множество E несчетно: множество
m-арных отношений на E с топологией простой сходимости все ещё остается
компактным, поскольку оно будет проективным пределом дискретных конечных пространств. Мы также можем ввести несколько символов отношений
(или одно мультиотношение) и даже бесконечное число символов вместо единственного m-арного символа: пространство реляционных структур на базе данной сигнатуры будет снова компактом относительно простой сходимости. Чтобы его выразить как проективный предел дискретных конечных пространств,
нужно рассмотреть конечные ограничения обеднений этих мультиотношений
на конечный язык (поскольку в формулу входит всегда лишь конечное число
символов отношений).
Ещё одна предупреждение : мы систематически интерпретировали символ
= как настоящее равенство; теперь, мы собираемся временно, для доказательства следующей теоремы, рассматривать его как обычное бинарное отношение
(если быть последовательным, следовало бы его обозначить по другому). Предположим, что язык содержит только символы констант и отношений; равенство
удовлетворяет следующим аксиомам
(8x)x = x; (8x)(8y)(x = y ! y = x); (8x)(8y)8z)(x = y ^ y = z ! x = z)
и для каждого символа отношения r :
(8x1) : : : (8xn)(8y1) : : : (8yn)(^ xi = yi ! (r(x1; : : : ; xn) ! r(y1; : : :; yn))) :
Обратно, если отношение = удовлетворяет этим аксиомам в структуре S ,
каждое отношение "переносится на фактор-систему" и S= = становится структурой, где = интерпретируется, как мы постоянно делали до сих пор, настоящим равенством.
Теорема 4.15 (компактность для бескванторных предложений) Для
того, чтобы множество A предложений без кванторов в языке, состоящем из
символов констант и отношений и без функциональных символов, имело модель (где символ = интерпретируется, как обычно, настоящим равенством)
достаточно, чтобы каждая конечная часть A имела модель.
Доказательство. Пусть E { множество констант языка L; замыкание про-
странства мультиотношений на E арностей, соответствующих арностям символов отношений из L , включая символ = , который определяется формулами
a = a; a = b ! b = a; a = b ^ b = c ! a = c ;
(a1 = b1 ^ ^ an = bn ! (r(a1; : : :; an) ! r(b1; : : : ; bn)) ;
где a; b; c пробегают все E и где r { символ отношения из L , компактно.
Эта теорема 4.15 очевидно, следствие теоремы 4.4, мы здесь её рассматриваем как один из этапов в доказательстве теоремы 4.4.
4.c
51
Метод Генкина
Теперь мы приступаем к методу Генкина; рассмотрим счетный чисто реляционный язык L (т.е. без символов констант и функций; мы всегда можем
свести нашу проблему к такому языку) и множество A предложений L , совместность которого мы хотим проверить.
К этому языку L , мы сначала добавим счетное число константных символов aij , индексированных парой натуральных чисел i; j . Для каждого натурального j обозначим через Ej множество fa0j ; a1j ; : : :; aij ; : : : g. Формул вида
f (a; x), где f (y; x) 2 L, с одной свободной переменной x , с параметрами a из E0 ,
счетное число: мы их пронумеруем f0; f1; : : : ; fi; : : : и каждой из них инъективным образом ставим в соответствие один элемент, называемый его свидетелем,
из множества E1: свидетелем f0 будет a01; : : : , свидетелем fi будет ai1 и т.д.
Затем мы пронумеруем все новые, т.е. не имеющие ещё свидетелей, формулы с параметрами из E0 [ E1 и для каждой из них, как и раньше, определяем
свидетеля из E2; продолжая таким же образом для каждой новой формулы с
одной свободной переменной и с параметрами в E0 [ E1 [ [ En?1 инъективно
определяем свидетеля, лежащего во множестве констант En. Нумерация формул произвольна; важно, что все формулы нумеруются так, чтобы определение
свидетелей было корректным; в итоге, каждая формула f (a; x) с параметрами
a из E = E0 [ E1 [ [ En : : : имеет свидетеля из E .
Для данной L-структуры S с конечным или счетным носителем назовем
нумерацией Генкина структуры S отображение E в носитель S , такое, что (мы
отождествляем aij с его образом в S ) :
{ каждый элемент носителя S имеет вид aij ,
{ если S ` (9x)f (a; x) , тогда S ` f (a; af (a;x)) , где af (a;x) { свидетель формулы f (a; x) .
Лемма 4.16 Каждая непустая, конечная или счетная L-структура имеет
нумерацию Генкина.
Доказательство. Мы начнем с нумерации базы структуры S списком
fa00; a10; : : : ; ai0; : : : g (если S конечно, то бесконечно повторяем последний элемент) ; затем берем в качестве ai1 элемент, удовлетворяющий fi(x) , если таковой существует, иначе { произвольный элемент; и т.д. продолжаем.
Заметим, что в определении нумерации Генкина мы не требуем, чтобы каждый элемент структуры имел вид ai0 ! Кроме констант E , мы также добавим
для каждой формулы f (x) языка L символ отношения, который мы обозначим f H (x) , арность которого совпадает с числом свободных переменных в f ;
если f { предложение, то F H { символ нульарного отношения (смотри главу
3). Чтобы упростить нашу жизнь, мы рассмотрим лишь формулы, не содержащие квантор 8; это совсем не сужает выразительные возможности нашего
языка, поскольку мы можем везде заменить 8 на :9:. Мы обозначим через
LH язык, полученный добавлением к языку L констант из E и символов отношений f H (x).
Обозначим через T (H ) следующее множество бескванторных предложений
языка LH , где a и b { произвольные кортежи элементов E :
Глава 4
52
КОМПАКТНОСТЬ
если f (x) { атомная, то f (a) $ f H (a) ,
если f и g { формулы из L , то (f ^ g)H (a) $ f H (a) ^ gH (a) ,
если f { формула из L , то (:f )H (a) $ :f H (a) ,
если f (y) { формула из L , имеющая вид (9x)g(y; x), то
f H (a) $ gH (a; ag(a;x)) , где ag(a;x) { свидетель формулы g(a; x) ,
{ для всех формул f (y; x) языка L , f H (a; b) ! f H (a; af (a;x)) , где af (a;x) {
свидетель формулы f (a; x) .
{
{
{
{
Теорема 4.17 Множество предложений f: : : ; fi; : : : g языка L имеет непустую модель тогда и только тогда, когда T (H ) [ f: : :; fiH ; : : : g совместно.
Доказательство. Предположим сначала, что множество f: : : ; fi; : : : g име-
ет непустую модель; по теореме Левенгейма 3.1, доказательство которой не
использует теорему компактности, так как язык L счетен, оно имеет конечную
или счетную модель : проинтерпретируем aij с помощью нумерации Генкина
этой модели и f H как множество кортежей, удовлетворяющих f H , в частности, это означает, что если f { предложение, то f H интерпретируется как
"истина", если f истинна на M , и как "ложь", в противном случае; нетрудно
видеть, что таким образом мы получаем модель для T (H ) [ f: : :; fiH ; : : : g .
Обратно, рассмотрим модель N для T (H ) [ f: : :; fiH ; : : : g ; в этой модели
возможно существуют элементы, не имеющие вид aij : пусть M { ограничение
N на множество всех aij ; M также модель T (H ) [ f: : : ; fiH ; : : : g , поскольку
все эти предложения { бескванторные. Теперь я оставляю читателю проверку
индукцией по сложности формул того, что для любой f (x) из L
M ` (8x)(f (x) $ f H (x)) ;
нужно использовать только тот факт, что M { модель для T (H ) , пронумерованная сюръективно константами aij : он поймет дальше, что aij образуют
нумерацию Генкина для M ! В частности, M ` fiH $ fi , и поскольку на M
истинны все fiH , то обеднение M на L будет (непустой!) моделью для всех fi .
Теорема 4.17 была доказана при предположении, что L счетен; для её доказательства при jLj = { > ! , достаточно усовершенствовать конструкцию
Генкина, введя { символов констант в каждое множество E0; : : : ; En; : : : .
Доказательство теоремы компактности методом Генкина. Итак, пусть
A { множество аксиом в языке L , каждая конечная часть которого имеет модель; начнем с разбора случая пустых моделей, прося Всевышнего не оставлять
больше на нашем пути это изобретение Дьявола. Для этого, добавим к нашему языку константный символ c и переделаем все предложения из A таким
образом: заменим каждый квантор 9x на (9x)(x 6= c)^ и каждый квантор 8x
на (8x)(x = c)_ ; пусть f 0 { предложение, полученное таким образом из f ; f 0
выражает просто-напросто, что элементы, отличные от c , образуют структуру, удовлетворяющую f : модель для f 0 получается из модели f добавлением
4.d
Исторические и библиографические примечания
53
точки c, а модель f получается из модели для f 0 стиранием этой точки. Таким
образом, мы видим, что A имеет модель () множество A0 формул f 0 имеет
модель, которая обязательно непуста!
Необходима ещё одна манипуляция, чисто метафизический характер которой знаком опытному читателю: мы можем заменить все символы функций
из L на их графики, являющиеся символами отношений, добавив аксиомы о
том, что они графики функций; также мы можем заменить константы из L
как и c , унарными предикатами вместе с аксиомами, выражающими, что они
удовлетворяются единственными элементами! В итоге мы получим множество
A00 предложений в чисто реляционном языке, любая конечная часть которого
имеет непустую модель.
Применяя теорему 4.17 , мы видим, что каждая конечная часть множества
предложений T (H ) [ (A00)H имеет модель, значит, по 4.15 это { совместная
теория и снова по 4.17 A00 совместно и, значит, A также совместно.
4.d Исторические и библиографические
примечания
Применения фильтров и ультрафильтров в топологии введены Анри Картаном [КАРТАН, 1937, 1937a] ; аксиома ультрафильтра была выведена из аксиомы выбора Тарским [ТАРСКИЙ, 1930]. Построение ультрапроизведений в
общем объеме принадлежит Лосю [ЛОСЬ, 1955]; он там доказал теорему, носящую теперь его имя. Однако известно несколько спорадических применений
ультрапроизведений до него, в частности [СКОЛЕМ, 1934], где ультрастепень,
ограниченная определимыми объектами, нашла применение для построения
нестандартной модели арифметики.
Теорема об изоморфных ультрастепенях была сильно поранена в [КЕЙСЛЕР,
1964]; завершающий укол был нанесен в [ШЕЛАХ, 1971a ].
Для введения в теорию моделей через ультрапроизведения я рекомендую
[БЕЛЛ-СЛОМСОН, 1969]. Теорема компактности под видом 4.5 и 4.6 принадлежит Геделю [ГЁДЕЛЬ, 1930]; в действительности, как я уже объяснил в начале
раздела 4.c, для Геделя эта теорема была простым следствием (можно даже
сказать: неожиданным следствием, в некотором роде { любопытным замечанием) его "теоремы полноты" логики, где он доказал, что конечная система правил вывода достаточна для выражения понятия следствия (смотрите главу 7).
Это можно было точно так же извлечь из [ЭРБРАН, 1928] или из [ГЕНЦЕН, 1934],
где были доказаны результаты той же природы.
Эта бедная теорема компактности вошла через маленькую дверь, и кажется, эта оригинальная скромность всё ещё причиняет ей вред в учебниках по
логике. По моему мнению, этот результат намного существеннее и первичнее
(и значит, также менее изощреннее), чем теорема полноты Геделя, подтверждающая, что можно формализовать вывод в некотором смысле как в арифметике;
выводить её из теоремы полноты { это методическая ошибка.
Если так поступают, то это из-за слепой верности историческим услови-
54
Глава 4
КОМПАКТНОСТЬ
ям, в которых она родилась; эта тяжесть традиций чувствуется даже в книге
[ЧЭН-КЕЙСЛЕР, 1973], которая рассматривалась в 70-е годы как библия теории
моделей; она начинается синтаксическими исследованиями, не имеющими ничего общего с тем, что излагается в следующих главах. Этот подход { выводить
компактность из возможности аксиоматизировать понятие вывода, как только
применяется к исчислению высказываний, дает самое странное доказательство
компактности 2! !
Такой подход, несомненно, более "логичен", но он имеет неудобство в том,
что сначала заставляют студента проглотить систему формального вывода,
в конечном счете достаточно произвольную, которую можно будет оправдать
лишь после, показав, что он действительно представляет семантическое следствие. Не забывайте, что формализмы имеют право на жизнь только при адекватном представлении главных понятий.
Теорема Левенгейма-Сколема 4.10, очень неудачно названа; приведенной
здесь полной версией она обязана Тарскому (смотрите [ТАРСКИЙ-ВОТ, 1957];
несомненно это не самая первая ссылка). Как я объяснил в замечании к главе 2, теоремы Левенгейма 2.5 и 3.1 могут законно носить имя ЛевенгеймаСколема: некоторые говорят в этом случае о теореме Левенгейма-Сколема
"вниз".
Вклад Тарского заключается в поднятии мощности, в построении произвольно больших моделей. Поэтому иногда это утверждение называют теоремой
Левенгейма-Сколема "вверх". Легенда гласит, что Торальф Сколем до конца
своей жизни возмущался связью своего имени с утверждениями такого рода,
рассматривая их как чушь, поскольку по его мнению несчетные множества
были реально несуществующими фикциями.
Понятие диаграммы систематически использовалось Абрахамом Робинсоном [РОБИНСОН, 1963].
Метод Генкина, заключающийся в построении моделей из констант, уточняя шаг за шагом отношение выполнимости среди них, появился в [ГЕНКИН,
1949].
Глава 5
Челночный метод в
! -насыщенных моделях
Le mechant go^ut du siecle en cela me fait peur;
Nos peres, tous grossiers,l'avaient beacoup meilleur
Et je prise bien moins tout ce que l'on admire
Qu'une vieille chanson que je m'en vais vous dire :
: : : :: : : : : : :: : : : : :: : : : : : :: : : : : : :: : : : : : :: : : : : :: : :
La rime n'est pas riche et le style en est vieux :
Mais ne voyez-vous pas que cela vaut bien mieux
Que ces colichets : : :
J.B. P.
5.a Пространство типов : : : : : : : : : : : : : : : : : : : : 56
5.b !-насыщенные модели : : : : : : : : : : : : : : : : : 57
5.c Элиминация кванторов : : : : : : : : : : : : : : : : 60
5.d Исторические и библиографические примечания : : : : : : : : : : : : : 64
55
56
Глава 5
ЧЕЛНОЧНЫЙ МЕТОД
5.a Пространство типов
Два элемента a и b в L-структурах (т.е. в структурах того же типа подобия,
что и L ) имеют одинаковый тип, если удовлетворяют одинаковым формулам
f (x) из L ; тип элемента a по определению есть множество pa формул f (x),
которым он удовлетворяет. Что такое тип, если не полная теория в языке
L(x) , полученная добавлением к L символа константы x ? Для удобства, мы
обозначаем здесь этот константный символ как переменную.
Для данного языка L назовём пространством S0 всех 0-типов (подразумевается, языка L) пространство J полных теорий в языке L ; пространство S1
всех 1-типов совпадает с пространством полных теорий в языке L [ fxg ; базой
открытых множеств являются множества hf (x)i всех типов p , содержащих
f (x) , где f (x) { формула самое большее с одной свободной переменной x языка L . Мы определяем таким же образом множество Sn всех n-типов или типов
n-ок, как множество полных теорий в L [ fx1; : : :; xng . Можно даже определить пространство SI всех I -типов для бесконечного множества I , введя новый
константный символ xi, называемый "переменной типа", для каждого элемента i из I ; как мы уже видели в 4.b, все эти пространства { вполне несвязные
компакты.
Договоримся, что когда мы говорим "тип", не уточняя какой, то мы под ним
подразумеваем 1-тип; и очень часто мы ограничиваемся приведением результатов для 1-типов, которые без труда обобщаются на n-типы и даже I -типы. Если
T { теория, то обозначим через S1(T ); : : :; Sn(T ); : : : множество типов элементов и n-ок из моделей T ; так как эти типы { те, что удовлетворяют аксиомам
T , множество Sn (T ) замкнуто в Sn , значит, это { компакт. Мы используем это
обозначение особенно тогда, когда T полна, и в этом случае S0(T ) сводится к
одной единственной точке.
Для данной полной теории T назовем множеством параметров подмножество A модели M для T ; то что важно в этом понятии { это не столько
множество A , а сколько формулы, которые удовлетворяются в M его элементами. Выделяем каждый элемент A константным символом и обозначим
через T (A) множество предложений таким образом обогащенного языка L(A) ,
истинных в M ; множество параметров задается, более точно, через T (A) , а не
только лишь через A . Мы видим, что если N { элементарное расширение M
и A { подмножество M , множество параметров A , рассматриваемое с точки
зрения M , остается таковым без изменения с точки зрения N .
Для данной формулы f (x; y) языка L для T и a в A выражение f (x; a) называется формулой с параметрами в A ; это не что иное как формула языка
L(A) . Теперь мы назовем типом над A полную теорию в языке L(A) [ fxg,
содержащую T (A). Два элемента имеют одинаковый тип над A , если они
удовлетворяют одним и тем же формулам с параметрами из A : они в определенном смысле расположены одинаково по отношению к A.
Мы обозначим через S1(T (A)) или просто S1(A), если теория T ясна из
контекста, множество типов над A. Оно снабжается, как обычно, топологией
заданной с помощью формул, база открытых множеств которой состоит из
5.b
!-насыщенные модели
57
множеств вида hf (x; a)i = fp : p ` f (x; a)g , которая превращает его во вполне
несвязный компакт. Таким же образом определяются пространства Sn (A) и
SI (A) . В этом контексте, когда T полна, Sn (T ) становится Sn(;) : говорят, что
это { типы без параметров. Ещё их называют чистыми, или абсолютными
типами.
Если A { подмножество модели M полной теории T , и если p из S1(A),
то говорят, что p реализуется в M или ещё M реализует p , если в M существует элемент типа p ; иначе говорят, что M опускает p. По определению
тип совместен, если он реализуется некоторым элементом x в модели N для
T (A). Поскольку эта последняя теория полна в языке L(A) , по лемме 4.11
структуры M и N имеют общее элементарное расширение в языке L(A) (т.е. A
интерпретируется одинаково в этих трех структурах), так что каждый тип p
из S1(A) в конце концов реализуется в некотором элементарном расширении
M ; но естественно, если M не достаточно богата элементами, он может быть
опущен в M .
Мы также используем, к сожалению, поскольку это может привести к путанице, слово реализовано в абсолютном смысле. Скажем, что тип p 2 S1(A)
реализован, если он реализован в A , т.е. если он тип элемента a из A или он
содержит формулу x = a .
Как понять для данного подмножества A модели M полной теории T , что
некоторое множество формул с параметрами из A есть тип, т.е. совместно и
полно ? Деликатным является особенно первое свойство: множество формул
p с параметрами из A совместно тогда и только тогда, когда каждое конечное подмножество p реализуется некоторым элементом в M ; на самом
деле по компактности достаточно проверить, что каждый конечный фрагмент
ff1(x; a); : : : ; fn(x; a)g совместен, т.е. реализуется в некотором элементарном
расширении M . Это означает, что T (A) вместе с (9x)(f1(x; a) ^ ^ fn (x; a)) совместна, и поскольку последнее предложение принадлежит L(A) , "константа"
x там заквантована, оно принадлежит полной теории T (A) в L(A) , значит, оно
истинно в M , являющейся моделью T (A) , и существует x в M , удовлетворяющий этим формулам f1(x; a); : : :; fn (x; a) . На языке топологии это звучит так:
если A { множество параметров из модели M полной теории T , то типы из
S1(A), реализующиеся в M , образуют плотное подмножество S1(A). Действительно, если hf (x; a)i { окрестность типа p , то эта формула удовлетворяется
некоторым элементом из M , тип которого лежит в этой окрестности.
5.b
! -насыщенные модели
Модель M полной теории T называется !-насыщенной (мы увидим позднее
более общее определение {-насыщенной модели в главе 9), если для любого
конечного подмножества a (которое мы обозначим как кортеж) в M , каждый
тип из S1(a) реализуется в M . Интерес к !-насыщенным моделям объясняется
следующими двумя теоремами :
58
Глава 5
ЧЕЛНОЧНЫЙ МЕТОД
Теорема 5.1 Каждая структура обладает !-насыщенным элементарным расширением.
Доказательство. Для каждого p из S1(a) , где a { конечное подмножество
M , существует элементарное расширение Mp модели M , реализующее p; по
теореме об общем элементарном расширении 4.14, примененной к теории T (M )
(для того, чтобы образ M при каждом таком расширении был одним и тем же),
все эти Mp элементарно вкладываются в одно расширение M1 для M , которое
реализует таким образом все типы над конечными подмножествами M . Повторяя процесс, получаем последовательность M M1 Mn Mn+1 : : :
элементарных расширений, такую, что каждый тип над конечным подмножеством Mn реализуется в Mn+1 . Тогда предел N этой последовательности расширений !-насыщен.
Теорема 5.2 Если две !-насыщенные структуры M и N элементарно эквивалентны, то они 1-эквивалентны: более точно, два кортежа одного типа
(над ; ), один в M , а другой в N , соответствуют друг другу при бесконечном
"челноке".
Доказательство. Пусть a из M , b из N одного типа; добавим например,
из M и пусть p тип над a , (т.е. тип p из S1(a) , который реализует );
рассмотрим множество q формул с параметрами из b, полученное заменой a
на b в каждой формуле f (x; a) из p ; q совместно : действительно, если f (x; a)
конечный фрагмент p , то M ` (9x)f (x; a) и, значит, поскольку a; b одного
типа, N ` (9x)f (x; b), и каждый конечный фрагмент q совместен. Кроме того,
поскольку q содержит f (x; b) или :f (x; b) для любой формулы f (x; b), q { тип
над b. Так как N !-насыщенна, этот тип реализуется некоторым элементом
из N , и a_ и b_ , удовлетворяющие одним и тем же формулам, имеют
одинаковые типы над ; . Добавление одного элемента к b рассматривается
аналогично.
Замечание 1 Если M и N 1-эквивалентны и M !-насыщенна, то N также !-насыщенна.
Действительно, для любого b из N существует a из M такой, что (M; a)
и (N; b) 1-эквивалентны; значит, a и b одного типа. Пусть q из S1(b) и p {
множество формул, полученное заменой b на a в формулах из q : точно так же,
как в предыдущем доказательстве, p { тип, который реализуется некоторым
элементом из M ; существует в N такой, что a_ и b_ 1-эквивалентны,
значит, a_ и b_ одного типа над ;. Итак, реализует q .
Замечание 2 Если M !-насыщенна, то для любого a из M и любого p из
Sn(a) p реализуется в M .
Достаточно заметить, что реализовать тип пары (a1; a2) { значит реализовать тип a1 , потом тип a2 над a1 ; и дальше можно итерировать эту процедуру.
5.b
!-насыщенные модели
59
Значит, !-насыщенная модель реализует все абсолютные n-типы для каждого
n . Но это условие недостаточно для !-насыщенности модели. Например, возьмем в качестве T теорию дискретного порядка без концевых точек; без труда
можно понять, что M !-насыщенна () она имеет вид Z C , где C { плотный линейный порядок без концевых элементов, в то время как она реализует
все чистые n-типы () она имеет вид Z C , где C { бесконечный линейный
порядок.
Замечание 3 Если T { полная теория и M { её !-насыщенная модель, то
каждая счетная модель T элементарно вкладывается в M .
Действительно, если N = fa0; a1 : : :; an; : : :; g , то можем последовательно
реализовать в M тип a0 , потом тип a1 над a0; : : : , тип an+1 над fa0; : : :; an; g и
т. д.
Замечание 4 По теореме 1.14 две счетные, элементарно эквивалентные !насыщенные структуры изоморфны.
При каких условиях полная теория T допускает (единственную) счетную,
!-насыщенную модель ? Это имеет место тогда и только тогда, когда Sn (T )
конечно или счетно для любого n (здесь мы не предполагаем, что T счетна) .
В действительности, это условие ещё означает, что для любого a из модели
M для T множество S1(T ) счетно (поскольку b и c одного типа над a { значит
a_ b и a_ c одного типа над ;); оно очевидно необходимо, поскольку счетная
модель реализует лишь счетное число типов. Чтобы понять его достаточность,
переделаем доказательство теоремы 5.1 : пусть A1 { счетное подмножество M1,
реализующее все n-типы над ;; затем A2 { счетное подмножество M2 , реализующее все типы над конечными подмножествами A1 (это семейство типов на
самом деле счетно), и т.д. Положим A = [An; Так как A удовлетворяет тесту
Тарского 2.4, оно элементарное ограничение N ; значит, A { счетная модель T
и по построению она насыщенна.
Теперь, когда мы вернулись к локальным изоморфизмам, следует сделать
остановку и осмотреться, сделать что-то вроде отчета нашей предыдущей деятельности. Мы ввели элементарную эквивалентность между отношениями
через "челнок" Фраиссе, её проинтерпретировали в терминах выполнимости
формул, обобщили для структур, доказали её свойство компактности и теперь
возвращаемся к "челноку".
В теории моделей, часто сталкиваются с такой, по настоящему фундаментальной, проблемой : мы располагаем множеством T предложений и хотим доказать, что T { полная теория. Попытка описания классов p-эквивалентности,
подобная той, что мы делали в главе 1 для дискретных порядков, часто бывает
крайне сложной. В определенных случаях находят лишь достаточные условия для p-эквивалентности (которых хватает для решения, но это не слишком
просто и не очень полезно), и требуются ограничения для языка (отсутствие
функций, конечность языка).
Более удачен следующий подход: мы делаем предположение о том, какие должны быть типы, затем рассматриваем две модели M и N , которые
60
Глава 5
ЧЕЛНОЧНЫЙ МЕТОД
можно считать !-насыщенными благодаря теореме 5.1, берем a в M и b в N ,
удовлетворящими условиям эквивалентности, и постараемся установить бесконечный "челнок" между a и b : прибавим к a и пытаемся найти в N
такой, что a_ и b_ удовлетворяли бы нашему предположению. Тот факт,
что N !-насыщенна нужен для существования , поскольку мы только можем
доказать, что искомое условие которое нужно реализовать, конечно выполнимо в N . Если это срабатывает, то задача решена, иначе мы забыли какое-то
условие однотипности кортежей или T не полна.
Этот метод "челнока" будет проиллюстрирован в последующих главах.
Естественно, в каждом отдельном случае нужно проявить изобретательность,
чтобы установить "челнок", часто опираясь на факты алгебраической природы: теория моделей не занимается только очевидными проблемами! Но вы
будете удивлены обилием вещей, работающих по этой схеме : "челнок" не
только способ изощренного введения в логику, а напротив, эффективный метод, применяемый специалистами в теории моделей ежедневно.
5.c Элиминация кванторов
Очень часто в "челночном" методе выдвигается предположение о том, что
два кортежа одного типа () они удовлетворяют одним и тем же формулам
из множества F , откуда и происходит интерес к следующей теореме :
Теорема 5.3 Пусть F { непустое множество формул f (x) языка L (возмож-
но, неполной) теории T , имеющих свободные переменные x = (x1 ; : : :; xn), и
любые две n-ки из моделей T имеют одинаковый тип, как только они удовлетворяют одним и тем же формулам из F . Тогда для любой формулы g (x) из
L с этими же свободными переменными существует булева комбинация f (x)
формул из F такая, что T ` (8x)(f (x) $ g(x)) .
Замечание. Обратное утверждение очевидно.
Доказательство. Рассмотрим открыто-замкнутые множества hgi в Sn(T );
если hgi = ;, то hgi = hf ^ :f i, и если hgi = Sn (T ), то hgi = hf _ :f i, где f
{ произвольный элемент непустого F ; разобравшись с этими тривиальными
случаями, рассмотрим p в hgi и q вне его; так как p и q не удовлетворяют одним
и тем же формулам F , то p ` fp;q (x) и q ` :fp;q (x) , где fp;q { формула вида '
или :' для некоторой формулы ' из F .
Зафиксируем p и будем варьировать q ; формулы hfp;q i и h:gi образуют
замкнутое семейство с общим пустым пересечением; по компактности одно из
его конечных подсемейств имеет непустое пересечение; это означает, что для
некоторой формулы hp = fp;q1 ^ ^fp;qn имеем p 2 hhpi hgi . Теперь варьируя
p, получаем покрытие компакта hgi открытыми множествами hhpi и, значит,
конечное число среди них достаточно для этого покрытия; дизъюнкция таких
hp будет эквивалентной g относительно теории T .
5.c
Элиминация кванторов
61
В случае, когда для любого n > 0 можно брать в качестве F свободные
формулы, говорят, что теория T элиминирует кванторы или ещё допускает
элиминацию кванторов. Это означает, что выполняются следующие эквивалентные условия :
{ для каждой формулыf (x) , где x = (x1; : : : ; xn); n > 0 существует бескванторная формула g(x) такая, что T ` (8x)(f (x) $ g(x)) , ,
{ для любого n > 0 две n-ки из моделей T , удовлетворяющие одним и тем
же бескванторным формулам, имеют одинаковый тип.
Примерами теорий, допускающих элиминацию кванторов, служат : теория
бесконечного множества, теория одного отношения эквивалентности с бесконечным числом бесконечных классов, теория плотного линейного порядка без
концевых точек.
Некоторые пренебрегают условием n > 0 в определении элиминации кванторов и ещё требуют, чтобы каждое предложение было эквивалентно бескванторному предложению по модулю T . Это предполагает, естественно, что множество бескванторных предложений непусто, т.е. язык содержит константные
символы или символы нульарных отношений. Значит, в строгом смысле, они
не считают, что вышеприведенные три примера имеют элиминацию кванторов.
Другие допускают эту элиминацию, утверждая, что истинное предложение для
этих (полных) теорий эквивалентно формуле x = x, которая истинна для любой интерпретации x, в то время как ложное предложение эквивалентно x 6= x,
т.е. они допускают эквивалентность предложения и формулы с одной свободной переменной! Это всегда ставило в тупик автора этих строк (как быть, если
все модели пусты?) , который довольствуется вышеприведенным определением : я должен его придерживаться для корректности теорем, которые будут
доказаны по поводу элиминации кванторов.
Заметим, что в выше приведенных трех примерах нет бескванторных предложений и любые две 0-ки из моделей T , удовлетворяющие одним и тем же
бескванторным предложениям, имеют одинаковый тип : действительно, тип
0-ки из модели M есть не что иное, как теория M , а также, поскольку T полна, существует единственный тип 0-ки! (Смотрите уместное предостережение
" F непусто" в 5.3).
Также заметим, что если n > 0 (не будем ломать голову!) и если две
m + n-ки, удовлетворяющие одним и тем же бескванторным формулам, имеют
одинаковый тип, тогда то же самое верно и для n-ок, удовлетворяющих одним
и тем же бескванторным формулам. Действительно, если мы из n-ки a образуем (m + n)-ку a0, повторяя m раз её последний элемент, то понятно, поскольку
формула x = y бескванторна, что a и b удовлетворяют одним и тем же бескванторным формулам () a0 и b0 удовлетворяют одним и тем же бескванторным
формулам () a0 и b0 одного типа () a и b одного типа.
Существует канонический способ получения из теории T языке L теории T 0
в обогащенном языке L0, имеющую элиминацию кванторов. На самом деле мы
его уже использовали по поводу метода Генкина в 4.c. Язык L0 получается из L
добавлением нового символа отношения f 0(x) для каждой формулы f (x) языка
62
Глава 5
ЧЕЛНОЧНЫЙ МЕТОД
L и T 0 состоит из аксиом T и ещё из аксиом вида (8x)(f (x) $ f 0(x)) . Легко
видеть, что каждая модель T 0 , обедненная до L , дает модель T , а модель T
обогащается единственным образом до модели T 0 : модели T и модели T 0 { это
одно и то же, с точностью до языка.
Теория T 0 элиминирует кванторы, поскольку каждая формула g(x) языка
L0 эквивалентна формуле f (x) языка L (полученной заменой каждого f 0 на
f ), которая, в свою очередь, эквивалентна формуле f 0(x) , которая не имеет
кванторов. Таким образом, мы видим что расширение моделей T элементарно
тогда и только тогда, когда имеется расширение для соответствующих моделей
теории T 0. Так как все эти конструкции { канонические, то они представляют
лишь технический интерес.
Говорят, что теория модельно полна, если она обладает следующим свойством : если M и N { модели T и M { расширение N , то это расширение
элементарно. Модельно полная теория не обязательно полна; просто две не
элементарно эквивалентные модели не имеют общего расширения. Конечно,
если T элиминирует кванторы, то она модельно полна, поскольку выполнимость бескванторных формул сохраняется при расширениях!
Назовем две теории T1 и T2 одного и того же языка компаньонами, если
каждую модель одной из них можно вложить (необязательно элементарно!) в
некоторую модель другой теории; поймем что это означает :
Теорема 5.4 Две теории являются компаньонами тогда и только тогда, когда они обладают одними и теми же универсальными следствиями (предложение { универсальное, если оно имеет вид (8x1) : : : (8xn)f (x1; : : :; xn), где f {
бескванторная).
Доказательство. Универсальное предложение f , истинное в структуре,
истинно в любом её ограничении; если T1 ` f и существует модель T2 , не
выполняющая f , то она не может быть расширена до модели T1 .
Обратно, предположим что T1 и T2 имеют одинаковые универсальные следствия и пусть M1 { модель T1 ; выделим каждый элемент M1 с помощью нового константного символа и пусть D(M1) { множество бескванторных предложений этого нового языка истинных на M1 ; если D(M1 ) ` f (a1; : : :; an), то
T ` (9x)f (x), значит, (8x):f (x) не является следствием ни T1, ни T2, имеющей
те же универсальные следствия; значит существует модель M2 для T2 с b в
ней, такая, что M2 ` f (b) . По компактности это означает, что D(M1) [ T2
совместно, т.е. M1 вкладывается в некоторую модель T2 .
Теория T обладает, таким образом, минимальным компаньоном { тем, что
обозначается T8 и аксиоматизируется универсальными следствиями T . Это
позволяет думать, что терминология была выбрана неудачно : дальше будет
ещё хуже.
Говорят, что теория T 0 { модельный компаньон T если она её модельно
полный компаньон.
Теорема 5.5 Теория обладает самое большее одним модельным компаньоном.
5.d
63
Исторические и библиографические примечания
Доказательство. Пусть T1 и T2 { модельные компаньоны теории T : значит, они компаньоны (даже модельные компаньоны!). Пусть M1 { модель T1;
она вкладывается в модель N1 для T2 , которая вкладывается в модель M2 для
T1 и т.д. Получаем цепь M1 N1 M2 N2 : : : Mn Nn Mn+1 : : : ,
предел которой мы обозначим через P ; поскольку T1 (T2) модельно полна,
цепь Mn (Nn ) элементарна и P { элементарное расширение M1 (N1) . Следовательно, M1, как и P , { модель T2 ; по симметрии мы видим, что T1 и T2 имеют
одни и те же модели, т.е. T1 = T2 .
T0
Говорят, что теория модельное пополнение T , если она её модельный
компаньон и, кроме этого выполняется следующее условие: если M { модель
T , вложенная с одной стороны в модель M1 теории T 0, а с другой { в модель
M2 той же T 0, тогда кортеж a из M удовлетворяет одним и тем же формулам
в M1 и M2 .
Естественно, модельно полная теория является своим модельным пополнением; ясно что теория с элиминацией кванторов является модельным пополнением своего любого компаньона. Теория является модельным пополнением
любого своего компаньона () она модельное пополнение T8 { самого слабого
среди них.
Теорема 5.6 Модельное пополнение универсальной теории (т.е. аксиомати-
зируемой универсальными предложениями) допускает элиминацию кванторов.
Доказательство. Пусть a и b , удовлетворяющие одним и тем же бес-
кванторным формулам, взяты из моделей M1 и M2 этой теории T 0 , пусть N1 и
N2 { подструктуры, порожденные кортежами a и b соответственно в моделях
M1 и M2 : они будут изоморфными моделями T8 , т.е. T , значит их можно
рассматривать как два вложения одной и той же модели N теории T . По
определению модельного пополнения a в M1 и b в M2 удовлетворяют одним и
тем же предложениям, и значит они имеют одинаковый тип в T 0 .
Заметим, что теория плотного линейного порядка без концевых точек является без всякого сомнения модельным пополнением теории линейного порядка,
и она должна элиминировать кванторы!
Модельное пополнение является неисчерпаемой темой для болтунов в теории моделей, видящих здесь фундаментальный вклад логики в алгебру. Они
любят иллюстрировать свои изложения, всюду понемногу, всякими диаграммами со стрелками, как это делают работающие в теории категорий. Для них
выражение "элиминация кванторов" является заклинанием волшебной силы.
В их оправдание скажем, что систематическое изучение модельного компаньона, когда он существует, может быть объектом солидной теории. Здесь мы
довольствуемся несколькими теоремами практического интереса, доказанными в ходе настоящего изложения.
64
Глава 5
ЧЕЛНОЧНЫЙ МЕТОД
5.d Исторические и библиографические
примечания
Понятия типа и {-насыщенных моделей были разработаны в течение пятидесятых годов; первое систематическое изложение имеется в [МОРЛИ-ВОТ,
1962]. Термин "элиминация кванторов" принадлежит Тарскому [ТАРСКИЙ,
1935]. Понятия модельного пополнения и модельного компаньона идут от А.
Робинсона [РОБИНСОН, 1956a]
Глава 6
Иллюстрации челночного метода
Lors fu li conseils des barons telx que il se hebergeroient entre le palais de Blaquerne et le chastel Buimont, qui ere une aba^ie close de murs. Et lors furent
tendu li tref et li paveillon, et bien fu ere chose a regarder : que de Costantinoble, qui tenoit III liues de
front par devers la terre, ne pot tote l'ost assegier que
l'unes des portes. : : : Et mult estoient perillousement,
que onques par tant poi de gent ne furent assegie tant
de gent en nulle ville.
J. de V.
6.a Алгебраически замкнутые поля : : : : : : 66
6.b Дифференциально замкнутые поля : : 72
6.c Булевы алгебры : : : : : : : : : : : : : : : : : : : : : : : : 80
6.d Ультраметрические пространства : : : : : 87
6.e Модули, экзистенциально
замкнутые модули : : : : : : : : : : : : : : : : : : : : : 92
6.f Исторические и библиографические примечания : : : : : : : : : : : : 100
65
66
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Пять примеров этой главы иллюстрируют метод, описанный в предыдущей
главе; равным образом они служат как примеры для последующего материала
этого курса. Автор не утверждает, что это самые значительные или плодотворные применения теории моделей в алгебре, или в других ветвях математики, и
он признает, что выбрал именно те случаи, где "челночный" метод применим
особенно хорошо.
6.a Алгебраически замкнутые поля
Под полем мы понимаем структуру c двумя бинарными операциями сложения и умножения, содержащую выделенные элементы, обозначаемые через
0 и 1 , и с отображением "перехода к противоположному" (x 7! ?x). Таким
образом, язык поля (чудное выражение!) состоит из двух символов констант,
одного символа унарной функции и двух символов бинарных функций. Я оставляю читателю аксиоматизацию понятия поля в этом языке, не забывая аксиому 0 6= 1 ; отметим, что поскольку отображение x 7! x?1 не включено в язык,
подструктура поля не всегда будет полем, а кольцом.
Легко видеть, что каждому терму с переменными x1; : : :; xn соответствует
многочлен P (x1; : : :; xn) с целыми коэффициентами, который мы будем писать
без скобок, ненужных из-за законов ассоциативности. Атомная формула имеет вид P (x) = Q(x) , где P и Q { такие многочлены; её выгодно заменить на
P (x) ? Q(x) = 0 . Итак, атомные формулы имеют вид P (x) = 0 , по этой
причине их называют равенствами или тождествами, а их отрицания вида
P (x) 6= 0 { неравенствами. Следовательно, бескванторная формула является
булевой комбинацией равенств, которую можно представить в виде дизъюнкции конъюнкций равенств и неравенств; часто конъюнкцию равенств и неравенств называют системой равенств и неравенств.
Как известно каждому, отображение кольца Z целых чисел в поле K , которое n отображает на элемент 1 + 1 + + 1 поля K , где сумма состоит из n
единиц (можно обозначить этот элемент через n , символ n не вносится, честно
говоря, в язык полей, это сокращение для 1+1+ +1), является гомоморфизмом колец. Поскольку его образ { целостное кольцо, его ядро { простой идеал,
который равен либо f0g , в этом случае говорят, что K характеристики ноль,
либо pZ , где p { простое число, тогда говорят, что K характеристики p .
То, что K характеристики p , выражается единственной аксиомой p = 0;
тогда мы знаем, что K { расширение поля Fp из p элементов. Чтобы выразить, что K характеристики ноль, необходимо бесконечное число аксиом :
p 6= 0 для каждого p ; поскольку конечное число этих аксиом не влечет другие,
теория полей характеристики p не является конечно аксиоматизируемой (смотрите раздел 4.b) ; заметим, между прочим, что снова по компактности, если
предложение f теории полей имеет модели характеристики p для произвольно
больших p (т.е. для бесконечного множества p), то она имеет модель характеристики ноль. Если K характеристики ноль, то оно расширение Z , значит,
также расширение Q его поля частных.
Для данного поля k и двух элементов a и b из полей, расширяющих k ,
6.a
Алгебраически замкнутые поля
67
мы говорим, что a и b k-подобны, если поля k(a) и k(b) , порожденные ими,
изоморфны над k , т.е. существует изоморфизм, оставляющий k поточечно
неподвижным и переводящий a на b .
Как понять, что два элемента таковы ? Рассмотрим каноническую сюръекцию кольца k[x] многочленов от одной переменной x с коэффициентами из k
в кольцо k[a], порожденное k и a , состоящую в замене переменной x в каждом
многочлене на a , и её ядро Ia=k называется идеалом тождеств для a над k;
поскольку k[a] целостно, то это { простой идеал и, наоборот, если I { простой,
то он идеал тождеств образа x в k[x]=I , вложенного в своё поле частных.
Если два элемента подобны, то они обнуляют одни и те же уравнения; и Ia=k
определяет k[a] , изоморфное k[x]=Ia=k , а также поле частных k(a) кольца k[a].
Класс подобия, таким образом, это простой идеал: два элемента подобны
над k () они удовлетворяют одним и тем же уравнениям с коэффициентами
в k , или ещё одним и тем же свободным формулам с коэффициентами из k .
Кольцо k[x] евклидово и описание его идеалов { легкое, поскольку все они
главные :
{ если Ia=k = 0 , то говорят, что a трансцендентен над k; k[a] изоморфно
k[x] и k(a) изоморфно полю k(x) рациональных функций от одной переменной с коэффициентами в k ,
{ иначе Ia=k порождается неприводимым многочленом Pa=k { минимальным
многочленом a над k ; в этом случае говорят, что a алгебраичен над k , и
тогда k[a] = k(a) ' k[x]=Pa=k .
Также известно, что поле k называется алгебраически замкнутым, если
каждый многочлен от одной переменной отличный от константы и с коэффициентами из k имеет корень в k . Чтобы аксиоматизировать это понятие
требуется бесконечный список аксиом (одна аксиома для каждой возможной
степени многочлена) :
An (8y0) : : : (8yn?1)(9x)(xn + yn?1xn?1 + + y1x + y0 = 0):
(Естественно, xn { сокращение для x x x , означающего произведение
n x-ов: в нашем языке нет никакого символа для возведения в степень).
Упражнение 6.1 1) Для каждого p постройте алгебраически незамкнутое
поле характеристики p , удовлетворяющее A1; : : :; An (работайте в хорошо
известных алгебраических расширениях Fp ).
2) Докажите, что существует поле характеристики 0 с этими же свойствами.
Лемма 6.2 Алгебраически замкнутое поле бесконечно.
Доказательство. Многочлен (x ? a1) : : : (x ? an) + 1 не имеет корней в
списке fa1; : : :; ang
Лемма 6.3 Каждое поле имеет алгебраически замкнутое расширение.
68
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Доказательство. Пусть k { наше поле и K { расширение k и P (x) {
отличный от константы многочлен из k[x] ; если Q(x) { неприводимый делитель
P (x) в k[x] , то k[x]=Q { расширение k , в котором P (x) имеет корень.
После этого мы поступаем так: перенумеруем все многочлены P с коэффициентами из k ; неудобство для начинающих логиков, заключается в том,
что если k несчетно, то мы не сможем пронумеровать эти многочлены натуральными числами, для этого необходимы ординалы. Не будем задерживаться
на этом: начнем с добавления корня P0 , получим поле K0 , расширяющее k, в
котором P0 имеет корень; затем построим расширение K1 поля K0 , в котором
P1 имеет корень и т.д. Таким образом мы построим возрастающую последовательность K полей такую, что многочлен P имеет корень в K : пусть L1 есть
объединение всех K . Тогда L1 { поле, расширяющее k , в котором каждый
полином с коэффициентами из k и отличный от константы имеет корень. Если
вы в данный момент чувствуете аллергию к трансфинитным конструкциям,
предпочитая конечные рекуррентности, то для каждого конечного множества
F = fP1; : : :; Pn g многочленов из k[x] вы можете построить расширение LF поля k , где каждый Pi имеет корень; затем соображения компактности дадут
очевидное существование L1 .
Повторяя этот процесс, построим возрастающую цепь k = L0 L1 Ln Ln+1 : : : полей, такую, что каждый многочлен с коэффициентами из
Ln имеет корень в Ln+1 . Поле L = [Ln является алгебраически замкнутым.
Теорема 6.4 Теория алгебраически замкнутых полей допускает элиминацию
кванторов: она является модельным пополнением теории полей и также теории целостных колец. Теория алгебраически замкнутых полей данной характеристики полна.
Доказательство. Рассмотрим a и b в алгебраически замкнутых полях K
и L , удовлетворяющие одним и тем же формулам без кванторов; мы хотим
показать, что a и b одного типа; можно предполагать K и L !-насыщенными,
поскольку иначе, мы можем заменить K и L на их !-насыщенные элементарные расширения, которые будут также алгебраически замкнутыми, поскольку
это понятие { элементарное.
Теперь мы должны показать, что a и b 1-эквивалентны; заметим, что K
и L одной характеристики, так как предложения p = 0 и p 6= 0 бескванторные;
это означает, на самом деле, что кольца, порожденные a и b , как и поля k и h,
порожденные a и b , изоморфны (это { общий факт, что a и b удовлетворяют
одним и тем же свободным формулам () они порождают изоморфные структуры!). Добавим теперь для определенности элемент к a ; если алгебраичен
над k , то минимальный многочлен P (x) , преобразованный изоморфизмом переводящим a на b , станет неприводимым полиномом из h[x] , который имеет
корень в алгебраически замкнутом поле L, и k(); k( ) изоморфны.
Теперь, если трансцендентен над k, то мы должны доказать, что существует в L, трансцендентный над h; однако, многочлен степени n имеет не
более n корней в поле (поскольку, если a { корень P (x), то x ? a делит P (x)),
значит, если Q1(x); : : : ; Qs(x) 2 h[x], то в силу бесконечности L (лемма 6.2),
6.a
69
Алгебраически замкнутые поля
существует элемент в L , не являющийся корнем ни одного из этих многочленов; следовательно, множество всех формул Q(x) 6= 0 , для Q(x) 2 h[x] и
Q 6= 0, будучи конечно выполнимым в L , совместно с теорией поля L ; так как
L !-насыщенно и все параметры этих формул лежат в b , оно реализуется
некоторым элементом из L .
Итак, мы доказали, что теория T алгебраически замкнутых полей элиминирует кванторы; значит, она является модельным пополнением всех своих
компаньонов, в частности, теория T8 для T совпадает с теорией целостных колец; действительно, с одной стороны, все её аксиомы универсальны, с другой
стороны, каждое целостное кольцо погружается в алгебраически замкнутое
поле (теория полей в языке (0; 1; ?; +; ) не универсальна: чтобы выразить существование обратного элемента необходима 89-аксиома ) .
Для последнего пункта, ; удовлетворяет одним и тем же предложениям
без кванторов в K и L () оно порождает в K и L изоморфные подструктуры;
это имеет место () характеристики K и L совпадают.
Замечание.
1
Мы имеем пример неполной теории, элиминирующей кванторы; это вызывает необходимость присутствия в языке константных символов
или 0-арных отношений, поскольку иначе кортежи ; в двух L-структурах удовлетворяют одним и тем же бескванторным предложениям (или ещё : порождают изоморфные подструктуры) .
2 Так как элиминация кванторов только лишь вопрос языка, нужно быть
очень точным когда речь идет о языке, служащим аксиоматизации интересующих нас структур: здесь им был (0; 1; ?; +; ) ; мы видим, что язык (+; )
достаточен для аксиоматизации понятия алгебраически замкнутого поля, так
как 0 и 1 определяются формулами с помощью сложения и умножения, но не
для элиминации кванторов. Если, в противоположность этому, мы добавим к
(0; 1; ?; +; ) символ унарной функции i для отображения переводящего 0 на 0,
а любой отличный от нуля элемент на его обратный, то этим модифицируем понятие подструктуры (которая теперь становится подполем, а не подкольцом),
но мы не вводим в действительности новых формул без квантора, поскольку
отношение y = i(x) определяется в языке (0; 1; ?; +; ) следующей формулой
без квантора x = y = 0 _ xy = 1 .
Как непосредственное следствие теоремы 6.4 получаем следующую фундаментальную теорему алгебраической геометрии:
Теорема 6.5 (Гильберта о нулях) Если (конечная!) система S равенств
и неравенств от многих переменных x1 ; : : :; xn с коэффициентами из поля k
имеет решение в некотором поле K , расширяющем k , то она имеет решение
в произвольном алгебраически замкнутом расширении k .
Доказательство. Пусть L { алгебраически замкнутое поле, содержащее
k, и K1 { алгебраически замкнутое расширение K . Имеем K1 ` (9x)S (x) и это
последнее предложение имеет параметры только из k , поэтому по свойству
модельного пополнения L ` (9x)S (x) .
70
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Замечание. Определение алгебраически замкнутого поля { это практически
теорема о нулях для системы от одной переменной.
Хорошо известно, что поле k имеет минимальное алгебраически замкнутое
расширение { его алгебраическое замыкание, которое единственно с точностью
до k-изоморфизма; мы собираемся доказать этот результат, обобщая его в рамках теории моделей.
Пусть A { множество параметров из модели M полной теории T ; элемент
a из M называется алгебраическим над A , если существует формула f (x) с
параметрами из A , выполняющаяся на a и, которая удовлетворяется лишь
конечным числом элементов из M (говорят, что формула f (x) алгебраизирует a ) . Например, если a лежит в A , то формула x = a её алгебраизует.
Если A; B M , то говорят, что B алгебраично над A , если каждый элемент
B алгебраичен над A ; наконец, если все элементы M , алгебраичные над A ,
принадлежат A , то говорят, что A алгебраически замкнуто в M . (Будьте осторожны: некоторые горе-специалисты теории моделей используют этот термин
в совершенно другом смысле в связи с модельным пополнением.)
Лемма 6.6 Если A B C M; B алгебраично над A и C алгебраично
над B , то C алгебраично над A .
Доказательство. Пусть c из C и f (x; b1; : : : ; bm) { формула с параметрами из B , алгебраизирующая c над B и имеющая только n решений в M , и
f1(y); : : :; fm(y) { формулы с параметрами из A , алгебраизирующие соответственно b1; : : :; bm над A. Тогда формула
(9y ) : : : (9y )(f (y ) ^ : : :fm(ym) ^
VV x 6= x 1 ^ VV fm(x ;1y ;1: : : ; y ))))
алгеf (x; y1; : : :; ym) ^ :((9x0) : : : (9xn)(0i<j
i 1
m
j
0in
n i
браизирует c над A .
Одним из следствий леммы 6.6 является то, что множество AM элементов
из M , алгебраических над A , алгебраически замкнуто в M : это { самое
маленькое алгебраически замкнутое надмножество A, и единственное такое,
алгебраичное над A. Оно называется алгебраическим замыканием A в M .
На самом деле оно не зависит от модели M , что позволяет определить
понятие алгебраического замыкания A множества A без упоминания M ; действительно, пусть N { другая модель T , содержащая A , т.е. модель T (A) .
Как модели теории T (A) M и N имеют общее элементарное расширение P ;
если f { алгебраическая формула с параметрами в A , то тот факт, что существует n элементов удовлетворяющих f , записывается одним предложением,
истинным как в M , так и в P ; это влечет, что все такие элементы лежат уже
в M и нет нового в P . Значит, AP = AM и по той же причине AP = AN .
Если сказать больше, то элементарные вложения M и N в P индуцируют
биекцию s между AM и AN , которая кроме того сохраняет выполнимость
формул: если a 2 AM , то M ` g(a) () N ` g(sa) .
Предположим теперь, что T { теория алгебраически замкнутых полей данной характеристики. Тогда имеет место исключительный факт : для любого
A M (M { модель T , значит, алгебраически замкнутое поле) A само является моделью T , т.е. алгебраически замкнутым полем (обратите внимание на
игру слов!) .
6.b
Дифференциально замкнутые поля
71
Действительно, a + b; a; b; 0; 1; ?a; a?1 алгебраичны над fa; bg, значит, A {
поле; и если P { отличный от константы многочлен из A[x] , он имеет корень в M , являющейся моделью T , и поскольку a алгебраизируется над A
формулой P (x) = 0 , то он лежит в A ; таким образом, это последнее множество { по-настоящему алгебраически замкнутое (в алгебраическом смысле, а
не теоретико-модельном!) поле, т.е. модель T .
Множество A есть то, что называется простой моделью над A : для любой
модели M теории T , содержащей A , существует (элементарное) вложение A
в M . Она имеет дополнительное свойство, что все вложения A имеют один
и тот же образ AM . Это, очевидно, единственная модель, содержащая A и
имеющая данное свойство простоты, поскольку, если A K ( A , то K не
может быть алгебраически замкнутым полем (иначе расширение K A было
бы элементарным и AK = A ).
Поскольку вы знаете зачатки теории полей, а может быть больше, вы определенно удивились непосредственной манере, с которой теоретик моделей берется за проблему : мы смогли развернуть панораму теории алгебраически
замкнутых не говоря о степени трансцендентности, о базе трансцендентности
расширения поля. Естественно, в последующем изложении мы предполагаем,
что вы хорошо знакомы с этими понятиями: если здесь у вас пробелы в знании,
то загляните в ближайший учебник по элементарной алгебре1 .
Кстати, что за пространства типов будут соответствовать теории алгебраически замкнутых полей данной характеристики ? Возьмем в качестве параметров поле K (поскольку, если K { поле, порожденное A , то Sn (K ) и Sn (A)
идентичны). Тогда Sn(K ) { множество простых идеалов кольца K [x1; : : : ; xn]
многочленов от n переменных, снабженное топологией, порожденной базой
открыто-замкнутых множеств вида hP (x) = 0i = fI : I ` P = 0g = fI : P 2 I g.
Это { то, что геометры называют конструктивной топологией
Геометры, утонченность которых общеизвестна, работают в топологии Зарисского Zn (K ), определенной на том же множестве простых идеалов, база
замкнутых множеств которой образована из hP (x) = 0i , а база открытых
множеств { из hP (x) 6= 0i . Это не сепарабельное пространство, нетерово (каждая убывающая цепь замкнутых множеств стабилизируется), с немножко
необычными свойствами. И естественно, поскольку топология Zn(K ) слабее,
чем Sn(K ), теоремы, доказанные по поводу Zn (K ) , более тонкие и более специфичные, чем теоремы о Sn (K ) .
Теоретики моделей, как люди скромные, предпочитают работать во вполне
несвязном компакте, в самых симпатичных среди топологических пространств,
после конечных дискретных пространств.
Упражнение 6.7 Формализуйте теорию T алгебраически замкнутых полей
в языке (0; 1; +; ) и докажите, что она имеет элиминацию кванторов. Какой
будет будет теория T8 ?
1
имеется ввиду учебник алгебры для 1-го и 2-го курса университетов
72
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
6.b Дифференциально замкнутые поля
Когда Галуа говорил о корнях уравнения, он имел ввиду комплексные числа, и только спустя долгое время после него алгебраисты начали рассматривать другие поля кроме подполей C : сама природа очень любезно предоставила
в распоряжение математиков алгебраически замкнутое поле. (Я не хочу сказать, что это поле было дано математикам изначально, какое-то время они потратили на понимание "мнимых решений" их уравнений, а хочу лишь сказать,
что они знали его даже до возникновения понятия алгебраически замкнутого
поля.) Но когда речь шла в конце предыдущего столетия о построении теории аналогичной теории Галуа, но касательно дифференциальных уравнений,
натолкнулись на следующую проблему: какую область следует выбрать для
того, чтобы иметь достаточно решений для дифференциальных уравнений ?
Вот это важный вклад теории моделей в алгебру, так как она сумела ответить
на этот вопрос понятием дифференциально замкнутого поля, которое является для дифференциальных уравнений тем же, что алгебраически замкнутые
поля для алгебраических уравнений, т.е. область, где дифференциальное уравнение имеет столько решений сколько можно от них ожидать. Не существует
естественного примера дифференциально замкнутых полей.
Пусть A { коммутативное кольцо; производная { это отображение d множества A в себя, такое, что для любых x; y из A справедливо
d(x + y) = dx + dy; d(xy) = xdy + ydx
Дифференциальное кольцо { это кольцо с производной; если оно является
полем, то говорят о дифференциальном поле. Элементы с нулевой производной
называются константами; они образуют подкольцо A , которое будет полем,
если A поле (и в частности, d1 = 0 ) . Легко проверить, что если A { целостное
кольцо, то любая производная A продолжается единственным образом на его
поле частных по правилу d(x=y) = (ydx ? xdy)=y2 .
Язык дифференциальных полей это язык поля, обогащенный одним символом унарной функции для обозначения производной : (0; 1; ?; d; +; ) . Однако, обычно обозначают dx через x0 , d(dx) через x00; : : :; d(d(: : : (dx) : : : )) через
x(n) , где n { кратность дифференцирования.
Примеры дифференциальных полей :
{ если K { поле, то его превращают в поле констант, полагая производную
тождественным нулем,
{ если K { поле, то снабжают K (x) формальной производной @R(x)=@x
рациональных функций,
{ поле формальных серий K ((x)) с его обычной производной,
{ поле мероморфных функций над связной открытой областью комплексной плоскости.
6.b
Дифференциально замкнутые поля
73
Начиная с этого места, мы рассматриваем только дифференциальные поля характеристики нуль.
Для данного дифференциального поля K мы определяем дифференциальное кольцо K [x]d дифференциальных многочленов от одной переменной с коэффициентами из поля K следующим образом. Как кольцо оно кольцо
K [x; x0; x00; : : :; x(n); : : : ] с бесконечным числом переменных, которые обозначаем так: x = x(0); x0 = x(1); x00 = x(2); : : : ; x(n); x(n+1); : : : . Поскольку, каждое
кольцо многочленов с коэффициентами из поля факториально , то каждый
его элемент однозначно разлагается в произведение неприводимых элементов.
Мы определяем на нем производную, продолжая производную на K , так что
производная от x(n) есть x(n+1) .
В других терминах, если P (x) лежит в K [x]d , то
P (x)0 = P (x) +
X x(n+1) @P
@x(n) ;
где P { многочлен, полученный из P , дифференцированием его коэффициентов (не забывайте P : элементы из K не являются обязательно константами!)
и где @P=@x(n) обозначает частную производную в обычном смысле относительно переменной x(n) .
Если P { многочлен, не лежащий в K (я не смею говорить : многочлен
отличный от константы!), то по определению его порядок { наибольшее n, такое,
что x(n) в нем присутствует : например, многочлен P второго порядка { это
многочлен от x; x0; x00 ; многочлен порядка 0 { это многочлен от x . И снова по
определению его сепарант есть S (P ) = @P=@x(n) , где n { его порядок: из-за
нулевой характеристики , S (P ) всегда отличен от нулевого многочлена.
Как мы сделали в случае полей, для данного дифференциального поля
K и дифференциального поля L , расширяющего K , а также элемента a из
L мы собираемся найти то, что определяет с точностью до K -изоморфизма
дифференциальное поле K (a)d порожденное K и a . Для этого рассмотрим
отображение K (x)d в L , состоящее в замене x на a : его образ является дифференциальным кольцом порожденным a и K . Его ядро есть идеал Ia дифференциальных уравнений над K , выполняющихся на a : это { простой идеал, поскольку K [a]d целостно, и он замкнут относительно производной (если
p 2 Ia , то p0 2 Ia); он называется простым дифференциальным идеалом. Идеал Ia определяет K (a)d с точностью до изоморфизма, так как последнее поле
является полем частных кольца K [a]d , снабженное единственной производной,
продолжающей производную на K [a]d. И наоборот, нетрудно видеть, что произвольный дифференциальный идеал I определяет простое расширение поля
K { поле частных кольца K [x]d=I . Значит, нам нужно дать описание простых
дифференциальных идеалов K [x]d : это { цель следующих лемм.
Обозначим через (P ) дифференциальный идеал, порожденный многочленом P , который является идеалом в обычном смысле, порожденным P и его
последовательными производными P 0; P 00; : : :; P (n); : : : ; обозначим через I (P )
множество дифференциальных многочленов Q таких, что для достаточно большого k S (P )k Q принадлежит (P ); тогда I (P ) { дифференциальный идеал:
если S (P )k Q 2 (P ) , то S (P )k Q0 + kS (P )0S (P )k?1 Q 2 (P ) и S (P )k+1 Q0 2 (P ) .
74
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Лемма 6.8 Если P { неприводимый многочлен порядка n , то (P ) не содержит многочленов порядка, меньшего, чем n ; и если Q имеет порядок n и
лежит в (P ) , то P делит Q . Тот же результат верен и для I (P ) .
Доказательство. Пусть Q 2 (P ) порядка не больше n и Q = A0P + A1P 0 +
+ Ak P (k); продифференцировав P k раз, мы получим равенство P (k) =
S (P )x(n+k) + Pk (x; : : : ; x(n+k?1)), где Pk { многочлен только от x; : : :; x(n+k?1) ;
если в полиномиальном тождестве Q = A0P + A1P 0 + + Ak P (k) мы заменим
неизвестное x(n+k) на рациональную дробь ?Pk =S (P ) (S (P ) не нуль!), мы получим равенство между рациональными дробями; левая часть, не содержащая
x(n+k) , не изменится и умножая обе части на нужную степень S (P ) , мы избавимся от знаменателей и получим полиномиальное равенство такого вида :
S (P )hQ = B0P + + Bk?1P (k?1):
Повторяя эту процедуру k раз, мы получим равенство S (P )m Q = AP .
Однако степень x(n) в S (P ) меньше, чем её степень в P , и P не может делить
S (P ) ; так как он неприводим, он должен делить Q . В случае идеала I (P ) P
делит S (P )m Q тогда и только тогда, когда он делит Q .
Упражнение 6.9 Докажите, что даже если P приводим и его порядок равен
n , то (P ) не содержит многочленов порядка, меньшего n.
Лемма 6.10 Если P { неприводимый многочлен порядка n, то I (P ) { простой
дифференциальный идеал.
Доказательство. Как понять, что Q лежит в I (P ) ? Если как в доказательстве леммы 6.8 , мы заменим x(n+k) на ?Pk =S (P ) , начиная с самой высшей
производной x , присутствующей в Q , затем умножая на подходящую степень
S (P ) , чтобы избавиться от дробности, и повторять это, то в итоге мы получим
многочлен Q1 порядка не больше n, такой, что для некоторого h многочлены
Q1 и S (P )hQ конгруэнтны по модулю (P ) .
Следовательно, Q лежит в I (P ) тогда и только тогда, когда для достаточно
большого m S (P )mQ1 лежит в (P ) , это включение означает, что P делит Q1 .
Вследствие этого, если UV 2 I (P ) , то P делит (UV )1 = U1V1 или ещё, что
либо P делит U1 , либо P делит V1 .
Лемма 6.11 Каждый простой дифференциальный идеал имеет вид I (P ) , где
P неприводим.
Доказательство. Пусть I { ненулевой простой дифференциальный идеал;
выберем в I ненулевые многочлены минимального порядка n , затем среди них
{ минимальной степени по x(n) и, наконец, среди последних { многочлен P
минимальной общей степени. Так как I { простой, очевидно, P неприводим: я
хочу доказать, что I = I (P ) .
Пусть Q лежит в I (P ) и S (P )m Q 2 (P ) I ; многочлен S (P ) , имея степень
по x(n) меньше, чем степень P по x(n), не может принадлежать I ; так как I {
простой, Q принадлежит I .
6.b
75
Дифференциально замкнутые поля
Пусть Q лежит в I ; с помощью метода, описанного в предыдущей лемме, начнем с образования многочлена Q1 порядка n, такого, что S (P )m Q
и Q1 конгруэнтны по модулю (P ) . Рассмотрим Q1 и P как многочлены от
переменной x(n) и выполним евклидово деление Q1 на P ; чтобы в равенстве,
полученном таким образом, избавиться от дробей, нужно его умножить на некоторую степень главного коэффициента M в P , являющегося многочленом от
x; : : :; x(n?1) , и получить многочлен R1 степени по x(n), меньшей, чем степень P
по x(n), такой, что M k Q1 = AP + R1 . Так как Q1; P и R1 лежат в I ,то должно
быть R1 = 0 по минимальности выбора P . Так как P не может делить свой
коэффициент, P делит Q1 , значит, Q лежит в I (P ) .
Таким образом, мы видим, что простой дифференциальный идеал определяется "минимальным многочленом" P ; I (P ) вообще говоря не совпадает
ни с идеалом, порожденным P , ни даже с радикальным (дифференциальным)
идеалом, порожденным P , и связь, которая объединяет простой идеал с его минимальным многочленом более тонка, чем в случае обычных полей (проблема
нахождения образующих для I (P ) в качестве радикального дифференциального идеала называется "проблемой Ритта" ; известны лишь её очень фрагментарные решения). Чтобы упростить формулировки теорем, договоримся, что
минимальный многочлен нулевого идеала { мифическое существо порядка !
и с сепарантом 1 . Рангом размерности простого дифференциального идеала
I (P ) называется порядок RD(I (P )) его минимального многочлена.
Лемма 6.12 Степень трансцендентности расширения поля K (a)d=K равна
RD(Ia=k ) .
Доказательство. Если Ia=K = 0 (в этом случае говорят, что a диффе-
ренциально трансцендентен над K ) , то a и его последовательные производные образуют базу трансцендентности K (a)d=K . Иначе пусть n { наибольшее натуральное число, такое, что a; : : :; a(n?1) алгебраически независимы над
K : n { порядок минимального многочлена P элемента a над K . Поскольку
0 = P (k)(a) = S (P )(a)a(n+k) + Pk (a; : : :; a(n+k?1)) и S (P )(a) 6= 0 , то a(n+k) выражается через производные a низшего порядка, и a; : : :; a(n?1) образуют базу
трансцендентности для K (a)d=K .
Лемма 6.13 Пусть P { неприводимый многочлен порядка n ; каждый про-
стой дифференциальный идеал, содержащий P , но не равный I (P ), имеет
ранг RD, меньший, чем n.
Доказательство. Пусть I (Q) { простой дифференциальный идеал, содержащий P и имеющий ранг размерности n. Имеем S (Q)mP 2 (Q) , по лемме
6.8 это означает, что Q делит P ; так как они { неприводимые многочлены, то
P = Q (с точностью до обратимого элемента K ).
Теперь мы собираемся исследовать, что произойдет с нашими идеалами
при расширении K L дифференциальных полей; простой идеал J в L[x]d
76
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
называется сыном простого идеала I в K [x]d , если I = J \ K [x]d . Так как
неприводимый в K [x]d многочлен P может также рассматриваться как многочлен из L[x]d , мы теперь обозначаем через I (P; K ) простой идеал в K [x]d с
минимальным многочленом P .
Неприводимый в K [x]d многочлен P может , быть разложен на множители в L[x]d. Окончательно неприводимые делители Pi получаются когда мы
переходим к алгебраическому замыканию K поля K (можно проверить, если
хотите, но это следствие следующей леммы, что производная на K продолжается однозначно на K ; конечно для этого существенно, что характеристика
рассматриваемых полей равна 0). Действительно по теореме 6.5 о нулях многочлен (от многих переменных!), неприводимый над алгебраически замкнутым
полем, остается таковым над любым расширением этого поля; элементарные
рассуждения из теории Галуа показывают, что все эти делители { простые и сопряжены K -автоморфизмами поля K ; действительно, если Pi { один из них, то
обозначим через Q произведение всех сопряженных с ним, которое инвариантно относительно всех K -автоморфизмов поля K : так как его характеристика
равна нулю, то это многочлен с коэффициентами из K , делящий P и, значит,
равный ему.
Лемма 6.14 Пусть K L { расширение дифференциального поля, P { непри-
водимый многочлен в K [x]d и P1 { неприводимый делитель P в L[x]d . Тогда
I (P1; L) { сын I (P; K ) .
Доказательство. Пусть Q 2 K [x]d . Предположим сначала, что Q лежит
в I (P; K ) и S (P )mQ 2 (P ); перейдем к L : P = AP1 , где P1 не делит A,
поскольку это { простой делитель P ; так как S (P ) = AS (P1) + @A=@x(n)P1;
S (P1)mAmQ 2 (P1) и ещё AmQ 2 I (P1; L) ; так как A не лежит в I (P1; L) (лемма
6.8) и этот идеал { простой, то Q 2 I (P1; L) .
Теперь предположим, что Q в I (P1; L) ; оставаясь внутри K , мы найдем
многочлен Q1 порядка не больше n, такой, что S (P )m Q и Q1 конгруэнтны
по модулю (P ) и, значит, Q1 { элемент из I (P1; L) ; так как его порядок не
превышает n , то он делится на P1 и поскольку его коэффициенты из K , то он
делится на все элементы, сопряженные с P1 в K , а также на их произведение
в силу их неприводимости; значит, Q1 делится на P , откуда Q лежит в I (P; L).
В частности, мы видим, что каждый простой дифференциальный идеал
имеет сыновей и эти сыновья с тем же рангом RD , что очевидно по лемме
6.14, называются сыновьями без отклонения.
Теперь мы можем приступить к понятию дифференциально замкнутого
поля; чтобы упростить себе жизнь, мы рассматриваем ненулевые элементы
поля K как дифференциальные многочлены порядка ?1 .
Дифференциальное поле K характеристики нуль называется дифференциально замкнутым, если оно имеет следующее свойство: каждая система, образованная из одного дифференциального уравнения порядка n 0 и одного
дифференциального неравенства порядка m < n от одной переменной x и с
коэффициентами из K , имеет решение в K . Дифференциальная замкнутость
6.b
77
Дифференциально замкнутые поля
дифференциального поля выражается следующим бесконечным списком аксиом :
(8y1 : : : yn)(8z1 : : : zm)(9x)(P (x) = 0 ^ Q(x) 6= 0) ;
где yi { коэффициенты многочлена P порядка n (один из главных коэффициентов равен 1 , чтобы гарантировать порядок n многочлену), bj { коэффициенты
многочлена Q порядка m < n (с теми же условиями): нужно по одной аксиоме для каждой возможной общей степени для P и Q . Учитывая соглашение
принятое выше, имеем совместную систему P (x) = 0 ^ 1 6= 0 , где P (x) {
дифференциальный многочлен порядка 0 , т.е. обычный многочлен, так что
дифференциально замкнутое поле, в частности, алгебраически замкнуто.
Теорема 6.15 Каждое дифференциальное поле вкладывается в некоторое дифференциально замкнутое поле.
Доказательство. Пусть K { произвольное дифференциальное поле и
(P0; Q0); : : :; (P; Q); : : : { ординальная нумерация всех систем от двух многочленов из K [x]d, где порядок Q меньше порядка P .
Допустим, что U0 { неприводимый делитель P0 в K [x]d того же порядка что
P0 и K0 { расширение K , содержащее элемент a0, такой, что Ia0=K = I (U0); по
лемме 6.8 Q0 не лежит в I (U0) и a0 { решение системы P0(x) = 0 ^ Q0(x) 6= 0.
Далее рассмотрим неприводимый делитель U1 для P1 в K0[x]d того же порядка
что и P1 и мы добавляем элемент a1, идеал тождеств над K0 которого равен
I (U1; K0) . И повторяя такую процедуру, в конце концов мы получим расширение L1 поля K , в котором все системы с коэффициентами из K имеют
решение; затем построим цепочку K L1 Ln Ln+1 : : : , такую, что
все системы с коэффициентами из Ln имеют решение в Ln+1 . Предел полей
Ln является дифференциально замкнутым расширением K .
Теорема 6.16 Теория дифференциально замкнутых полей (характеристики
нуль) полна и имеет элиминацию кванторов.
Доказательство. Пусть a и b из дифференциально замкнутых полей K
и L , которые предполагаются !-насыщенными и пусть они порождают изоморфные дифференциальные подполя k и h. Мы должны доказать, что (K; a)
и (L; b) 1-изоморфны. (Замечание: в нашем языке удовлетворять одним и
тем же формулам означает породить изоморфные дифференциальные кольца,
и что эквивалентно, породить изоморфные дифференциальные поля).
Добавим, например, к a ; пусть P { минимальный многочлен над k,
и Q { дифференциальный многочлен, полученный переносом P на h изоморфизмом: Q также неприводим; так как L дифференциально замкнуто, то для
данного конечного множества Q1; : : :; Qs дифференциальных многочленов, отличных от нуля и имеющих меньший порядок чем Q, существует элемент из L,
удовлетворяющий системе Q = 0 ^ Q1 Q2: : : Qs 6= 0. По компактности будет
совместным с теорией L также существование элемента , такого, что Q( ) = 0
и Qi( ) 6= 0 для любого многочлена Qi 6= 0 из h[x]d порядка, меньшего, чем
78
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
порядок Q ; так как L !-насыщенно, такой существует в L . По лемме 6.13
I=h = I (Q; h) и k()d и h( )d изоморфны.
Теорема 6.17 (о дифференциальных нулях) Пусть K { дифференциаль-
ное поле (характеристики нуль) и S { (конечная) система дифференциальных
равенств и неравенств от многих переменных, имеющая решение в некотором расширении L поля K ; тогда S имеет решение в любом дифференциально
замкнутом расширении K .
Доказательство. Эта теорема доказывается так же, как теорема 6.5.
Теперь возникает вопрос о существовании дифференциального замыкания
данного дифференциального поля K , т.е. дифференциально замкнутого поля
K , такого, что любое вложение K в дифференциально замкнутое поле продолжается до K .
Мы покажем, что K действительно обладает таким замыканием: это частный случай доказательства существования простых моделей для тотально трансцендентных теорий, которые будут в последующем изучены очень детально
(смотри главу 18) .
Для теории T дифференциально замкнутых полей, пространство S1(K ) совпадает с пространством простых дифференциальных идеалов в K [x]d, топология которой порождается базисом открыто-замкнутых множеств вида
hP = 0i = fI : I 2 S1(K ) и P 2 I g .
Когда тип изолирован в этой топологии ? (Ещё говорят, что соответствующий идеал ограничен) . Лемма 6.13 утверждает, что hP = 0i изолирует I (P )
от типов, имеющих больший RD-ранг и, значит, окрестность, изолирующую
I (P ), можно выбрать в виде hP = 0 ^ Q1 6= 0 ^ ^ Qs 6= 0i, где Qi имеют
меньший порядок, чем P , и ещё, заменив Qi на их произведение Q, в виде
hP = 0 ^ Q 6= 0i . Другими словами, I (P ) изолирован тогда и только тогда,
когда существует Q, порядок которого меньше, чем порядок P , и I (P ) { единственный дифференциальный идеал, содержащий P и не содержащий Q . Мы
видим, что по определению (и это согласуется с главой 5) дифференциально
замкнутое расширение K реализует все изолированные типы над K .
Лемма 6.18 Изолированные типы образуют плотное множество в S1(K ) .
Доказательство. Пусть f { формула с параметрами из K , определяющая
непустое открыто-замкнутое множество S1(K ), и p из hf i , имеющий минимальный RD-ранг и минимальный многочлен P . Тип, удовлетворяющий формуле
P = 0 ^ f , не может иметь меньший RD-ранг, чем порядок P , и обязательно
совпадает с p : это открытое множество изолирует p.
Эта лемма позволяет нам доказать, что каждое дифференциальное поле
обладает дифференциальным замыканием. Действительно, пусть K { такое
поле и L { дифференциально замкнутое расширение K . Если K дифференциально замкнуто, то оно является своим замыканием, иначе существует изолированный тип p 2 S1(K ) , не реализующийся в K : действительно, некоторая
6.b
Дифференциально замкнутые поля
79
система P = 0 ^ Q 6= 0 не имеет решения в K , и по лемме 6.18 эта система
удовлетворяется некоторым изолированным типом над K . Так как L дифференциально замкнуто, оно содержит элемент такого типа, скажем a0 ; полагаем
K1 = K (a0)d. Если K1 дифференциально замкнуто, то остановимся, иначе найдем a1 из L ? K1, изолированного типа над K1, и т.д.
Продолжая такой процесс, построим последовательность a элементов из
L, индексированных ординалами, такую, что a 62 K = K (fa g<)d и тип a
над K изолирован.
Неизбежно через некоторое (трансфинитное) число шагов эта конструкция
остановится, поскольку она разворачивается внутри L и a не повторяются.
Значит, в конце концов мы получим дифференциально замкнутое поле K =
K (fa g< )d для некоторого .
Я утверждаю, что K { простое дифференциально замкнутое поле над K :
действительно, если L1 { дифференциально замкнутое надполе K , тип a0 над
K , как изолированный, реализуется в L1 ; это означает, что можно вложить
K1 в L1 ; затем реализуем тип a1 над K1 в L1 и т.д. ; итерируя процедуру, мы
вкладываем K в L1 , следующим шагом мы можем продолжить это вложение
на a , поскольку его тип над K изолирован.
Установив существование дифференциального замыкания, зададимся вопросом об его единственности. Действительно, K { единственное простое дифференциально замкнутое поле над K , но мы в данный момент далеки от возможности его доказательства; она требует достаточно тонкую технику стабильности и будет приведено лишь в главе 18.
Дифференциальное замыкание имеет более патологические свойства, чем
алгебраическое замыкание полей. Прежде всего, какой тип будет алгебраическим в смысле дифференциально замкнутых полей ? Если P { многочлен
порядка 1 и Q { многочлен меньшего порядка, чем P , то мы видим, что
система P (x) = 0 ^ Q(x) 6= 0 ^ x 6= a1 ^ ^ x 6= an имеет решение в в любом дифференциально замкнутом поле, содержащем его коэффициенты. Как
следствие, единственными алгебраическими типами будут те, у которых минимальный многочлен порядка 0. Таким образом, в случае дифференциально
замкнутых полей, алгебраическое замыкание в теоретико-модельном смысле
есть не что иное, как алгебраическое замыкание в качестве поля.
Если, например, K { поле констант, то мы видим, что его дифференциальное замыкание намного больше чем алгебраическое замыкание, поскольку
легко убедиться, что любой алгебраический над K элемент является константой. Это влечет, что если L { дифференциально замкнутое расширение K ,
то для единственности образа вложения K нет никаких оснований. Действительно, пусть p { изолированный и неалгебраический тип из S1(K ) (например,
если K { поле констант, то формула x0 = 1 изолирует тип над ним) ; так
как p неалгебраичен, то теория, язык которой содержит { новых символов
констант, выражающая, что эти элементы { различные реализации p, совместна. Как следствие, K имеет дифференциально замкнутое расширение L с {
реализациями типа p, где { > jK j. Однако, каждая из них может быть взята как первый элемент в нумерации некоторой копии K , так что каждая из
них может содержатся в образе вложения K ; но, так как по теореме Левен-
80
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
гейма K имеет дифференциально замкнутое расширение в своей мощности,
card(K ) = card(K ) , так что вложение K в L не может содержать их всех.
Поле K имеет, если K { поле констант, ещё более озадачивающее свойство:
существуют дифференциально замкнутые поля, лежащие строго между K и K .
Естественно, так как они также простые, они K -изоморфны K : существует
не сюръективное K -вложение K в K ! (говорят, что простая модель, имеющая такое свойство, не минимальна) . Доказательство этого факта использует
легкую теорию моделей и один очень непростой результат дифференциальной
алгебры.
6.c Булевы алгебры
Булевым кольцом называется ассоциативное кольцо с единицей, в котором
= x для любого x; значит, мы имеем также (x + y)2 = x2 + xy + yx + y2 =
x + xy + yx + y и кроме этого (x + y)2 = x + y ; поэтому xy + yx = 0 для
произвольных x; y ; x2 + x2 = 0, значит, x + x = 0 для любого x или x = ?x ;
отсюда булево кольцо имеет характеристику 2 и, так как xy = ?yx = yx , оно
коммутативно.
Чтобы аксиоматизировать это понятие, мы вводим язык, содержащий два
символа констант 0 и 1 , два символа бинарных отношений + и ; читатель без
труда напишет несколько универсальных аксиом, выражающих, что A булево
кольцо, не забывая при этом 0 6= 1 . В булевом кольце определим две бинарные
операции ^ ; _ и унарную операцию : следующим образом : x ^ y = x y ,
x _ y = x + y + xy; :x = 1 + x .
Читатель легко убедится, что следующие свойства выполняются для всех
x; y и z .
x2
{ (законы де Моргана или дуальность) :(:x) = x,
:(x ^ y) = :x _ :y; :(x _ y) = :x ^ :y ,
{ x_x = x^x =x ,
{ (ассоциативность ^ ) (x ^ y) ^ z = x ^ (y ^ z) ,
{ (ассоциативность _ ) (x _ y) _ z = x _ (y _ z) ,
{ (дистрибутивность ^ над _) x ^ (y _ z) = (x ^ y) _ (x ^ z) ,
{ (дистрибутивность _ над ^) x _ (y ^ z) = (x _ y) ^ (x _ z) ,
{ (коммутативность ^ и _) x ^ y = y ^ x; x _ y = y _ x ,
{ x ^ :x = 0; x _ :x = 1 ,
{ x ^ 0 = 0; x _ 0 = x; x ^ 1 = x; x _ 1 = 1 ,
{ 0 6= 1; :0 = 1; :1 = 0 .
6.c
Булевы алгебры
81
Структура в языке 0; 1; :; ^; _; , удовлетворяющая этим универсальным
аксиомам, называется булевой алгеброй ; читатель может проверить снова, что
в булевой алгебре отношение x ^ y = x эквивалентно отношению x _ y = y и,
что это { (частичный) порядок, который мы обозначим x y ; относительно
него 0 является наименьшим, а 1 наибольшим элементами. Для этого порядка
x _ y есть верхняя грань x и y , и x ^ y нижняя грань: таким образом, речь идет
о решетке и даже о дистрибутивной решетке (удовлетворяющей аксиомам
дистрибутивности ^ над _ и _ над ^ ) ; кроме этого она снабжена операцией
дополнения : , которая переставляет ^ и _, инволютивна, т.е. :(:x) = x, и
переворачивает порядок: если x y , то :x :y ; вдобавок :x { одновременно
наименьший элемент y, такой, что x _ y = 1 и наибольший элемент y, такой,
что x ^ y = 0 . Как следствие, мы видим, что булева алгебра может быть также
рассматриваться как частичный порядок, называемый булевым порядком: все
операции 0; 1; :; ^; _ определяются через этот порядок.
С булевым кольцом A мы связали некоторую булеву алгебру b(A); обратное я оставляю читателю для проверки: если в булевой алгебре B мы полагаем
x y = x ^ y; x + y = (x _ y) ^ (:x _ :y) , то получаем булево кольцо a(B );
и кроме этого a(b(A)) = A; b(a(B )) = B . Таким образом, мы видим, что с
точностью до языка булевы кольца и булевы алгебры одни и те же структуры,
булево кольцо канонически преобразуется в булеву алгебру и наоборот, преобразования в обеих направлениях осуществляются с помощью бескванторных
формул.
Несомненно, что все, о чем говорилось выше, опирается на простые, но
немного длинные проверки (в особенности, проверка ассоциативности + ) , и
именно поэтому я оставляю это удовольствие читателю. Как пример булевой
алгебры можно привести алгебру подмножеств непустого множества E , где
0 = ;; 1 = E; :x { дополнение x в E; x _ y { объединение x и y , x ^ y
{ их пересечение; как булево кольцо, это есть не что иное, как произведение
копий двухэлементного поля Z=2Z(являющегося, впрочем, наименьшим булевым кольцом со сложением: 0 + 0 = 1 + 1 = 0; 0 + 1 = 1 ; и умножением
0 0 = 0 1 = 0; 1 1 = 1 ), где копии индексированы элементами E ; чтобы
это понять, сопоставим каждому подмножеству x в E его характеристическую
функцию, т.е. функцию из E в множество f0; 1g , которая отображает e в 1 ,
если e 2 x, и в 0 , если e 62 x . Из-за этого эта булева алгебра обозначается 2E .
Подмножество I булевого кольца A называется идеалом в A , если оно
идеал (нетривиальный, т.е. не содержащий 1) в обычном для колец смысле :
{ если x и y из I , то x + y лежит в I ,
{ если x лежит в I , то x y лежит в I ,
{ 1 62 I .
Если мы перейдем к языку булевых алгебр, эти условия после некоторых
манипуляций, выполнение которых мы снова оставляем читателю, перепишутся так :
{ если x и y из I , то x _ y лежит в I ,
82
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
{ если x 2 I и y x , то y 2 I ,
{ 1 62 I .
Каждый знает, что образ кольца A при гомоморфизме f изоморфен фактору A по ядру f , которое является идеалом и, что обратно по любому идеалу
можно определить фактор-кольцо A=I . Это имеет место, в частности, для
булевых колец и для булевых алгебр, алгебра B=I будет алгеброй, ассоциированной фактору соответствующего булевого кольца по I .
Для фактора A=I , элементами I будут в точности, те элементы, которые
отображаются в 0 . В булевом контексте, чаще предпочитают рассмотрение
элементов, отображающихся в 1, и называют фильтром множество элементов
вида :x , где x пробегает некоторый идеал (обратите внимание: фильтр не дополнение к идеалу, а множество элементов, дополнение которых принадлежит
идеалу!) ; таким образом фильтр характеризуется следующими свойствами :
{ если x и y из F , то x ^ y лежит в F ,
{ если x 2 F и x y , то y 2 F ,
{ 0 62 F .
Часто, когда говорят о факторе булевой алгебры, фильтр и идеал, соответствующий ему, отождествляют. Можно заметить следующее: если B булева
алгебра, то полагая
00 = 1; 10 = 0; :x0 = :x; x ^0 y = x _ y; x _0 y = x ^ y ;
мы определяем на множестве B другую структуру B 0 булевой алгебры, называемой дуальной к B ; отображение x 7! :x является изоморфизмом B на B 0 ,
фильтры B 0 будут идеалами B , так что некоторые говорят "дуальный идеал"
вместо фильтра.
Фильтры над I , рассмотренные нами в разделе 4.a являются фильтрами булевой алгебры 2I . В булевой алгебре идеал прост если и только, если
он максимален, поскольку единственное целостное булево кольцо { это двухэлементное поле f0; 1g; идеал I в B максимален тогда и только тогда, когда
B=I = f0; 1g, т.е. если для любого x либо x, либо :x лежит в I . Фильтр,
соответствующий максимальному идеалу называется ультрафильтром: ультрафильтры { это максимальные фильтры F , равным образом характеризующиеся среди всех фильтров тем свойством, что для любого x либо x , либо
:x 2 F , следовательно, множество, состоящее из дополнений элементов ультрафильтра, { это соответствующий ему максимальный идеал.
Если E { вполне несвязное компактное пространство (т.е. обладающее базой открытых множеств, одновременно являющихся замкнутыми), то открытозамкнутые подмножества E образуют булеву подалгебру 2E . Это, на самом
деле, самый общий вид булевой алгебры, как показывает следующая теорема
о представлении.
Теорема 6.19 (Стоун) Каждая булева алгебра изоморфна алгебре открытозамкнутых множеств вполне несвязного компактного пространства E , которое кроме того, определяется однозначно с точностью до изоморфизма.
6.c
83
Булевы алгебры
Доказательство. Пусть E { множество максимальных идеалов B , и
для каждого x из B полагаем hxi = fI : I 2 E и x 2 I g ; заметим, что
h0i = E; h1i = ;; h:xi = E ? hxi и hx ^ yi = hxi [ hyi , поскольку x ^ y = x y
и идеалы { простые. Тогда hx_yi = hxi\hyi , действительно идеал, содержащий
x и y, содержит и x _ y ; если он содержит x _ y , то он содержит x и y , которые
меньше него.
Значит, множества вида hxi образуют подалгебру 2E и порождают топологию J на E ; покажем, что E становится таким образом компактным пространством (которое вполне несвязно, поскольку каждое открытое множество
из базы является одновременно замкнутым) ; E сепарабельно, поскольку если
I 6= J , то существует x; x 2 I , но x 62 J ; тогда :x 2 J и, значит, hxi и
h:xi { две окрестности отделяющие I и J . Если hxii { семейство замкнутых
множеств из базы, обладающее свойством конечного пересечения, то любое конечное число xi содержится в некотором идеале, а также 1 не принадлежит
идеалу, порожденному всеми xi , т.е. он собственный идеал (отличный от B ),
который содержится в некотором максимальном идеале (смотрите раздел 8.b
об аксиоме выбора) . Этот идеал принадлежит пересечению всех hxii .
Заметим, что множества вида hxi являются единственными открыто-замкнутыми подмножествами E . Действительно, открытое множество является
объединением множеств вида hxii и если оно компакт, то является объединением конечного числа из них. Итак, мы определили сюръективный гомоморфизм B на дуальную к алгебре открыто-замкнутых подмножеств E . Что будет
ядром ? Если x лежит в ядре, то hxi = E (так как нулем дуальной алгебры будет E , а не ; ) ; это означает, что x = 0 , поскольку если x 6= 0 , то существует
максимальный идеал, содержащий :x и не содержащий x .
Значит этот гомоморфизм биективен; вообще-то предпочитают рассматривать пространство E 0 ультрафильтров B , снабженное топологией, определяемой с помощью hxi = fF : F 2 E 0 и x 2 F g = fF : F 2 E 0 и :x 62 F g ; так
как B и B 0 изоморфны, то такими будут E и E 0 , но этот путь { более удобный, поскольку сразу получают изоморфизм на алгебру открыто-замкнутых
подмножеств E 0 :
h0i = ;; h1i = E 0; hx ^ yi = hxi \ hyi hx _ yi = hxi [ hyi ;
а не изоморфизм на её дуальную алгебру. Это пространство ультрафильтров
B называется пространством Стоуна B .
Таким образом, B представляется как алгебра открыто-замкнутых множеств своего пространства Стоуна. Докажем единственность: если E { вполне
несвязный компакт, то ультрафильтры алгебры B открыто-замкнутых подмножеств E по сходимости соответствуют точкам E , изоморфного пространству
Стоуна B .
Заметим, что непустые замкнутые множества пространства Стоуна алгебры B соответствуют её фильтрам: F 2 \hxii если и только, если F содержит
фильтр порожденный всеми xi . Так как конечная булева алгебра имеет конечное пространство Стоуна, это пространство дискретно и алгебра изоморфна
булевой алгебре всех подмножеств множества f0; 1; : : : ; n ? 1g.
84
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
С булевыми алгебрами мы сталкиваемся повсюду в теории моделей, чаще всего как с алгеброй предложений некоторого языка L , рассматриваемых
по модулю эквивалентности (два предложения эквивалентны, если они имеют
одни и те же модели) . Теория это фильтр в этой алгебре; её стоуновское
пространство, таким образом, образовано из полных в этом языке теорий. Эта
алгебра носит название алгебры Тарского-Линденбаума языка L . Если мы её
факторизуем по теории T , получаем алгебру Тарского-Линденбаума теории
T , которая является алгеброй предложений из L с точностью до эквивалентности по модулю T (два предложения эквивалентны по модулю T , если они
имеют одни и те же модели среди моделей для T ) ; если T полна, эта алгебра
сводится к двум элементам, нулю, который является классом предложений
ложных для T (:f 2 T ) , и к единице, т.е. класса предложений истинных
для T (f 2 T ) .
С помощью тех же соображений, можно рассматривать алгебру предложений языка L [ fxg или L [ fx1; : : : ; xng ; пространством Стоуна этой алгебры
будет пространство типов, являющихся полными теориями в этих языках.
Можно приступать к изучению теории моделей алгебраическим способом,
рассматривая булевы алгебры, снабженные операциями, соответствующие кванторам; их называют полиадическими алгебрами : они абстрактные эквиваленты алгебры формул некоторого языка. Тогда теорема компактности доказывается с помощью теоремы о представлении полиадических алгебр, аналога
теоремы 6.19 . Эта область логики, в которую мы не будем проникать глубоко,
называется алгебраической логикой.
Теперь мы собираемся изучать некоторые булевы алгебры как структуры, т.е. сделать их объектами теории моделей. В булевой алгебре B фильтр
F , порожденный конечным числом элементов x1; : : : ; xn порождается также
их нижней гранью: значит, он главный. Если F { главный ультрафильтр, то
его образующий является ненулевым минимальным элементом, такие элементы назовём атомами. Говорят, что алгебра атомна, если каждый ненулевой
элемент мажорирует некоторый атом. Например, 2E и, в частности, любая
конечная булева алгебра атомна. Атомность булевой алгебры означает также,
что изолированные точки её пространства Стоуна, которые в точности совпадают с главными ультрафильтрами, образуют плотное подмножество.
В атомной булевой алгебре B два элемента равны как только они мажорируют одни и те же атомы (поскольку тогда (:x ^ y) _ (:y ^ x) { нуль), так что B
оказывается подалгеброй алгебры всех подмножеств множества всех атомов.
В противоположность атомным алгебрам, мы имеем безатомные алгебры, стоуновское пространство которых не содержит изолированных точек.
Атомность или безатомность алгебры легко выражается с помощью аксиом. Так как каждая булева алгебра вкладывается в 2E , где E { её стоуновское
пространство, теория атомных алгебр является компаньоном теории булевых
алгебр. Это имеет место также для теории безатомных булевых алгебр : вложим B в алгебру B1 = B B диагонально, сопоставляя элементу x элемент
(x; x) ; никакой элемент B не является атомом в B1 , так как если (x; x) 6= (0; 0) ,
то он находится строго выше (x; 0) ; повторяя эту процедуру построим цепочку
B B1 Bn Bn+1 : : : , такую, что никакой элемент Bn не является
6.c
Булевы алгебры
85
атомом в Bn+1 : предел алгебр Bn будет безатомной алгеброй.
Атомная булева алгебра, имеющая лишь конечное число атомов a1; : : :; an
конечна: если мы сопоставим элементу x этой алгебры множество атомов, которые он мажорирует, то получим изоморфизм B на 2n . Заметим также, что
булева алгебра, порожденная конечным множеством элементов x1; : : :; xn , конечна. Её атомами будут элементы вида "1x1 ^ ^ "nxn, не равные нулю, где
"i = "ничего" или : . На самом деле легко видеть, что каждый ненулевой
элемент булевой алгебры, порожденной x1; : : :; xn, является верхней гранью
элементов такого вида (используйте ассоциативность, дистрибутивность и законы де Моргана, чтобы доказать, что элементы описанного вида действительно образуют булеву алгебру) . В частности, свободная
алгебра, порожденная
n
n
2
n элементами, имеет 2 атомов, значит она имеет 2 элементов.
Для каждого натурального n мы рассмотрим формулу An(x) , выражающую, что x мажорирует по крайней мере n атомов.
Теорема 6.20 Теория бесконечных атомных булевых алгебр полна; она элиминирует кванторы в языке f0; 1; :; ^; _; A1; : : :; An; : : : g . .
Доказательство. Рассмотрим в двух бесконечных атомных, !-насыщенных
булевых алгебрах кортежи a в первой и b во второй, удовлетворяющих одним
и тем же бескванторным формулам вышеописанного языка. Последнее означает, что если "1a1 ^ ^ "nan мажорирует в точности m атомов (т.е. удовлетворяет формуле Am(x) ^ :Am+1(x) ) , то этому же условию удовлетворяет
"1b1 ^ ^ "nbn . Так как алгебра атомна, то в частности для m = 0 , это означает, что если один из этих элементов { нуль, то другой также равен нулю. Это
условие достаточно для того, чтобы a и b породили изоморфные подалгебры;
если "1a1 ^ ^ "nan мажорирует бесконечное число атомов, т.е. удовлетворяет
Am(x) для всех m 2 ! , то таким же будет и "1b1 ^ ^ "nbn .
Добавим к кортежу a ; для любой цепочки " = ("1; : : : ; "n) полагаем
"a = "1a1 ^ ^ "n an , " = ^ "a , 0" = : ^ "a ; мы различаем следующие
случаи :
{ если "a мажорирует в точности m атомов, то " мажорирует p , а 0"
мажорирует q атомов и p + q = m ; по предположению "b мажорирует
также m атомов и через " обозначим верхнюю грань p из них, а через "0
остальных; " ^ "0 = 0 , " _ "0 = "b ;
{ если "a мажорирует бесконечное число атомов, в то время когда " мажорирует только p из них, возьмем в качестве " верхнюю грань p атомов,
находящихся под "b , в качестве "0 { её относительное дополнение; аналогично поступаем, если 0" мажорирует конечное число атомов;
{ если "a , " и 0" мажорируют бесконечное число атомов, то нужно разделить "b на два дизъюнктных куска " и "0 , каждый из которых мажорирует бесконечное число атомов.
Это возможно, поскольку в !-насыщенной булевой алгебре, если a мажорирует
бесконечное число атомов, то существует такой b , что a^b и a^:b мажорируют
86
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
бесконечное число атомов. Действительно, если bn { верхняя грань n атомов
под a , то a ^ bn мажорирует n атомов, а a ^ :b { бесконечное число, откуда по
компактности и !-насыщенности следует результат.
Теперь, чтобы найти элемент , такой, что a_ и b_ 1-эквивалентны,
достаточно склеить кусочки и взять в качестве верхнюю грань всех " (дополнение которого есть верхняя грань всех "0 ) .
Теорема 6.21 Теория безатомных булевых алгебр полна и имеет элиминацию кванторов (в языке 0; 1; :; ^; _ ) ; она является модельным пополнением
теории булевых алгебр.
Доказательство. Докажем, что два кортежа a и b в произвольных двух
безатомных булевых алгебрах, удовлетворяющих одним и тем же бескванторным формулам, 1-эквивалентны. Булева алгебра порожденная элементами a1; : : :; an определяется с точностью до изоморфизма условиями вида
"a = 0; a 6= 0 . С другой стороны, так как алгебра безатомна, то любой
элемент делится на две ненулевые части.
Добавим к a , если " = 0 , то полагаем " = 0 . Если 0" = 0 , то полагаем
" = "b, и если " и 0" { ненулевые, то разделим "b на два ненулевых куска:
"b = " _ "0 ; " ^ "0 = 0 . Остается склеить все " .
Так как две безатомные булевы алгебры всегда 1-эквивалентны, то мы
видим, что с точностью до изоморфизма существует только одна счетная безатомная булева алгебра (теорема 1.14) , которая, впрочем, является свободной
алгеброй порожденной счетным числом образующих; через дуальность Стоуна
(теорема 6.19) это доказывает, что существует только одно вполне несвязное
компактное пространство без изолированных точек со счетной базой (это дисконтинуум Кантора) .
Теорема 6.22 Теория безатомных булевых колец полна и допускает элиминацию кванторов (в языке 0; 1; :; ^; _ ) ; она является модельным пополнением
теории булевых колец.
Доказательство. Операции булевых колец определяются через операции
булевой алгебры и наоборот с помощью бескванторных формул.
Я напомню, что булев порядок это порядок соответствующий некоторой
булевой алгебре. Поскольку операции в ней определимы через порядок, то
булевы порядки являются моделями следующей теории : выражаем, что существуют наименьший и наибольший элементы, верхние и нижние грани, дополнение и эти понятия удовлетворяют аксиомам булевой алгебры. Булевы
порядки без атомов являются моделями некоторой полной теории, поскольку
мы выражаем порядок через булевы операции, она не является модельно полной, так как вложение порядка не сохраняет понятия наименьшего элемента,
верхней грани и т.п. Расширение безатомных булевых порядков элементарно,
только если соответствующие булевы операции сохраняются.
6.d
Ультраметрические пространства
87
Теория булевых порядков является компаньоном теории (частичных) порядков. Действительно, порядок I вкладывается в порядок булевой алгебры 2I
при сопоставлении множества Ia = fx : x ag с a , так как Ia Ib () a b .
В частности, мы видим, что любой счетный частичный порядок вкладывается
в счетную безатомную булеву алгебру.
Наконец заметим, что теория частичного порядка обладает модельным пополнением; рассмотрим частичный порядок, определенный на n + 1 элементах
x1; : : :; xn; y . Обозначим через f (x; y) диаграмму этого порядка, т.е. конъюнкцию формул вида u v; :(u v) , выполняющихся на нем. Через g(x)
обозначим диаграмму ограничения этого порядка на x1; : : : ; xn . Добавим к
теории частичных порядков в качестве аксиом все предложения следующего
вида для каждой возможной пары (f; g) :
(8x1) : : : (8xn)(9y)(g(x) ! f (x; y)) :
Это совместная теория и, на самом деле, это компаньон теории частичных
порядков. Действительно, если I { частичный порядок, A { конечное подмножество I и b { новый элемент, такой, что порядок на A [ fbg продолжает
порядок на A , то определяем следующим образом порядок на I [ fbg, продолжающий одновременно порядок на I и на A [ fbg : если c 2 I , то полагаем
c b , если существует a в A такой, что c a и a b , и полагаем b c , если
существует a в A такой, что b a и a c . Мы без труда убеждаемся, что это
частичный порядок.
Из этого мы выводим, сделав ! шагов в схеме построения, которая теперь
должна быть хорошо знакома читателю, что любой частичный порядок вложим в некоторую модель этой теории T . Почти очевидно, что два кортежа
из двух моделей T , удовлетворяющие одним и тем же свободным формулам,
1-эквивалентны. Так как две модели T всегда 1-эквивалентны, существует
только одна счетная модель с точностью до изоморфизма.
6.d Ультраметрические пространства
Рассмотрим линейный порядок I с наименьшим элементом 0, и назовем
ультраметрическим пространством множество E вместе с отображением d :
E 2 ! I , удовлетворяющем следующим условиям:
{ для всех x и y из E d(x; y) = 0 () x = y
{ для всех x и y из E d(x; y) = d(y; x)
{ для всех x и y из E d(x; z) Max(d(x; y); d(y; z)) .
Значение d(x; y) называется расстоянием от x до y . Третье условие носит название ультраметрического неравенства; оно означает, что отношения
d(x; y) i и d(x; y) < i являются отношениями эквивалентности, и оно влечёт,
что данные три точки образуют либо равносторонний треугольник (d(x; y) =
88
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
d(y; z) = d(z; x)), либо "равнобедренный" треугольник, имеющий две равновеликие стороны, где третья сторона { самая меньшая. Мы договоримся здесь
называть правильным многогранником множество точек, равноудаленных друг
от друга.
Чтобы говорить об этом понятии ультраметрического пространства мы
введём унарный предикат I (u) для обозначения носителя порядка I , константный символ для 0 , символ бинарного отношения для порядка I , унарный
символ E (u) для обозначения самого пространства E и символ функции для
обозначения расстояния. Носитель структуры, соответствующий ультраметрическому пространству, образуется с одной стороны из I , а с другой { из пространства E , так что выполняются два следующих условия:
(8u)(I (u) _ E (u); :(9u)(I (u) ^ E (u)) :
Чтобы не писать I и E повсюду, мы различаем два вида переменных:
{ переменные вида i; j; k; : : : должны рассматриваться как представляющие
расстояния, т.е. элементы I , (9i)f (i) и (8i)f (i) должны рассматриваться
как сокращения для (9u)(I (u) ^ f (u)); (8u)(I (u) ! f (u)) :
{ переменные вида x; y; z; : : : должны рассматриваться как представляющие точки, т.е. элементы E , и формулы (9x)f (x); (8x)f (x) { сокращения для (9u)(E (u) ^ f (u)); (8u)(E (u) ! f (u)) :
Понятие ультраметрического пространства легко (универсально) аксиоматизируется в этом языке. Мы рассмотрим следующий список аксиом:
A0 (9x)(x = x) ;
A1 (8i)(8x)(9y)(d(x; y) = i) ;
A2 (8i)(8x1)(8x2)(9y)(d(x1; x2) = i ! d(x1; y) = d(x2; y) = i) ;
: : : : : : :: : : : : :: : : : : : :: : : : : : :
VV d(x ; x ) = i ! VV d(x ; y ) = i) ;
An (8i)(8x1) : : : (8xn)(9y)(1<
n 1n
: : : : : : :: : : : : :: : : : : : :: : : : : : :
B2 :(9i)(9x1)(9x2)(9x3)(d(x1; x2) = d(x2; x3) = d(x3; x1) = i 6= 0) ;
: : : : : : :: : : : : :: : : : : : :: : : : : : :
Bn :(9i)(9x1) : : : (9xn+1)(i 6= 0 ^ 1<VVn+1d(x; x ) = i)
: : : : : : :: : : : : :: : : : : : :: : : : : : :
6.d
Ультраметрические пространства
89
Для n 2 аксиома An выражает, что каждый правильный многогранник с
n вершинами продолжается до правильного многогранника с (n+1) вершинами;
напротив, аксиома Bn выражает, что не существует правильного многогранника с n + 1 вершинами. Ультраметрическое пространство называется богатым,
если оно удовлетворяет всем аксиомам A0; : : :; An; : : : ; для n 2 ультраметрическое пространство называется n-богатым, если оно удовлетворяет аксиомам
A0; : : :; An?1; Bn .
Лемма 6.23 Каждое I -значное пространство вкладывается в I -значное богатое пространство; каждое I -значное пространство без правильных многогранников с n + 1 вершинами вкладывается в I -значное n-богатое простран-
ство.
Доказательство. Пусть E { I -значное пространство; если E { пустое,
то добавим одну точку a к E . Ясно, что множество fag с функцией d(a; a) = 0
является ультраметрическим пространством и аксиома A0 удовлетворяется.
Предположим теперь, что существует a в E и нет элементов из E находящихся на расстоянии i от a . Тогда добавим точку b к E и продолжим
расстояние на E до E [ fbg :
{ d(a; b) = i ,
{ если c 2 E; c 6= a, тогда обязательно d(a; c) 6= i ; если d(a; c) < i , то
полагаем d(b; c) = i и если d(a; c) > i , то полагаем d(b; c) = d(a; c) .
Легко проверить, что действительно получим ультраметрическое расстояние и заметим, что если E [fbg содержит правильный многогранник из n точек,
то такой многогранник содержит и E (если этот многогранник содержит b , то
он не содержит a : заменим b на a ).
Предположим теперь, что мы имеем n точек a1; : : :; an в Е, равноудаленных
друг от друга на расстоянии i , но этот правильный многогранник не расширяется; тогда мы добавляем к E точку b вместе со следующими расстояниями:
d(a1; b) = = d(an; b) = i ;
если c в E отлично от a1; : : : ; an , тогда для некоторого am верно неравенство
d(am; c) 6= i . Если d(c; am ) > i , то все d(c; ah) равны между собой и полагаем
d(c; b) = d(c; an) . Если напротив d(c; am) < i , то в этом случае d(c; ah) = i для
всех h 6= m , и мы полагаем d(c; b) = i .
Проверку того, что мы получили ультраметрическое пространство оставляем читателю. Заметим, что i { минимально возможное расстояние от b до
точки из E . Докажем, что если E не содержит правильного многогранника с
n + 2 вершинами, то такого многогранника нет и в E [fbg . Пусть c1; : : :; cn+1 ; b
образуют такой многогранник, длина ребер которого равна j . Если j > i ,
то все d(cm ; ah) равны j , что нам дает правильный многогранник с n + 2 вершинами в E . Если j = i, то из-за максимальности многогранника a1; : : :; an
каждому ch соответствует некоторый ak и только один такой, что d(ch ; ak) < i;
так как число элементов ch на единицу больше, чем в этом многограннике, имеем, например, d(c1; a1) < i; d(c2; a1) < i , что противоречит вместе с d(c1; c2) = i
ультраметрическому неравенству.
90
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
После этого, стартуя от данного I -значного пространства E и добавляя
к нему по одному точки, получим I -значное расширение такое, что каждая
точка a из E имеет находящуюся от неё на расстоянии i точку b в E1 и каждый правильный многогранник с n вершинами в E расширяется до такого
многогранника с n + 1 вершинами в E1 . Итерируя этот процесс, получим
цепь I -значных пространств E E1 En : : : , предел которой будет
богатым.
Если теперь E не имеет правильных многогранников с (n + 1) вершинами,
мы можем проделать то же самое, расширяя только правильные многогранники, имеющие меньше n вершин, и, согласно нашему замечанию, не введя
правильных многогранников с n + 1 вершинами. Таким образом, мы погружаем E в n-богатое пространство.
Теория богатого пространства, в частности, содержит теорию своего порядка. Мы поймем, что на самом деле она сводится к ней : если порядки I и
J элементарно эквивалентны, то богатое I -значное пространство элементарно
эквивалентно любому богатому J -значному пространству. Каждому кортежу
(i; x) образованному из n-ки элементов I и m-ки элементов из E , мы сопоставляем (n + m(m ? 1)=2)-ку, образованную из i и попарных расстояний элементов
x ; этот кортеж будет называться кортежом расстояний для (i; x) .
Теорема 6.24 Два богатых ультраметрических пространства элементарно
эквивалентны, как только таковыми будут их порядки. Расширение богатых
пространств элементарно, как только расширение соответствующих порядков элементарно; более точно, два кортежа из таких пространств имеют
одинаковый тип если и только, если их кортежи расстояний имеют одинаковый тип в смысле теории линейных порядков. Тот же результат верен и
для n-богатых пространств.
Доказательство. Предположим, что нам даны два богатых ультраме-
трических пространства (I; E ) и (J; F ) , которые, как обычно, !-насыщенны.
Покажем, что это влечет !-насыщенность порядков I и J (это частный случай
общего результата о структурах, одна из которых интерпретируется в другой,
смотри раздел 9.d) . Действительно, если a { конечное подмножество I и p {
тип над a в смысле теории порядка I , то он реализуется элементом в некоторой ультрастепени I U порядка I ; { элемент также ультраметрического
пространства (I; E )U : пусть q { его тип над a в смысле теории этого пространства. Поскольку (I; E ) !-насыщенна, q реализуется элементом из I ,
который, если ограничится языком порядка I , реализует p .
Далее предположим, что I и J вдобавок элементарно эквивалентны и рассмотрим a в (I; E ) , b в (J; F ) такие, что их соответствующие кортежи расстояний a0 и b0 имеют одинаковый тип в языке порядков. Нам нужно доказать, что
a и b 1-эквивалентны. Добавим, например, слева, если 2 I , то достаточно ответить таким в J , что его тип над b0 соответствует типу над a0 , что
возможно в силу !-насыщенности J . Теперь предположим, что лежит в E .
Если a не содержит элементов из E , то отвечаем произвольным из F ; иначе
пусть a из a, такой, что d(; a) минимально, и b { точка, соответствующая a в
6.d
91
Ультраметрические пространства
b . Если d(; a) не принадлежит a0 , то пусть j из J , тип которого (в смысле
теории порядков) над b0 соответствует типу d(; a) над a0 . Так как F богато,
то существует точка в F , такая, что d(; b) = j . Ультраметрическое неравенство определит все расстояния от до b и кортежи a и b имеют кортежи
расстояний одного типа.
Теперь предположим, что d(; a) лежит в a0 , тогда пусть P { максимальный правильный многогранник в a с длиной ребра d(; a) , содержащий точку
a (возможно, что P сведется к fag ) ; так как d(; a) минимально, то все расстояния от до P равны d(; a) , а расстояния от до оставшихся точек a
определяются ультраметрическим неравенством. Если Q { правильный многогранник в b , соответствующий P , достаточно ответить элементом таким,
что Q [ f g { правильный многогранник, длина ребра d(; b) которого соответствует d(; a) (последнее нужно только в случае, когда P состоит из одной
вершины) .
То же доказательство работает для n-богатых пространств: просто там не
сталкиваемся никогда с правильными многогранниками из более, чем n точек.
Просмотрев доказательство теоремы 6.24 мы видим, что два кортежа a
и b в двух богатых I -значных пространствах, имеющие одинаковые кортежи
расстояний, 1-эквивалентны. Значит два богатых I -значных пространства 1эквивалентны над I (т.е. элементы I остаются неподвижными в процессе "челнока" ). Как следствие отсюда получим, что если I счетен, то по теореме 1.14 с
точностью до изоморфизма (даже с точностью до I -изоморфизма!) существует
единственное счетное богатое n-значное пространство. В этом случае по теореме Левенгейма каждое богатое I -значное пространство имеет элементарное
счетное I -значное ограничение и ясно, что это счетное богатое
I -значное пространство является единственной простой моделью над множеством I теории богатых пространств. Мы увидим в разделе 10.f , что для любого порядка I , даже несчетного, существует простое I -значное богатое ультраметрическое пространство, но это простое пространство не всегда единственно.
Те же результаты верны для n-богатых пространств.
В предвидении глав о стабильности, мы хотим описать типы точек (т.е.
элементов пространства, но не порядка) над моделью (I; E ) теории богатых
пространств, соответствующих теории данного порядка. По теореме 6.24 тип x
над (I; E ) определяется типами кортежей над I , образованных из d(x; a) , где
a пробегает E . Это позволяет классифицировать типы на четыре вида :
{ реализованные типы : тип элемента a из E , т.е. существует a из E такой,
что d(x; a) = 0 .
{ дистанционные типы : существует элемент a из E , такой, что d(a; x) не
лежит в I (но лежит в некотором элементарном расширении I !). Тогда
тип x полностью определяется заданием a и типом d(a; x) над I . На
самом деле, если b из E и d(a; b) < d(a; x) , то d(b; x) = d(a; x), и если
d(a; b) > d(a; x) , то d(b; x) = d(a; b) .
{ полигональные типы : все d(a; x) лежат в I и имеется минимум i . Пусть
тогда a { такой, что d(a; x) = i и P { максимальный правильный много-
92
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
гранник, содержащий a и имеющий длину ребер i (легко видеть, что если
Q { другой такой многогранник, то существует каноническая биекция между P и Q , сопоставляющая элементу b из P единственный элемент b0 из
Q такой, что d(b; b0) < i ) . Тип x полностью определяется a и i : если b из
P , то d(b; x) i и на самом деле d(b; x) = i из-за минимальности i . Если
b 62 P , то существует c из P такой, что d(b; c) 6= i и ультраметрическое
неравенство определяет d(b; x) .
{ псевдо-предельные типы : в этом оставшемся случае все d(a; x) лежат в
I , но множество A элементов i из I , таких, что d(x; ai) = i для некоторого
i , не имеет наименьшего элемента. Тогда, на самом деле A { концевой
сегмент I : если i 2 A; i < j , то берем aj такой, что d(ai; aj ) = j и тогда
d(x; aj ) = j .
Последовательность ai { это то, что называется псевдопоследовательностью Коши: если i < j , то имеем d(ai; aj ) = j . Псевдопределом такой последовательности будет элемент (необязательно единственный, если 0 не будет
нижней гранью A !), такой, что d(; ai) = i для всех i из A . Мы видим, что
псевдопредельный тип определяется множеством A и последовательностью ai
элементов из E , которая сходится к x . Эта последовательность не должна
иметь псевдопредел a в E , поскольку иначе d(x; a) будет меньше всех i из A .
Говорят, что пространство максимально полно , если каждая псевдопоследовательность Коши в нем имеет псевдопредел. Легко видеть, что реализуя
один за другим все псевдопредельные типы, каждое I -значное пространство
можно расширить до максимально полного I -значного пространства. Над таким пространством псевдопредельных типов не существует.
Заметим, что только дистанционные типы заставляют расширяться порядок I . Все остальные можно реализовать в элементарном расширении (I; F )
над (I; E ) . Наконец, что касается n-богатых пространств, ситуация приблизительно похожа, за исключением того, что не существует полигональных типов.
6.e Модули, экзистенциально
замкнутые модули
С левым A-модулем M над кольцом с единицей A мы связываем следующий
язык :
{ символ бинарной функции для обозначения сложения в M ,
{ символ константы для обозначения нуля в M ,
{ для каждого из A символ унарной функции для обозначения умножения
на .
Таким образом, мы видим что кольцо не является изучаемой структурой :
оно является частью языка. Читатель легко выпишет какие универсальные
6.e
93
Модули
аксиомы удовлетворяются A-модулями. Если A является кольцом Z целых
чисел, то Z-модуль не что иное как абелева группа. В этом случае можно
ограничиться одним символом для сложения и одним символом для противоположного, поскольку nx = x + + x .
Для любой полной теории T A-модулей, мы хотим описать типы над моделями T . В связи с этим нам понадобится следующее предварительное, но
впрочем полезное, утверждение.
Лемма 6.25 (Б. Нейман) Пусть G { группа, не обязательно абелева, и
K1; : : :; Kn { конечное число правых или левых смежных классов по подгруппам
G, такое, что G = K1 [ [ Kn , тогда G покрывается теми Ki , которые
соответствуют подгруппам конечного индекса в G .
Доказательство. Так как Ha = aa?1Ha , то все Ki имеют вид aiHi для
некоторых подгрупп Hi в G . Докажем лемму индукцией по числу m таких
подгрупп.
Для m = 1 это очевидно: единственная вовлеченная подгруппа имеет конечный индекс.
Покажем переход от m к m +1 . Рассмотрим конечное минимальное семейство смежных классов, покрывающих G, и пусть число вовлеченных подгрупп
равно m +1 . Если H { одна из них, то каждый класс aH , если он не участвует
в покрытии, покрывается классами вида bH 0 с H 0 6= H . Помножив все эти
классы слева на a?1 и применив предположение индукции, мы видим, что для
этого покрытия достаточны те bH 0 , у которых H \ H 0 имеет конечный индекс
в H . Из этого мы выводим, что поскольку покрытие минимально, для любых
вовлеченных подгрупп H и H 0 пересечение H \ H 0 имеет конечный индекс в
обеих подгруппах.
Как следствие, пересечение L всех Hi является подгруппой конечного индекса в каждой из них и каждый смежный класс по Hi разбивается на конечное
число классов по L . Из первоначального покрытия мы получаем покрытие из
конечного числа смежных классов по L , следовательно, L имеет конечный
индекс в G , как и каждая Hi .
Мы называем примитивной формулу вида (9y1) : : : (9yn)(^ Ei(x; y)) , где
Ei(x; y) { равенства, т.е. формулы вида 1x1 + : : :m xm + 1y1 + : : : nyn = 0 с
коэффициентами i и j из A . Заметим, что конъюнкция двух примитивных
формул эквивалентна примитивной формуле (вынесите все кванторы вперед,
после переименования связанных переменных так, чтобы они были разными у
двух формул) .
Если M { A-модуль и f (x) { примитивная формула от n свободных переменных, то кортежи, удовлетворяющие ей, образуют подгруппу, которую
называют примитивной в M n ; мы обозначим эту подгруппу через Gf (x) .
Назовем примитивной формулой с параметрами в M формулу f (x; a) полученную из примитивной формулы f (x; x0) без параметров подстановкой кортежа элементов из M вместо x0 . Заметим, что элементы M n, удовлетворяющие
f (x; a), образуют смежный класс по примитивной подгруппе Gf (x;0) .
94
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Теорема 6.26 Пусть T { полная теория модулей и M { модель T , тогда
два кортежа из элементарного расширения M имеют одинаковый тип над
M если и только, если они удовлетворяют одним и тем же примитивным
формулам с параметрами из M .
Доказательство. Пусть N { !-насыщенная модель теории T (M ) и a; b
{ два кортежа, удовлетворяющие одним и тем же примитивным формулам с
параметрами из M . Мы должны показать, что a и b 1-эквивалентны. Добавим, например, элемент c к a . Если f (x; y) { примитивная формула с параметрами в M , выполняющаяся на a_c , то (9y)f (x; y) примитивна и выполняется
на a . Значит, она выполняется и на b . Так как конъюнкция конечного числа
примитивных формул снова примитивна, то множество всех формул f (b; y) ,
где f (x; y) { примитивная формула с параметрами в M , выполняющаяся на
a_ c , совместно и по !-насыщенности существует d из N , такой, что b_d их
всех удовлетворяет.
Значит мы имеем d, такой, что все примитивные формулы, истинные на
a_ c, истинны также на b_d . Нам нужно найти элемент e , имеющий это же
свойство и кроме этого такой, что каждая примитивная формула, ложная на
a_ c , также ложна на b_ e !
Если f (m;
x; y) { примитивная формула с параметром m из M , истинная
_
на a c , то мы хотим, чтобы e был конгруэнтным d по модулю Gf (0;0;y) .
Пусть теперь g(m;
x; y) { такая формула, ложная на a_c . Если существует
f (m;
x; y), истинная на a_c, такая, что N ` :(9y)(f (a; y) ^ g(a; y)), тогда то
же самое верно при замене a на b , удовлетворяющего тем же примитивным
формулам, и нам ничего не надо требовать от e : простое выполнение им f (b; y)
запрещает выполнение им g(b; y) .
В противном случае, если Gg(0;0;y) \ Gf (0;0;y) конечного индекса n в Gf (0;0;y) ,
то покажем, что снова не надо требовать ничего от e . Действительно, так как
две рассматриваемые подгруппы в M определимы без параметров, то это выражается в теории T модуля M . Тогда существуют u1; : : :; un в M такие, что каждый элемент Gf (0;0;y) конгруэнтен одному из u1; : : : ; un них по модулю Gf \Gg ,
т.е. смежный класс по первой подгруппе разбивается на n смежных классов по
модулю второй. Значит, если элемент c0 удовлетворяет g(a; y) ^ f (a; y) , то c и
c0 конгруэнтны по модулю Gf и существует единственный ui, такой, что c + ui
и c0 конгруэнтны по модулю Gg . Поэтому существует единственный ui , такой,
что a_ c удовлетворяет примитивной формуле g(x; y + ui) с параметрами M .
Если a_ c не удовлетворяет g(x; y) , то это просто потому, что ui не лежит в
Gg(0;0;y). Так как b_ d удовлетворяет той же формуле, простое удовлетворение
g(x; y + ui) запрещает ему выполнять g(x; y) .
В оставшемся случае, существует элемент dg , такой, что b_ dg удовлетворяет g(m;
x; y) и мы хотим, чтобы e не был конгруэнтным dg по модулю группы
Gg(0;0;y) .
Подведем итог : мы имеем семейство Gf групп замкнутых относительно
конечных пересечений и другое семейство Gg групп, таких, что Gg \ Gf всегда
имеет бесконечный индекс в Gf . Мы хотим, чтобы e был конгруэнтным d по
модулю каждой Gf и не был конгруэнтным dg по модулю Gg для каждой Gg .
Тогда по лемме 6.25 конечное объединение смежных классов по Gg не может
6.e
95
Модули
покрыть класс по модулю Gf и то, к чему мы стремимся, совместно.
Однако в языке T (M ) условие, которое мы стараемся реализовать, выражается через выполнимость формул с параметрами только из b . Действительно,
d и dg вовлечены только через их классы и вместо того, чтобы сказать, вовлекая параметр d, " x конгруэнтен d по модулю Gf ", можно сказать " x лежит
в смежном классе по Gf элементов, удовлетворяющих f ", т.е. возвращаясь к
нашей отправной точке " x удовлетворяет f (b; x) " ! Следовательно, поскольку
N !-насыщенна, такой e в N действительно существует.
Теперь попытаемся описать в удобной манере типы от одной переменной
над моделью M для T : тип p элемента x над M определяется примитивными формулами f (x; a) с параметрами a из M , удовлетворяющимися x . Если
p ` f (x; a) , тогда M ` (9x)f (x; a) и существует элемент af из M , удовлетворяющий эту формулу, и который, значит,конгруэнтен x по модулю Gf (x;0) . При
других обозначениях, это означает, что тип p элемента x над М определяется
конгруэнтностями x a ( mod G) , где a из M и G { примитивная подгруппа M , которым он удовлетворяет (поскольку G определяется формулой без
параметра, то x ? a 2 G есть формула нашего языка) .
Назовем семейство F примитивных подгрупп фильтром подгрупп, если выполняются следующие условия :
{ M принадлежит F ,
{ если G и H лежат в F , то их пересечение также лежит в F ,
{ если G принадлежит F и G \ H конечного индекса в G, то H лежит в F .
Тип p из S1(M ) определяет фильтр Fp примитивных подгрупп G таких, что
существует aG в M , конгруэнтность которого с x по модулю G выводима из p.
Мы только что показали, что p определяется заданными Fp и aG (или, более
точно, их смежными классами по G ).
Естественно, элементы aG должны удовлетворять условию когерентности:
если G G0 , тогда aG и aG0 конгруэнтны по модулю G0 . Но это условие является единственным ограничением и каждый фильтр F имеет вид Fp , какой
бы ни была модель M теории T . Действительно, по лемме 6.25 множество
предложений выражающих, что x лежит в каждой подгруппе из F и не конгруэнтен ни с каким элементом по модулю любой примитивной подгруппы не
лежащей в F , совместно.
Аналогично, если p 2 S1(M ) и Fp F 0 , то существует элементарное расширение N модели M и сын q (смотри определение в разделе 11.a) типа p над
N такой, что Fq = F 0 . Для этого реализуем тип p элементом a из некоторого
расширения N и возьмем в качестве q тип, утверждающий, что x конгруэнтно
a по модулю каждой G из F 0 и не конгруэнтно никакому элементу N по любой
примитивной подгруппе вне F 0 .
Заметим наконец, что если p из S1(M ) и M { элементарное ограничение
N , то p имеет единственного сына q над N , такого, что Fp = Fq . На самом
деле, так как q не добавляет новых классов к уже известным, у нас нет другого
Глава 6
96
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
выбора. Этот сын называется наследником или сыном без отклонения. Другие,
которые расширяют фильтр групп, называются сыновьями с отклонением.
Это вторая встреча с понятием отклонения2 (первая была в 6.b) извещает
о скором изучении стабильности в общих рамках, начиная с главы 11. Прежде
чем полететь к таким высоченным вершинам, нам ещё нужно закончить уйму
земных дел. Пока что мы хотим найти условие, при котором теория A-модулей,
универсальная в данном уже нами языке, имеет модельный компаньон. Прежде чем перейти к обсуждению, мы хотим немного развить теорию модельных
компаньонов, для которой модули служат прекрасной иллюстрацией.
Пусть M { структура и N { расширение M . Мы говорим, что M экзистенциально замкнуто в N , если для любого a из M и для любой бескванторной
формулы f (x; y) языка M , если N ` (9y)f (a; y) , то M ` (9y)f (a; y) .
Лемма 6.27 Модель M экзистенциально замкнута в N тогда и только тогда, когда существует элементарное расширение M1 модели M такое, что
M N M1 .
Доказательство. Если M M1 , то M экзистенциально замкнуто в M1
и, тем более, в N . Обратно, если M экзистенциально замкнуто в N , то выделим константой каждый элемент N и рассмотрим множество предложений
T (M ) [ D(N ) , где T (M ) { множество предложений, истинных в M , и D(N )
{ множество бескванторных предложений, истинных в N . Это множество совместно, поскольку для каждого его конечного фрагмента мы можем интерпретировать константы N n M элементами из M ; оно имеет модель, являющуюся
тем, что нам нужно.
Лемма 6.28 Если M экзистенциально замкнуто в N и M1 элементарно экви-
валентна M , то существует экзистенциально замкнутое вложение M1 в
структуру N1 , элементарно эквивалентную N .
Доказательство. 1-ый метод : для некоторого ультрафильтра U мы имеем M1 M U N U = N1 ; остается проверить, что M U , как и M1, экзистенциально замкнута в N U .
2-ой метод : пусть T { теория N ; выделим константой каждый элемент
M1 и пусть T1 { множество универсальных предложений обогащенного языка,
истинных в M1 ; множество T [ T1 совместно, поскольку N можно превратить в
модель для каждого его конечного фрагмента, выделив некоторые константы
из M (так как, если M1 ` (8y)f (a; y), тогда M ` (9x)(8y)f (x; y)). Значит, это
множество имеет модель , что нам и нужно.
Теперь рассмотрим универсальную теорию T8 ; модель этой теории называется экзистенциально замкнутой (среди моделей T8), если она является
таковой в каждом её расширении, являющимся моделью T8 .
Лемма 6.29 Любая модель T8 вкладывается в экзистенциально замкнутую.
2
Примечание переводчика: в русской литературе чаще применяется термин ответвление.
6.e
97
Модули
Доказательство. Пусть M { модель T8 ; пронумеруем формулы f (x; a)
без квантора с параметрами в M ; если f0 { первая формула и она реализуется
в некотором расширении M , являющимся моделью T8 , то в качестве M 0 берем
одну из них, иначе полагаем M 0 = M ; и если f1 реализуется в некотором расширении M 0 ( будьте внимательны: возможно, что f1 реализуется в некотором
расширении M , но ни в одном расширении M 0 ), то в качестве M 1 берем одну
из них и т.д. Повторяя эту процедуру, мы получим расширение M1 модели
M , являющееся моделью T8 (поскольку выполнимость универсальных формул сохраняется при переходе к пределу), такую, что каждая бескванторная
формула с параметрами в M , реализующаяся в некотором расширении M1 ,
реализуется в M1 .
Действуя таким образом, мы построим цепочку M M1 Mn : : : ,
предел которой будет экзистенциально замкнутым.
Лемма 6.30 Элементарное ограничение экзистенциально замкнутой модели
экзистенциально замкнуто.
Доказательство. Если M M1 и M1 экзистенциально замкнута и если
M N { модель T8 , то существует модель T8 , расширяющая N и M1 (так
как каждое универсальное предложение с параметрами из M , истинное в N ,
истинно в M , значит оно истинно также в M1 ; другое объяснение { можно
вложить M1 в ультрастепень M , не сдвигая M ). Значит, если a 2 M; b 2 N
и f (x; y) { формула без кванторов, такая, что f (a; b) истинна (в N !), то она
истинна в этом общем расширении, следовательно, M1 ` (9y)f (a; y) и M `
(9y)f (a; y) .
Лемма 6.31 Если каждое элементарное расширение экзистенциально замкнутой модели экзистенциально замкнуто, то каждое экзистенциально замкнутое расширение экзистенциально замкнутой модели элементарно.
Доказательство. Пусть M и N экзистенциально замкнуты и M N .
По лемме 6.27 существует элементарное расширение M1 модели M , такое, что
M N M1 . Аналогично, существует элементарное расширение N1 модели
N , такое, что M N M1 N1 . Так как по предположению M1 и N1 экзистенциально замкнуты, то мы можем повторять эту процедуру и построить
две сплетенные элементарные цепи M N Mn Nn : : : , общий предел
P которых будет элементарным расширением и M и N . Предложение с параметрами в M истинно в N () оно истинно в P () оно истинно в N .
Значит, N { элементарное расширение M .
Упражнение 6.32 Формула называется 89-предложением, если оно имеет
вид (8y)(9x)f (y; x) , где f (y; x) { бескванторная. Если T { теория, то через
T89 обозначается множество 89-предложений, выводимых из неё. Докажите,
что если M { модель T89 , то она экзистенциально замкнута в некоторой
98
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
модели T и имеет элементарное расширение, являющееся пределом моделей
T . Докажите, что T допускает аксиоматизацию 89-предложениями если и
только, если каждый предел моделей T является моделью T .
Ещё одно определение : класс L-структур называется элементарным, если
он состоит в точности из моделей некоторой (не обязательно полной) теории T
в этом языке.
Теорема 6.33 Универсальная теория T8 имеет модельный компаньон T тогда и только тогда, когда класс её экзистенциально замкнутых моделей элементарен и в этом случае T { их теория.
Доказательство. Если экзистенциально замкнутые модели являются классом моделей теории T , то по лемме 6.29 T { компаньон T8 и по лемме 6.31 T
модельно полна.
Обратно, предположим что T8 имеет модельным компаньоном T . Если M
{ модель T , N { модель T8 и M N , тогда N вкладывается в некоторую
модель M1 теории T . В силу модельной полноты T , расширение M M1
элементарно, так что M экзистенциально замкнуто в M1 и тем более в N .
Значит, все модели T экзистенциально замкнуты.
Если M экзистенциально замкнута, то она вкладывается в некоторую модель N для T , где она, конечно, будет экзистенциально замкнутой. Отсюда
по лемме 6.27 имеем M N M1 , где M1 { элементарное расширение M .
Мы ещё не знаем, является ли M1 экзистенциально замкнутой, но мы знаем
по лемме 6.27, что она вкладывается экзистенциально замкнутым образом в
некоторую модель N1 теории T . Итерируя эту процедуру, мы получаем цепь
моделей M N M1 N1 Mn Nn : : : , где цепь из Mn элементарна.
Такой же будет цепь Nn по модельной полноте T . Общий предел этих цепей
будет элементарным расширением и M и N , следовательно, M { модель T .
Применим этот замечательный результат к модулям. Модулем конечного
типа назовем модуль имеющий конечную систему образующих (также говорят
просто о конечно порожденном модуле), значит, он является образом свободного модуля An . Модуль называется конечно представимым, если он имеет
вид An=R , где R { подмодуль An конечного типа. Представление M { это просто задание системы порождающих e1; : : :; en для M и списка порождающих
r1; : : : ; rk модуля R отношений между e1; : : : ; en . Заметим, что если M представимо в системе порождающих e1; : : :; en с помощью отношений r1; : : : ; rk и
f1; : : : ; fm { другое множество порождающих и через e01; : : : ; e0n обозначены выражения e1; : : :; en через f1; : : : ; fm , то мы получаем представление M заменяя в r1; : : : ; rk элементы e1; : : : ; en на e01; : : : ; e0n и добавляя к ним выражения
f1; : : : ; fm через e01; : : : ; e0n . Мы видим таким образом, что если M конечно
представим, то любая конечная система порождающих M имеет некоторое конечное представление.
Кольцо A называется когерентным (слева), если каждый (левосторонний)
идеал в A конечного типа является конечно представимым (напомним, что
идеал есть не что иное, как подмодуль в A). Например, если A нетерово (слева),
то оно когерентно, так как каждый подмодуль An конечного типа.
6.e
Модули
99
Теорема 6.34 Теория A-модулей имеет модельный компаньон, тогда и только тогда, когда кольцо A когерентно, в этом случае она допускает модельное
пополнение, являющееся полным и допускающее элиминацию кванторов.
Доказательство. Сначала предположим, что A не когерентно. Тогда
существуют 1; : : :; n из A, порождающие идеал, не имеющий конечного представления. Для любой конечной системы R отношений, выполняющихся для
1; : : : ; n , существуют a1; : : :; an в некотором модуле, удовлетворяющие эти соотношения, но не все соотношения, выполняющиеся для 1; : : : ; n . Возьмем
модуль An=R , он может быть вложен в экзистенциально замкнутый модуль
MR . Так как a1; : : : ; an не удовлетворяют всем соотношениям для 1; : : : ; n
не может существовать такой x , что 1x = a1 ^ ^ n x = an .
Как следствие следующий список аксиом совместен :
{ множество T предложений, истинных на всех экзистенциально замкнутых модулях,
{ для любого соотношения 11 + + n n = 0 для 1; : : :; n предложение
1a1 + + n an = 0 ,
{ :(9x)(1x = a1 ^ ^ n x = an) .
Я утверждаю, что некоторая модель M этой теории не экзистенциально
замкнута. Это влечет, что экзистенциально замкнутые модули не образуют
элементарный класс. Действительно, поскольку a1; : : :; an порождают модульобраз идеала, порожденного 1; : : :; n , модуль M Ax, факторизованный
отношениями 1x ? a1; : : :; n x ? an , будет расширением M .
Теперь предположим, что A когерентно. Рассмотрим следующий список
аксиом, содержащий кроме аксиом A-модуля, для каждого идеала конечного
типа в A , представленного соотношениями r1(1; : : : ; n); : : :; rk (1; : : : ; n) ,
и для каждых 1; : : : ; m , не лежащих в идеале, порожденном 1; : : :; n ,
следующее предложение
(8x1) : : : (8xn)(8y1) : : : (8ym)(9z)(^ ri(x1; : : : ; xn) !
! (1z = x1 ^ : : : nz = xn ^ 1z 6= y1 ^ ^ mz 6= ym))
В случае нулевого идеала, представленного единицей, мы получаем следующую аксиому :
(8y1) : : : (8ym)(9z)(0z = 0 ^ 1z 6= y1 ^ ^ mz 6= ym)
Эти аксиомы выражают, что если a1; : : :; an удовлетворяют соотношениям представления 1; : : : ; n , то кортеж (a1; : : : ; an) делится на кортеж 1; : : : ; n ,
причем частное z удовлетворяет определенным неравенствам.
Возьмем, например, кольцо Zцелых чисел. Так как идеал nZ как модуль
изоморфен Z, он нулевого представления, и получаем следующие аксиомы, где
n1; : : : ; nm не делятся на n :
(8x)(8y1) : : : (8ym)(9z)(x = nz ^ n1z 6= y1 ^ ^ nm z 6= ym) :
100
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
Легко видеть, что моделями этой теории являются делимые группы, имеющие
бесконечное число элементов порядка p для каждого простого числа p .
Этот список аксиом совместен и является компаньоном теории модулей. На
самом деле, если a1; : : : ; an удовлетворяют представлению R для 1; : : : ; n , то
в модуле M Az=(1z ? a1; : : :; n z ? an) справедливо z 2 M в том и только в
том случае, когда лежит в идеале, порожденном 1; : : :; n . Следовательно,
каждый экзистенциально замкнутый модуль является моделью теории T .
Мы докажем, что T полна и допускает элиминацию кванторов. Для этого
рассмотрим !-насыщенные модели M и N теории T с кортежами a и b, порождающими изоморфные подмодули M и N , мы должны показать, что a и
b 1-эквивалентны.
Добавим c к a , что определяет тип модуля, порожденного c и a ? Рассмотрим идеал I элементов из A таких, что. c = a 2 M . Этот модуль
изоморфен M Ac факторизованному элементами c ? a .
Ясно, что если 1; : : :; n из I , то a1 ; : : :; an удовлетворяют представлению
1; : : : ; n из I . Для любого из I обозначим через b элемент модуля N ,
соответствующий a . Рассмотрим следующий список аксиом :
{ z = b для всех 2 I ,
{ z 6= b для всех 62 I и всех b 2 N .
Так как модуль N удовлетворяет аксиомам T , каждый конечный фрагмент
этого списка выполняется некоторым элементом N . По компактности и
!-насыщенности существует элемент d из N , удовлетворяющий всему списку, и a_c; b_d порождают изоморфные модули.
6.f Исторические и библиографические
примечания
Элиминация кванторов для алгебраически замкнутых полей рассматривается в общем как теорема Тарского, появившаяся в [ТАРСКИЙ, 1951]. Просто
скажем, что это перевод на современный жаргон старого метода решения системы полиномиальных равенств и неравенств с помощью последовательного
исключения переменных. Его примеры находят начиная с самого появления
математики в Вавилоне и он был объектом серьезного теоретического исследования со времен китайского средневековья (см. [ХОУ, 1977]). В этой работе
Тарский показал также элиминацию кванторов для вещественно замкнутых
полей (в языке с предикатом ). Эти последние относятся к вещественно полям так же, как алгебраически замкнутые поля к полям, т.е. удовлетворяют
аналогу теоремы Гильберта о нулях, откуда понятно, что эта элиминация является фундаментальным фактом для вещественной геометрии { вещественного
аналога алгебраической геометрии.
Более значительный успех теории моделей { это знаменитая теорема Акса и Кочена [АКС-КОЧЕН, 1966], которая при определенных предположениях
6.f
Исторические и библиографические примечания
101
позволяет свести теорию гензелевого поля к теории его поля классов вычетов и теории его группы значений. Этот результат является тем, чем часто
любят размахивать знаменоносцы теории моделей. Действительно, он позволяет решить в конечном итоге гипотезу Артина. Это { первое свидетельство
зрелости теории моделей, её первое неоспоримое приложение за узкими пределами логики. Последствия теоремы Акса-Кочена до сих пор занимают немало
исследователей.
Другое значительное приложение { это порождение дифференциально замкнутых полей. Алгебра дифференциально замкнутых полей была интенсивно
исследована Риттом в первой половине этого столетия, затем Эллисом Колчиным, который написал учебник [КОЛЧИН, 1973]. Важно заметить, что Колчин
обращался к изолированному типу по имени "ограниченный идеал", однако ни
он, ни Ритт нее думали о выявлении дифференциального аналога алгебраического замыкания. Заслуга в этом принадлежит Абрахаму Робинсону, который
опираясь на работы Зейденберга [ЗЕЙДЕНБЕРГ, 1956] о методе исключения в
системах дифференциальных равенств и неравенств, заметил что дифференциальные поля удовлетворяют необходимым условиям существования модельного пополнения { только что введенного им понятия, откуда родилось понятие
дифференциально замкнутых полей. Представленная здесь крайне элегантная
аксиоматизация этого понятия принадлежит Ленор Блюм [БЛЮМ, 1968]. Современная тенденция логиков { это вывод результатов Зейденберга об элиминации и синонимов теоремы о дифференциальных нулях из свойства модельной
полноты теории дифференциально замкнутых полей, а не наоборот.
Существование и единственность дифференциального замыкания являются следствиями общей теоремы о тотальной трансцендентности рассматриваемой теории. Дифференциальный контекст, не приносит никаких упрощений в
доказательство этих фактов, которое займет у нас много времени. Эти результаты также рассматриваются как важнейший вклад теории моделей в алгебру.
Неминимальность дифференциального замыкания была одновременно доказана в работах [КОЛЧИН, 1974] , [ШЕЛАХ, 1973] и [РОЗЕНЛИХТ, 1974] . По этому
поводу можете обращаться к [ГРАМЭН, 1983] и статьям соседствующим с ней.
Теория моделей дифференциально замкнутых полей подается изучению
достаточно плохо, до сих пор остается открытым вопрос о классификации её
счетных моделей. Теория дифференциально замкнутых полей характеристики
p существует, она технически более сложна. Это { модельный компаньон, но
не модельное пополнение теории дифференциальных полей характеристики p
; она описана Кэрол Вуд [ВУД, 1973] .
Булевы алгебры обязаны своим именем английскому математику Джорджу
Булю (1815 { 1864) ; теорема представления доказана в [СТОУН , 1936] . Эти
алгебры встречаются в логике везде. Для введения в алгебраическую логику
я рекомендую книгу Хелены Расевой [РАСЕВА, 1974] и для её структурного
изучения [СИКОРСКИЙ, 1964]. На самом деле, все пополнения теории булевых
алгебр описаны.
Богатые ультраметрические пространства были предложены мной Франсуаз
Делон [ДЕЛОН, 1984] для выявления сущности теоретико-модельных явлений,
замеченных ею в теории нормированных полей; они дают отличные примеры
102
Глава 6
ИЛЛЮСТРАЦИИ ЧЕЛНОЧНОГО МЕТОДА
и контрпримеры для иллюстрации многих вопросов этого курса.
Модули образуют достаточно широкий класс структур, теория моделей которых особенно проста. Лемма 6.25 принадлежит [НЕЙМАН, 1952]. Теорему
6.26 доказал Вальтер Баур [БАУР, 1976]. Можно доказать, вовлекая чуть больше алгебру, что на самом деле существует элиминация кванторов до булевых
комбинаций примитивных формул даже при отсутствии модели M . Этот результат был доказан за несколько лет раньше Вандой Шмелевой для абелевых
групп [ШМЕЛЕВА, 1955] . Можно описать все теории абелевых групп с помощью инвариантов Шмелевой.
Исследованиям экзистенциально замкнутых моделей мы обязаны Абрахаму Робинсону [РОБИНСОН, 1971]. Более детально о применениях к алгебраическим ситуациям можно прочитать в [МАКИНТАЙР, 1977] и особенно в
[ЧЕРЛИН , 1976] . Про связь между модельным компаньоном и форсингом по
Робинсону смотрите [РОБИНСОН, 1971] и [ХИРШФЕЛЬД-УИЛЕР, 1975] . Теорема 6.34 доказана Полем Эклофом и Габриелем Саббахом [ЭКЛОФ-САББАХ,
1970/71 ] .
Глава 7
Арифметика
" " ;
E: I!
7.a Функция следования : : : : : : : : : : : : : : : : : : 104
7.b Порядок : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 105
7.c Сумма : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 106
7.d Сумма и произведение:
кодирование конечных множеств : : : 111
7.e Кодирование формул,
теорема Тарского : : : : : : : : : : : : : : : : : : : : : 117
7.f Иерархия
арифметических множеств : : : : : : : : : : 119
7.g Некоторые аксиомы, модели
фрагментов арифметики : : : : : : : : : : : : : 129
7.h Нестандартные модели в
арифметическом определении : : : : : : : 135
7.i Арифметический перевод
метода Генкина : : : : : : : : : : : : : : : : : : : : : : : : 136
7.j Понятие доказательства,
разрешимых теорий : : : : : : : : : : : : : : : : : : 140
7.k Теорема Геделя : : : : : : : : : : : : : : : : : : : : : : : 145
7.l Немного математической фикции : : : 148
7.m Исторические и библиографические примечания : : : : : : : : : : : : 152
103
104
Глава 7
АРИФМЕТИКА
7.a Функция следования
В этой главе мы изучаем структуры, образованные хорошо известными отношениями или операциями, определенными на множестве N , обозначаемой
также ! , натуральных чисел. Мы начинаем с изучением функции следования
которая числу x сопоставляет число x +1 ; язык содержит символ s для обозначения этой функции, также символ константы 0 для обозначения наименьшего
натурального числа.
Выражаем аксиомами, что s инъективно, и что каждый элемент, за исключением 0, является последователем:
(8x)(8y)(sx = sy ! x = y); (8x)sx 6= 0
(8x)(9y)(x = 0 _ x = sy) :
Какими будут модели теории, образованной из этих трех аксиом? Они содержат во-первых орбиту действия s на 0 : эта орбита f0; s(0); : : : ; sn (0); : : : g
является копией функции следования на натуральных числах. Ещё они могут содержать конечные, циклические орбиты или бесконечные орбиты копии
функции следования (Z; s) на целых числах. Но наша функция следования не
содержит циклов порядка n , что выражается аксиомой :
:(9x1) : : : (9xn)(x2 = sx1 ^ ^ xn = xn?1 ^ x1 = sxn) :
Обозначим через S теорию, аксиоматизированную этим бесконечным списком
аксиом. Легко видеть, что она не конечно аксиоматизируема: если мы выразим, что не имеется циклов порядка 1; 2; : : : ; n , то допускаем циклы порядка
n+1 . Я утверждаю, что эта теория полна, т.е. это теория функции следования,
и что она допускает элиминацию кванторов (в языке s; 0).
Действительно, каждая модель S содержит копию (N; s) , в которой можно выбирать элементы a1; : : : ; an , удаленных друг от друга на произвольно
большие расстояния, таким образом, с теорией этой модели совместно утверждение, что существуют a1; : : : ; an , не удовлетворяющие никаким равенствам
ai = sk aj , и, следовательно, каждая !-насыщенная модель S образована из копии (N; s) и из бесконечного числа копий (Z; s) ; тогда легко видеть, что в двух
таких моделях, два кортежа, удовлетворяющие одним и тем же формулам без
кванторов, !-эквивалентны.
Мы могли бы также провести челнок Фраиссе в стиле главы 1: надо предварительно заменить функцию следования её графиком, то есть множеством
пар (n; n + 1) , называемым "бинарным отношением следования"; определение
классов p-эквивалентности в этом случае не сложное. Можно также поступать
немного по-другому, замечая, что с точностью до изоморфизма имеется ! счетных моделей S , смотря по тому сколько копий (Z;s) она имеет 0; 1; 2; : : : ; n; : : :
или ! , в то время как для каждого несчетного кардинала она имеет единственную модель в этой мощности, так как имеется только одна возможность
копий (Z;s) . Теория, которая так же, как S , имеет единственную модель в
мощности , называется -категоричной, или еще категоричной в .
7.b
105
Порядок
Теорема 7.1 Если теория T не имеет конечных моделей, и категорична в
мощности jT j , то она полна.
Доказательство. Предположим, что T имеет модель М, удовлетворяющую f , и другую N , удовлетворяющую :f . Тогда М и N бесконечны, и по
теореме Левенгейма-Сколема, они имеют соответственно элементарно эквивалентные M1 и N1 мощности , которые должны быть изоморфны: это противоречие.
Таким образом, эта теорема также доказывает, что S полна; на практике,
ее область применения гораздо более ограничена чем мы могли бы думать, так
как часто -категоричность теории можно понять только с помощью челнока,
который дает ее полноту непосредственно. Например, мы могли ее использовать, чтобы показать полноту теории алгебраически замкнутых полей данной
характеристики, зная теорему Штейница о базе трансцендентности, и также,
конечно, единственность алгебраического замыкания, доказанную без теорию
моделей!
Для того, чтобы доказать элиминацию кванторов, зная, что S полна, достаточно отметить, что в несчетной модели S (и также в его !-насыщенной
счетной модели!) два кортежа, удовлетворяющие одним и тем же свободным
формулам, переводятся автоморфизмом. Из всего этого заключаем, что теория
следования очень проста и классификация его моделей непосредственна.
7.b Порядок
Порядок (N; ) натуральных чисел был тщательно изучен в первой главе:
его теория является теорией дискретного порядка с наименьшим элементом
и без наибольшего элемента, и мы знаем (см. описание типов в разделе 1.b,
упражнение 1.10), что она имеет элиминацию кванторов, если добавить к языку
символ 0 для обозначения наименьшего элемента и для каждого целого n ,
символ dn (x; y) для обозначения отношения "имеется n элементов между x и
элементом y ".
Теперь, когда мы имеем некоторый опыт в обращении с бесконечным челноком, то, что мы имеем действительно полную теорию , и что порядок и
"расстояния", а также "расстояние до 0 ", описывают типы, можно выяснить
так :
{ моделями обсуждаемой теории являются цепи вида N + Z C , где C
является какой-нибудь цепью (здесь, в отличие от последователя, имеется
связь между различными копиями Z : они должны быть упорядочены
одни по отношению к другим) ;
{ в !-насыщенной модели этой теории, цепь C плотна без концов: действительно, если a < b и d(a; b) = 1 , то с теорией этой модели совместно
утверждение, что существует x , a < x < b, на бесконечном расстоянии
106
Глава 7
АРИФМЕТИКА
как от a , так и от b ; и что существует элемент y , y > b, на бесконечном
расстоянии от b ;
{ возрастающие кортежи в двух таких моделях, имеющие одни и те же
расстояния, 1-эквивалентны.
Теория порядка натуральных чисел, которая конечно аксиоматизируема,
также не доставляет больших проблем: её модели ясно описаны выражением
N + Z C , если мы считаем, что понятие цепи является ясным. Она более
сложна, чем теория следования, в следующем техническом смысле : отношение
y = sx интерпретируемо формулой x < y ^ (8z)(x z y ! x = z _ z = y) ;
говорят также, что следование определимо через порядок. Каждое предложение на языке следования можно таким образом заменить предложением на
языке порядка: заменяем следование на его перевод; так что знание о теории
порядка влечет знание теории следования.
Каждая модель теории следования получается из модели теории порядка:
достаточно упорядочить различные копии Z . Это { очень редкое явление.
7.c Сумма
Мы рассматриваем теперь структуру, образованную бинарной операцией
суммы, определенной на универсуме натуральных чисел; она позволяет интерпретировать порядок, заменяя формулу x y на (9z)(x + z = y) . В этом
случае, не каждая модель порядка получается из модели суммы: если эта модель содержит элемент x , больший всех чисел вида 0; 1; 1+1; : : : ; 1+ +1; : : :
(в этом случае говорят, что x { нестандартный), то легко видеть, что x + x на
бесконечном расстоянии от x ; таким образом, необходимо, чтобы цепь C не
имела наибольшего элемента.
Упражнение 7.2 Счетная модель порядка получается из модели суммы тогда и только тогда, когда она имеет вид ! или ! + Z Q , где Q { цепь
рациональных чисел.
Мы собираемся теперь аксиоматизировать теорию суммы и описать её типы; для простоты, мы добавим к языку два символа константы для обозначения 0 и 1 : эти элементы определимы через сумму, x = 0 определяется через
x + x = x, а x = 1 { через x 6= 0 ^ (8u)(8v)(u + v = x ! u = 0 _ v = 0) . Тогда,
сумма удовлетворяет следующим аксиомам:
1. (8x)(8y)(x + y = y + x) коммутативность,
2. (8x)(8y)(8z)[(x + y) + z = x + (y + z)] ассоциативность,
3. (8x)(x + 0 = x)
4. (8x)(x + 1 6= x)
5. (8x)(8y)(x + y = 1 ! x = 0 _ x = 1)
7.c
Сумма
107
6. (8x)(8y)(9z)(x = y + z _ y = x + z)
7. (8x)(8y)(8u)(8v)(x = y + u ^ y = x + v ! x = y) .
Эти аксиомы выражают, что отношение (9z)(x + z = y) является линейным
порядком (транзитивным по (2), рефлексивным по (3), антисимметричным по
(7), линейным (6)), которое отныне обозначим через ; по (3) и (1) наименьшим
элементом является 0, и по (4) и (5) его последователем является 1.
Они влекут также, что каждое ненулевое x , будучи больше чем 0 , имеет
вид y + 1 и x + 1 является последователем x : по (4) x + 1 > x и, если y > x , то
y = x + z с z 6= 0 , таким образом, y = x +1+ t . Отметим, что они влекут также,
что если x y , то x + z y + z , и если x < y , т.е. x + 1 y , то x + z < y + z.
И обратно, рассматривая все случаи (x < y, x = y, x > y), мы видим, что
они влекут следующие свойства сократимости: x + z y + z ! x y ,
x+z = y+z ! x= y , x+z < y +z ! x < y .
Теперь примем соглашения о сокращениях записи: если n { натуральное число, то мы обозначим через n , в качестве этого числа, терм 1+ +1, где сумма
берется n раз; и мы обозначим через nx терм x+ +x, где сумма берется n раз;
не забываем, что, когда мы используем эти сокращения, произведение целых
чисел не присутствует в нашем языке. В модели для аксиом (1) { (7), элементы вида 0; 1; 2; : : : ; n; : : : , образуют начальный сегмент, на котором сумма изоморфна сумме натуральных чисел; эти элементы называются стандартными;
можно без помех отождествлять стандартное подмножество модели с соответствующими натуральными числами; их называют иногда также настоящими
натуральными числами, контрастно с нестандартными элементами модели,
которые, таким образом, больше, чем все стандартные элементы; модель сама
называется нестандартной, если она содержит нестандартный элемент; таким
образом, с точностью до изоморфизма существует единственная стандартная
модель, состоящая из настоящих натуральных чисел.
Сумма удовлетворяет также свойствам евклидова деления, которые выражаются бесконечным списком следующих аксиом (одна аксиома для каждого
ненулевого (стандартного!) натурального числа n) :
(8n ) (8x)(9y)(x = ny _ x = ny + 1 _ _ x = ny + (n ? 1)) ,
что можно переписать также в виде
(80n ) (8x)(9y)(9r)(x = ny + r ^ r < n)
Невозможно заменить список аксиом (8) единственной аксиомой так, как пытаются делать, универсально квантифицируя по n : в нашем языке произведения
нет, ny есть не что иное, как сокращение для y + + y . И действительно
не очень трудно видеть, что порожденная аксиомами 1; 2; : : : ; 7; 81 ; : : :; 8n ; : : :
теория не конечно аксиоматизируема, т.е. конечное число аксиом евклидова
деления никогда не может повлечь все остальные.
Как следствие этих аксиом, получаем единственность остатка и частного
евклидова деления: если ny + r = nz + s, с r и s меньше n , тогда y = z и
r = s ; действительно, если например z y; z = y + u , то ny + r = ny + nu + s ,
упрощая получим r = nu + s , таким образом, nu r < n : единственное число,
меньшее r , которое имеет вид nu есть 0 , таким образом, u = 0 . Мы обозначим
через [x=n] "целую часть" от деления x на n , т.е. единственный y, такое, что
108
Глава 7
АРИФМЕТИКА
x = ny + r с r < n ; r называется остатком от деления x на n .
Теорема 7.3 Множество аксиом 1; 2; : : : ; 7; 81; : : :; 8n ; : : : образует полную те-
орию суммы натуральных чисел и допускает элиминацию кванторов в языке
0; 1; ; +; [ =2]; : : : ; [ =n]; : : : .
Доказательство. В языке который мы рассматриваем, всякая подструктура содержит 0 и 1 , и замкнута относительно сложения и функций [ =n] .
Пусть нам даны !-насыщенные модели M и M 0 этой теории, кортежи a и b ,
порождающие в них изоморфные подструктуры A и B : мы должны показать
что a и b 1-эквивалентны. (Это покажет ещё, что теория полна, так как
подструктура, порожденная пустым множеством, всегда изоморфна сложению
настоящих натуральных чисел).
Добавим например элемент к A ; я утверждаю что подструктура, порожденная A и образована из элементов вида a + k[=n] , где a из A и k и n {
натуральные числа. Действительно, 0 и 1 имеют такой вид; как считать сумму
a + k[=n] и b + h[=m] ? Надо, очевидно, привести к общему знаменателю :
= n[=n] + rn ,
= m[=m] + rm ,
= nm[=nm] + rnm , rnm = np + rn = mq + rm ,
откуда
[=n] = m[=nm] + p [=m] = n[=nm] + q
и искомая сумма равна a + b + pk + qh + (km + hn)[=nm] . Отметим, что форма
выражения зависит только от остатков по модулю n , m , nm .
Как поделить a + k[=n] на m ? Если a = m[a=m] + r, тогда
a + k[=n] = m([a=m] + k[=mn]) + r + kp ;
таким образом, частное равно [a=m] + k[=nm] + [r + kp=m] , и снова видим, что
это вычисление зависит только от остатков .
Следовательно, чтобы определить полностью структуру, порожденную А и
с точностью до изоморфизма, остается выяснить когда
a + k[=n] b + h[=m] ;
(и в частности, когда a + k[=n] = b + h[=m]) ; это перепишется еще в виде
a + km[=nm] + kp b + hn[=nm] + hq , и умножая два числа на nm (аксиомы
влекут x y $ kx ky ) и добавляя (km + hn)rnm к обеим частям, получим
nma + nmkp + hnrnm + km nmb + nmhq + kmrnm + hn ;
которое является неравенством вида a0 + k0 b0 + h0 , способ получения
a0; b0; k0; h0 из начальных данных a; b; k; h; m; n зависит только от остатков по
модулю n , m , nm .
Поманипулируем еще с этим неравенством, которое мы перепишем без штрихов, и предположим что k h ; заменяя k на k ? h получим : a + k b ,
или k[a=k] + r + k k[b=k] + s ; если r s , то это эквивалентно неравенству
[a=k]+ [b=k] ; если r > s , то это эквивалентно неравенству [a=k]+ < [b=k] ;
случай k < h разбирается подобным способом. В итоге, с точностью до изоморфизма подструктура, порожденная A и , определяется :
7.c
109
Сумма
1) последовательностью остатков по модулю n ,
2) неравенствами вида a + b; a + b , с a и b в А , удовлетворяющимися
элементом .
Обозначим через А1 множество, образованное из разностей пар элементов
из A , и через B1 { множество, образованное из разностей пар элементов из В:
изоморфизм А на В продолжается до изоморфизма А1 на В1 , сохраняющего
порядок (так как a ? b c ? d $ a + d c + b ; на самом деле А1 и В1 {
подструктуры, которые изоморфны).
Нам надо таким образом найти , удовлетворяющий тем же конгруэнциям,
что и , и определяющий на В1 сечение, соответствующее тому, что определяет
на А1 ; различаем два случая:
{ 2 A1 ; таким образом имеет вид а ? b; берем в качестве соответствующую разность элементов В, и оставляем читателю проверку того, что имеет тот же остаток по модулю n что и { 62 A1 ; так как А1 замкнуто относительно последователя и предшественника, если a 2 A1 и а < , тогда а + 1 < , и если b 2 A1 ,
< b, тогда < b ? 1 ; и мы хотим найти в соответствующем сечении,
удовлетворящий данные конгруэнции, т.е. удовлетворить список формул
: : :; a y; : : :y b; : : :y rn( mod n); : : : ; так как для того, чтобы определять y по модулю n1; : : :; ns , достаточно определить его по модулю
их произведения (это является следствием аксиом!), конечная система,
извлеченная этого списка, эквивалентна трем условиям :
a y; y b; y rn( mod n) ;
которым удовлетворяет a, или а + 1, или а + 2 : : : или а + (n ? 1)! . Эти
условия таким образом совместны с теорией M , и по компактности и
!-насыщенности существует в M , удовлетворяющий им всем.
Существует более естественный способ аксиоматизации суммы, состоящий
в выражении свойства рекурсии натуральных чисел: если подмножество натуральных чисел содержит 0 , и если вместе с каждым x оно содержит x+1, тогда
оно совпадает целиком с N . Если мы вводим переменную X для подмножеств
N , это пишется так:
(8X )[(0 2 X ^ (8x)(x 2 X ! x + 1 2 X )] ! (8x)(x 2 X ) :
Только вот это выражение не является разрешенной аксиомой в нашем
языке; нам разрешаются квантификации по индивидам носителя рассматриваемой структуры, но не квантификации по его подмножествам; мы можем
говорить о множестве, об отношении, о функции только если мы их вводим заранее специальным символом. Именно по этой причине наш язык называется
языком первого порядка; языки, в которых определяют квантификацию также
по подмножествам, отношениям и т.п., именуются языками второго порядка;
они не позволяют развить теорию моделей подобно той, что первого порядка,
как показывает следующее упражнение :
110
Глава 7
АРИФМЕТИКА
Упражнение 7.4 Покажите, что язык второго порядка не обладает свойством компактности (заметьте, что в языке второго порядка сумма, или
даже следование натуральных чисел характеризуется с точностью до изоморфизма).
Но, хотя в нашем языке невозможно говорить во всей общности о подмножествах N , можно по крайней мере рассматривать те из них, которые определяются формулой f (x) языка суммы, и сказать, что если 0 удовлетворяет
f , и если вместе с каждым x x + 1 так же удовлетворяет f , тогда каждый x
удовлетворяет f . Для этого нужно добавить по одной аксиоме Af для каждой
формулы f ; но, так как все эти аксиомы имеют один и тот же вид, то иногда
говорят, что Af является схемой аксиом : чтобы получить аксиомы, которые
описывает схема Af , надо заменить f последовательно всеми формулами.
Аксиоматикой Пресбургера называются следующие аксиомы:
(I ) (8x)(x + 1 6= 0)
(II ) (8x)(8y)(x + 1 = y + 1 ! x = y)
(III ) (8x)(x + 0 = x)
(IV ) (8x)(8y)[x + (y + 1) = (x + y) + 1]
(Vf ) (8x)f[f (x; 0) ^ (8y)(f (x; y) ! f (x; y + 1))] ! (8y)f (x; y)g :
Рекурсия (еще говорят: индукция) является движущей идеей этой аксиоматики, которая, очевидно, выполняется для суммы натуральных чисел; аксиома
(IV) объясняет как можно считать x + y последовательно начиная с x +0 , x +1 ,
x + 2 , и т.д. ; имеется по одной аксиоме (Vf ) для каждой формулы f языка
(+; 0; 1) с n + 1 свободными переменными: эта аксиома называется аксиомой
индукции, относительно переменной x , в формуле f (x1; : : : ; xn; x) .
Теорема 7.5 Аксиоматика Пресбургера аксиоматизирует теорию суммы натуральных чисел.
Доказательство. Ясно, что эти аксиомы истинны для суммы натураль-
ных чисел, и для доказательства полноты этой теории лучше всего вывести из
них каждую аксиому предыдущего списка. Действительно, аксиоматика Пресбургера обязана своей элегантностью скорее метафизическому вдохновению,
чем интуиции о том, что является типами. Мы здесь проделаем это быстро.
(2) Ассоциативность доказывается , индукцией по z :
x + (y + 0) = x + y = (x + y) + 0 ;
x + (y + (z + 1)) = x + ((y + z) + 1) = (x + (y + z)) + l =
= ((x + y) + z) + 1 = (x + y) + (z + 1) :
(1) Коммутативность получается в три этапа ; индукцией по x : 0 + x = x ,
индукцией по x : 1 + x = x + 1 , индукцией по y : x + y = y + x .
(4) индукцией по x : 0 + 1 6= 0 ; x 6= x + 1 влечет x + 1 6= (x + 1) + 1
7.d
111
Кодирование конечных множеств
(5) индукцией по x показываем, что каждое ненулевое число имеет вид u +1 ;
если (u + 1) + y = 1 , 0 = u + y , и ни u ни y не имеют вид v + 1 , таким
образом, u = 0
Аксиомы (6) , (7) , (8n) оставляем читателю.
Отметим, что в доказательстве теоремы 7.5 используются только слабые
версии, тем не менее бесконечное число, аксиом индукции.
Пример модели теории суммы Возьмите две упорядоченные группы : Z
целых чисел и Q рациональных чисел; снабдите произведение групп Z Q лек-
сикографическим порядком. Тогда элементы, большие чем (0; 0) составляют
модель теории суммы натуральных чисел.
Замечание . Для теории суммы, число типов над ; есть 2! : имеется действительно 2! возможностей, чтобы выбрать остатки по модулю n (когерентным способом!) . Следовательно эта теория не может иметь счетную
!-насыщенную модель.
7.d Сумма и произведение : кодирование
конечных множеств
С этого момента, мы будем изучать структуру, образованную из натуральных чисел с суммой и произведением; теория этой структуры называется арифметикой. Мы предположим, что язык содержит 0; 1; ; +; , хотя 0; 1; необязательны, так как они определимы через сумму; тем не менее 0 и 1 очень
удобны, так как они позволяют выразить каждое натуральное (стандартное!)
число термом n = 1 + + 1 ; и с другой стороны, порядок играет такую фундаментальную роль в классификации формул арифметики, что практически
необходимо его выделять специальным символом.
Так же, как и для суммы, мы называем стандартной моделью модель N
арифметики, образованную из настоящих натуральных чисел; так как каждый
элемент стандартной модели выделен термом, его диаграмма (множество предложений, а не только предложений без кванторов, которым удовлетворяют
его элементы) является частью арифметики, и каждая нестандартная модель
является элементарным расширением стандартной модели, являющейся ее начальным сегментом.
В предыдущих параграфах, мы изучили некоторые частичные структуры
арифметики, одна богаче другой, каждая из которых интерпретировалась в
следующей. Мы смогли аксиоматизировать их теории, и описать некоторые
нестандартные модели: это изучение от случая к случаю становилось все более
деликатным. С суммой нам было труднее, чем с порядком или последователем,
но мы вышли из положения почти тем же путем, преодолев осложнения только
технического характера.
Но мы поймем, что со суммой и произведением мы делаем качественный
112
Глава 7
АРИФМЕТИКА
прыжок и мы входим в новую область; и теперь нам не удастся ни аксиоматизировать арифметику, ни строить нестандартные модели, так как мы увидим,
что имеются теоретические препятствия против этих попыток: арифметика не
может иметь ни аксиоматизацию, ни нестандартных моделей той же природы, присущей изученным до этого частичным структурам; конечно, нам надо
уточнить, что мы понимаем под "природой" этих объектов.
Мы еще не готовы для этого и в этом параграфе мы лишь покажем, что
арифметика содержит кодированную в ней самой комбинаторику, или теорию
конечных множеств. Так как это кодирование очень существенно для изучения моделей арифметики и для того, чтобы оценить её выразительную силу,
его нужно хорошо усвоить. Предположим, что мы хотим сказать "существует конечная последовательность из 10 элементов таких, что f " ; мы должны
только написать (9x1) : : : (9x10)f ; мы можем делать это также для последовательности из миллиарда элементов ; но как сказать на нашем языке первого
порядка "существует конечная последовательность из x элементов", где x {
переменная ? Вот тут-то -функция Геделя и дает искомое средство.
Функция (u; v; w) Геделя сопоставляет трем целым числам u; v; w последовательность целых чисел a0; : : : aw?1 длины w (если w = 0 , то (u; v; w) {
пустая последовательность), определенную таким образом: ai является остатком евклидова деления u на (i + 1)v + 1 .
Теорема 7.6 Функция (u; v; w) является сюръекцией N3 в множество конечных последовательностей элементов из N .
Доказательство. Натуральные числа удовлетворяют китайской лемме:
если d0; : : :; dw?1 попарно взаимно просты, то для данных a0; : : :; aw?1 существует натуральное u , конгруэнтное a0 по модулю d0 , : : : , конгруэнтное aw?1
по модулю dw?1 (чтобы доказать китайскую лемму, покажите, что
Z=d0 : : : dw?1 Z= Z=d0Z Z=dw?1Z:
Нам остается найти u больше a0; : : :; aw?1 (чтобы эти натуральные числа
были остатками по модулю для всех (i + 1)v + 1)), такое, что, если i < j < w ,
то (i + 1)v + 1 и (j + 1)v + 1 были взаимно простыми. Полагаем v = n! , где n
больше w; a0; : : : ; aw?1 ; если p является простым общим делителем (i + 1)n! + 1
и (j + 1)n! + 1 , то он делит также (j ? i)n! и он делит таким образом j ? i или
n! , и так как j ? i делит n! , он делит n! ; но так как p делит (i + 1)n! + 1 , он
должен делить 1, это абсурд.
Свет проник в разум читателя: для того, чтобы сказать "существует конечная последовательность, у которой i-ый член : : : " скажем "существует u; v; w
такие, что остаток деления u на (i + 1)v + 1 : : : "; и все это { на языке арифметики, так как формула (9y)(a = yb + c ^ c < b) выражает, что c является
остатком деления a на b.
В качестве иллюстрации определим в арифметике показательную функцию xy . Прежде всего заметим, что сумма получается итерацией следования,
произведение { итерацией суммы, и показательная функция { итерацией произведения : сумма { это единственная функция f такая, что (8x)f (x; 0) = x ,
7.d
Кодирование конечных множеств
113
(8x)(8y)f (x; y +1) = f (x; y)+1 ; произведение { это единственная функция f такая, что (8x)f (x; 0) = 0 , (8x)(8y)f (x;y + 1) = f (x; y) + x ; показательная функция { единственная f такая, что (8x)f (x; 0) = 1 , (8x)(8y)f (x; y +1) = f (x; y) x .
Но эти определения, содержащие квантификацию по функции ("единственная
функция"), для нас запрещены. Кажется, что градация структур становится
все более и более сложной: следование, сумма, сумма и произведение; за ним
следует структура: сумма, произведение, показательная функция. Ничего подобного, мы укажем формулу первого порядка языка суммы и произведения,
определяющего график показательной функции { отношение z = xy .
Введем сокращение: r(u; v) обозначает остаток от деления u на v + 1 ; мы
уже отметили, что эта функция определяется через сумму и произведение.
Наша формула f (x; y; z) , определяющая отношение z = xy , следующая:
(9u)(9v)(r(u; v) = 1 ^ r(u; (y + 1)v) = z ^
^ (8i)(1 i y ! r(u; (i + 1)v) = x r(u; iv))) :
Почему это то, что нужно ? Предположим что x; y; z удовлетворяют формуле; рассмотрим последовательность
a0 = r(u; v); : : :; ai = r(u; (i + 1)v); : : :; ay = r(u; (y + 1)v) ;
так как a0 = 1 , и ai+1 = ai x , обязательно получим ay = xy , и, кстати,
формула утверждает, что z = ay ! Обратно, если z = xy , то по теореме 7.6 последовательность a0 = 1; : : : ; ai = xi; : : :; ay = xy имеет вид (u; v; y +1) , откуда
следует существование u и v и формула действительно удовлетворяется.
Идея этого доказательства заключается в том, что определение рекурсией
благодаря функция превращается в нечто выразимое на языке арифметики;
теперь читателю предлагается определить через сумму и произведение любую
функцию из N в N , которая приходит ему на ум (например, ту, которая x
сопоставляет x-ое простое число); если в некоторых случаях он потерпит неудачу, то это из-за недостатка опыта в управлении функцией или, возможно,
у него больное воображение; иначе, он установит, несколько неожиданно для
себя, что каждая "естественная" функция из N в N определима в арифметике.
Пока все это выглядит немного кустарно, и теперь мы покажем метод более
систематического исследования, состоящий в интерпретации "теории конечных
множеств" (или комбинаторики) внутри арифметики.
Все, или по крайней мере каждый читатель математической литературы
знает как писать числа в десятичной системе счисления посредством десяти
цифр; и выпускники средней школы знают также как писать число в двоичной
системе счисления посредством
двух цифр 0 и 1 : оно состоит в том, чтобы
P
i
его представить в виде "i2 , с "i = 0 или 1 , причем "i все нули начиная
с некоторого номера. Мы нуждаемся в нескольких элементарных леммах о
нумерации.
Лемма 7.7 Каждое число обладает одним единственным разложением в двоичном основании.
114
Глава 7
АРИФМЕТИКА
Доказательство.
Покажем сначала единственность; мы используем форP
мулу 0ik 2i = 1 + 2 + + 2kP= 2k+1 ?P1, которую легко показать индукцией
по k ; итак, предположим, что "i2i = i2i { два разложения одного и того
же числа; "i как и i нули начиная с некоторого места, существует наибольший
индекс k такой, что "k 6= k , предположим например, что "k = 0; k = 1 ;
отбрасывая
индексам, большим k , получаем равенство:
P0ik?1 "i2iто,= что
P0соответствует
i
k
2
+
2
, которое невозможно, так как левый член
ik?1 i
k
мажорируется 2 ? 1 .
Покажем теперь, что каждое число x имеет требуемое разложение; мы не
делаем это индукцией по x из-за проблемы сложения
P с "записью в уме". Проще
заметить, что имеются 2k различных разложений 0ik?1 "i2i , в которых все
цифры являются нулями начиная с k ; мы уже поняли, что числа,Pкоторые они
представляют, все различные, и они кроме того мажорируются 0ik?1 2i =
2k ? 1 : это { все числа от 0 до 2k ? 1 .
Лемма 7.8 Функция (x; i) , сопоставляющая паре (x; i) (i + 1)-ую цифру
разложения x в двоичном основании, определима через сумму и произведение.
Доказательство. Отношение y = (x; i) определяется следующей форму-
лой, которая может выражена только через сумму и произведение, так как,
как мы уже знаем, показательная функция определяется через них:
(9u)(9v)(9w)f[r(u; v) = 1 _ r(u; v) = 0] ^
^ (8j )[1 j w ! (r(u; jv) = r(u; (j + 1)v) _ 2j + r(u; jv) =
= r(u; (j + 1)v))] ^ x = r(u; (w + 1)v) ^ (i > w ! y = 0) ^
^ (i = 0 ! y = r(u; v)) ^ (((1 i w) ^ r(u; iv) = r(u; (i + 1)v)) ! y = 0) ^
^ [((1 i w) ^ r(u; iv) 6= r(u; (i + 1)v)) ! y = 1]g :
Это { то, что надо, потому что последовательность (u; v; w + 1) , представленная тройкой u; v; w + 1 , дает в точности частичные суммы разложения x
по основанию два.
Мы вводим теперь бинарное отношение "принадлежности" между целыми
числами: говорим, что x 2 y, если x + 1-ая цифра разложения y по основанию два равна 1; если она равна 0, то x 62 y . По лемме 7.8 отношение x 2 y
определимо в арифметике формулой (y; x) = 1. Это бинарное отношение принадлежности определяет модель "теории множеств" с носителем N; очевидно,
чтобы дать смысл этому утверждению, надо было бы уточнить аксиомы этой
теории, чего автор этих строк абсолютно избегает. Будет проще, если читатель убедится, что натуральные числа, снабженные этой принадлежностью,
7.d
Кодирование конечных множеств
115
имеют формальные свойства множеств, с которыми они упражнялись школе,
и которые в течение века служат жизненной средой для развития математики.
Например, одним из принципов этой теории множеств является аксиома
экстенсиональности: "два множества, которые имеют одни и те же элементы,
равны"; она здесь выполняется, так как два числа, имеющие одно и то же разложение по основанию два, равны! Мы имеем пустое множество, являющееся
числом 0; для данных двух чисел a и b , мы можем образовать пару fa; bg ,
которая равна одноэлементному множеству fag = 2a , если a = b , и 2a + 2b ,
если a и b { различные. Вообще, в этой модели для данных n различных чисел a0; : : : ; an?1 можно образовывать множество fa0; : : : ; an?1g , являющийся
числом 2a0 + + 2an?1 .
Если x 2 y , то x < y так как i < 2i. Поэтому наше отношение принадлежности фундировано, т.е. не существует последовательности x1; : : : ; xn с
x1 2 x2 2 2 xn 2 x1 . В частности, элементы a все строго меньше a. Теперь
легко видеть, что если имеется два множества a и b , то можно образовывать
их объединение, совпадающее с числом a + b, если a и b дизъюнктны; аксиома
суммы также истинна: можно образовывать объединение элементов a ; как
и аксиома множества всех подмножеств: можно образовать множество чисел,
являющихся подмножествами a ; схема аксиом замещения также верна (это
последнее "темное" утверждение адресована ученым: если Вам не хватает науки, и если Вы хотите блистать в обществе, пролистайте учебник по теории
множеств).
В модели (N; 2) имеются только конечные множества; здесь "конечность"
{ внешнее свойство относительно модели: для данного числа a, множество x,
таких, что x 2 a, конечно; как мы заметили, любое конечное множество чисел
имеет вид fx=x 2 ag. В предыдущей фразе, слова "множество", "конечный" необходимо понимать в естественном, неформальном, интуитивном смысле (если
считать множества естественными объектами, о которых можно иметь интуицию!), а не в техническом смысле модели (N; 2); но также можно показать,
что эта модель удовлетворяет аксиоме "каждое множество конечно" или еще
"для каждого a существует натуральное число n и биекция n на a".
Как в теории множеств, представляются натуральные числа ? Число 0
представляется множеством ; ; 1 представляется , одноэлементным множеством содержащим f;g , 2 есть f;; f;gg , и т.д. Если n обозначает множество,
представляющее число n , то n + 1 представляется n [ fng . Таким образом,
натуральное число становится множеством предшествующих ему натуральных
чисел. Мы видим, что натуральное число n транзитивно (если x 2 y и y 2 n ,
тогда x 2 n), и что отношение принадлежности определяет на элементах n
(строгий) линейный порядок: читатель может проверить что только элементы вида n модели (N; 2) обладают этими двумя свойствами; они составляют
множество N ("множество", не представимое в модели (N; 2) !) натуральныХ
чисел в смысле модели (N; 2) .
Мы уже отметили, что если x и y дизъюнктны относительно 2 , x \ y = ; ,
т.е. x и y не имеют общих разрядов, равных 1, тогда x[y = x+y ; и что fxg = 2x ;
кроме того x 62 x (так как если x 2 y , то x < y ); следовательно, отображение,
которое x сопоставляет x определяется законом следующей индукции: 0 = 0 ,
116
Глава 7
АРИФМЕТИКА
(x + 1) = x + 2x . Наш читатель не будет более удивлен, узнав, что функция
y = x определяется в арифметике формулой:
(9u)(9z)(r(u; v) = 0 ^ r(u; (x + 1)v) = y ^
^ (8i)(1 i x ! r(u; (i + 1)v) = r(u; iv) + 2r(u;iv))) :
Следовательно, мы можем переложить, посредством отображения , которое определимо, структуру N на его образ N . Что мы выигрываем при этом ?
То, что теперь N вся покрыта комбинаторикой, что все то что будет говорить
о конечных подмножествах N , конечных множествах конечных подмножеств
N , и т.д. может быть выражено с помощью 2 . Что такое пара (x; y) ? Это
{ множество ffxg; fx; ygg ; Что такое произведение множеств x y ? Это {
множество пар, у которых первая координата является элементом x и вторая
элемент y . Что такое отображение x в y ? Это { подмножество x y , являющееся графиком функции. Что такое конечная последовательность элементов
x ? Это { отображение n в x для некоторого n . Короче, все теоретикомножественные понятия, например бинарного отношения на x , группы на x и
т.д., которые не выходят за рамки конечных множеств, непосредственно переводимы благодаря отношению 2 .
Таким образом, если для доказательства свойства натуральных чисел нужны комбинаторные понятия, то вместо того чтобы использовать функцию ,
которая была полезной на техническом этапе для определения отношения 2 ,
мы можем использовать наше отображение , чтобы свободно работать с N в
нашей комбинаторике (N; 2) , и вернуться в N обратным отображением из N вN.
Например, предположим что мы хотим определить функцию y = px , отображающую x на x-ое простое число; читатель это умеет с помощью функции
, как в предыдущих примерах; но можно также перейти в N и выразить,
что y { простое число (в смысле N ), такое, что существует биекция между
x и множеством простых чисел, меньших числа y .
Здесь, экономия времени не фантастическая; она становится таковой если
необходимо ввести множества множеств, функций, и т.д. Управление функцией , чтобы закодировать все эти понятия, становится сложной манипуляцией, в то время как в (N; 2) все происходит естественно : достаточно выразить
нашу интуицию. Тем не менее читателю, у которого интуиция ещё недостаточно сформирована (или искажена теоретико-множественной практикой, приведшей к потере доверия этому отношению 2) нужно время от времени проводить
тяжелые, но более осязаемые доказательства посредством этой функции : понимание значения этого кодирования конечных множеств в арифметике очень
важно.
Мы заключим этот параграф несколькими тонкими рассмотрениями. Мы
сейчас работали в стандартной модели N ; что произойдет, если мы заменим
N на одно из его нестандартных элементарных расширений N1 ? Формула,
определяющая отношение 2 на N определяет бинарное отношение также на
N1 , которое мы обозначим тем же символом, и (N1; 2) является, очевидно,
элементарным расширением (N; 2) , так как каждое свойство 2 выражается
через сумму и произведение.
7.e
Кодирование формул
117
Подмножества A из N1 , соответствующие множествам в смысле этой комбинаторики, то есть подмножества A из N1 , соответствующие некоторому a
из N1 такому, что для каждого x из N1 , x 2 a тогда и только тогда, когда x
в A , будут назваться "множествами, кодированными в модели N1", или еще
"конечными множествами в смысле N1 ". Все действительно конечные подмножества N1 кодируются таким образом, так как следующее предложение
является теоремой арифметики:
(8x1) : : : (8xn)(9y)(8x)(x 2 y $ (x = x1 _ _ x = xn)) ;
Но следующая аксиома также истинна в арифметике, которая говорит, что для
любого x сегмент [0; x] закодирован:
(8x)(9y)(8z)(z 2 y $ z < x) :
Следовательно, среди этих конечных в смысле N1 множеств, находятся
и те, у которых число элементов x (более точно, x) нестандартное; Значит,
рассматриваемые вне модели, они бесконечны, но что касается свойств, выразимых на нашем языке, они ведут себя точно так же, как конечные множества.
Кроме того, модель (N1; 2) удовлетворяет аксиоме "каждое множество конечно", то есть "каждое множество находится в биекции с натуральным числом" !
Понятие стандартного или нестандартного числа ощутимо только если рассматривать нашу модель извне или на более мощном языке. Каждая модель
арифметики живет с мыслью, что она составлена из настоящих натуральных
чисел: только внешний наблюдатель лишен этой иллюзии.
7.e Кодирование формул,
теорема Тарского
Так как мы располагаем комбинаторикой, мы можем кодировать формулы языка (0; 1; ; +; ) , то есть их представлять числами и так, чтобы манипуляции на формулах становились определимыми операциями в арифметике.
Мы хотим, таким образом, инъективно сопоставить каждой формуле свой код;
для этого сначала упорядочим все символы языка : скобки (; ), логические
символы :; _; ^; 9; 8 сигнатурные символы =; 0; 1; ; +; , символы переменных x1; x2; x3 : : : , и в этом порядке им сопоставим числа 0; 1; 2; 3; 4 : : : . Слово
является конечной последовательностью a0; : : :; an этих символов; его можно
представлять, например, числом p0ao+1 pann+1 , где pi обозначает i-ое простое
число: символ, который находится в i-ом месте, { это степень pi минус один.
Видно сразу, что множество кодов слов легко определимо в арифметике: это
множество таких чисел x , что если простое число p делит x , то каждое простое
число, меньшее p, делит x . Более сложно, но можно определить множество
кодов формул благодаря функции .
Вот почему мы откажемся от этого кодирования в пользу нашей комбинаторики (N; 2) ; действительно, слово есть не что иное как конечная последовательность символов, то есть отображение n в конечноe подмножество нашего
118
Глава 7
АРИФМЕТИКА
списка символов из N (можно брать и N ): это непосредственно выражается
в структуре (N; 2) . Слова являются таким образом конечными последовательностями в смысле (N; 2) . Как отличить формулы от других слов? Вводя
список их подформул: слово m является формулой, если существует конечная
последовательность m0; : : :; mn слов, такая, что последнее есть m и каждая mi
либо атомна, либо является конъюнкцией или дизъюнкцией двух предшествующих слов этой последовательности, либо является отрицанием или квантификацией предыдущего слова. Все это непосредственно выразимо в (N; 2) как
только покажут, как определяются атомные формулы: это слова такого-то или
такого вида.
Все понятия которые касаются формул и которые не выходят за комбинаторику (т.е. которые включают только конечные множества) определимы в
арифметике: это понимается единообразно в модели (N; 2) ; если вы не хотите её использовать, то надо будет каждый раз манипулировать функцией .
Например функции, которые формуле или, более точно, её коду, сопоставляют
её сложность, её ранг квантификации, код множества её подформул, код множества её свободных переменных и т.д., определимы. Значит, можно выразить
в арифметике, что формула является предложением, то есть она не содержит
свободных переменных.
Но как определить то, что формула f (x) удовлетворяется кортежем a ?
Индукцией по сложности f ? Конечно, но индукция имеет дело с парой (f; A) ,
где A является множеством кортежей, удовлетворяющих f . Так как это множество A может быть бесконечным и убежать из нашей комбинаторики, то
непонятно, как проводить это определение индукцией. Невозможность этого
утверждается следующей теоремой, которая выдвинута вперед, так как она
очень точно указывает пределы выразительной силы арифметики:
Теорема 7.9 (Тарский) Множество кодов предложений,истинных в арифметике, не определимо арифметической формулой.
Доказательство. Итак допустим, что существует формула V (x) с одной
свободной переменной x , такая, что числа n , удовлетворяющие ей, были точно
кодами истинных предложений. Множество A кодов формул с единственной
свободной переменной x определимо, так же как и функция ' , сопоставляющая
паре (n; m) , где n в A , код предложения, полученного заменой в формуле с
кодом n переменной x числом m .
Тогда обозначим через V (x; y) формулу V ('(x; y)) ; мы видим, что эта формула удовлетворяется такими парами (n; m), что n { код формулы, имеющей
единственную свободную переменную x , такой, что предложение, полученное из неё заменой x на m, было истинным. Пусть тогда n0 { код формулы
:V (x; x) ; мы не сможем выйти из следующей дилеммы :
{ если V (n0; n0) истинно, то :V (n0; n0) истинно ,
{ если V (n0; n0) ложно, :V (n0; n0) ложно.
7.f
Иерархия арифметических множеств
119
Замечание. Мы должны были выбрать вполне определенное кодирование,
но ясно, что в этом выборе имеется большой произвол: его можно модифицировать, но сущность от этого не изменится; необходимо только, чтобы оно
позволило арифметически выразить "обычные" операции на формулах (например замена переменной величины константой, отрицание, и т.д.). Если четные
номера сопоставим истинным предложениям, а нечетные номера { ложным
предложениям, то у нас нет никаких шансов доказать теорему Тарского.
7.f Иерархия арифметических множеств
Говорят, что подмножество Nn { арифметическое, если оно образовано из
n-ок, удовлетворяющих некоторой формуле f (x) в языке арифметики; говорят
ещё, что подмножество определимо в арифметике. Мы приступаем к классификации арифметических формул и множеств, которые они определяют, по
числу кванторов этих формул в пренексной форме. Мы уже говорили в разделе 2.a о приведении к пренексной форме в общих чертах; здесь мы собираемся определить специальные пренексные формы в арифметике, вводя понятие
"ограниченных квантификаций".
В формулах вида (9y)(y x ^ f (x; y)) или (8y)(y x ! f (x; y)) со свободной переменной x указанные кванторы называются ограниченными: чтобы
понять истинна ли формула на n , достаточно проверить только те y , которые
меньше n ; как только известно n , нужно сделать лишь конечное число проверок; вполне понятно, что такого рода квантификации гораздо более простой
природы, чем неограниченные кванторы, и что надлежит их различать. Итак,
введем обозначения: (9y x)f , (8y x)f как сокращения (9y)(y x ^ f ) ,
(8y)(y x ! f ) ; в формулах (9y < x)f , (8y < x)f переменная x { свободная,
даже если она не свободна в f .
Формула называется 0-формулой, или еще с ограниченной квантификацией, если все его кванторы ограничены; точно так же, как формула приводится
к пренексной форме, легко видеть, что 0-формула эквивалентна 0-формуле,
у которой все кванторы стоят впереди.
1-формула есть формула, имеющая вид (9x)f , где f есть 0-формула ;
1-формула имеет вид (8x)f для некоторой 0-формулы f . И индукцией по
n определим классы n - и n-формул для n > 1 : n+1-формула имеет вид
(9x)f , где f есть n-формула; n+1-формула имеет вид (8x)f , где f есть n формула. Индекс n означает таким образом, что перед формулой имеется n
кванторов, поочередно 9 и 8 ; означает что формула начинается с 9 , и ,
что она начинается 8 .
Теорема 7.10 В арифметике, конъюнкция или дизъюнкция двух n - формул
эквивалентна n -формуле; ограниченная квантификация, или экзистенциальная квантификация, примененная к n -формуле дает формулу, эквивалентную n -формуле; отрицание n -формулы эквивалентна n -формуле.
Конъюнкция или дизъюнкция двух n-формул эквивалентна n-формуле;
ограниченная квантификация, или универсальная квантификация, применен-
120
Глава 7
АРИФМЕТИКА
ная к n-формуле, дает формулу, эквивалентную n-формуле; отрицание nформулы эквивалентна n-формуле.
Доказательство. Индукцией по n: n+1 -формула имеет вид (9x)f , где
f есть 0- или n-формула в зависимости от значения n; (9x)f ^ (9y)g ,
(9x)f _ (9y)g эквивалентны соответственно (9x)(9y)(f ^ g) , (9x)(9y)(f _ g) ,
при условии, что в первом случае в случае необходимости изменяются имена связанных переменных так, чтобы x не была свободной в g , а y { в f ;
(9y)(9x)f эквивалентна (9z)(9y z)(9x z)f . Формула вида (9y u)(9x)f
эквивалентна формуле (9z)(9y u)(9x z)f ; (8y u)(9x)f эквивалентна
(9z)(8y u)(9x z)f , действительно, каждому y, меньшему, чем u, соответствует x , и так как этих x конечное число, они мажорируются некоторым z .
Наконец :(9x)f эквивалентна (8x):f . Для n+1 рассуждения аналогичны.
Из теоремы 7.10 следует, что каждая формула эквивалентна n - или nформуле для некоторого n. Будем говорить, что формула есть "n - формуле",
когда она эквивалентна, очевидным образом, n -формуле; например, скажем,
что отрицание n -формулы есть n-формула, хотя, формально, это не так;
скажем так же, что n -формула есть также n+1- и n+1-формула (квантифицируйте по переменной, не содержащейся в формуле).
Теперь будем говорить, что A N k есть n -множество, если оно имеет
n-определение, то есть если оно составлено из множества кортежей, удовлетворяющих некоторой n -формуле, и что оно есть n{множество, если имеет
n-определение. Естественно, если множество определяется n -формулой для
некоторого n, то возможно, что эта формула эквивалентна гораздо более низкой формуле в этой иерархии.
n -множество, являющееся одновременно n-множеством, называется n{
множеством, т.е. если его дополнение { n -множество. У нас нет n-формул:
задание n-множества { это задание n -определения этого множества и nопределения этого множества, эквивалентных,следовательно, в арифметике.
Классы n -множеств и n-формул будем часто отождествлять и обозначать
просто через n . Аналогично обозначаем класс n- и n -множеств.
Как следствие теоремы 7.10 для классов n , n , n получаем следующую
диаграмму включений, обозначенных стрелками :
1
:::
n
:::
%
%
&
%
&
%
&
0 1
n
n+1
%
&: : :
& % 2 &: : %
&
:
n
1
Мы увидим, что каждое из этих включений строгое, то есть что иерархия не
обрывается с некоторого n . Вкратце, классы n являются алгебрами Буля относительно _; ^; :, замкнутыми относительно ограниченных квантификаций;
классы n и n замкнуты относительно _; ^ и ограниченных квантификаций;
классы n замкнуты относительно 9 , классы n { относительно 8 , дополнение n -множества принадлежит классу n, а дополнение n-множества {
классу n . Отметим мимоходом, что в теоретико-множественных терминах
экзистенциальная квантификация A называется проекцией A из !k+1 на !k .
7.f
121
Иерархия арифметических множеств
В действительности оказывается, чтобы установить эту иерархию введение
ограниченных кванторов необязательно. Назовем диофантовым множество,
определимое формулой вида (9y1) : : : (9yn)f , где число кванторов 9 необязательно равно 1, а f является конъюнкцией уравнений P (x; y) = Q(x; y) , где P
и Q { многочлены c натуральными коэффициентами. Так как такое уравнение является формулой без кванторов, ясно, что каждое диофантово множество есть 1 , но так же истинно, что каждое 1-множество диофантово; это
теорема Матиясевича, которая позволяет ответить на знаменитую проблему
Гильберта; я не буду здесь рассматривать эту теорему.
Прежде чем продолжить, мы проведем несколько классических манипуляций на множествах n и n. Мы говорим, что функция из 0 !k в !k0 есть n функция, если её график является n-подмножеством в !k+k ; здесь, функция
всюду
определена: каждому x из ! k соответствует
один и единственный00 y из
0
0
k
k
k
! . Если f является функцией из ! в ! , а0 g 00{ функцией из !k в !k , то
склейкой f и g называется функция из ! k в ! k +k , которая кортежу0 x сопоставляет сочленение f (x)g(x) ; если f является функцией из !k в !0 k , то её
координаты - композиция f с одной из k0 канонических проекций ! k в ! .
Лемма 7.11 График n -функции есть n-множество; композиция двух n функций является также n -функцией; обращение n-биекции и также склейка двух n -функций является n -функцией; наконец, функция есть n -функция
тогда и только тогда, когда каждая из её координат есть n -функция.
Доказательство. Поскольку f { всюду определенная функция, отношение
y 6= f (x) определяется формулой (9z)(z = f (x) ^ z 6= y) из класса n , если
такова формула z = f (x) ; если h { композиция f и g , то отношение z = h(x)
определяется через (9y)(z = g(y) ^ y = f (x)) ; биекция и обратное для неё
отображение имеют один и тот же график (поменяйте ролями x и y).
Граф склейки h функций f и g определяется формулой y1 = f (x) ^ y2 =
g(x) ; каноническая проекция !k на его i-ую координату определяется 0формулой без квантора y = xi, следовательно, если f есть n -функция, то
такова же и её композиция с проекцией; обратно, любая функция f является
склейкой своих координат.
Лемма 7.12 Пусть f (x) { n-функция; если '(y) { n -формула, то такова
и '(f (x)); и если '(y) { n -формула, то такова и '(f (x)).
Доказательство. Формула '(f (x)) может быть записана по выбору как
(9y)(y = f (x) ^ '(y)) или (8y)(y 6= f (x) _ '(y)) !
То же самое можно сказать по-другому:
Лемма 7.13 Прообраз n -множества относительно n -функции является
n-множеством; прообраз n-множества относительно n -функции является n -множеством.
Доказательство. Записываем x 2 f ?1(A) по нашему желанию в виде
(9y)(y = f (x) ^ y 2 A) или (8y)(y 6= f (x) _ y 2 A) .
122
Глава 7
АРИФМЕТИКА
Лемма 7.14 Образ n-множества при n-функции является n -множеством.
Доказательство. Запишем x 2 f (A) в виде (9y)(x = f (y) ^ y 2 A) .
Характеристическая функция множества A отображает x на 1 , если x 2 A ,
и отображает x на 0, если x 62 A .
Лемма 7.15 n-множества и только они имеют характеристическую n функцию.
Доказательство. Пусть f { характеристическая функция A ; если A 2
n , то график f определяется n -формулой: (x 2 A ^ y = 1) _ (x 62 A ^ y = 0) ;
и если f { n -функция, A определяется формулой f (x) = 1 , а его дополнение
определяется формулой f (x) = 0 .
Лемма 7.16 Для любых k и h , существует 1-биекция между !k и !h .
Доказательство. Рассмотрим биекцию f из ! в ! ! , состоящую в перечислении !2 по возрастанию x + y , затем по возрастанию y : разбиваем четверть плоскости ! ! на отрезки, параллельные второй диагонали, помещаем
их впритык один за другим и пронумеруем. В n первых отрезках, соответствующих x + y = 0 ; x + y = 1 ; : : :; x + y = i ; : : :; x + y = n ? 1 , содержится
1 + 2 + + n = n(n + 1)=2 пар; следовательно, функция g , обратная к f ,
определяется формулой g(x; y) = (x + y)(x + y + 1)=2 + y ; g { 1-биекция !2
на ! (если вас геометрия не убеждает, то вы можете всегда доказывать биективность индукцией по x и y), так как её график определяется 0-формулой
2z = (x + y)(x + y + 1) + 2y . Функция, которая (x1; : : :; xk ; xk+1) сопоставляет (x1; : : : ; g(xk ; xk+1)) , является 1-биекцией !k+1 на !k , откуда с помощью
композиции следует общий результат.
!k
Так как можно свести к ! всегда 1-биекцией, сохраняющей иерархию,
в основном говорят, когда речь идет об арифметических множествах, только о
подмножествах ! , или функциях из ! в ! : введение !k не является большим
обобщением. Например, с помощью биекции из !2 в ! докажем следующую
лемму, которая будет полезна впоследствии:
Лемма 7.17 (Принцип n -выбора) Пусть R(x; y) { бинарное n -отношение
на натуральн??х числах, такое, что для каждого x существует такой y , что
(x; y) удовлетворяет R. Тогда существует n -функция f из ! в !, такая, что
для каждого x пара (x; f (x)) удовлетворяет R .
Доказательство. Если бы мы попытаемся сопоставить x наименьшее y,
такое, что N ` R(x; y) , то чтобы выражение "для каждого z < y, (x; z) 62 R"
было n-формулой, необходимо n-определение для R. Лучше мы перепишем
R в виде (9t)S (x; y; t) , где S есть 0 или n?1 в зависимости от значения n ,
и берем y из пары (y; t) с наименьшим номером. Пусть { каноническая 1биекция !2 на ! и пусть 1 и 2 { две 1-проекции обращения : для каждого
7.f
123
Иерархия арифметических множеств
x пара (1(x); 2(x)) { единственная такая, что x = (1(x); 2(x)); Рассмотрим
функцию y = f (x) , график которой определяется следующей n -формулой:
(9z)(S (x; 1(z); 2(z)) ^ (8u < z):S (x; 1(u); 2(u)) ^ y = 1(z)) :
Лемма 7.18 Непустое подмножество ! есть n -множество если и только
если оно образ n -отображения из ! в ! ; оно есть n -множество если и
только если оно образ возрастающего n -отображения из ! в ! .
Доказательство. Множество ! всех натуральных чисел определяется 0-
формулой x = x; таким образом, по 7.14 образ n-функции есть n -множество.
Обратно, предположим, что A содержит a и определяется формулой (9y)f (x; y) ,
где f из n?1 или 0 в зависимости от значения n. Рассмотрим функцию g
из !2 в ! , которая пару (x; y) отображает на x если f (x; y) удовлетворяется,
и отображает на a иначе; её график z = g(x; y) определяется 0-формулой
(f (x; y) ^ z = x) _ (:f (x; y) ^ z = a) , и образ g есть в точности A ; остается
брать композицию g с 1-биекцией ! на !2.
Предположим теперь, что f { возрастающая n -функция из !2 в ! ; таким
образом, имеем f (x + 1) f (x) для каждого x . Если её образ конечен, то есть
если f постоянна начиная с некоторого числа, то он множество fa0; : : :; asg,
определимое формулой x = a0 _ _ x = as ; иначе дополнение образа f ,
которое не ограничено в ! , определяется следующей n -формулой : x < f (0) _
(9y)(f (y) < x < f (y + 1)) ; значит, этот образ является n-множеством.
Пусть f { перечисление непустого множества A натуральных чисел:
f (0) есть наименьший элемент A, f (1) { его второй элемент, : : : , f (n) { его
(n + 1)-ый элемент (f (0) считается первым, а не нулевым элементом !); если
A бесконечно, то f { возрастающая инъекция, биекция между ! и A ; если
A конечно, то договоримся, что f повторяет наибольший элемент A : в этом
последнем случае график f определяется следующей 0-формулой:
(x = 0 ^ y = a0) _ _ (x = m ? 1 ^ y = am?1) _ (x m ^ y = am) ;
Если A { бесконечное n-множество, то y = f (x) определяется следующей
n-формулой, где функция должна служить для того, чтобы кодировать
последовательность f (0) , f (1) , : : : ,f (x) :
(9u)(9v)f[r(u; v) 2 A ^ ((8t v)(t < r(u; v) ! t 62 A)] ^
^ (8i x)(r(u; iv) 2 A ^ r(u; (i + 1)v) 2 A ^ r(u; iv) < r(u; (i + 1)v) ^
^ ((8t y)(r(u; iv) < t < r(u; (i + 1)v) ! t 62 A))) ^ r(u; (x + 1)v) = yg;
поскольку отношения w = r(u; v) , эквивалентные w < v ^ (9z u)u = zv + w ,
и отношения t 2 A , t 62 A выразимы n -формулами.
124
Глава 7
АРИФМЕТИКА
Лемма 7.19 Если A является n -подмножеством в ! и если f1; : : :; fs явля-
ются n -функциями из ! mi в ! , то замыкание A этими функциями есть
также n -множество.
Доказательство. Элемент этого замыкания получается из элементов A
итерацией композиций fi ; если выберем какой-либо способ такого получения
элемента a , то получаем конечную последовательность a0; : : : ; an с an = a, и
такую, что каждый aj либо лежит в A , либо получается как fi от предыдущих
элементов: закодируем эту последовательность посредством функции .
В двух предыдущих леммах, мы закодировали рекурсивные определения с
помощью функции ; поймем, что такие действия не выводят за класс функций n (это позволяет понять, что все "обычные" функции лежат в 1); более
точно, мы говорим, что функция f из !k+1 в ! определена через функцию g
из !k в ! (g имеет на одну переменную меньше, чем f ; если n = 0 , то это
константа) и функцию h из !k+2 в ! ( h имеет, таким образом, на одну переменную больше, чем f ) индукцией (говорят также, рекурсией) относительно
переменной y , если f { функция (обязательно единственная), определенная
следующими условиями :
f (x1; : : : ; xk ; 0) = g(x1; : : :; xk ) ;
f (x1; : : : ; xk ; y + 1) = h(x1; : : :; xk ; y; f (x1; : : :; xn; y)) :
Функция g называется функцией начальных данных, равной f (x; 0) ; а функция h { функцией перехода, позволяющей вычислить f (x; y + 1) зная значение
f (x; y) .
Лемма 7.20 Если g и h { n-функции, то функция f , определенная индукцией
через них, также является n -функцией.
Доказательство. Чтобы определить отношение z = f (x1; : : :; xk ; y) , зако-
дируем последовательность f (x; 0); f (x; 1); : : : ; f (x; y) с помощью функции .
Класс 0 , служащий началом иерархии, создан искусственно, и его элементы трудно характеризуемы; многое не изменилось бы, если рассматривать
квантификации типа (9y 2x), (8y 2x), или даже (9y 2x), (8y 2x ),
но однако эти очень простые квантификации выводят за класс 0 . Напротив,
видно, что если f { n -функция и ' { формула, то формулу (9y f (x))' можно
переписать по выбору (9z)(9y z)(z = f (x) ^ ') или (8z)(9y z)(z 6= f (x) _ ') ,
в то время как (8y f (x))' можно переписать по выбору (9z)(8y z)(z =
f (x) ^ ') или (8z)(8y z)(z 6= f (x) _ ') , так, что квантификации, ограниченные n-функциями, не выводят за класс n , ни за класс n , ни, следовательно, за класс n . Эта надежность классов n , n , n показывает, что
они создают очень естественную иерархию для арифметических множеств, и
мы увидим в конце этого параграфа, что более высокое место в этой иерархии
действительно означает большую сложность определения.
7.f
Иерархия арифметических множеств
125
Функции из 1 называются также рекурсивными функциями, так как определение рекурсией является одним из главных способов, который позволяет их
получить; иногда их называют также эффективно вычислимыми функциями,
так как они являются выражением на математических терминах немного туманной идеи "функций, вычислимых чисто механическим способом" (говорят
также: вычислимый алгоритмом). Множества 1 , являющиеся их образами,
называются рекурсивно, или еще эффективно, перечислимыми множествами;
что касается 1-множеств, у которых характеристическая функция рекурсивна, они называются рекурсивными или еще разрешимыми.
Под алгоритмом для механического вычисления функции f понимают задание программы или списка инструкций, которую вычислитель, начиная с
данного х , осуществляет шаг за шагом, обладающее следующим свойством:
каково бы ни было число x , данное вначале, через некоторое время вычислитель получит приказ остановиться и выводить число f (x) . Вычислитель,
который может быть, например, тем, что называют в коммерции компьютером,
не имеет никакую самостоятельность, и никакую интеллектуальную инициативу: он умеет только придерживаться инструкций данного списка; но в этом
чисто теоретическом подходе к вычислимости мы не заботимся о возможности
выполнения вычислений реальным механическим устройством и, в частности,
мы пренебрегаем временем и пространством необходимыми для вычислений,
лишь бы только они завершались.
Поймем сначала, что 1-функция f вполне вычислима существом с самыми
ограниченными интеллектуальными возможностями, но которое имеет беспредельную любовь к вычислениям совершенно идиотских, механических операций. Отношение y = f (x) имеет вид (9z)'(x; y; z) , где ' { 0-формула; однако
проверка выполнимости бескванторной формулы'(x) на кортеже a доступно
любому ученику начальной школы: достаточно уметь складывать, умножать
и вычитать (для проверки: a b?) Если даны m; n; p , то проверку истинности предложения '(m; n; p) можно осуществить дебильным методом: так как
все кванторы ограничены числом max(m; n; p) , то необходимо проверить лишь
конечное число значений для связанных переменных, и достаточно запрограммировать наш оператор так, чтобы он проводил все испытания с числами меньшими max(m; n; p). Очевидно, этот алгоритм непрактичен: рост времени вычислений вместе с увеличением данных состарит благородного программиста, но
он совершенно удовлетворяет нас, живущих в рае объектов, которые существуют только в теории. И вот инструкции, которые мы даем нашему оператору:
начинай с данного x ; нумеруй все пары (y; z) натуральных чисел посредством
канонической 1-биекции !2 на ! ; для каждой пары (y; z) проверь истинность
формулы '(x; y; z) ; остановись как только ты найдешь такое истинное предложение; выводи значение y соответствующей пары.
А что насчет обратного утверждения? Для этого нужно поразмышлять
немного о том, что может быть механической процедурой; нашим исполнителем может быть вычислитель с ластиком и карандашом, пишущий на листе
бумаги, или более современно, читающая (и пишущая) головка с лентой, разбитой на ячейки, намагниченные или размагниченные; его программа состоит
из списка инструкций I0; : : :; In , каждая из которых следующего типа: если
ты обнаружил то-то (например, перед тобой находится намагниченная ячей-
126
Глава 7
АРИФМЕТИКА
ка), то осуществляй такую-то операцию (например, размагничивай ячейку, или
перемещайся на одну ячейку налево, или направо, и т.д.) и затем перейди к
i-ой инструкции; иначе (ячейка перед тобой { не намагниченная) осуществляй
такую-то операцию, и перейди к j -ой инструкции. Мы можем закодировать числом, благодаря нашей комбинаторике, состояние листа бумаги, или магнитной
ленты, перед нашим оператором так же, как и инструкцию, которую он должен
осуществить: это число, которое называют "этапом вычисления", кодирует положение, где находится оператор. Задание программы есть не что иное, как
задание "функции перехода", позволяющей переходить от этапа к следующему
этапу. Должно быть ясно ввиду элементарности тестов и операций, выполняемых нашим оператором, что эта функция перехода будет иметь график, определенный формулой с квантификациями, ограниченными не очень страшной
рекурсивной функцией. В этих условиях, по 7.20 функция, сопоставляющая
паре (x; z) код z-ого этапа вычисления, полученного от начального данного x ,
с I0 в качестве начальной инструкции, также рекурсивна. Функция y = f (x) ,
вычисленная этим способом, определяется 1-формулой : "существует момент
времени z, такой, что оператор, начиная с данного x , после z этапов получил
приказ остановиться, и выводить х". Запомним интерпретацию неограниченного экзистенциального квантора в этой формуле: он по сути соответствует
длительности вычисления.
Предыдущие рассуждения выглядели бы более строгими, если бы мы дали
математическое определение "процедур механических вычислений"; по этому
поводу, высказывание "функция вычислима если и только если она рекурсивна" известна под именем тезиса Чёрча: говорят тезис, а не теорема Чёрча, потому что, в отсутствии точного определения вычислимости, это мнение,
правдоподобность которого можем подтверждать только аргументами такого
же типа, что мы наметили. Этот тезис поддерживается тем, что все многочисленные формальные подходы к вычислимости (один из них через машины
Тьюринга, которые можно рассматривать как абстрактные эквиваленты наших компьютеров; фактически, они являются их весьма далекими прародителями и, впрочем, именно компьютеры надо было бы скорее рассматривать в
качестве конкретных реализаций машин Тьюринга, изобретенных до компьютеров!), предпринятые до сих пор, определяют один и тот же класс 1-функций.
Кроме того этот тезис не без пользы: часто, чтобы найти 1-формулу, определяющую график функции, кодируют в арифметике естественный способ её
вычисления.
И даже тезис Чёрча допускает следующее усиление: "каждая функция из
N в N есть 1-функция, если только она не является специально построенным
контрпримером"! Вот это совершенно парадоксальное высказывание, так как
имеется только счетное число 1-функций (не более, чем формул), и они составляют таким образом совсем незначительное множество среди всех функций
из N в N. Но, однако, опыт показывает, что функции и множества, которые
появляются "естественно" в математическом контексте, лежат в классе 1 , за
очень редкими исключениями (например проблема Гильберта, решенная Матиясевичем), и кроме того, это даже легко доказывается.
Фактически, все функции, о которых может думать нормальный математик
принадлежат к еще более ограниченному классу { классу примитивно рекур-
7.f
127
Иерархия арифметических множеств
сивных функций. Это { функции, которые получаются из функций x 7! 0,
x 7! x; x 7! x + 1; : : :; (x1; : : :; xi; : : :xn) 7! xi; : : : композициями, склейками
и определениями рекурсией. Это { не очень естественный класс функций, и
если 1-функцию в общем легко выявить (при наличии небольшого опыта, в
конце концов находят 1-формулу её графика), то часто трудно доказать, что
она примитивно рекурсивна: нет другого способа, кроме последовательного
построения, начиная с базисных функций. Так как эти функции имеют свойства, касающиеся аксиоматизации арифметики, а также в качестве примера,
мы покажем, что функция леммы 7.8 примитивно рекурсивна :
Лемма 7.21 Функция (x; y) примитивно рекурсивна .
Доказательство.
1 Функция Min(1; x) примитивно рекурсивна :
Min(1; 0) = 0 , Min(1; x + 1) = 1 ,
2 Полагаем x y = 0 если y > x , x y = x ? y , если x y ; функция
x 1 примитивно рекурсивна : 0 1 = 0; (x + 1) 1 = x ,
3 Функция x y примитивно рекурсивна : x 0 = x; x (y + 1) =
(x y ) 1 ,
4 Пусть f (x; y) { частичная сумма разложения по основанию 2 числа x до
y : если x = " + "12 + + "k 2k , тогда f (x; y) = " + "12 + + "y 2y ; это
примитивно рекурсивная функция: f (0; y) = 0 ; f (x + 1; y) = f (x; y) + 1 ,
если f (x; y) + 1 < 2y+1 , и f (x + 1; y) = 0 если f (x; y) + l = 2y+1 ; или
еще f (x + 1; y) = Min(1; 2y+1 (f (x; y) + 1)) (f (x; y) + 1) , и функция
перехода примитивно рекурсивна, так как таковы сумма, произведение и
показательная функция.
5 Тогда (x; 0) = f (x; 0) , (x; y + 1) = Min(1; f (x; y + 1) f (x; y)) .
После рассмотрения этого примера, читатель должен быть теперь убежден
что все введенные в разделе 7.f функции о формулах (сопоставляющая формуле её ранг квантификации, или код множеств её свободных переменных, и
т.д.), в определении которых рекурсия играла главную роль, рекурсивны и
даже примитивно рекурсивны; и что такие множества, как множества предложений, множества n-предложений и т.п., все лежат 1. Это можно принять
только слепой верой в обобщенный тезис Чёрча или проверкой каждого отдельного случая, которую мы оставим подозрительному читателю. После этого, мы
можем уточнить теорему Тарского следующим образом :
Теорема 7.22 Множество кодов n-предложений, истинных в арифметике
является n -множеством вне n ; множество кодов предложений, истинных
в арифметике является n -множеством вне n .
128
Глава 7
АРИФМЕТИКА
Доказательство. Покажем сначала положительную часть теоремы, и
прежде всего, что множество кодов 0-предложений, истинных в арифметике,
есть 1-множество. Действительно, в 0-формуле f (a1; : : :; an) все связанные
переменные ограничены числом max(a1; : : :; an), и истинность этого предложения определяется индукцией по парам, образованным подформулой g в f и множеством кортежей ограниченных max(a1; : : : ; an) и удовлетворяющих g. Так
как множества таких кортежей конечны, они соответствуют объектам, кодированным в нашей комбинаторике, и высказывание "x является кодом истинного 0-предложения" выражается 1-формулой; таково же и высказывание "x
является кодом ложного 0-предложения" , так как преобразование,состоящее
в том, чтобы брать отрицание формулы соответствует рекурсивной операции
на кодах. Высказывание "x не является кодом 0-предложения, или является
кодом ложного 0-предложения", таким образом, есть 1-формула и определяет дополнение нашего множества.
Когда 1-предложение (9x)f (x) , где f является 0-формулой, истинно?
Если существует a, такой, что 0-предложение f (a) истинно. Как только заметим, что функция, которая коду 0-формулы со свободной переменной x
и числу a сопоставляет код 0-предложения, полученного заменой x на a в
формуле, является рекурсивной, и зная что истинность 0-предложения выражается 1-формулой, видим, что "существует a такой, что f (a) истинно"
есть 1-формула. Так как истинные 1-предложения соответствуют отрицаниям ложных 1-предложений, они образуют 1-множество. Индукцией по
n , видим точно так же, что истинные n -предложения образуют множество,
определенное n -формулой V n (x) ; что истинные n-предложения образуют
множество, определенное n-формулой V n(x) .
Для отрицательной части, предположим, что существует n-формула V (x) ,
определяющая множество кодов истинных n -предложений. Рассмотрим формулу V (x; y) = V ('(x; y)) , определяющую множество пар, у которых первый
элемент формула n с одной свободной переменной, таких, что предложение,
полученное заменой этой переменной на y истинна; здесь ' { 1-функция замены переменной на константу. V (x; y) есть n-формула; таким образом, формула :V (x; x) эквивалентна n-формуле с кодом n0 и мы получаем то же противоречие, что в теореме Тарского.
Эта теорема доказывает, что все включения вида n n n+1, а также
n n n+1 { строгие. Мы видим, что каждое n -множество получается просто от "n -истинности", множества, определенного формулой V n (x).
Чтобы проверить, что b принадлежит a-ой n -формуле (т.е. множеству, определенному n -формулой с кодом a), надо проверить, что '(a; b) 2 V n (x); по
этой причине, это множество V n (x), которое сложнее всех множеств n ,
называется "n -универсальным множеством".
Можно также релятивизировать иерархию и определять рекурсивность или
n-множества относительно множества A. Тогда каждое n -множество рекурсивно в V n (x). Если A и B взаимно рекурсивны по отношению друг к другу,
то говорят, что они имеют одну и ту же степень, и изучение этих степеней,
которые мы только упоминаем, составляет теорию рекурсивности.
7.g
Аксиомы фрагментов арифметики
129
7.g Некоторые аксиомы, модели
фрагментов арифметики
Мы собираемся в этом параграфе рассматривать некоторые аксиомы, которым удовлетворяют сумма и произведение натуральных чисел, и мы поймем, в какой мере результаты предыдущих параграфов остаются в силе для
структур, являющихся моделями только некоторого фрагмента арифметики.
Назовем минимальной арифметикой следующее конечное множество аксиом
A0 :
(8x)(x + 1 6= 0)
(8x)(8y)(x + 1 = y + 1 ! x = y)
(8x)(0 x)
(8x)(8y)(y x + 1 $ y x _ y = x + 1)
(8x)(x = 0 _ :(x 0)) (8x)(8y)(x + 1 y $ x y ^ y 6= x)
(8x)(x + 0 = x)
(8x)(8y)[x + (y + 1) = (x + y) + 1]
(8x)(x 0 = 0)
(8x)(8y)[x (y + 1) = x y + x]
Аксиомы A0 определяют поведение 0 по отношению к арифметическим операциям так же, как и поведение x +1 , предполагая знание поведения x. Выбор
такой системы, образованной из конечного числа универсальных аксиом, не без
произвола; мы могли бы например коммутировать переменные x и y в аксиомах, описывающих связи суммы и произведения с последователем.
В модели M системы A0 отображение s(x) = x +1 инъективно; 0 лежит вне
образа s , но там могут быть другие точки не-последователи. Для натурального числа n обозначим тем же символом n n-ого последователя 0 в M . Мы
видим, что аксиомы A0 говорят, что элементы, меньшие или равные n, { это
0; : : :; n?1; n, а все элементы M , за исключением 0; : : :; n?1, больше или равны
n . Эти последователи 0 будут называться стандартными числами (или элементами) модели M ; это стандартное подмножество M является начальным
сегментом, каждое стандартное число меньше каждого нестандартного числа
(естественно, это использование слова "начальный сегмент" немного противозаконно, так как не можем вывести из A0 , что есть порядок) ; и кроме
того легко видеть, что это стандартное подмножество является ограничением
M , изоморфным настоящим натуральным числам, с суммой и произведением. Это влечет, и является первопричиной существования A0 , что каждое
1-предложение арифметики является следствием A0 .
Но в остальном A0 является чрезвычайно слабой теорией, допускающей
нестандартные числа с самым фантастическим поведением. Одно из редких
не 1-ограничений то, что функция следования не имеет циклов, так как в A0
можно доказать , что, если n > 1 , то (8x)(x x + n ^ :(x + n x)). Вот
модель, носитель которой состоит из её стандартного подмножества 0; 1; 2; : : :
и второй копии ! : 00; 10; 20; : : : ; отношение x y выполняется на следующих
парах: во всех случаях n m0 ; если n меньше m , то n0 m0 ; и если n + m
является суммой n и m , то n0 + m = (n + m)0; n0 + m0 = n + m0 = m0 ; если n m
является произведением n и m , то n m0 = (n m)0; n0 m = n0 m0 = n0.
Однако, если мы добавим к A0 следующую аксиому второго порядка :
(8X )((0 2 X ^ (8x)(x 2 X ! x + 1 2 X )) ! (8x)(x 2 X )) ;
130
Глава 7
АРИФМЕТИКА
то можем показать, что модель сводится к своему стандартному подмножеству,
т.е. структура, образованная суммой и произведением настоящих натуральных
чисел, характеризуется с точностью до изоморфизма. Это было замечено в начале этого века итальянским математиком Пеано; по этой причине называют
"арифметикой Пеано" множество аксиом, образованное из A0 и всех следующих "аксиом индукции" (по одной аксиоме для каждой формулы f ):
I (f ) (8x)f[f (x; 0) ^ (8y)(f (x; y) ! f (x; y + 1))] ! (8y)f (x; y)g :
Этот список аксиом основывается на той же метафизике, что и аксиоматика
Пресбургера (см. 7.c) для суммы натуральных чисел. Так как мы не имеем
права выражать аксиому индукции, действительную для всех подмножеств
модели, мы делаем это по крайней мере для любого подмножества, доступного
в нашем языке, то есть определимого формулой арифметики.
Если мы добавим к A0 аксиомы индукции только для формул из 0 , n
или n, то говорим соответственно о теории 0-индукции, n-индукции или
n-индукции. Отметим мимоходом, что аксиома 0-индукции лежит одновременно в 2 и 2 , а аксиома n или n-индукции является n+2 ? и n+2предложением (замените f ! g на :f _ g ).
Добавление некоторых аксиом индукции делает множество A0 более осмысленным; с I (y = 0 _ (9z y)y = z + 1) , мы доказываем, что каждое ненулевое число является последователем; мы видим также, простой проверкой доказательства теоремы 7.5, что теория суммы является следствием 0индукции (и даже конечного числа аксиом 0-индукции, так как свойства евклидова деления доказываются с единственной аксиомой индукции, говорящей о произведении). Мы также доказываем при помощи 0-индукции, что
(8x)(8y)(x y $ (9z)x + z = y) , из чего следует, что теория порядка полностью выводится также из 0-индукции. При помощи 0-индукции доказывают
также, что произведение ассоциативно, коммутативно (и даже верно, что теория произведения, т.е. множество предложений, истинных для натуральных
чисел и говорящих только о произведении, является следствием 0-индукции)
и дистрибутивно по сложению.
Однако 0-индукция также слаба. Например, из 0-индукции можно вывести теорему "для каждого x, существует простое число, которое не делит x":
доказываем индукцией по формуле
(8x0 x)(x0 1 _ (9y x)(9z x)(y 2 ^
^ (8u x)(8v x)(y = uv ! u = 1 _ v = l) ^ x0 = yz)) ;
что каждое число имеет простой делитель; потом берем простой делитель x +1.
Но позволяет ли 0-индукция доказать, что "для каждого x существует простое число больше x", т.е. бесконечность множества простых чисел, { это
сегодня открытая проблема. Обычно этот элементарный факт доказывают
так: рассматривают множество простых чисел меньших x , и берут простой
делитель последователя произведения. Чтобы провести это доказательство
формально, надо доказать существование кода для множества простых чисел
меньших числа x , что не обеспечивается 0-индукцией.
7.g
Аксиомы фрагментов арифметики
131
Так как принадлежность, x 2 y , есть 1-отношение, надо ожидать, что 0индукция допускает абсурдное поведение для комбинаторики, присоединенной
к арифметике. Например, 0-индукция не позволяет доказать, что каждое
множество действительно конечно, ни даже, что каждое одноэлементное множество кодируется: действительно, легко видеть, что начальный сегмент модели арифметики, замкнутый относительно суммы и произведения, является
моделью 0-индукции; если этот сегмент не замкнут относительно отображения x 7! 2x , найдутся одноэлементные множества без кодов; этот метод не
может быть приложен к предыдущей проблеме, так как известно, что между
x и 2x всегда имеется простое число.
Напротив, следствием 1-индукции является :
(8x1) : : : (8xn)(9x)(8y)[y 2 x $ (y = x1 _ _ y = xn )] ;
здесь можно даже доказать, что добавив элемент к кодированному множеству
получаем снова кодированное множество :
(8x)(8y)(9z)(8t)(t 2 z $ t 2 x _ t = y) :
Это заставляет думать, что 1-индукция является достаточно сильной теорией, не искажающая нашу интуицию об арифметике, и остаток этого раздела
будет посвящен доказательству приемлемости этой теории. Мы её берем, таким образом, как основу аксиоматического подхода к арифметике, еще раз
отмечая между прочим, что специалисты в данной области её рассматривают как слишком сильную теорию. Они довольствуются добавлением нескольких аксиом к 0-индукции, гарантирующих хорошее поведение показательной
функции, то есть комбинаторики, и показывают, что эта система достаточна
для доказательства всех обычных арифметических теорем, то есть всё кроме
искусственных логических контрпримеров.
Но прежде чем продолжить, сделаем два замечания об аксиоме индукции.
Студенты всегда обнаруживают с ужасом, что она имеет два вида: слабая
форма, для которой рекурсия должна начинаться от 0 , и переходить от x к
x + 1 , то что мы уже использовали ; и сильная форма, в которой переходят от
всех z строго меньших y к y , то есть :
I 0(f ) (8x)f[(8y)((8z < y)f (x; z) ! f (x; y))] ! (8y)f (x; y)g :
Это, действительно, более сильная аксиома чем I (f ) , если мы располагаем
A0 и вдобавок аксиомой, заявляющей, что каждое ненулевое число является
последователем : действительно, если фиксированное x удовлетворяет посылку I (f ) , то оно удовлетворяет также посылку I 0(f ), так как A0 обязывает
y < y + 1 . Но в действительности, так как мы уже увидели по поводу простых чисел, эти две разновидности индукции эквивалентны, так как I 0(f (x; y))
является следствием I ((8z y)f (x; z)) .
Есть еще другой способ введения индукции, который выражает то, что
каждое непустое множество натуральных чисел имеет наименьший элемент,
или еще :
I 00(f ) (8x)f(9y)f (x; y) ! (9y)[f (x; y)) ^ (8z < y):f (x; y)]g :
132
Глава 7
АРИФМЕТИКА
Без труда видно, что I 0(f ) и I "(:f ) эквивалентны.
В тесном родстве с аксиомами индукции находятся аксиомы коллекции, выражающие, что числа, удовлетворяющие формуле f (t) и меньшие некоторого
числа z , образуют конечное множество в смысле модели :
C (f )
(8x)(8z)(9y)(8t)(t 2 y $ t z ^ f (x; t)) :
Когда изучают модель M для A0 , пытаются повторить на ней то, что
известно про стандартные натуральные числа. Например, пытаются определить показательную функцию, беря ту же формулу, которую мы использовали
для определения графика показательной функции на настоящих натуральных
числах. Проблема в том, что априори нет оснований, что в M эта формула
определит график функции; и при положительном ответе, можно ещё сомневаться в том, что если n { стандартное число, то значение 2n в M то же самое,
что в стандартной модели; и даже если и это истинно, то нет еще оснований,
чтобы обычные свойства показательной функции были истинны в M .
Рассмотрим фрагмент T арифметики, содержащей A0 , или даже просто
непротиворечивую теорию содержащую A0 (т.е. T может содержать ложные
аксиомы для настоящих натуральных чисел); пусть f { функция из ! в ! ,
график которой определяется арифметической формулой '(x; y) . Мы говорим
что f { доказуемая в T общая функция если из T следует, что ' является графиком функции : (8x)(9!y)'(x; y) ; и в этом случае мы говорим, что f хороша
для T , если кроме того для каждого стандартного n верно T ` '(n; f (n)); очевидно, это определение может ввести в заблуждение : речь идет о свойствах
формулы ' , а не функции f , которую она определяет, так как не имеется
оснований, по которому два определения f , эквивалентные для настоящих
натуральных чисел, остаются таковыми во всех моделях T .
Аналогично, рассмотрим подмножество A в ! , определенное формулой
'(x) ; мы говорим, что A хорошо для T если для каждого стандартного n справедливо T ` '(n) , если n 2 A , и T ` :'(n) если n 62 A . Если A определяется
n-формулой ' и n-формулой , то говорим что оно n-доказуемо в T , если
T обеспечивает эквивалентность ' и , т.е. T ` (8x)('(x) $ (x)).
Когда мы работаем в ослабленной арифметике, надо подстраховать нашу интуицию, которая нас побуждает распространять без проверки некоторые
очевидные свойства настоящих натуральных чисел на все модели рассматриваемой теории. Если мы хотим перевести без изменения результаты, полученные в предыдущих разделах, нам надо убедиться в том, что все множества
и функции, участвующие в манипуляциях кодов формул хорошие; если наша теория слишком слаба для этого, то надо это осознавать и быть особенно
бдительным. Например, мы отметили, что квантификация, ограниченная рекурсивной функцией, не выводит за классы 1 или 1. Если, скажем, ' и
y = f (x) суть 1-формулы, то (8y f (x))'(x; y) эквивалентна 1-формуле:
чтобы это осталось истинным в T , надо доказать, что в T y = f (x) определяет общую функцию, это необходимо, чтобы в T мы могли заменить y 6= f (x)
1-формулой.
Ясно что множества 0 хороши для минимальной арифметики A0 : в проверке факта n 2 A участвуют только числа меньше n ; впрочем, то же самое
7.g
Аксиомы фрагментов арифметики
133
верно и для каждого множества определенного формулой, где квантификации
ограничены многочленами от n . Теперь заметим, что для каждой теории T ,
содержащей A0 , каждое 1-доказуемое множество хорошее. Действительно, множество A определяется в модели настоящих натуральных чисел 1формулой '(x) и также 1-формулой (x), и T ` (8x)('(x) $ (x)) . Пусть
M { модель T , если n { стандартное число, и если n 2 A, то ! ` '(n) , таким образом, M ` '(n) так как ' 2 1 и ! { начальный сегмент M . Точно
так же, если n 62 A, то M ` : (n) , и так как T ` (8x)('(x) $ (x)) , то
M ` :'(n). Например, доказуемо рекурсивная функция (т.е. 1-формула, про
которую можно доказать в T , что она { график общей функции) хороша.
Какой фрагмент арифметики нам обеспечивает, что обычные функции, или
существенные отношения, которые появляются в кодировании комбинаторики
или языка хороши ? Один приемлемый фрагмент { это 1-индукция; она позволяет действительно доказать аксиому, выражающую, что если A { множество,
кодированное функцией , то для любого a множество A [ fag также кодируется этой функцией ; это упражнение требует трудолюбия, основанного на
китайской лемме, которое мы оставляем читателю: в любом случае, если бы
она не была доказуема по 1-индукции, то надо было бы срочно её добавить.
Это свойство позволяет обеспечить, что построения простой рекурсией хороши: если мы взглянем на определение показательной функции в 7.d, то видим, что 1-индукцией (по y) можно доказать, что для всех x и y существует
единственный z такой, что z = xy ; сущность заключается в доказательстве существования кода для последовательности x; x2; : : :; xy ; xy+1 при условии, что
известен только код x; x2; : : : ; xy ; кроме того, мы можем также доказать элементарные свойства показательной функции такие, как xu+v = xu xv , выявив
соответствующие рекурсии на 1-формулах.
Вообще, те же рассуждения показывают, что примитивно рекурсивные
функции { доказуемо общие в 1-индукции, и они, таким образом, доказуемо рекурсивны и хороши для неё. Так как мы предусмотрительно проверили в
лемме 7.21, что функция примитивно рекурсивна, то теперь видно, что комбинаторика и наше отношение 2 хороши для 1-индукции : в одной из её моделей
M найдутся "ложные" конечные множества (т.е. конечные множества нестандартной мощности), но настоящие конечные множества настоящих чисел (т.е.
множества стандартной мощности, у которых все элементы стандартны) гарантированно получают тот же код в M , что и в ! . Итак, если Вы убеждены что
"обычные" функции примитивно рекурсивны, а множества, присутствующие
"естественно" в математическом контексте, имеют примитивно рекурсивную
характеристическую функцию, то Вы теперь можете быть спокойны за надежность 1-индукции.
Мы можем теперь сравнить различные виды аксиом индукции, которые мы
ввели:
Теорема 7.23 При наличии 1-индукции, n -коллекция и n-коллекция экви-
валентны, а n -коллекция влечет n - и n -индукцию, в то время как n+1 или n+1 -индукция влечет n -коллекцию.
Доказательство. Аксиома коллекции C (f ) эквивалентна аксиоме C (:f ) ;
134
Глава 7
АРИФМЕТИКА
действительно, если a кодирует множество y таких, что y z ^ f (z) , то
fy j y z ^ :f (y)g = fy j y z ^ y 62 ag ;
существование кода этого последнего множества доказывается 1-индукцией
по z. Тогда n -коллекция позволяет доказать n и n-индукцию, применением
принципа, по которому каждое конечное подмножество натуральных чисел
имеет наименьший элемент, что доказуемо 1-индукцией.
Наконец, если заметим, что 2z+1 { максимальный код подмножеств сегмента [0; z] , то видим, что аксиома коллекции для f доказывается индукцией по
формуле:
(9t 2z+1 )(8y z)(y 2 t $ f (y)) ;
являющейся по выбору n+1 или n+1, если f есть n или n .
Таким образом, в модели 1-индукции мы имеем хорошее множество формул со стандартным кодом; они { настоящие формулы, коды которых вычисляются тем же способом, что в стандартной модели. Стандартные n -формулы в
M являются таковыми и в самом ! ; и когда в M мы осуществляем операцию
замены переменной стандартной константой, мы делаем точно ту же операцию, что и в ! : все это происходит из-за того, что используемые комбинаторные манипуляции хороши, что подтверждается доказательством примитивно
рекурсивного характера функций, участвующих в них.
Следовательно, теорема Тарского может обобщаться следующим образом:
Теорема 7.24 (Тарский) Пусть M { модель 1-индукции; не существует
формулы V (x), такой, что для каждого стандартного n M ` V (n) тогда и
только тогда, когда n является кодом истинного предложения в M .
Доказательство. Повторите доказательство теоремы 7.9, используя то,
что функции замены хороши.
Естественно, теорема Тарского остается верной для структуры, скажем, в
конечном языке (если язык счетен, то надо дать его "эффективное" перечисление), в котором можно определять модель 1-индукции. 1-индукция также
не является абсолютно необходимой для теоремы Тарского; она может быть
доказана для еще более слабых фрагментов арифметики. Но если мы работаем в очень слабой теории, то надо предвидеть возможный бред кодирований и
комбинаторики.
Нестандартные формулы удовлетворяют формальным законам, определяющим истинные формулы, но невозможно им придать смысл: именно об этом
говорит теорема Тарского. Напротив, мы располагаем n-предикатом V n ,
чтобы выразить истинность n-формул. Легко доказать 1-индукцией, снова из-за того, что функции замены переменной константой хороша, что для
каждого стандартного m M ` V n (m) если и только если m является кодом n-предложения, истинного в M (Это не означает, что V n хорошее: n предложения, истинные в !, и те, что истинны в M , не обязательно одни и те
7.h
Нестандартные модели арифметики
135
же!). Таким образом, используя этот n -предикат истинности, можно определить понятие выполнимости для нестандартных n -формул, где n { стандартный и фиксированный, даже если они имеют нестандартное число свободных
переменных. Но для формул x с нестандартным x это безнадежно. Это доказывается практически тем же методом, что модели 1-индукции удовлетворяют усилению теоремы Тарского (теорема 7.22), запрещающим существование
n-формулы, такой, что стандартные числа, которые ей удовлетворяют, были
кодами n-предложений, ложных в модели.
7.h Нестандартные модели в
арифметическом определении
Одной из нестандартных моделей теории порядка является ! + Z ; легко
упорядочить натуральные числа изоморфно ! + Z бинарным 1-отношением:
достаточно представить элемент n из ! через 3n , элемент ?n; n 6= 0 , из Z через 3n ? 1 , и элемент n из Z через 3n +1 . Мы видим так же, что модель суммы,
описанная в конце параграфа 7.c , изоморфна 1-определенной структуре на
настоящих натуральных числах. Если мы верим, что 1-множества { "эффективно описанные" множества, то мы "эффективно" построили нестандартные
модели теории порядка и теории суммы.
По теореме Левенгейма-Сколема, существуют счетные нестандартные модели арифметики, модели, для которых носителем может быть !. В начале
раздела 7.d я сказал, что я не буду её пытаться строить "эффективно"; теперь мы увидим, что сумма и произведение в такой модели не могут быть
одновременно определимыми в арифметике, и тем более не существует 1определения; мы можем даже уточнить на каком уровне нестандартная модель
A0 , определимая в арифметике, обязательно лжет, то есть удовлетворяет n или n-предложению, ложному для настоящих натуральных чисел (теорема
7.25). Следовательно, даже если отождествление 1 с понятием "эффективный" кажется вам сомнительным, Вы должны признать, что не существует
нестандартной модели арифметики, имеющей такое же простое определение,
что эти две вышеописанные структуры.
Итак, рассмотрим модель M 1-индукции, определенную на базе ! натуральных чисел, в которой сумма x +M y и произведение x M y имеют графики,
определенные формулами из n , значит, также из n , так как речь идет об
общих функциях. Другие обычные отношения и функции, сопровождающие
M , будут иметь также арифметические определения, возможно, чуть более
сложными чем n . Например, порядок M в M , определенный n -формулой
(9z)(x +M z = y) может быть вне n . Действительно, квантор в его определении не может быть ограниченным (в смысле , а не M ) : если y { нестандартное, то fz : z M yg { бесконечное и, значит, неограниченное подмножество в ! !
Мы видим, что в определении функции из леммы 7.8 функция rM (u; v) остается в n , но квантор (8j ) также не может быть ограниченным, так что можно
только доказать что функция 2 n+1 , а x 2M y есть n+1-отношение. В сле-
136
Глава 7
АРИФМЕТИКА
дующей теореме мы требуем, чтобы эта принадлежность была n -отношением;
если в нашей модели сумма и её произведение только n-определимы, ??о надо
заменить n на n + 1 .
Теорема 7.25 Пусть M { нестандартная модель 1-индукции и n-коллекции
с носителем !, у которой сумма, произведение и принадлежность n -определимы; тогда существует n - или n -предложение, истинное в арифметике
(т.е. в стандартной модели) и ложное в M .
Доказательство. Предположим, что каждое истинное в арифметике пред-
ложение из n или из n , истинно также в M . Если m { стандартное число,
то m-ый последователь 0M в M обозначим через mM . Так как V n(x) является n-формулой, то M ` V n(mM ) , ! ` V n(m) , m является кодом
предложения n , истинного в обеих структурах !
Если мы обозначим через V Mn (x) формулу, полученную заменой в V n(x)
символа + на +M и на M , то M ` V nM (mM ) , ! ` V Mn (mM ). Отметим
маленькую двусмысленность в обозначениях: сказать, что M удовлетворяет
предложению V n(m), это значит, что формула V n(x) удовлетворена элементом mM ; это вызвано тем, что мы склонны смешивать константу с символом,
который его представляет в языке.
Пусть a { нестандартный элемент в M ; по n-коллекции существует b,
который в M кодирует fx j x a ^ V n(x)g; значит,
! ` x 2M b $ x M a ^ V Mn (x):
Следовательно, если мы вернемся в ! , то для того, чтобы видеть что x { код истинной n-формулы, надо понять, что xM 2M b. Однако функция x 7! xM определяется n -формулой "существует конечная последовательность a0; : : :; ax ,
такая что a0 = 0M и ai+1 = ai +M 1M для каждого i < x, и xM = ax". Это
представляет n -определение множества кодов n-предложений, истинных в
арифметике, что противоречит теореме 7.22.
При большей тщательности, можно распространить этот результат на модели 1-индукции : если N { модель 1-индукции, и если M { модель 1индукции и n-коллекции, чьи сумма, произведение и принадлежность n определимы в N , и если M и N удовлетворяют одним тем же n-предложениям,
тогда отображение x 7! xM из N в M является изоморфизмом.
7.i Арифметический перевод
метода Генкина
В предыдущем параграфе, мы поняли то, что достаточно сложный список
аксиом (аксиомы Пеано плюс множество истинных формул из n или из n) не
может иметь слишком простую нестандартную модель. Здесь, мы рассмотрим
обратную проблему: для данного списка аксиом, найти метод, выявляющий
7.i
Арифметический перевод метода Генкина
137
непротиворечив ли он или нет, и при положительном ответе построить также его самую простую модель, которая возможна. Для этого мы собираемся
выразить в арифметике метод Генкина.
Итак, мы рассмотрим множество A аксиом, на конечном или счетном (ясно,
что несчетный язык невозможно закодировать в арифметике !) языке L. Чтобы применить метод Генкина, мы сведем проблему сначала к случаю, когда
язык включает только символы отношений, то что делается автоматически.
Таким образом, мы имеем в языке L список r1; : : :; rn ; : : : символов отношений,
и мы предположим, что функция, которая n сопоставляет местность rn , рекурсивна (это действительно минимальное требование; если язык L конечен, то
проблем с представлением языка нет). Сопоставляя каждому символу языка
условный номер, можно кодировать его формулы так, чтобы различные "естественные" манипуляции с формулами выражались рекурсивными функциями,
как это мы сделали для языка арифметики.
Язык L порождает язык LH перечисления Генкина, состоящий из списка
символов констант aij и символов отношения f H для каждой формулы f , служащих для элиминации кванторов; LH кодируется тем же способом. Теперь
рассмотрим список T (H ) структурных предложений языка LH , данный в 4.c;
так как все погружается в эффективность самого низкого уровня, функция,
которая сопоставляет формуле её свидетеля, рекурсивна, и это T (H ) есть 1множество.
Константы aij пронумерованы ! ! ; но так как мы располагаем рекурсивной биекцией между ! ! и ! , мы можем их пронумеровать ! : можно
говорить " k первых aij "; также могут быть пронумерованы ! все символы f H
с помощью "функции перечисления" множества (см. лемму 7.18).
Мы назовем "деревом Генкина" следующий частичный порядок H : элементом H для фиксированного натурального k , называющегося его высотой,
является задание ограничений k первых отношений f0H ; : : :; fkH?1 на k первых
элементов aij (это, таким образом, конечное множество условий вида a 2 fiH
или a 62 fiH , содержащего для каждого условия его само или его отрицание, но
не оба, где a пробегает множество кортежей соответствующей длины, берущихся среди k первых aij ), и всех структурных предложений, в которых участвуют
только k первых fiH и k первых aij (не забываем, что речь идет о предложениях
без кванторов!). Мы упорядочиваем это множество включением : p q, если
каждое условие из q присутствует в p и, значит, высота q не меньше высоты p .
Ясно, что H так же, как его отношение порядка, есть 1-множество. Отметим также, что существует функция h(x), рекурсивная и легко вычислимая
(как говорят теоретики чисел), которая ограничивает коды элементов H высоты не больше x. Кроме того, функция, которая формуле f в L сопоставляет
его перевод без квантора f H , рекурсивна (она определяется простой рекурсией); следовательно, если A есть n -, n - или n-множество, то таков же и его
образ AH от этой функции; напомним, что если e { предложение, то eH есть не
что иное, как символ нульместного отношения.
Мы называем деревом Генкина, присоединенным к A, подмножество H(A)
в H , образованное элементами удовлетворяющими, если они достаточной высоты, предложения AH ; элемент высоты k принадлежит H(A), если он удо-
138
Глава 7
АРИФМЕТИКА
влетворяет всем eH , имеющим номер меньше k ; принадлежность к H(A) выражается формулой " p 2 H и для каждого символа f с номером не большим
высоты p; f H 62 AH или f H присутствует в p "; мы видим таким образом, что
H(A) есть n-множество, если А 2 n , и n -множество, если А 2 n , и nмножество, если А 2 n . Что может произойти в этом дереве ? Возможны
два случая:
{ H(A) не имеет элемента высоты k для некоторого k ; это означает, как мы
увидим, что H(A) конечно; построение дерева Генкина останавливается,
то есть, следуя всевозможным ветвям, мы находим в конце концов противоречие. Это означает, как мы отметили в разделе 4.c, что множество A
противоречиво (или, более точно, чем оно не имеет непустую модель; мы
оставляем читателю удовольствие решения вопроса: имеет ли множество
предложений пустую модель! ).
{ иначе, построение продолжается всегда; мы увидим, что тогда дерево
p(A) имеет бесконечную ветвь; ветвь есть не что иное, как последовательное задание ограничений структуры на k первые констант, затем на
k + 1 первых констант, и т.д., удовлетворяющие предложениям Генкина.
В конце ветви, получают перечисление Генкина некоторой модели A .
Эти замечания нам позволят выражать в арифметике совместность n множества предложений, и даже в случае совместности дадут определимую
модель в арифметике. Но чтобы их оправдать, надо сначала доказать лемму
о деревьях: мы называем здесь деревом частично упорядоченное множество,
с наименьшим элементом, который называется его корнем, и такое, что миноранты каждого элемента x образуют конечную цепь, число элементов которой
называется высотой x ; ветвь дерева { это его максимальная подцепь. Дерево
называется конечно ветвящимся если каждый элемент высоты k имеет только конечное число (возможно нуль) мажорант высоты k + 1 . Дерево Генкина
имеет очевидно все эти свойства (его корень { пустая последовательность).
Теорема 7.26 (Денеш Кёниг) Каждое бесконечное дерево с конечным ветвлением имеет бесконечную ветвь; более точно, если это n-дерево, высота
элементов дается n+1 -функцией, и если коды элементов высоты k ограничены n+1 -функцией от k , тогда оно имеет бесконечную n+1-ветвь.
Доказательство. Пусть A { наше дерево, и пусть A { дерево, образованное элементами A, имеющими бесконечное число мажорант; A содержит
корень A , и так как A конечного ветвления, каждый элемент высоты k в A
(высота в A та же самая, что и в A !) имеет в A мажоранту высоты k + 1 ;
любая ветвь A является бесконечной ветвью A . Дерево A определяется
следующей формулой : p 2 A , и для каждого k, превышающего высоту p ,
существует элемент q в A высоты k , мажорирующий p . Мы определяем ветвь
A , полученную выбором на каждом шаге элемента с наименьшим кодом, следующим образом: p 2 A и существует последовательность p0; p1; : : : ; pk , чья
длина k есть высота p , такая, что p0 { корень A и pi+1 { мажоранта высоты
i + 1 (это ограничивает квантификацию) элемента pi , имеющий минимальный
код в A, для каждого i k, и наконец, pk = p .
7.i
139
Арифметический перевод метода Генкина
При посылках второй части теоремы, квантифицировать по элементам высоты меньшей, чем высота p, значит делать квантификацию ограниченную
n+1-функцией, так что A так же, как его ветвь, имеет n+1-определение.
Теорема 7.27 Утверждение, что n -множество предложений несовмест-
но выражается n -предложением; каждое совместное n -множество предложений имеет n+1 -модель.
Замечание. Не путайте "n -множество предложений", что означает мно-
жество кодов предложений, среди которых каждый может быть произвольно
большой сложности, и не обязательно на языке арифметики, с "n -предложением" или "множеством n-предложений".
Доказательство. Пусть A { наше множество предложений. Так как H(A)
{ поддерево рекурсивного H, высота в H(A) является рекурсивной функцией и
квантификации по элементам высоты меньше k ограничены рекурсивной функцией. Чтобы выразить несовместность A, надо сказать, что H(A) конечно, или
ещё оно не содержит элемента высоты k для некоторого k: "существует k, такое, что p 62 H(A) для каждого элемента p из H высоты k". Если A 2 n , то
H(A) 2 n и его дополнение, как и последнее предложение, принадлежит n .
В случае, когда А { непротиворечивое n-множество, дерево H(A) 2 n и
его высота удовлетворяет гипотезе теоремы 7.26. Таким образом, оно имеет
бесконечную n+1-ветвь. Эта ветвь порождает модель для A на множестве
констант aij : чтобы понять, что атомная формула выполнима, достаточно
установить, что она появляется на ветви когда надо; это вполне определяет
n+1-структуру, за исключением того, что равенство не интерпретируется истинным равенством, а n+1-отношением эквивалентности . Чтобы получить
модель с настоящим равенством, ограничимся элементами с наименьшими кодами в своих -классах, определяющимися n+1-формулой (8y < x)y 6 x .
Если мы получим конечную модель из m элементов, то можно их перевести
на m первых натуральных чисел ; иначе получаем бесконечную модель с n+1носителем и n+1-отношениями, определенными на нем; переведя сюръективно
это бесконечное n+1-множество на ! посредством своей функции перечисления (см. лемму 7.18), получаем n+1-модель с носителем !.
Несколько комментариев об этой последней теореме; во-первых, естественно искать -модели ; действительно, если А является системой аксиом на
языке L , расширим язык, добавляя символ r0 для каждого реляционного отношения языка L вместе с аксиомой :r $ r0, и получим множество А0 аксиом,
которое имеет ту же сложность по , или , что и А; и - или -модель
для А0 является тем же, что -модель для А !
Можно напротив интересоваться почему теорема 7.27 дает n+1-модель для
n- или n-теории, и дает только n+2-модель для n-теории. Ключ к этой
асимметрии между n и n дается следующей теоремой, которая будет принята на ура преподавателями и унтер-офицерами так же, как и всеми лицами, у
которых главная задача { повторять без устали одни и те же вещи.
140
Глава 7
АРИФМЕТИКА
Теорема 7.28 (плеоназма) Для каждого n+1-множества предложений существует n -множество (1 -множество, если n = 0) предложений, имеющее те же следствия.
Доказательство. Пусть А { наше множество предложений, определенное
формулой (9y)f (x; y) , где f { формула из 0 или n в зависимости от случая;
идея заключается в том , чтобы заменить пару, образованную формулой x и
числом y , формулой, полученной 2y отрицаниями x. Получаем таким образом
множество B , имеющее, как нетрудно видеть, те же следствия, что и А ; так
как для одного x из А могут существовать несколько y , формула x появится
много раз под эквивалентной формой в B , откуда имя "теоремы плеоназма".
Включение z 2 B определяется формулой : "существует подформула x в z
и целое y меньшей сложности чем x , такие, что (x; y) удовлетворяет f и что
z получается 2y отрицанием x"; так как кванторы ограничены рекурсивными
функциями, B действительно имеет указанную сложность.
Мы видим также, что метод Генкина не мог дать теорему, лучшую чем
7.27, так как мы можем надеяться только на то, что n-дерево имеет n-ветвь
(представьте, например, что оно состоит из единственной ветви!); тем не менее,
контрпримеры, которые мы дали в 7.25, не доказывают, что оценка из 7.27 {
наилучшая из возможных, так как они говорили о n-теориях, не имеющих
n-моделей, а именно:
{ язык состоит из символов 0; 1; ; +; ; 2; a ;
{ включаются аксиомы Пеано (1-список) и аксиома определяющая 2 через сумму и произведение ;
{ включается также 1-список аксиом a n , выражающих, что элемент
a не стандартный ;
{ добавляется n-список аксиом, полученный плеоназмом, эквивалентный
списку истинных n-предложений ;
{ наконец, включается n-список истинных n-предложений.
Чтобы получить непротиворечивый n-список предложений, не имеющий nмодели, нужны чуть более тонкие методы, которые мы оставим в стороне.
7.j Понятие доказательства,
разрешимые теории
Если x и y { предложения (т.е. коды предложений), то x ` y значит, что
множество fx; :yg несовместно. Как мы увидели в предыдущем параграфе,
множество пар (x; y) предложений, таких, что y является следствием x определяется 1-формулой Pr(x; y) ("y доказуемо из x"). Кстати, что мы понимаем под доказательством? Мы тестируем непротиворечивость fx; :yg методом
7.j
Разрешимые теории
141
Генкина, и получаем доказательство того, что y является следствием x, тогда,
когда мы достигнем высоты k, где ветви дерева обрываются, т.е. приводят к
противоречию. Вот это натуральное k и есть та неограниченная переменная в
предикате доказательства.
Я утверждаю, что это 1-отношение Pr(x; y) не принадлежит 1 ; действительно, минимальная арифметика является конечным множеством аксиом A0 ,
которое можно заменить одним единственным предложением { их конъюнкцией; если бы доказуемость была 1- предикатом, то предложения, доказуемые
из A0 так же, как и 1-предложения, доказуемые из A0 , образовали бы 1множества. Однако каждое 1-предложение, истинное в арифметике { следствие A0 , и кроме того, так как A0 истинно для настоящих натуральных чисел,
то оно не может доказать ничего ложного. Следовательно, 1-предложения,
являющиеся следствиями A0 , в точности те, что истинны в арифметике, и они
образуют 1-множество, не являющееся 1-множеством.
Этот последний результат просит не волноваться о будущем нашей профессии: так как доказуемость не 1-предикат, невозможно запрограммировать
компьютер так, чтобы для любой конечной системы аксиом x и любого предложения y он выяснил за конечное время: является ли y следствием x. Такая
программа делала бы бесполезной работу математика или, по крайней мере
тех среди них, кто верит в добродетели аксиоматического метода!
Если A является n -множеством предложений, то его следствия образуют
n-множество: выразим, что A [ f:yg несовместно методом Генкина, или еще,
что x доказуем из конъюнкции конечного числа элементов A. Если A 2 n ,
то его следствия образуют n+1 -множество; мы не можем делать лучше из-за
теоремы плеоназма 7.28.
Мы знаем уже давно (теорема Тарского), что не можем определить в арифметике множество ее истинных предложений. Если у нас была надежда на
арифметическую аксиоматизацию, то мы теперь понимаем, что эта надежда
напрасна: если теория имеет n -аксиоматизацию, то она должна быть n множеством! Когда мы провозглашали аксиоматизации для порядка или суммы натуральных чисел, мы приводили 1-списки аксиом, то есть нам удавались очень простые аксиоматики. Арифметика не может иметь аксиоматизацию такого вида, и самое простое определение арифметики, что мы можем
дать, следующее: "это предложения, истинные для суммы и произведения настоящих натуральных чисел"!
Установив, что арифметика Пеано более чем достаточна для арифметических потребностей нормального математика, и обманутые скрытым метафизическим вдохновением (спасли, как могли, аксиому индукции второго порядка,
переводя её в язык первого порядка), мы могли поверить в какой-то момент,
что она достаточна для того, чтобы аксиоматизировать арифметику. Теперь
мы понимаем, что были очень далеки от истины, так как это { 1-аксиоматика
(" быть аксиомой индукции " есть 1-свойство); только оттого, что она 1определима, она не может доказывать все истинные 1-предложения, и модель
арифметики Пеано может лгать на самом низком уровне, возможном для модели A0 , то есть 1 . Мы видим, что огромное расстояние отделяет то, что
истинно для настоящих натуральных чисел, и то, что доказуемо по Пеано, или
142
Глава 7
АРИФМЕТИКА
в любой аксиоматической системе, определимой в арифметике.
Предикат доказуемости, который был введен в этом разделе, полностью
удовлетворяет нужды теоретика моделей. Но в ветви логики, называемой
"теорией доказательств" и посвященной понятию доказательства, принято его
анализировать более подробно: как это было объяснено в начале раздела 4.c,
дается конечное число правил, позволяющих "выводить" формулу из конечного множества других формул; из этих правил очевидно, что если x вывели
из A, то он является следствием A. И говорят, что x доказуемо из множества
A, если его получают из конечного подмножества A последовательным применением правил вывода. Ясно, что такая доказуемость есть 1-предикат. Ещё
надо показать, и это делается в основном методом близким к методу Генкина,
что если x является следствием A, то он доказуем из A.
Этот результат, выражающий адекватность синтаксического понятия (доказуемости) семантическому понятию (следствия) называется "теоремой полноты Геделя". Что любопытно, что он был доказан Геделем и другими до
ясного осознания явления компактности; впрочем, компактность выводили из
этой самой теоремы, учитывая, что в доказательстве противоречивости A участвуют только конечное число элементов A. Это было в духе того времени,
семантические понятия, такие, как "x является следствием A", то есть "каждая модель A удовлетворяет x", были под подозрением, что логики искали
абсолютную истинность в мире математических рассуждений, а не в какой-то
модели, и они были в основном увлечены эффективным характером понятий,
которые они вводили.
По инерции, или из-за уважения к истории, учебники тиражируют это
представление, весьма чуждое духу теории моделей, которая основывается
на семантических понятиях. Это представление { скучное, если его рассматривать во всех деталях, и непонятное, если их опустить : в обеих случаях,
оно окончательно разочаровывает кандидатов в логики. И это методическая
ошибка, так как компактность является более фундаментальным свойством
чем 1-характер вывода: все доказательства адекватности выводимости понятию следствия используют, часто скрытно, сходимость последовательностей в
компактных пространствах.
Некоторые говорят, что теория T (т.е. совместное множество предложений,
и замкнутое относительно вывода) аксиоматизируема, если T 2 1 ; так как
по теореме плеоназма 1-теория является тем же, что теория, имеющая 1аксиоматизацию, они этим хотят сказать, что эта теория обладает эффективной аксиоматизацией (эффективный = 1). Поскольку каждая теория имеет,
эффективную или нет, аксиоматизацию, то в этом случае лучше сказать рекурсивно аксиоматизируемая. Наконец, T называется разрешимой, если она
является 1-теорией (теория сама, а не одна из её аксиоматизаций!): это означает, что мы располагаем механическим методом, выясняющим верно ли, что
предложение принадлежит T или нет. Естественно, все это предполагает, что
мы закодировали соответствующим способом язык T в арифметике, от уточнения которого обычно воздерживаемся, особенно если этот язык конечен. Следующий простой результат полезен :
Лемма 7.29 Полная n-теория является n-теорией.
7.j
143
Разрешимые теории
Доказательство. Если T полна, то x 62 T тогда и только тогда, когда
:x 2 T и это дает n -определение дополнения T .
Следовательно, следующие полные 1-теории разрешимы, для которых мы
раньше дали эффективные аксиоматизации: плотный порядок без концевых
точек, отношение эквивалентности с бесконечным числом бесконечных классов, теория следования, порядка или суммы натуральных чисел, алгебраически
замкнутые поля данной характеристики, дифференциально замкнутые поля
нулевой характеристики, и т.д.
Лемма 7.30 Теория алгебраически замкнутых полей разрешима.
Доказательство. Пусть T { эта теория, T 2 1 ; предложение x не принадлежит T если и только если :x является следствием
T [ f2 6= 0; 3 6= 0; : : : ; p 6= 0; : : : g
или если существует p, такое, что :x { следствие T [ fp = 0g; это дает 1определение дополнения T . (Действительно, по компактности, если x не в T ,
то существует p, такое, что :x { следствие T [ fp = 0g ).
Пример теорий, рекурсивно аксиоматизируемых и неразрешимых: A0 , и по
той же причине (множество её 1-следствий не разрешимо) каждая 1-теория,
содержащая A0. Напомним, что A0 конечно аксиоматизируема.
Доброжелатели не забывают предупреждать о "неэффективном" характере
доказательств элиминации кванторов главы 6, использующих не формализуемые в арифметике аргументы компактности. Они сами предпочитают трудоемкие, и главное, не очень надежные методы, состоящие в том, чтобы показывать
шаг за шагом, что формулу f можно заменить формулой без кванторов, что они
делают теоретически эффективно в зависимости от f . Следующий результат
им доказывает, что бесполезно себя мучить с построением объекта (по случаю
алгоритма элиминации), когда можно понять очень просто, что он существует:
действительно, каждая 1-теория, элиминирующая кванторы, элиминирует
их эффективно.
Лемма 7.31 Если T { n -теория, элиминирующая кванторы, то существует n -функция, сопоставляющая каждой формуле эквивалентную ей по модулю T формулу без квантора.
Доказательство. Применяем принцип n-выбора (лемма 7.17) к бинарно-
му n -отношению, образованному из пар (f (x); g(x)) формул, таких, что g не
имеет кванторов и (8x)(f (x) $ g(x)) доказуема в T.
Могут естественно возразить против алгоритмов, предложенных вышеупомянутыми результатами, из-за их ужасно непрактичного характера. Если мы
имеем полную рекурсивно аксиоматизируемую теорию, алгоритм решения, который мы предлагаем, вопроса о том, что лежит ли f в T или нет, состоит в
144
Глава 7
АРИФМЕТИКА
перечислении всех следствий T до тех пор, пока не встретим f или :f , основывающимся на систематическом исследовании противоречивых деревьев Генкина! Точно так же в алгоритме элиминации кванторов ждут до тех пор, пока
не появится формула без кванторов, эквивалентная f (x). Такого рода алгоритмы, где ждут, когда произойдет некоторое явление, без оценки возможного
времени ожидания, абсолютно нереалистичны; выполнение такой программы
занимает такое фантастическое количество времени, что от них волосы на голове программиста встают дыбом! И эти алгоритмы могут потребовать не
только значительное количество времени, а также большой объем памяти для
проведения этих расчетов.
В случае алгебраически замкнутых полей, мы располагаем более эффективным алгоритмом, но который становится также быстро непрактичным, последовательного исключения неизвестных в полиномиальных уравнениях и неравенствах, следуя методу, известному с самых античных времен.
Для теоретика моделей эффективная конструкция хорошего алгоритма
элиминации представляла бы интерес только, если бы он имел действительно
намерение им воспользоваться, чего не бывает никогда. Именно поэтому достаточно напрасное упражнение { пытаться точно оценить количество времени
и объема памяти (вычисленных как функции от длины проверяемой формулы
f ), необходимое для проверки принадлежности к разрешимой теории T . Однако, если мы ищем точные верхние оценки этого времени и этого пространства,
то снова метод конечного челнока Фраиссе дает лучшие результаты, так как он
позволяет свести выполнимость предложения f в структуре S к выполнимости
предложения f в конечной подструктуре S .
Пусть действительно необходимо тестировать выполнимость предложения
f , в структуре S чисто реляционного языка, и ранг квантификации f равен
k ; пусть Ck { конечное множество представителей классов (k ? 1)-эквивалентности элементов S ; пусть Сk?1 { конечное множество, такое, что для каждого
a из Сk , каждый класс (k ? 2)-эквивалентности (a; x) имеет представителя
(a; b), с b в Ck?1 , и так далее: определяем таким образом конечные множества
Ck Ck?1 C1 .
Мы говорим, что квантор в f ранга i, если i { ранг квантификации формулы, которая находится под областью его действия; из определения i-эквивалентности ясно следует, что f истинно в S если и только, если там истинно предложение f , полученное релятивизацией по Ci каждого квантора ранга i (заменой
(9x на (9x 2 Ci) и (8x) на (8x 2 Ci)). Следовательно, если мы располагаем
очень простым описанием классов k-эквивалентности, как в случае дискретного порядка раздела 1.b, сведем выполнимость предложения к выполнимости
предложений в конечных структурах небольших мощностей, что в благоприятных случаях дает хороший алгоритм решения.
Возможность осуществления этого алгоритма нас мало интересует: неразрешимость или разрешимость теории не связан со структурными свойствами
его моделей, являющихся предметом теории моделей. И он не привносит ничего в изучение рекурсивности или сложности алгоритмов, которые вмешиваются в эти темы только рутинной техникой. Если мы слишком часто встречаем теоретиков моделей которые, некоторой отягощающей верностью логи-
7.k
Теорема Геделя
145
ческим происхождением теории моделей, считают себя обязанными отмечать,
что такая-та теория группы, кольца, и т.д. разрешима, это по большому счету
потому, что теория моделей не сумела выковать специфический язык, чтобы формулировать свои результаты: они хотят сказать что рассматриваемая
теория проста, что они умеют описывать её типы и, может быть, классифицировать её модели. Эта структурная простота не имеет в принципе ничего
общего с рекурсивностью, которая измеряет в некотором смысле сложность
системы аксиом, а не классов структур. Эта сложность более чувствительна
ко всевозможным лингвистическим манипуляциям, без структурных воздействий. Однако на практике констатируют часто, что легко аксиоматизируемая
теория структурно проста, и наоборот, хотя нетрудно привести { это детская
игра { контрпримеры.
Отметим также, что понятие доказуемости, к которому мы привязались,
не воспроизводит реальное функционирование мысли математика: чтобы доказать что-то, он не делает никогда систематическое исследование на противоречие по дереву Генкина! Чтобы доказать этим способом теорему 7.5, где
показана эквивалентность двух систем, аксиоматизирующих сумму натуральных чисел (опираясь на аргументы, рассматриваемые как приемлемые для любого математика, чтобы убедить читателя, что каждая модель одной системы
является моделью другой), надо было бы исписать целый том.
В заключение отметим, что алгоритм элиминации не является обязательно разрешающим алгоритмом: предложение f заменяется предложением g без
квантора, ему эквивалентным по модулю T , но решение вопроса принадлежности g теории T { это другая проблема.
7.k Теорема Геделя
По теореме Тарского, мы знаем, что если A есть n-фрагмент арифметики,
то существует n-предложение арифметики, не являющееся следствием A :
действительно, n-следствия из A образуют n -множество, которое не может
быть множеством всех истинных n-предложений.
Теорема Геделя дает пример такого предложения. Мы знаем, что существует n -формула, обозначенная PrA (x; y), которая выполняется тогда и
только тогда, когда x является кодом формулы с одной свободной переменной,
и предложение, полученное заменой этой переменной на y является следствием
A; мы обозначим n-формулу :PrA (x; x) через GA (x).
Теорема 7.32 (Первая теорема Геделя) Если A является n-фрагментом
арифметики, и если a есть код формулы GA (x), то n-предложение GA (a)
истинно в стандартной модели и не является следствием A.
Доказательство. Предположим, что A ` GA (a). Следовательно, в насто-
ящем мире GA (a) доказуемо из A и для настоящих натуральных чисел Pr(a; a)
истинно так же, как и :GA (a), а GA (a) ложно; так как настоящие натуральные числа удовлетворяют A, все что доказуемо из A, истинно в стандартной
146
Глава 7
АРИФМЕТИКА
модели : получаем противоречие. Следовательно, A 6` GA (a) и для настоящих
натуральных чисел PA (a; a) ложно, а GA (a) истинно.
В случае 1-фрагментов арифметики, Гедель замечательным образом нашел гораздо более волнующую форму своей теоремы. Мы знаем, что непротиворечивость n -фрагмента A арифметики выражается n-предложением, которое мы обозначим Cons(A) : на самом деле достаточно выразить, что 0 6= 0
не является следствием A, или выразить, что дерево Генкина, соответствующее
A , бесконечно.
Теорема 7.33 (Вторая теорема Геделя) Если A является 1-фрагментом
арифметики, содержащим 1 -индукцию (или нечто разумно близкое к 1 индукции), то Cons(A) истинно в стандартной модели и не является следствием A.
Доказательство. Формула Cons(A) истинно для настоящих натуральных
чисел, так как A имеет модель (настоящих натуральных чисел!) и, следовательно, действительно непротиворечив. Мы хотим показать что GA (a) является следствием A [ fCons(A)g, и тогда по первой теореме Геделя Cons(A) не
может быть следствием A .
Предположим, что это не так и что мы имеем модель N для A [fCons(A)g,
удовлетворяющую :GA (a). Так как N удовлетворяет Cons(A), она позволяет строить методом Генкина 2-структуру M , являющуюся моделью A, или
точнее структурных предложений Генкина (которые без кванторов!) соответствующих A. Так как N удовлетворяет :GA (a) и PrA(a; a), то докажем, снова
методом Генкина, что GA (a) является следствием A и, в частности, что модель
M удовлетворяет GA (a).
Но M является моделью A0, и мы можем определить в N отображение,
которое x сопоставляет элемент xM , являющимся x-ым последователем нуля
в M (не забываем, что модель N верит, что настоящие натуральные числа
{ это она; это мы, которые видим её извне, не разделяем эту точку зрения).
Образ N 0 множества N при этом отображении является начальным сегментом
M , это то, что N считает "стандартной частью" M . Но M удовлетворяет 1предложение GA (a), как и его начальный сегмент N 0, и, значит, также N , что
противоречит гипотезе.
Где применяется в этом доказательстве гипотеза о том, что A содержала
1-индукцию ? Сначала чтобы доказать существование модели M , то есть
существование бесконечной ветви в бесконечном дереве с конечным ветвлением; затем для адекватности некоторых утверждений в модели N реальности:
например, когда N утверждает, что (стандартное) предложение GA (a) удовлетворяется M , надо чтобы это было действительно так, чтобы замены переменных константами осуществлялись правильно; надо также, чтобы предложения
Генкина, соответствующие GA (a) в N , вели себя корректно, и влекли действительно GA (a) для M .
Мы констатируем, что эта теорема Геделя, даже если она не применяет в
игре очень сложный технический аппарат, достаточна тонка: первая теорема
7.k
Теорема Геделя
147
доказана в реальном мире, то есть в настоящих натуральных числах, в то время
как вторая воспроизводит доказательство первой в модели N . Со временем
начинающий логик оценит её красоту, с каждым днем все больше и больше;
это один из редких математических результатов, что испытываешь каждый раз
новое удовольствие восстанавливая его доказательство (если удается !), после
того как его забыл.
Таким образом, существует модель арифметики Пеано, которая содержит
доказательство противоречивости арифметики Пеано! Естественно, это "доказательство" { нестандартное, и не соответствует ничему в реальности: уровень,
где все ветви дерева Генкина оканчиваются противоречием, является нестандартным числом, которое конечно только при рассмотрении внутри обсуждаемой модели. Логика спасена, но это тем не менее впечатляет!
Чтобы иметь версию второй теоремы для n -фрагмента A арифметики, надо к ней добавить что-то, нарушающее ее эстетику: назовем n-истинностью
n-множество n-предложений, истинных в арифметике, множество определенное n -формулой V n . Тогда доказывается, что предложение n , утверждающее совместность A + n -истинность не доказуема в A ; естественно, модель N не удовлетворяет тем же предложениям n , что стандартная модель:
Cons(A + n -истинность) означает, что N позволяет строить методом Генкина
модель M для A , удовлетворяющую тем же предложениям n , что и она!
Если в случае 1 не было нужды в этой предосторожности, то это потому,
что мы смогли перевести в N то, что A влечет n -истинность. И надо предположить что A содержит что-нибудь вроде n -индукции, чтобы иметь нашу
ветвь в дереве, а также чтобы выполнимость n-предложений, стандартных в
N , соответствовали чему-нибудь разумному.
Теорема Геделя естественно распространяется на теории, например !-непротиворечивые, позволяющие интерпретировать модель арифметики, или по
крайней мере не слишком безумную модель А0. Говорят, что T !-непротиворечива если как только T ` f (n) для любого стандартного n, то (8x)f (x)
совместна с T ; или что T !-противоречива, если существует формула f (x)
такая, что T ` (9x)f (x) и T ` :f (n) для любого стандартного n.
Теорема Геделя хотя имеет почти чем 70-летний возраст, всё еще сильно
в моде в тех местах, где любят поболтать. По правде сказать, эпистомологилюбители не видят почти ничего кроме афоризма вида "никакая теория не
может доказать сама свою собственную непротиворечивость", или "никто не
может доказать свое собственное существование ", и только удивляются технической настойчивостью математика, показывающего так старательно то, что
должно быть очевидно по здравому смыслу; чрезвычайно противоречивый здравый смысл, так как те же лица признают в общем картезианскую аксиому "я
думаю, значит я существую"! Это недооценка этой теоремы ; сначала потому, что она говорит на самом деле ни о доказательствах, ни о формулах, а
о кодах (что бы ни говорили, в шутку, логики); ещё потому, что обсуждаемая теория должна быть из 1 (Должны ли мы верить в то, что существуют
только "аксиоматизируемые" теории?), или на худой конец из n . Но фраза
"непротиворечивость арифметики не доказуема в арифметике" не имеет никакого смысла, так как по теореме Тарского непротиворечивость арифметики
148
Глава 7
АРИФМЕТИКА
не соответствует никакому предложению языка арифметики. И каждая эпистомологическая интерпретация этой теоремы основывается на рискованном
предположении её законности и законности синтаксиса и семантики теории
моделей за узкими пределами математической логики. Но несомненно только
одно: прежде чем философствовать по поводу этой теоремы, надлежит знать
её точное утверждение и, если можно, доказательство ; например, бесполезно
её рассказывать студентам, которые не справляются с разложением числа на
простые делители.
Однако это точно, что теорема Геделя, так же и Тарского, основывались, с
точностью до кодирования, на простой аргумент { парадокс лгуна, который, от
Святого Павла и до Бертрана Рассела, служит основанием для бесчисленных
более или менее удачных математических шуток; иногда себя спрашиваешь,
эти теоремы Геделя, Тарского или Berloquin! В случае Тарского, ищут формулу которая говорит "я лгу"; в случае Геделя, который определенно более
тонок, ищут аргумент, доказывающий свою собственную противоречивость.
Когда проводят математическое доказательство такого типа, то ученые говорят, что использовали "аргумент диагонализации". Именно такой аргумент
использовал Кантор, чтобы доказать, что не существует биекции между множеством и множеством его подмножеств (см. главу 8 ). Эти аргументы участвовали существенным образом при изучении иерархии n и n определимых
множеств в арифметике.
Так как этот метод { очень общий, аргумент диагонализации Геделя может
быть применен к любому языку (первого порядка или нет), при условии, что
можно определить отношение доказуемости: наличие 1 -предиката доказуемости является, вместе с компактностью, основным свойством синтаксиса и
семантики, изучаемых в теории моделей.
7.l Немного математической фикции
Арифметика, в отличие от таких теорий, как теория алгебраически замкнутых полей, часто вводит нас в сомнения. Мы можем там закодировать
наш язык и механизмы нашей мысли; нам тяжело выполнять роль наблюдателя, внешнего и беспристрастного, и мы испытываем сладкую дрожь при этой
тонкой игре, состоящей в том, чтобы делать вид, что мы { только автомат,
манипулирующий нашей моделью.
Определенно, что её изучение дало нам понять пределы наших возможностей, или более точно, возможностей аксиоматического метода: мы знаем,
например, что не можем аксиоматизировать арифметику кодируемым в арифметике способом. Со времен Евклида, вместе с Лейбницем, а затем с Уайтхедом, Расселом и Гильбертом, математики мечтали разработать систему аксиом, которая удовлетворила бы окончательно их потребности: раз и навсегда
утвердить список примитивных вещей, допущенных как истинные, так же, как
список допущенных способов доказательств, и затем развивать математику не
выходя из этой системы, из этого "рая". Дать априори все правила игры {
это была, для большинства математиков в начале этого века, единственной
7.l
Немного математической фикции
149
гарантией строгости. Это было бы впрочем чисто относительной строгостью,
так как она опиралась бы на адекватность базовых понятий, которые основывают выбранную аксиоматическую систему: говорят о множествах маленьким
детям, им дают примеры множеств, но кто им сказал, что это { множество?
Этот подход заставляет только отодвинуть основополагающие проблемы в математике к этим базовым понятиям, что все же улучшает их изучение, при
отсутствии их решений.
Теорема Геделя заставляет сомневаться в преимуществе такого метода, так
как она ясно указывает, что какова бы ни была выбранная аксиоматика, надо
будет из неё выйти. Очевидная слабость аксиоматического метода в том, что
если T является теорией (рекурсивно перечислимой; но кто предложит другую систему аксиом?), содержащей как минимум арифметику, то невозможно
доказать в T непротиворечивость T . Но она { еще более катастрофическая
для своих сторонников: теорема Геделя позволяет строить теории, которые
доказывают собственную противоречивость, и которые непротиворечивы! Действительно, Пеано + :Cons(Пеано) является непротиворечивой теорией, и так
как здесь доказывается, что Пеано несовместна, тем более доказывается что
Пеано+ :Cons(Пеано) несовместна! Если таким образом Вы находитесь в данной аксиоматической системе, и что случайно Вы докажете в этой системе, что
эта система несовместна, то это еще не значит, что Вы действительно доказали противоречивость вашей системы. Может быть, просто Вы признали как
аксиому свойство, ложное для настоящих натуральных чисел.
Теорема Геделя была представлена с полным основанием своим автором в
качестве доказательства окончательного провала того, что известна под именем "программа Гильберта", которая является надеждой, лелеянной в начале
20 века, о возможностях аксиоматического метода. В то время, некоторые математики брали под сомнение законность бесконечных методов, доказательств
трансфинитной индукцией так же, как и существование "актуальной бесконечности", с которой как минимум должны были обращаться с предосторожностью. Гильберт думал, что за отсутствием исчерпывающего ответа на метафизический вопрос о настоящем существовании бесконечного, мы могли бы по
крайней мере показать его совместность: если так, то все были бы довольны;
даже если Вы не верите в актуальную бесконечность, Вы должны будете допустить что её присутствие в математических доказательствах не может привести
к противоречию (он хотел также, чтобы успокоить своих оппонентов, показать
что то, что мы можем доказать используя актуальную бесконечность, и что
не касается её непосредственно, может быть также доказано и без неё); но,
чтобы аргумент был полностью убедительным, эту непротиворечивость надо
было доказать чисто финитистскими средствами. Таким образом, математики
старались, если выразиться анахронически, показать чисто арифметическими
методами непротиворечивость теории множеств; или более точно, доказать в
аксиоматизируемой арифметике непротиворечивость аксиоматической теории
множеств. Но теория множеств позволяет определить модель арифметики из
множества натуральных чисел; и если Вы не служите предметом серьезной
шизофрении, Вы должны выбрать такую теорию множеств, которая охватывает допущенную Вами арифметику. Таким образом, непротиворечивость вашей
теории множеств доказывает непротиворечивость вашей арифметики и, следо-
150
Глава 7
АРИФМЕТИКА
вательно, не доказуема в вашей арифметике!
Почти не удивительно видеть авторов учебников, уступающих удобствам
аксиоматики, предпосылая своим трудам главу 0 про "теорию множеств", устанавливая правила игры для последующего; это уступка возможности априорного, догматического и не критического изложения содержания какой-то науки и это успокаивает студентов, которые очень любят, чтобы им вдолбили
надежные истины, даже если в них они ничего не понимают. Напротив, то что
удивительно, это признанные математики, придерживающиеся такого очень
формального взгляда и не сделавшие выводы из известной, и уже старой, теоремы Геделя. Наиболее характерным является Никола Бурбаки, который
принялся писать трактат о математике, начиная с самых "начал". Это { старая энциклопедическая мечта, по мнению автора этого курса, который считает,
что энциклопедия не является больше подходящей формой выражения научной мысли нашего времени. Некоторые удивляются Бурбаки, или по крайней
мере некоторым из его последователей, ставящих так высоко основания математики и так низко логиков. Но это позиция, в целом, логичная, так как если
аксиомы являются оракулами и если строгость является предметом культа, то
кощунственно делать из неё позитивное исследование, и надлежит отстранить
без жалости тех, кто имеет такую претензию.
Теоремы Геделя и Тарского { очень отрицательные результаты о возможностях аксиоматического подхода. Что хотят люди (математики)? От логиков
не ждут особых прояснений об арифметике, но можно надеяться на то, что
как только теоретик чисел докажет некоторый глубокий арифметический результат, логик немедленно сумеет ему сказать, является ли этот результат
следствием некоторой аксиоматики типа Пеано. Вот это и есть работа логика! Работа безнадежная, так как модель Пеано может лгать на самом низком
уровне, то есть 1 . Единственное, что может ответить логик: чтобы быть
уверенным, что результат является следствием Пеано, надо провести доказательство в Пеано!
Тогда зачем так лелеять аксиоматику Пеано? Потому что мы чуть не поверили в первое время, что она составит полную аксиоматику арифметики?
Мы теперь раскаиваемся в этой ошибке молодости. На чем основывается наше убеждение, что всякая обычная арифметическая теорема доказывается в
Пеано, что каждая естественная функция ведет себя хорошо во всех моделях
Пеано, убеждение, которое нарушается только если это сделано специально?
Теорема Тарского нам говорит, что это чувство ни на чем не основано, если
не на туманном принципе, который служит также обоснованием "обобщенного
тезиса Чёрча", а именно, что наиболее часто встречающиеся объекты наименее вероятны. (Находите ли Вы в сборнике упражнений DEUG действительно
разрывные функции ? или примитивные не вычислимые через элементарные
функции?)
А что касается мысли о том, что хитрый Бог нас кажется поместил в нестандартную модель арифметики, не являющуюся может быть даже настоящей арифметикой, о чем естественно мы не могли бы отдать себе отчет, она
может быть только продуктом затуманившегося разума. Это { потерять из
виду, что язык, знакомый теоретику моделей, в основном был использован им
7.m
Исторические и библиографические примечания
151
только по технической причине, потому что он дает доступную теорию моделей
(компактность, определимость понятия доказательства, : : : ) и только из-за деформации разума в конце концов можно себе внушить, что это естественная
рамка математической мысли : фактически, математик выходит из неё легко.
Как я уже однажды сказал, логики, или скорее теоретики моделей, являются простыми людьми; вводить элементарную эквивалентность локальными
изоморфизмами { это избегать подхода к выполнимости, отравленного метафизическими остатками. Они верят, что натуральные числа, которыми они располагают являются настоящими числами, и что множество истинных в арифметике предложений существует, даже если оказывается, что оно не имеет
такого же простого описания, как множество четных чисел; теорема Геделя,
которую они излагают не пряча скрытые там кодирования, четко объясняется,
для них, как свойство "ложных натуральных чисел", и никак не расшатывает в них веру в истинную арифметику. Одним словом, их счастье в немного
наивной философии, которая заключается в одной фразе: "Математические
объекты существуют, а их описание преходяще".
Чтобы завершить на приятной ноте, мы собираемся войти в фикцию. Одна
из знаменитых теорем { это теорема Ферма; Может быть, она была доказана
своим автором, но этот последний не оставил ничего проясняющего своим потомкам, и с тех пор теорема не поддается усилиям тысяч математиков. Она
формулируется таким образом:
(8x)(8y)(8z)(8t)(xt + yt = zt ! t 2 _ x y = 0) ;
Если заменить показательную функцию её определением через сумму и произведение, то видим, что это 1-предложение. Следовательно, если оно ложно,
то его отрицание является следствием A0 (имеем настоящий контрпример, и
достаточно осуществить вычисления!), случай { неинтересный; мы выдвигаем
таким образом гипотезу, что оно истинно, и мы можем представить, что если
никто не смог его доказать до настоящего времени, может быть это именно
потому, что оно не является следствием аксиом Пеано. Логик, у которого
средства более ограничены чем у теоретика чисел, будет иметь более скромное намерение, чем он: вместо того, чтобы пытаться показывать, что теорема
Ферма истинна, он попытается только доказать что она совместна.
В какой системе аксиом он собирается проводить свое доказательство?
Естественно, в Пеано, являющейся нашей системой отсчета. Но, если модель
N Пеано утверждает, что теорема Ферма совместна с A0 , он построит модель
M теоремы Ферма, с начальным сегментом N 0 , изоморфным N (см. доказательство второй теоремы Геделя), и только оттого, что теорема Ферма есть
1 , она также истинна в N 0 и в N : доказать в Пеано, что теорема Ферма
совместна с Пеано , { это доказать в Пеано , что теорема Ферма истинна. Какова бы ни была система аксиом A , допущенных Маленьким Никола, он не
может доказать, оставаясь в своей системе, что теорема Ферма совместна, не
показывая что теорема Ферма истинна (т.е. следствие A ). Все это говорит, что
логика не продвигает ни на один шаг доказательство большой теоремы Ферма.
152
Глава 7
АРИФМЕТИКА
7.m Исторические и библиографические
примечания
Теорема 7.1 о полноте категоричных теорий появилась в [ЛОСЬ, 1954] и
[ВОТ, 1954]. Аксиоматика Пресбургера 7.5 описана в [ПРЕСБУРГЕР, 1930]; для
теории произведения натуральных числа, консультируйтесь у [ЦЕГЕЛСКИЙ,
1981]. Хотя для нас это прямое следствие теоремы компактности, существование нестандартных моделей арифметики было немного озадачивающим явлением для наших отцов; одно из их первых появлений было в [СКОЛЕМ, 1934].
Кодирование комбинаторики и языка в арифметике восходят к [ГЁДЕЛЬ, 1931];
наше отношение 2 определялось в [АККЕРМАН, 1937]. Теорема Тарского в его
знаменитой статье об истинности [ТАРСКИЙ, 1935].
Определение иерархии арифметических множеств, которая параллельна
борелевским и аналитическим иерархиям, введенным поляками и другими славянами в дескриптивную теорию множеств, обязано [КЛИНИ, 1936]; примитивно рекурсивно функции определялись Геделем [ГЁДЕЛЬ, 1931], и общерекурсивные функции Клини [КЛИНИ, 1936]. Теорема Матиясевича опубликована
в [МАТИЯСЕВИЧ, 1970]; она подводит конец длинной последовательности работ о проблеме, поставленной Гильбертом, который спрашивал, существует ли
алгоритм, позволяющий определить, имеет ли многочлен с несколькими переменными, с целыми коэффициентами целый корень; ответ "нет", по теореме
Матиясевича, которая превращает рекурсивным способом 1-предложение в
синонимичное диофантово предложение.
Тезис Чёрча формулировался в [ЧЁРЧ, 1936]; машины Тьюринга обязаны
[ПОСТ, 1936] и [ТЬЮРИНГ, 1936]; степени рекурсивности и n -универсальных
степеней появляются в [ПОСТ, 1948]. Как хороший вводный учебник по рекурсивности, я рекомендую [ШЕНФИЛД, 1971].
Термин "арифметика Пеано" воздает должное "Формуляру математики"
Джузеппе Пеано [ПЕАНО , 1895{08 ]; эта книга, которая имела значительное
влияние на современный математический символизм, состоит по большей части
из систематического представления базовых математических понятий, а не из
"аксиоматизации" в техническом смысле, как мы это понимаем сегодня; в то
время, не имели никакого представления о значительном расстоянии, которая
отделяет силы выражений языка второго порядка и языка первого порядка.
Конструкции моделей из разделов 7.h и 7.i являются частью фольклора логики 50-х годов ; можно например консультироваться у [ШЕНФИЛД, 1960]; не
существование нестандартной рекурсивной модели арифметики Пеано обязано
[ТЕННЕНБАУМ, 1959]; теорема Плеоназма должна иметь свое происхождение
в [ФЕФЕРМАН, 1957]. Комбинаторная лемма Денеша Кёнига о деревьях очевидно гораздо старше: [КЁНИГ, 1927]. Как и для того, чтобы знакомиться
с современной теорией моделей арифметики, так и для того, чтобы углубить
свои знания о них, вы найдете материал в [БЕРЛИН-МАКАЛУН-РЕССЭР, 1982].
Адекватность понятия доказательства 1 семантике логики первого порядка была показана [ЭРБРАН, 1928], [ГЁДЕЛЬ, 1930] и [ГЕНЦЕН, 1934], следуя заметно различным подходам; здесь неуместно рассматривать влияния которые
7.m
Исторические и библиографические примечания
153
они оказали на современную теорию доказательств . Чтобы собрать материал
об алгоритмической сложности некоторых логических теорий, очень решительный читатель может консультироваться у [ФЕРРАНТ-РАКОФФ, 1979].
Две теоремы Геделя из [ГЁДЕЛЬ, 1931] . Утверждение 7.33 содержит ингредиент, которого Гёдель тщательно избегал; в 7.33 речь идет о рекурсивных
фрагментах настоящей арифметики; Гёдель никогда не говорил об истинности,
ни о выполнимости в структуре, а о вещах доказуемых в (рекурсивной) теории,
и он сформулировал свою теорему для !-непротиворечивой теории, содержащей аксиомы Пеано (которая таким образом может содержать предложения,
ложные для настоящих натуральных чисел); его результаты затем были обобщены Россером для непротиворечивых расширений аксиом Пеано, Однако, в
учебнике логики, для которого главный сюжет не история идей, формулировка
теоремы Гёделя в виде 7.33 { единственно важная.
Глава 8
Ординалы и кардиналы
8.a Вполне упорядоченные множества : : 155
8.b Аксиома выбора : : : : : : : : : : : : : : : : : : : : : : : 159
8.c Кардиналы : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 166
8.d Конфинальность : : : : : : : : : : : : : : : : : : : : : : 172
8.e Исторические и библиографические примечания : : : : : : : : : : : : 175
154
8.a
155
Вполне упорядоченные множества
Эта глава носит вспомогательный характер для теории моделей. Она написана для удобства читателя: каждый раз, до настоящего времени, когда вопросы касались "ординалов", "трансфинитной рекурсии", его просили допустить
пригодность доказательств, предложенных по аналогии со счетным случаем,
обещая ему более глубокое изложение впоследствии. Настала пора для этого
изложения, так как со следующей главы нам нужны будут достаточно точные
результаты об "арифметике кардиналов".
8.a Вполне упорядоченные множества
Полный порядок (или полная цепь) { это линейный порядок, в котором каждое не пустое подмножество имеет наименьший элемент. Говорят, что множество вполне упорядочено, если оно снабжено полным порядком. Например,
пустой порядок, конечный порядок, порядок ! натуральных чисел являются
полными порядками. Если A и B является полными порядками, то такими же
будут и сумма A + B , и лексикографическое произведение A B , что читатель
легко проверит в качестве упражнения. Каждый подпорядок полного порядка
является полным порядком.
Напоминаем, что начальным сегментом порядка A называется его подмножество B , такое, что если a лежит в B , то любой меньший его элемент из A
(миноранта для a) также лежит в B . Если множество A является полным
порядком, то оно имеет два вида начальных сегментов: сам порядок A и начальные сегменты обозначаемые Aa , являющимися множествами элементов
A , строго меньших a для некоторого a 2 A . Мы видим таким образом, что
полный порядок изоморфен множеству своих собственных начальных сегментов, упорядоченных по включению.
Лемма 8.1 Пусть A и B { два полных порядка и f и g { два изоморфизма A
на начальные сегменты B . Тогда f = g .
Доказательство. Предположим что f и g различны. Тогда, пусть a {
наименьший элемент из A, такой, что f (a) 6= g(a) . Допустим, например, что в
B f (a) < g(a) . Так как g(A) является начальным сегментом B , то найдется
элемент c < a, такой, что g(c) = f (a) . Следовательно, по выбору a верно
равенство f (c) = f (a) . Противоречие.
Эта лемма утверждает в частности, что если A является полным порядком,
то тождественное отображение является единственным изоморфизмом A на
начальный сегмент A , т.е. A не изоморфно ни одному из своих собственных
начальных сегментов.
Лемма 8.2 Пусть A и B { два полных порядка. Тогда существует изоморфизм одного из них на начальный сегмент другого.
Доказательство. Предположим сначала, что для каждого a из A , Aa
изоморфно собственному начальному сегменту B . По предыдущей лемме этот
156
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
начальный сегмент единственнен, и мы обозначим его через Bf (a) . Тогда легко
видеть, что отображение f является изоморфизмом порядка A на начальный
сегмент B .
Обратно, пусть a { наименьший элемент A, такой, что Aa не изоморфен
собственному начальному сегменту B . Для любого b < a сегмент Ab изоморфен собственному начальному сегменту Bf (b) порядка B . Мы видим, что f
является изоморфизмом Aa на начальный сегмент B , который по определению A не может быть собственным. Отображение f является, таким образом,
изоморфизмом между порядками Aa и B .
Для данных двух полных порядков A и B мы говорим, что ординал A меньше ординала B , в обозначении ord(A) ord(B ), если A изоморфен начальному
сегменту B . Не будем сейчас давать точный смысл слову "ординал". Мы рассматриваем ord(A) < ord(B ) в качестве готового выражения так же, как определяем понятие n-мерного пространства в алгебре, не сказав первоначально
чем является размерность.
Ясно, что это отношение рефлексивно, транзитивно, и антисимметрично в
следующем смысле : если ord(A) ord(B ) и ord(B ) ord(A) (в этом случае
говорят, что A и B имеют один и тот же ординал), тогда A и B изоморфны.
Действительно, если f является изоморфизмом A на начальный сегмент B ,
и g { изоморфизм B на начальный сегмент A , то f g и g f являются тождественными отображениями. Кроме того, по лемме 8.2 два полных порядка
всегда сравнимы.
Мы определяем таким образом "отношение линейного порядка на ординалах". Для данного полного порядка A , ординалы, строго меньшие этого A ,
это ординалы собственных начальных сегментов A , которые соответствуют
точкам A . Мы видим таким образом, что ординал отождествим с множеством
всех ординалов, которые строго меньше его, снабженного их отношением естественного порядка.
Если хотите, можно под ординалом упорядоченного множества A понимать
класс всех полных порядков, которые ему изоморфны. Однако,вообще так не
поступают, так как существует технический способ в теории множеств, состоящий в выборе исключительного элемента из этого класса { ординала фон
Неймана1, который я собираюсь сейчас ввести.
Множество называется транзитивным, если каждый элемент является его
подмножеством: в других терминах, a транзитивно, если каждый раз, когда
x 2 a и y 2 x , тогда y 2 a . Например ; транзитивно, также как f;g . В более
общих терминах, если a транзитивно, то a [ fag также транзитивно. Говорят,
что множество a является ординалом фон Неймана, если оно транзитивно и
если отношение принадлежности x 2 y является строгим порядком, соответствующим полному порядку на a : x y означает, что x 2 y _ x = y , x 2 y
означает x y ^ x 6= y , или x < y . Например ; является ординалом фон
Неймана, который в этом контексте лучше обозначать через 0 ; f;g { также
ординал фон Неймана: его обозначают 1 ; также как и f;; f;gg , обозначаемый
2 ; вообще, если a является ординалом фон Неймана, то таковым является и
1
Джон фон Нейман { один из отцов атомной бомбы ; но не леммы 6.25
8.a
157
Вполне упорядоченные множества
a [ fag .
Отметим, что элемент b ординала фон Неймана a сам является ординалом
фон Неймана : b транзитивен, так как отношение принадлежности транзитивно
между элементами a , и (b; 2) является полным порядком, так как это { ограничение (a; 2) . Начальные сегменты ординала фон Неймана { он сам и его
собственные начальные сегменты, которые являются также его элементами!
Включение a 2 a невозможно, так как на отношение x 2 y является строгим
порядком.
Лемма 8.3 Изоморфизм между ординалами фон Неймана является тождественным отображением: если два ординала фон Неймана изоморфны (т.e.
соответствующие им порядки изоморфны), то они равны.
Доказательство. Пусть a и b { наши два ординала фон Неймана и пусть
f не тождественный изоморфизм между a и b и c { наименьший элемент такой,
что f (c) =
6 c . Изоморфизм f отображает начальный сегмент элементов из a
строго меньших c , на начальный сегмент порядка b , состоящий из элементов,
строго меньших f (c) . Следовательно, c и f (c) являются двумя множествами, которые имеют одни и те же элементы, которые таким образом равны.
Противоречие.
Лемма 8.4 Каждый полный порядок изоморфен некоторому ординалу фон
Неймана.
Доказательство. Пусть A { вполне упорядоченное множество. Предполо-
жим, что существует x в A такой, что Ax не изоморфен ординалу фон Неймана,
и пусть a наименьший среди них. Тогда для каждого x < a по лемме 8.3 существует единственный изоморфизм, между Ax и ординалом фон Неймана x0 .
Если x < y < a , то обязательно x0 является начальным сегментом y0 ,являющимся образом x при изоморфизме между y и y0 , иначе говоря x0 2 y0 . Тогда
мы видим, что множество элементов вида x0 образует ординал фон Неймана,
и что оно изоморфно Ax . Противоречие.
Мы поняли, что каждый собственный начальный сегмент полного порядка
изоморфен ординалу фон Неймана. Для завершения доказательства достаточно отметить, что A является собственным начальным сегментом A + 1 {
порядка, полученного из него добавлением точки справа.
Таким образом, ординалом упорядоченного множества A называется единственный изоморфный ему ординал фон Неймана. Встречаются студенты, которые испытывают аллергию к ординалам, определяемым как "типы полных
порядков", и находят более удобоваримым понятие ординала фон Неймана.
Вот вам странное последствие догматического образования, которое путает
формализм со строгостью и выдвигает вперед техническую хитрость в ущерб
основной идее: надо иметь странно искаженный разум, чтобы найти естественным понятие транзитивного множества!
Ординал фон Неймана является множеством всех меньших его ординалов
(фон Неймана; я не собираюсь больше таскать это имя повсюду). Его элементы
158
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
являются также и его собственными начальными сегментами. Естественный
порядок, то есть принадлежность или равенство, образует род полного порядка
на ординалах. Я говорю "род", так как ординалы образуют слишком широкий
класс чтобы быть множеством. Обычно дают такое объяснение : иначе, они бы
образовали ординал, который бы принадлежал самому себе и, значит, был бы
меньше самого себя, что невозможно. Для ординалов справедлив следующий
принцип индукции:
Если существует ординал, удовлетворяющий некоторому свойству P , то
существует наименьший такой ординал.
Пусть, действительно, a { ординал, удовлетворяющий P . Если он наименьший, то все доказано. Иначе, множество элементов a , которые удовлетворяют
P , не пусто и значит имеет наименьший элемент b , который удовлетворяет
свойству P . Этот принцип может быть изложен также в следующем виде:
Если для каждого ординала x тот факт, что все y < x удовлетворяют
свойству P влечет, что x также удовлетворяет P , тогда все ординалы
удовлетворяют P .
Если ординал имеет наибольший элемент a , он таким образом имеет вид
a [ fag , то говорят, что он последователь; иначе, говорят что он предельный .
Предельный ординал является объединением, или еще верхней гранью, всех
меньших ординалов2 .
В доказательствах по индукции часто случается, что нужно рассматривать
два случая, в зависимости от того, что обсуждаемый ординал последователь
или предельный. Из-за предельных ординалов индукция не сводится как в
арифметике, к переходу от ординала к своему последователю (если применять
обозначения 7.g , то I 0 и I " единственные удовлетворительные в контексте
ординалов формы аксиом индукции; форма I неверна).
Ординал называется конечным, если все ненулевые ординалы, меньшие или
равные ему, являются последователями; пример: ; , f;g , f;; f;gg ,... Мы убеждаемся что понятие конечного ординала является переводом, на теоретикомножественные термины, неформального понятия натурального числа. Наименьший бесконечный ординал, который является наименьшим предельным
ненулевым ординалом, и порядок которого изоморфен естественному порядку
натуральных чисел обозначается ! или @0 . Впрочем, обсуждаемый изоморфизм является тождественным отображением, так как, по соглашению фон
Неймана, ! есть множество натуральных чисел, и его порядок является порядком натуральных чисел.
Другое применение индукции это построения трансфинитной рекурсией.
Для данного ординала x описывают способ который позволяет строить однозначно определенный объект Mx , предполагая,что для каждого y < x такой My
уже построен. В таких рассуждениях основным шагом от противного является
рассмотрение наименьший ординала x , для которого не существует объекта
Mx .
Иногда довольствуются построением для x , меньших фиксированного ординала a . Примеры таких построений трансфинитной рекурсией, мы увидели
Внимание: любой ординал, как последователь так и предельный, является множеством
всех меньших ординалов
2
8.b
159
Аксиома выбора
в 1.c для производных топологического пространства и для -изоморфизмов.
Мы собираемся трансфинитную рекурсию использовать и для доказательства
следующего утверждения.
Лемма 8.5 Пусть A полный порядок, и B ограничение (не обязательно на
начальный сегмент!) A . Тогда ord(B ) ord(A) .
Доказательство. Пусть ординал B , c которым мы его можем отожде-
ствить. Рассмотрим функцию f из в A , определенную такой рекурсией :
f (x) есть наименьший элемент A , больший всех f (y) для y < x , если он
существует, иначе, f (x) { наименьший элемент A . Легко видеть по индукции, что f (x) x , так что f (x) всегда наименьший элемент A , больший всех
f (y) для y < x . Второй случай был только ораторской предосторожностью,
чтобы функция f определялась. Эта функция является изоморфизмом B на
начальный сегмент A , который может быть и самим A , даже если B является
собственным подмножеством A.
8.b Аксиома выбора
Теорема 8.6 (Цермело) Каждое множество можно вполне упорядочить.
Доказательство. Если множество A пусто, то оно вполне упорядочено.
Если оно не пусто, то имеет элемент, пусть a0 . Если множество A этим не
исчерпывается, то оно имеет другой элемент a1 , продолжая по индукции эту
процедуру, сопоставляем каждому ординалу элемент a из A до тех пор пока для некоторого ординала множество a ; < , не совпадет целиком с
A . При этом каждый элемент a выбирается отличным от всех предыдущих.
Построение должно обязательно остановиться, так как ординалы полных порядков, которые можно определить на подмножестве A образуют множество,
в то время как класс всех ординалов не образует множество. Когда мы остановимся, то получим полное упорядочение множества A .
Доказательство этой теоремы является, конечно, мошенничеством, так как
каждый знает, что эта теорема эквивалентна аксиоме выбора, и что аксиома
выбора не является следствием "других" аксиом теории множеств. Это последнее высказывание имеет действительный смысл только, если мы уточним
другие аксиомы, то есть если выберем формальную теорию множеств, например, теорию Цермело-Френкеля ZF.
Здесь появляется методическая проблема; мы могли бы, в предыдущей главе, выбрать аксиоматическую рамку, дать пример списка аксиом Пеано, и работать только внутри этой системы. Это не было сделано, так как всегда под
рукой имеется естественная модель арифметики, полученная из настоящих
натуральных чисел. Мы верим в существование множества истинных предложений для настоящих натуральных чисел , даже после того как отдаем себе
160
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
отчет, что это множество имеет достаточно сложное определение. И потом,
после определенной работы, мы поняли, что аксиомы Пеано составляют только очень слабое приближение к этой настоящей арифметике. Естественный
подход к арифметике является следующим: "Мы имеем числа, и пытаемся их
описать". Но множества, что это такое?
Если для множеств ситуация другая, то это потому, что не существует
естественной модели теории множеств. Что является настоящими множествами, в сущности, никто не знает. Так, что мы находимся в несколько затруднительном положении. Нам нужно задать список разумных аксиом, в том
смысле, что, если бы настоящие множества существовали, они бы удовлетворяли, вероятно, этим аксиомам то, что очевидно очень субъективно, и затем
выявлять последствия этой аксиоматики. Но проблема в том, что эта теория
множеств нас касается ещё больше чем арифметика, так как мы можем определить в терминах множеств всю нашу математику, а не только комбинаторику,
и что мы использовали на менее формальным уровне эту же теорию множеств
чтобы изучить теорию множеств! Перевод каждого математического понятия
на язык множеств настолько прямой и настолько естественен по крайней мере
для математика этого века, что он служит подводным камнем для начинающего логика. Случается он смешивает понятия, внутренние относительно модели
и те, что внешние: когда он изучает арифметику, где переводы осуществляются достаточно искусственными кодированиями, он лучше защищён от этой
неясности.
Можно дать аргумент, объясняющий невозможность существования естественной, абсолютно убедительной модели теории множеств. Если бы она существовала, то была бы множеством M , снабженным бинарным отношением
принадлежности, которое было бы что{то вроде элементарного ограничения
мира, в котором мы живем. Но, поскольку выполнимость предложения в M
легко определяется в теории множеств, то мы имели бы определение истинности внутри этой теории, что опровергается теоремой Тарского.
Этот аргумент не так силён: приложенный к арифметике, он доказывает
всего лишь, что множество натуральных чисел бесконечно. Понятно, что эта
естественная "модель" теории множеств должна была бы быть высшего типа,
что{то вроде предела определяемых вещей в этой теории. И на самом деле
ZF имеет модели этого типа { модели "кумулятивной иерархии", так что нам
гарантирована непротиворечивость ZF, хотя естественно она не доказуема в
ZF.
Но так как никто не имеет ясного представления хотя бы об одной модели
этого типа, способной служить абсолютным ориентиром для математической
мысли, вопрос знания, верна ли аксиома выбора, не имеет большого смысла.
Напротив, мы не без сомнения утверждаем что Cons(Пеано) верна, хотя она не
доказуема в системе Пеано. Единственный разумный вопрос, это спрашивать,
является ли она следствием данной системы аксиом или нет, или совместна
ли она с этой системой. Действительно, по теореме Гёделя, рассматриваемые
системы не могут доказать собственную непротиворечивость. Но они могут
доказать относительную непротиворечивость аксиомы выбора. Доказываем в
ZF, что если ZF совместна, тогда ZF + Аксиома выбора совместна, так же впро-
8.b
Аксиома выбора
161
чем, как и ZF с отрицанием аксиомы выбора. Эти и другие проблемы такого
типа, дали толчок развитию плодотворной и очень специфической отрасли логики "теории множеств", которая выходит целиком за рамки этого труда. Мы
могли бы впрочем настоятельно советовать читателю рассматривать её только приобретя прочные знания в теории моделей, которая является основанием
логики. Однако, так как после Кантора мы купаемся в множествах, их нельзя избежать, и мы собираемся, оставаясь по возможности неформальными,
немного углубиться в свойства этих гипотетических множеств.
Эта "неформальная теория" { в высшей степени антиномичный объект, тем
не менее испытывает сильное влияние аксиоматики Цермело-Френкеля, подспудная метафизическая идея которой состоит в том, что множества являются "маленькими" по отношению к миру. Например, дополнение множества не
может быть множеством. Теория множеств развивается обычно в этой аксиоматике. Сказать, что это естественная рамка математической мысли, это очень
рискованно. Однако, это точно, что она становится все более и более таковой,
так как математическая практика, ежедневная теоретико-множественная концепция математиков все более и более испытывает влияние ZF.
Можно впрочем понять, что глубокие теоремы теории множеств, доказанные по поводу ZF, остались бы действительными и в другой системе. Среди этих других систем, относительный успех имели { система BG ГеделяБернайса, похожая на ZF, и система NF New Foundations Куайна, которая
основывается на совершенно другой идее.
Мы собираемся теперь доказать эквивалентность различных классических
форм аксиомы выбора. Чтобы сделать это доказательство совершенно строгим,
надлежало бы уточнить какие аксиомы допускаются, то чего мы не делаем:
читатель убедится, что свойства множеств, которые используются неформально, допустимы.
1. Аксиома выбора. Для каждого множества A , существует функция f
из множества не пустых подмножеств A в A , которая каждый не пустой
элемент A отображает в один из своих элементов (говорят, что f является
функцией выбора на A ).
2. Аксиома выбора (2-ая форма). Пусть R отношение эквивалентности на
A . Тогда существует подмножество B в A , которое содержит ровно по
одному элементу в каждом классе разбиения, соответствующего R .
3. Аксиома выбора (3-я форма). Произведение не пустых множеств не пусто.
4. Аксиома Цермело. Каждое множество может быть вполне упорядочено.
5. Аксиома Хаусдорфа. В частичном порядке, каждая цепь (т.e. каждое
линейно упорядоченное подмножество этого частичного порядка) содержится в максимальной цепи.
6. Аксиома Куратовского. (Напоминаем что частичный порядок называется индуктивным, если каждая цепь имеет в нем верхнюю грань). В частичном не пустом индуктивном порядке имеется по крайней мере один
максимальный элемент.
162
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
7. Аксиома Куратовского (2-ая форма). В частичном индуктивном порядке
каждый элемент мажорируется некоторым максимальным элементом.
Аксиома Куратовского более известна под именем аксиомы Цорна, хотя последний высказал её более чем через 20 лет после Куратовского. Это ошибочное присвоение обязано энтузиазму Бурбаки, испытывавшему к этой аксиоме
пристрастие, которая позволяла (не всегда естественным способом) избегать
трансфинитных рекурсий.
Доказательство (избыточное).
1 () 2
1 =) 2 так как функция выбора f на A выделяет из каждого класса по
представителю, то берем в качестве B f -образ множества классов R . Чтобы
показать 2 =) 1 , рассмотрим подмножество множества P (A) A , образованное из пар (X; x) таких, что x 2 X (P (A) обозначает множество подмножеств
A) и на этом множестве определим отношение эквивалентности R "иметь одни
и те же первые координаты". Пусть B множество представителей классов по
модулю R , существующее по аксиоме 2 . Следующая функция f является
функцией выбора на A : каждому не пустому подмножеству X в A сопоставляется класс по модулю R , образованный из пар с первой координатой X , и в
качестве f (X ) берут вторую координату единственного элемента этого класса,
лежащего в B .
1 () 3
В этом случае сказать, что существует функция выбора значит показать,
что декартово произведение не пустых подмножеств A не пусто. Если
(: : :; Ai; : : : ) является семейством не пустых множеств, то ограничение функции выбора на [Ai на это семейство и есть элемент их произведения.
1 () 4
Если множество A вполне упорядочено, то отображая каждое не пустое
подмножество A на свой наименьший элемент относительно этого полного порядка, получаем функцию выбора. Чтобы доказать обратную импликацию
мы повторяем доказательство теоремы 8.6, недостаток которой заключался в
отсутствии действительного описания a . Предполагая, что известны все элементы a ; < , мы теперь располагаем функцией выбора на A , которая
позволяет определить однозначно a в зависимости от элементов a , где < .
Если f: : :; a ; : : : g = A , то останавливаемся. В противном случае a является
значением f на дополнении в A этого множества.
6 () 7
В индуктивном порядке мажоранты элементов образуют не пустой индуктивный порядок.
5 () 7
Цепи частичного порядка, упорядоченные по включению, образуют индуктивное множество. Если мы рассмотрим в индуктивном множестве максимальную цепь C , продолжающую цепь из одного элемента а , эта цепь имеет
мажоранту b, которая может быть только её наибольшим элементом, и он максимален.
6 () 4
8.b
163
Аксиома выбора
Пусть A множество, тогда обозначим через B множество полных порядков, определенных на подмножествах A . Это множество не пусто, так как оно
содержит полный порядок ; . Упорядочиваем B следующим образом: a b ,
если а является начальным сегментом b . Нетрудно видеть, что это индуктивный порядок : цепь мажорирует??я общим расширением каждого из своих
элементов, определенного на объединении их носителей (это общее расширение
является полным порядком, в котором каждый элемент является начальным
сегментом). Пусть тогда а максимальный элемент B . Я утверждаю, что а
совпадает с A . Действительно, если это не так, то существовал бы элемент x
из A помимо базы a . Тогда мы могли бы продолжить порядок а , полагая, что
x больше каждого элемента носителя a , что противоречит максимальности а.
1 () 7
Пусть a произвольный элемент из A . Определим индукцией по ординалу
последовательность a элементов индуктивного порядка A , предполагая
что A снабжен функцией выбора. Полагаем a0 = a . Далее, если = +
1 , и a максимален, то останавливаемся. Если это не так или ординал пределен, то цепь fа0; : : :; а ; : : : g< имеет не пустое множество M точных
мажорант (в предельном случае, она не имеет наибольшего элемента). Тогда
полагаем аalpha = f (M ) . Построение должно остановиться, так как мы не
можем отобразить инъективно класс всех ординалов в множество. Поясним
для тех кто знает ZF , что это является следствием схемы аксиом замещения
и того факта, что ординалы не образуют множество. Остановка означает, что
мы нашли нашу максимальную мажоранту для a .
Аксиому выбора математики не любят. Они её предпочитают использовать
в форме Куратовского-Цорна, например чтобы показать существование максимальных идеалов в кольце с единицей, так как эта аксиома им кажется более
материально осязаемой. С аксиомой выбора, они не понимают того, что надо
показать. Так как они испытывают отвращение к построениям трансфинитной рекурсией, то они суют эту аксиому Куратовского-Цорна куда попало, что
часто их обязывает к акробатическим трюкам. Сколько имеется учебников
алгебры, которые для доказательства теоремы о том, что любые два базиса
векторного пространства бесконечной размерности имеют одно и то же число
элементов, используют её вариант для подпространств конечной размерности,
вместо того, чтобы прямо доказать трансфинитную версию леммы о замене!
(См. 19.11) .
Аксиому выбора часто плохо понимают: чтобы найти элемент в непустом
множестве она не нужна! Действительно, если это множество не пустое, то это
потому, что оно имеет по крайней мере один элемент! Проблема в следующем:
если мы имеем семейство множеств, про которое индивидуально знаем, что
каждое не пусто, то ничто не обеспечивает существование функции выбора,
в некотором роде единообразной и общей процедуры, показывающей что все
они не пустые. Это нюанс между понятиями "каждый" и "все"! Если у вас
аллергия к этой метафизике, вам следует потрудится над теорией множеств,
и изучить доказательство (трудное) независимости аксиомы выбора от других
аксиом ZF .
164
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
Чтобы разъяснить идеи нашему читателю, покажем без аксиомы выбора
что произведение конечного числа не пустых множеств не пусто: это доказывается рекурсией по числу n . По гипотезе индукции, мы имеем функцию
f с областью определения [0; n ? 1] , которая i сопоставляет элемент из Ai .
Так как An не пусто, то оно имеет элемент a , тогда продолжим f , полагая
f (n) = a .
Аксиома конечного выбора не является на самом деле аксиомой, это теорема, которая доказывается из других аксиом. Напротив, существуют ослабленные формы аксиомы выбора, которые не может выведены из них; примером
является аксиома счетного выбора, которая утверждает, что если
A0; A1; : : :; An; : : : счетная совокупность не пустых множеств, то их произведение не пусто. Другой пример следующая аксиома зависимого выбора: пусть
A непустoe множество, а R бинарнoe отношение на A такие, что для каждого
а из A существует b из A такой, что (а; b) удовлетворяет R ; тогда существует
последовательность an элементов A (т.e. отображение ! в A) такая, что для
каждого n (an; an+1) лежит в R . Сравните это утверждение с 7.l7.
Эта последняя аксиома выводится легко, если мы располагаем функцией
выбора на A , например, если A вполне упорядочено. Таким образом, она следствие аксиомы выбора. Такая аксиома позволяет доказать аксиому счетного
выбора. Действительно, рассмотрим бинарное отношение R , определенное на
объединении A множеств An таким образом : (a; b) удовлетворяет R если для
некоторого целого n a в An и b в An+1 . В теории множеств доказано (это
трудно!), что она строго сильнее чем аксиома счетного выбора.
Аксиома счетного выбора постоянно используется в анализе; её часто ловко скрывают, чтобы не сеять смуту в сознании студентов, предрасположенных
допускать все что угодно, и профессоров, не любящих расшатывать основания
науки. Например, чтобы показать что счетное объединение множеств меры
0 само является множеством меры 0 используют следующую цепочку рассуждений. Каждое множество An содержится вPоткрытом P
множестве On меры
меньшей "=2n+1 . Таким образом ([An) (On ) "=2n+1 = " . Я с
такими выкладками согласен, но заметим, что здесь необходимо выбрать для
каждого n окрестность On среди всех тех, которые удовлетворяют условию.
Давайте будем без иллюзий: без аксиомы выбора, мы не сможем даже доказать, что произведение счетного семейства множеств An имеющих каждое
по два элемента, не пусто! Однако, если A = f0; 1g , то A! не пусто, так как
оно содержит нулевую последовательность. Может показаться, Q
что так как
!
каждое An находится в биекции с A, то A находится в биекции с An и, следовательно, мы докажем непустоту указанного декартова произведения. Это
{ ошибка, так как чтобы строить такую биекцию, надо для каждого n выбрать
одну биекцию между A и An среди двух возможных. Как замечательно сказал
Бертран Рассел, это { разница между семейством пар носков и семейством пар
ботинков: для последнего мы имеем функцию выбора, которая состоит в том
чтобы всегда брать левый ботинок.
Существование полного порядка на множестве действительных чисел может быть обеспечено только аксиомой: это { предмет веры, мы не можем его
считать "естественным". Оно имеет весьма неприятные последствия для ана-
8.b
Аксиома выбора
165
лиза, так как производит странные множества, которых мы никогда не встретим, как базис R , рассматриваемого в качестве векторного пространства над
Q , или не измеримое по Лебегу множество.
Таким образом, хороший выбор (если можно так выразиться) для математического анализа допускать аксиому счетного выбора, или зависимого выбора, и отклонить аксиому общего выбора, заменив её напротив более приятными
аксиомами, которые ей сильно противоречат. Это необходимо для того, чтобы
сохранить человеческое лицо анализа, не вводя экзотические множества (не
будет никакого интереса к теории множеств действительных чисел, если будет неверно, что объединение счетного семейства множеств меры 0 имеет меру
0) . Этот выбор полностью прагматический, так как метафизические основания, которые можно давать для принятия или отклонения аксиомы счетного
выбора, также действительны для аксиомы общего выбора.
В алгебре, а также в теории моделей, которая близка к алгебре, напротив допускают аксиому выбора. И почему же? Потому что она упрощает
жизнь. Все векторные пространства будут иметь базис, поля имеют базис
трансцендентности, кольца с единицей максимальный имеют идеал. Аксиома
выбора абсолютно необходима для первых глав этого курса. Мы фактически
её использовали чтобы доказать теорему Левенгейма, где имеются выборы ai
, ловко скрытые автором, для теоремы компактности и при применении ультрафильтров, и при применении метода Генкина, для определения понятия
доказательства,..., короче, она необходима почти везде. Если бы мы её не предполагали, то нам надо было бы отягощать условия теорем, уточняя каждый
раз, что некоторые множества вполне упорядочены, или определены особым
способом. Это полностью бесполезное осложнение, не связанное с предметом
нашего изучения.
Например, мы использовали аксиому ультрафильтра: каждый фильтр
подмножеств A продолжается до ультрафильтра. Так как фильтры, упорядоченные включением, образуют индуктивное множество (объединение цепи
фильтров является фильтром, так как оно не содержит ; ), это прямое следствие аксиомы выбора. В теории множеств доказано, что аксиома ультрафильтра строго слабее чем аксиома выбора.
Аксиома ультрафильтра достаточна, чтобы доказать теорему Тихонова,
которая утверждает что каждое произведение компактных пространств компактно (в французской литературе принято считать, что компакт удовлетворяет условию отделимости Хаусдорфа). В построениях рекурсией, которые
мы проводили, наше поведение было часто типичным для тех, кто допускают
аксиому выбора: мы определяли a как элемент некоторого множества A , не
уточняя какого. Просто потому, что подразумевали, что берем то, что дано
функцией выбора, и что бесполезно это повторять все время. Одним словом, в
этой книге, аксиома выбора рассматривается как верная.
166
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
8.c Кардиналы
Теорема 8.7 (Кантор) Если существует инъекция f из A в B , и инъекция
g из B в A , то существует биекция между A и B .
Доказательство. Мы говорим, что элемент а 2 A или b 2 B первого
вида, если он имеет следующее свойство: если например это а из A, то он в
образе g и g?1(a) в образе f , а f ?1(g?1 (a)) в образе g , и т.д., то есть когда
мы поднимаемся начиная с элемента по прообразам, поочередно из f и из g ,
никогда не останавливаемся.
Мы говорим, что он второго вида, если когда таким образом поднимаемся,
то остановимся на элементе A , который не лежит в образе g и, что он третьего
вида, если поднимаясь остановимся на элементе B , который не в образе f .
Рассмотрим отображения ' из A в B , и из В в A , определенные таким
образом :
- если a первого или второго вида, то '(a) = f (a) ,
то '(a) = g?1(a) ,
- если X - третьего вида,
- если b - первого или третьего вида, то (b) = f ?1(b) ,
- если b - второго вида,
то (b) = f ?1(b) .
Так как ' = IdB ; ' = IdA , то ' и являются двумя взаимно обратными
биекциями.
2A
Обозначим через множество подмножеств A . Это множество можно
отождествить с множеством функций из A в множество 2 = fO; 1g если сопоставить подмножеству в A его характеристическую функцию.
Теорема 8.8 (Бернштейн) Каково бы ни было множество A , не существует сюръекции из A на 2A .
Доказательство. Пусть f сюръекция A на 2A , тогда полагаем X = fa :
a 2 f (a)g . Так как X лежит в образе f , то для некоторого элемента a0 2 A
будет X = f (a0) . Тогда, если a0 62 X , то a0 2 X , и если a0 2 X , то a0 62 X .
В обеих случаях имеем противоречие.
Отметим, что эти две теоремы доказаны без использования аксиомы выбора. Мы говорим, что кардинал множества A меньше кардинала множества
B , в обозначении card(A) card(B ), если существует инъекция A в B (рассматриваем сейчас card(A) card(B ) в качестве готового выражения). Это
отношение явно транзитивно: card(A) card(B ) и card(B ) card(C ) влечет
card(A) card(C ). Если card(A) card(B ) и card(B ) card(A), тогда говорят, что A и B имеют один и тот же кардинал дело в том, что тогда по 8.7
существует биекция между A и B . По 8.8, кардинал 2A строго больше кардинала A , так как существует инъекция A в 2A та, которая каждый элемент a
из A отображает на соответствующее одноэлементное подмножество fag .
Отметим, что если card(A) card(B ) и A не пусто, то существует сюръекция g множества B на A . Действительно, если f инъекция A в B и а
8.c
Кардиналы
167
произвольный элемент A , то полагаем g(b) = f ?1(b) , если b в образе f , и
g(b) = a в противном случае .
Это именно приблизительно все то, что можно сказать о кардиналах в отсутствии аксиомы выбора. В частности, нельзя доказать, что два кардинала
всегда сравнимы и что, если существует сюръекция A на B , то card(A) card(B ) . С этого момента, мы работаем с аксиомой выбора. Если f является
сюръекцией A на B , то каждый элемент b из B мы отображаем, функцией
выбора на A , на некоторый элемент из f ?1(b) . Таким образом мы определяем
инъекцию B в A , значит card(A) card(B ) .
Если A и B является произвольными множествами, то их можно вполне
упорядочить, первый ординалом , второй ординалом . Если является
начальным сегментом , то из этого получаем инъекцию A в B , если же
является начальным сегментом , то получаем инъекцию B в A . Так
как два ординала всегда сравнимы, то всегда имеем card(A) card(B ) или
card(B ) card(A) .
Кардиналом множества А называется наименьший ординал такой, что
на носителе A существует полный порядок типа . Кардинал множества A
обозначается равным образом как card(A) или jAj . Кардинал, это ординал фон
Неймана, который не может находится в биекции, не обязательно растущей, ни
с каким из своих собственных начальных сегментов. Из-за этого, кардиналы
иногда называют начальными ординалами.
Например 0,1,2,... и все конечные ординалы являются кардиналами. Ординал ! является кардиналом, а ! + 1 не является кардиналом, так как он
находится в биекции с ! (отобразите ! на 0 и n на n +1 ) . Множество имеющее
кардинал ! называется счетным. Иногда, по контексту, "счетный" означает
"конечный или счетный". Наименьший несчетный ординал является кардиналом. Так как card(! + 1) = ! и все бесконечные ординалы начинаются с
! , то заметим, что бесконечный кардинал является предельным ординалом:
добавление точки к бесконечному множеству не увеличивает его кардинал.
Если кардинал, то через + обозначим наименьший кардинал строго,
больший . Кардинал + часто называют последователем кардинала . Обратите внимание, что если бесконечно, то + не является последователем в
качестве ординала. По теореме 8.8 + 2 , где 2 обозначает кардинал множества подмножеств множества кардинала .
Континуум-гипотеза является следующей аксиомой: !+ = 2! . Обобщенная
континуум-гипотеза утверждает, что для каждого бесконечного кардинала ,
выполняется равенство + = 2 . Из неё следует, что для любых бесконечных
множеств A; B , если A вложимо в B и B вложимо в 2A , то A находится в биекции с B , или B находится в биекции с 2A . Обобщенная континуум-гипотеза
в этой последней форме влечет аксиому выбора. Этот результат получен Серпинским; но континуум-гипотеза независима от ZF + аксиома выбора (результаты Геделя и Коэна). В теории моделей обычно не предполагают континуумгипотезу, слишком упрощающую арифметику кардиналов. Обычно стараются
доказать теоремы без нее; и если где-нибудь её используют, то впоследствии
пытаются от неё отказаться.
168
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
Индукцией по ординалу мы определяем последовательность @ таким
образом3: @ является наименьшим бесконечным кардиналом строго большим
каждого @ для < . Так @0 = !; @1 = !+ (иногда обозначают также
через !1) и т.д. , @ есть " -ый бесконечный кардинал". Мы получаем таким
образом индексацию всех бесконечных кардиналов ординалами: на самом деле
легко видеть, что кардинал меньше или равен @ , таким образом он имеет
вид @ , для некоторого .
Так же определяем последовательность i кардиналов4 : если = +
1 , то i = 2i ; i0 = ! , если предельный ненулевой ординал, то i
является верхней гранью (в качестве ординала или кардинала это одно и то же)
кардиналов i , для < . Обобщенная континуум-гипотеза утверждает что
i = @ для каждого . Если, напротив она неверна, то последовательность
i-ов прыгает через некоторые кардиналы.
Теорема 8.9 Если A бесконечное множество, то A A и A имеют один и
тот же кардинал.
Доказательство. Пусть кардинал A , определим на множестве порядок 0 следующим образом (не забываем, что элементами являются
ординалы с естественным порядком) :
(; ) <0 (1; 1) , если max(; ) < max(1; 1) ,
или, если max(; ) = max(1; 1) и < 1 ,
или, если max(; ) = max(1; 1) и = 1 и < 1 .
Оставляем читателю проверку того, что это линейный порядок. Покажем
что это полный порядок. Пусть A не пустое подмножество и B множество
элементов (; ) из A таких, что max(; ) минимален (в ординале ). Пусть
теперь C множество элементов B таких, что минимален. Наконец, пусть а
элемент C с минимальным . Тогда а наименьший элемент A относительно
порядка 0 .
Мы собираемся теперь рассуждать индукцией по , или что то же самое,
индукцией по его индексу в качестве @ . Отметим сначала что
< card( ) . Действительно, отображение которое отображает в (; 0)
является инъекцией в .
Если = @0 и (; ) 2 ! ! , то те (1; 1) , которые меньше в (; ) относительно порядка 0 , мажорируются max(; ) , являющимся конечным числом.
Их, таким образом, также конечное число. Тогда порядок 0 является полным
бесконечным порядком, каждый собственный начальный сегмент которого конечен: его ординал , таким образом, ! . Мы получаем, таким образом, биекцию
между ! и ! ! , немного другую, но также примитивно рекурсивную, чем
та которую мы использовали в арифметике в лемме 7.16 : здесь мы нумеруем
элементы пакетами max(x; y) = m , вместо x + y = m .
В других случаях, если (1; 1) 0 (; 1) , то 1 и 1) мажорируются
max(; ) , являющимся ординалом строго меньшим . Обозначим его кардинал через , таким образом, строго меньше , и ординал (; ) , таким
3
4
алеф @ { первая буква древнееврейского алфавита
бет i { вторая буква древнееврейского алфавита
8.c
169
Кардиналы
образом, мажорируется , который по гипотезе индукции, равен . Таким
образом, ординал полного порядка 0 имеет кардинал по крайней мере , а все
его собственные начальные сегменты являются кардиналами строго меньшими
. Тогда он может быть только ординалом . Таким образом мы установили
биекцию между и .
Доказательство последней теоремы может казаться на первый взгляд немного сложным: в нем именно аксиома выбора, позволяющая вполне упорядочить A , является существенным аргументом.
Мы видим, как следствие этой теоремы, что "арифметика бесконечных кардиналов" особенно проста. Если и кардиналы, то называем + (внимание:
это не является суммой ординалов) кардинал A [ B , где кардинал A равен , а
кардинал B равен и A с B дизъюнктны. Если и конечны, то это будет их
обычная сумма в качестве натуральных чисел. Если один из них бесконечен,
то + = max(; ) . Действительно, если например = max(; ) , то
+ + 2 = :
Подобным образом, произведением двух кардиналов и называется кардинал декартова произведения A B , где кардинал A равен , а кардинал B
равен (внимание: это не является лексикографическим произведением ординалов). Если и конечны, то это будет их обычное произведение в качестве
натуральных чисел. Если же один из них бесконечен, а другой не нуль, то
= max(; ) . Действительно, если например = max(; ), то
1= :
Обозначим через кардинал множества AB всех отображений из B в A ,
где кардинал A равен , а кардинал B равен . Если B и С дизъюнктны,
то отображение B [ C в A определено своими ограничениями на B и на C ,
которые можно выбирать совершенно независимо, так что AB[C находится в
биекции с AB AC , и + = .
Задавать отображение из C в AB , которое сопоставляет c функцию fc , это
то же самое, что задавать отображение B C в A , которое паре (b; c) сопоставляет fc (b) и значит () = . Если и конечны, то показательная
функция арифметики.
Предположим теперь, что бесконечен, тогда 0 = 1 . Если = n конечно
и не нуль, то так как 2 = и m+1 = m , легко показывается индукцией
по n , что n = . Если бесконечен и меньше , то можно только указать
границы для . Отметим сначала, что если бесконечен, то = 2 . Действительно, 2 . Кроме того, задавать функцию из в , это задавать
её график, который является подмножеством , значит 2 = 2 .
Следовательно, если ; бесконечны и , то 2 . Действительно,
= 1 = 2 .
Если бесконечен и , тогда = 2 , так как 2 = 2 .
Остается случай когда конечен: 00 = 1 , и если 6= 0 , то 0 = 0; 1 = 1. Для
n 2 , справедливо тождество n = 2 , так как 2 n = 2 .
170
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
Обозначим теперь через <! множество конечных последовательностей со
значениями в , то есть функций, которые для некоторого n отображают [0; n]
в . Иначе говоря <! = [n . Если бесконечно , то <! = ! = ,
так как n = для любого n . Таким образом, если бесконечен, то множество конечных последовательностей со значениями в имеет кардинал
. Точно такой же кардинал имеет и множество конечных подмножеств ,
являющимися образами этих последовательностей.
Все это позволяет полностью оправдать оценки кардиналов, которые нам
служили для того, чтобы доказать теорему Левенгейма-Сколема: если язык
включает только конечное или счетное число реляционных, функциональных
или константных символов, то существует только счетное число слов в этом
языке, т.е. произвольных конечных последовательностей символов языка, так
как их число равно !<! = ! . Значит существует не более ! формул, и их
число с другой стороны по крайней мере равно ! , например, имеется счетное
число формул вида xi = xi . Таким образом jT j = ! . Аналогично, если число
символов языка равно , то jT j = <! = .
В теореме Левенгейма (2.5, 3.1), мы должны были оценивать число формул
с параметрами из множества A кардинала : это сводится подсчету формул
языка L(A) ,полученного добавлением имени для каждого элемента A . Таким образом jT (A)j = (jLj + jAj)<! = max(jT j; jAj) . Успокоив читателя в пригодности прошлых теорем, я добавлю, предвидя будущее, две комбинаторные
теоремы.
Теорема 8.10 Для каждого бесконечного кардинала , существует цепь кардинала , имеющая по крайней мере + сечений (или, эквивалентно, существует цепь кардинала + , имеющий плотную подцепь кардинала ).
Доказательство. Пусть наименьший кардинал такой, как > ;
так как = 2 , то . Полагаем, что A есть множество отображений из в , кардинал которого по крайней мере + , который мы снабжаем
следующим ниже отношением порядка, называемым "лексикографическим порядком". Если f и g два различных элемента A , то существует наименьший
ординал в такой, что f () 6= g() . Если для этого f () < g() (в упорядочении ординала ), то полагаем f < g . Если же, напротив g() < f () ,
то полагаем g < f .
Нетрудно видеть, что речь идет о линейном порядке, и что множество B
отображений в , принимающих постоянное значение 0 начиная с некоторого
места, образует в нем плотную подцепь. Для каждого из , обозначим через
B множество элементов A , принимающих постоянное значение 0 для каждого
. Их число совпадает с числом отображений из множества [0; ] в .
Так как ординал строго меньше , то его кардинал также строго меньше ,
и по определению jBj (и в действительности jBj = за исключением
случая = 0) . Так как B = [<B , то его кардинал равен = .
Для данного бесконечного кардинала , назовем Ded() наименьший кардинал такой, что никакая цепь кардинала не могла иметь различных сечений (символ Ded - от фамилии Дедекинд). Если Ded() является кардиналомпоследователем, то мы обозначим через ded() его предшественника: ded()
8.d
Конфинальность
171
является таким образом максимальным числом сечений, которые может иметь
цепь кардинала . Для некоторых , ded может не существовать.
Так как сечение в A определено подмножеством в A являющимся его меньшим классом, то Ded() (2 )+ , и если ded() существует, то ded() 2 .
Таким образом, с помощью теоремы 8.10, мы получаем оценки
(+)+ Ded() (2 )+; + ded() 2 :
Для = ! , ded() существует, и равен 2! , так как цепь рациональных чисел имеет 2! сечений. И естественно, если допускать обобщенную континуумгипотезу, то ded() существует всегда и равен 2 . Но поведение функции Ded ,
в отсутствии этой гипотезы, является предметом заботы специалистов теории
множеств.
Теорема 8.11 (Хаусдорф)
Если A является бесконечным множеством кар)
(2
динала , то имеются 2 различных ультрафильтров из подмножеств A .
Доказательство. Так как ультрафильтр
на A является множеством под)
(2
множеств A, то их не более чем 2 . Нам нужно показать, что их по крайней
мере столько же. Говорим, что семейство F подмножеств A булево независимо, если оно составляет базу свободной алгебры Буля. Это означает, что
если X1; : : : ; Xn; Y1; : : : ; Yn являются различными элементами F , то пересечение всех Xi и всех дополнений Yj в A никогда не пусто.
Если F является булево независимым семейством, то каждому подмножеству G в F соответствует база фильтра, образованная из элементов G и
дополнений элементов из F , которые не лежат в G . Эта база фильтра продолжается до ультрафильтра UG . Если G 6= G0 , тогда обязательно UG 6= UG0 ,
действительно, если например X 2 G; X 62 G0 , тогда X в UG в то время как
именно дополнение к X лежит в UG0 . Следовательно, нам достаточно доказать,
что существует булево независимое семейство из 2 подмножеств A .
Рассмотрим наше множество A кардинала и множество B , дизъюнктное
с A , образованное из элементов b(F ; P1; : : : ; Pn ), индексированных, с одной
стороны, конечным подмножеством F из A и с другой стороны, (конечным!)
множеством P1; : : :; Pn подмножеств F . Так как имеется только конечных
подмножеств A , и каждое из них имеет лишь конечное число подмножеств, то
B также имеет кардинал .
Каждое подмножество X в A мы отображаем инъективно на подмножество
X 0 в A [ B , определенное таким образом:
{ если a в A , то a 2 X 0 () a 2 X
{ если b в B; b = b(F ; P1; : : : ; Pn ), то b 2 X 0 () X \ F одно из Pi .
Я утверждаю, что семейство X свободно. Действительно рассмотрим различные подмножества X1; : : : ; Xn; Y1; : : : ; Yn из A . Если два множества отличаются, это значит, что некоторая точка принадлежит одному, но не другому. Таким образом, существует конечное подмножество F в A такое, что
следы P1; : : :; Pn ; Q1; : : : ; Qn этих множеств на F попарно различны и элемент
b(F ; P1; : : :; Pn ) принадлежит Xi0 , но не принадлежит Yi0 . Таким образом мы
построили семейство из 2 независимых подмножеств A [ B . Так как это последнее множество имеет кардинал , то нам остается только его перевести
биекцией на A , чтобы получить требуемое семейство.
172
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
8.d Конфинальность
Конфинальное подмножество B цепи A , это просто её не ограниченное
подмножество : для каждого а из A , существует элемент b из B , больший или
равный a . Цепь B называется конфинальной к цепи A , если она изоморфна
подцепи конфинальной с A . Это понятие ,очевидно, транзитивно: если A
конфинальна к B и B конфинальна к C , тогда A конфинальна к C .
Теорема 8.12 Каждая цепь имеет конфинальное вполне упорядоченное (ограничением порядка на цепи!) подмножество.
Доказательство. Пусть A цепь, тогда индукцией по мы определяем следующим образом возрастающую последовательность элементов A : если цепь
f: : :; a ; : : : g< не ограничена, то останавливаемся, a не определяется; иначе
a является точной мажорантой a , для < . Когда процесс закончится,
построим подцепь, вполне упорядоченную и не ограниченную в A .
Таким образом, конфинальностью A называется (другие говорят: финальный характер A) наименьший ординал, обозначаемый cof (A) , конфинальный
в A . По транзитивности, ординал < cof (A) не может быть конфинальным в cof (A) , и cof (A) равен своей собственной конфинальности: ординал,
обладающий этим свойством называется, регулярным.
Лемма 8.13 Каждый регулярный ординал является кардиналом.
Доказательство. Достаточно доказать, что каждый полный порядок A
обладает финальным подмножеством, чей ординал меньше или равен card(A) =
. Для этого индексируем A ординалами из , находящегося в биекции с A .
Элементы A , таким образом, имеют вид a : 2 . Мы располагаем двумя
полными порядками на A : порядок элементов A и порядок индексов. Повторим теперь доказательство предыдущей леммы, строя последовательность b
индукцией по :
{ если последовательность fb g< , не ограничена в A , то останавливаемся
и элемент b не определяется ,
{ иначе, в качестве b берем элемент a с минимальным индексом , который больше всех b ; < и больше или равен a .
Если остановимся до , то получим конфинальное подмножество ординала
< ; а иначе получим конфинальное подмножество ординала .
Отличают таким образом два рода кардиналов: регулярные кардиналы, и
другие, которые называются сингулярными кардиналами. Например, конечными регулярными кардиналами являются 0 (пустой конфинальности) и 1 ,
конфинальная цепь которого имеет наибольший элемент; ординал ! регулярен.
Теорема 8.14 Кардинал 6= 2 сингулярен если и только, если существует
семейство содержащее меньше чем множеств, кардинал каждого из которых меньше чем , и объединение семейства имеет кардинал .
8.d
173
Конфинальность
Доказательство. Если сингулярен, то он имеет конфинальное подмножество A имеющее меньший кардинал. Для каждого из , обозначим через
I = f : g (в действительности, I = + 1 !) . По определению I
является собственным начальным сегментом , кардинал которого меньше ,
за исключением случая когда конечен и является его наибольший элементом. Если равен 0 или 1 , то он регулярен, и критерий проверен. Если = n
конечен и больше 2 , то n = (n ? 1) + 1 . Если бесконечен, то = [2AI .
Предположим теперь, что A = [i2I Ai и = jAj; jAij < ; jI j < так,
что кардинал множества I минимальный с таким свойством: A не может
быть выражено как объединение менее, чем своих подмножеств имеющих
кардинал меньший чем . Отобразим полный порядок на I . Это позволяет
индексировать множества Ai через . Можно предполагать, что множества
A дизъюнктны. В противном случае, заменим каждое множество A на A ?
[<A . Мы снабжаем каждое множество A полным порядком, например,
порядком его кардинала.
Рассмотрим на A "суммарный" полный порядок порядков на [A . Считаем а < b , если a 2 A; b 2 A , где < или, если a; b 2 A и a < b в смысле
A . Если кардинал конечен, то значит множество A конечно и его кардинал больше или равен 2 (в действительности, = 2). Если бесконечен, то
он является предельным ординалом, и так как он минимален с обсуждаемым
свойством, то каждый собственный начальный сегмент суммарного полного
порядка множеств A имеет кардинал меньший . Таким образом порядок
на [A является обязательно полным порядком . Тогда последовательность
элементов минимальных в каждом A , ординал которой равен , конфинальна в .
Доказательство предыдущей теоремы показывает что действительно, для
каждого бесконечного кардинала , cof () = является наименьшим кардиналом таким, что можно выразить как сумма кардиналов, каждый из
которых меньше . Характеристика регулярных кардиналов является следующей : пусть A возрастающая последовательность множеств, индексированных
. Таким образом, если < , то A A . Тогда каждое подмножество
[<A , имеющее кардинал меньший , содержится в одном из A .
Мы, например, очень часто использовали регулярность ! в следующей форме : если для каждого n верно An An+1 , то каждое конечное подмножество
[An содержится в одной из An . В большей общности, если A возрастающая
последовательность, множеств индексированная ординалом , то каждое подмножество B в [< A, имеющее кардинал меньший cof ( ) содержится в одной
из A . Если бы это не имело место, то множество таких , что A содержит
элемент из B , не лежащий в множествах с меньшим индексом (это множество
индексов имеет кардинал не больше кардинала ) будет конфинально в .
Каждый бесконечный кардинал-последователь регулярен. Если = + , то
объединение семейства из множеств кардинала имеет кардинал = .
Если бесконечный регулярный кардинал, не являющийся последователем,
отличный @0 , то необходимо, чтобы = @ . Действительно, если ординал
ненулевой и предельный, то последовательность @ : < , конфинальна
174
Глава 8
ОРДИНАЛЫ И КАРДИНАЛЫ
в @ . Если мы допускаем обобщенную континуум гипотезу, то 2 = + , и
2 всегда регулярeн. Без этой гипотезы это вообще говоря не верно, но мы
собираемся показать, что конфинальность 2 строго выше .
Теорема 8.15 [Юлиус Кёниг 5]. Пусть Ai и Bi два семейства множеств,
каждое индексированное одним и тем же множеством I , такие, что для
каждого i кардинал Ai меньше кардинала Bi . Тогда кардинал объединения Ai
меньше кардинала произведения Bi .
Доказательство. Эта теорема эквивалентна аксиоме выбора: при Ai 6= ;
видим, что утверждается непустота произведения непустых множеств. И мы
доказываем теорему, конечно, используя аксиому выбора. Можно, очевидно,
предполагать, что множества Ai дизъюнктны. Так как существует инъекция
Ai в Bi , то
можно также предполагать, что Ai Bi . Покажем сначала, что
Q
j [ Aij jBij . Для этого, выберем в каждом Bi элемент bi , не лежащий
в Ai . Определим инъекцию [Ai в Bi следующим образом: элемент a из Ai
отобразим на I -кортеж с i-ой координатой a , а с j -ой координатой bj , для
j 6= i .
Q
Покажем теперь, что нет сюръекции
s множества [Ai на Bi . ПредполоQ
жим, что s отображение [Ai в Bi и пусть Ci подмножество Bi , образованное
из i-ых проекций элементов s(Ai) . Так как jCij jAij < jBij , то найдется элемент bi из Bi , не лежащий в Ci . Тогда кортеж (: : :; bi; : : : ) не лежит в образе
s.
Следствие 8.16 Для всех бесконечных кардиналов имеем < c of () .
Доказательство. Мы можем выразить как объединение множеств A :
< cof (); jAj < . Полагая B = видим, что кардинал суммы A , равный
, меньше кардинала произведения B , равного cof () .
2
Так как
=
= 2 , то конфинальность 2 обязательно выше .
Например, конфинальность 2! выше ! . Кардинал 2! не может равняться @! ,
но, за этим исключением, в теории множеств умеют доказывать, что 2! может
(2 )
находиться почти где угодно в иерархии алефов.
Упражнение 8.17 При предположении обобщенной континуум гипотезы докажите, что если бесконечный кардинал, и если и кардиналы меньшие
, тогда . Выведите из этого, что > если и только, если
cof () .
5
отец автора теоремы 7.26 о деревьях
8.e
Исторические и библиографические примечания
175
8.e Исторические и библиографические
примечания
Из-за утилитарного характера этой главы, бесполезно давать ссылки по
поводу результатов. Всё, что здесь упоминается, очень классическое. Это
было бы работой, не имеющей связи с тем, что я предпринял здесь, так как
представить эволюцию "Теории множеств" в течение конца прошлого века, это,
в действительности, описывать появление современной концепции математики.
Для всего этого, я хотел бы ограничиться ссылкой на [МУР, 1982] . Я делаю тем
не менее одно исключение в пользу [ЙЕХ, 1977] , чтение которого рекомендую
для тех, кто хочет подробнее разобраться с аксиомой выбора.
Глава 9
Насыщенные модели
SATURABILITE sf. T. de chimie. Qualite de ce qui est saturable
SATURABLE adj. Qui est suspectible de saturation
SATURANT, ANTE adj. Qui a la propriete de saturer
SATURATION (sa-tu-ra-sion) sf. T. de chimie
1 Le terme ou, les anites reciproques des deux principes d'un
corps binaire etant satisfaites, aucun des deux principes n'est plus
susceptible de s'unir avec une nouvelle quantite de l'autre : : :
2 Saturation du sol des cimetieres, condition qui provient de ce
que, des cadavres nouveaux y etant sans cesse inhumes, avant que
les cadavres plus anciens aient eu le temps de se consumer, le
sol devient impropre a operer les changements qui constituent la
putrefaction.
E.L.
9.a Теорема Свенониуса : : : : : : : : : : : : : : : : : : 178
9.b Компактные, насыщенные,
однородные, универсальные
модели : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 180
9.c Блестящие модели : : : : : : : : : : : : : : : : : : : : 185
9.d Свойства сохраняющиеся
при интерпретации : : : : : : : : : : : : : : : : : : : : 190
9.e Рекурсивно
насыщенные модели : : : : : : : : : : : : : : : : : : 191
9.f Исторические и библиографические примечания : : : : : : : : : : : : 197
176
9.a
Теорема Свенониуса
177
Теперь мы приступаем к теории моделей в буквальном смысле. Сначала
уточним некоторые обозначения, которые здесь будут приняты. Мы рассматриваем теорию T , которая будет полной, если не оговорено противное, в языке
L; через jT j или jLj обозначается мощность языка, то есть число его формул,
она равна !, если L содержит конечное или счетное число символов отношений, функций и констант и она равна {, если L содержит { > ! символов.
Если T полна и имеет конечную модель, то она будет ее единственной моделью с точностью до изоморфизма. Поскольку, этот случай не очень интересен,
мы в дальнейшем предполагаем, что все модели T бесконечны.
Символами M; N : : : обозначают модели теории T ; множество параметров
{ это подмножество A некоторой модели T ; L(A) обозначает язык, полученный
добавлением к L символов констант для обозначения каждого элемента A; и
T (A) обозначает теорию, образованную из предложений в L(A) , выполняющихся на элементах из A в модели M , где они все лежат. Необходимо понять,
что множество параметров задается не множеством A , а теорией T (A) . Если
A M; M N (N { элементарное расширение M ), то A отождествляется, как множество параметров, с A, рассматриваемым как подмножество N ,
поскольку T (A) сохраняется при элементарном расширении.
Если M { модель T , то модель T (M ) есть не что иное, как элементарное
расширение M (в котором каждый элемент M выделен константой). Если
A M , то говорят, что два элемента x1 и x2 имеют одинаковый тип над A,
если они удовлетворяют одним и тем же "формулам с параметрами из A",
т.е. формулам из L(A); значит, тип { это полная теория в языке L(A [ fxg),
содержащая T (A); любой тип в конце концов реализуется в некотором элементарном расширении M . Множество типов над A обозначается через S1(A); мы
его снабжаем топологией, определенной с помощью формул: оно становится
вполне несвязным компактом.
Напомним, что типы, реализующиеся в произвольной модели, содержащей
A (т.е. в модели T (A)) образуют плотное подмножество S1(A) : смотрите 5.а;
и что если A содержится в B , то ограничение S1(B ) на S1(A) { непрерывное
отображение. Аналогично можно вводить пространства Sn(A) типов n-ок, или
n-типов, взяв n переменных x1; : : :; xn вместо одной x; и даже пространство
S(A) -типов, где { ординал, введя -последовательность переменных, то
есть последовательность fx ; g< переменных, индексированных ординалом .
Некоторые называют "типом" теорию, не обязательно полную, в L(A[fxg),
называя "полным типом" элемент S1(A) или Sn (A); для нас тип всегда будет
полным, если мы не уточняем "неполный тип"; "неполный тип" { это замкнутое подмножество S1(A). Если A = ;, то мы пишем Sn (T ) вместо Sn (;). Тип
над ; будем называть типом без параметра, чистым или абсолютным типом,
следуя своему настроению. Часто говорят "модель", не уточняя ее теорию;
это потому, что модель, конечно, является моделью своей собственной теории!
Символы ; ; ; : : : обозначают ординалы, {; ; ; : : : { бесконечные кардиналы, т.е. начальные ординалы; card(A) или jAj есть мощность A.
178
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
9.a Теорема Свенониуса
Если два элемента a и b модели M соответствуют друг другу при некотором автоморфизме s модели M (sa = b), или при автоморфизме некоторого
элементарного расширения M , то очевидно, что a и b имеют одинаковый тип.
Следующая теорема утверждает обратное:
Теорема 9.1 Если два элемента a и b модели M имеют одинаковый тип, то
существует элементарное расширение N модели M и автоморфизм s модели
N такой, что s(a) = b .
Доказательство. Нужно доказать совместность множества предложений
в языке L(M ) [fsg, состоящего из T (M ), формулы s(a) = b, аксиомы, выражающей, что s { биекция, и аксиом, выражающих, что s сохраняет все отношения,
функции и константы структуры M . Из компактности, достаточно доказать,
что каждый его конечный фрагмент совместен, также мы можем свести доказательство к случаю, когда M { конечная или счетная модель в конечном
языке, который можно полагать, как это мы часто делали, чисто реляционным. Тогда введем для каждого p 1 новый символ Ep(x1; : : : ; xp; y1; : : : ; yp)
и список аксиом, содержащий T (M ) , и выражающий, что Ep(x; y) определяет
отношение эквивалентности на p-ках, аксиомы
(8x)(9y)E1(x; y); : : : ; (8x)(8y)(8u)(9v)(Ep(x; y) ! Ep+1(x; u; y; v)); : : :
и наконец, для каждой атомной формулы f (t; x) первоначального языка, аксиомы вида
(8x)(8y)(Ep(x; y) ! (f (a; x) $ f (b; y))) :
Это семейство аксиом совместно, так как его конечный фрагмент вовлекает
только p символов E1; : : : ; Ep и мы получаем для него модель с носителем M ,
интерпретируя Ei(x; y) через множество кортежей (x; y) длины 2i элементов M
таких, что a_x и b_ y (p ? i)-эквивалентны (т.е. удовлетворяют одним и тем
же формулам до кванторного ранга p ? i ) . Очевидно, это возможно потому,
что a и b одного типа, т.е. p-эквивалентны для любого p .
Итак, эта счетная теория имеет конечную или счетную модель N , которая,
если рассматривать как L структуру, элементарно расширяет M , поскольку
является моделью T (M ); и если c и d { кортежи длины p из N , удовлетворяющие Ep(x; y) , то a_с и b_d 1-эквивалентны в смысле языка L. Как следствие
a и b 1-эквивалентны в L-структуре N . По 1.14, поскольку N счетна, это
означает, что (N; a) и (N; b) изоморфны или еще, что существует автоморфизм
s модели N , такой, что s(a) = b .
Если A { подмножество модели M , то мы назовем A-автоморфизмом M
автоморфизм M , оставляющий неподвижным A поточечно. Заменив в теореме
9.1 T на T (A), мы видим, что два элемента из M имеют одинаковый тип над A
тогда и только тогда, когда существует элементарное расширение M , некоторый A-автоморфизм которого переводит один элемент на другой. Более того,
9.a
179
Теорема Свенониуса
это же доказательство проходит для n-типов и, по компактности, для типов
-последовательностей. Эта теорема, проясняющая понятие типа, позволяет
также доказать некоторые результаты об определимости, излагаемые ниже.
Пусть даны L-структура M и n-арное отношение r на M , r называется определимым (также говорят интерпретируемо), если существует формула f (x)
языка L такая, что r состоит в точности из кортежей из M , удовлетворяющих
f ; в языке L(r) структура (M; r) удовлетворяет (8x)(r(x) $ f (x)): Здесь, формула f не содержит параметров из M , если формула содержит параметры из
M , то уточняем: r определимо с параметрами. Тогда, если (M 0; r0) { элементарное расширение (M; r), отношение r0 определяется формулой f и в M 0 ; и
очевидно, что каждый автоморфизм структуры M 0 является автоморфизмом
и для r0. Обратное также верно:
Теорема 9.2 (Свенониус) Если отношение r на носителе структуры M не
определимо в M , то существует элементарное расширение (M 0 ; r0 ) структуры (M; r), такое, что некоторый автоморфизм s модели M 0 не сохраняет r0 .
Доказательство. Сначала докажем, что существует элементарное расширение (M1; r1) модели (M; r) вместе с двумя кортежами a и b одного типа в
смысле M1, один в r1, а другой в :r1. Если это не так, то в теории T (r) тип
n-ки, удовлетворяющей r, зависит только от его ограничения на язык L структуры M . Итак, пусть p 2 Sn(T; r) и предположим, что p ` r(x), { множество
формул языка L, удовлетворяющихся типом p. По предположению ` r(x) и
по компактности некоторый конечный фрагмент , который можно заменить
на конъюнкцию его формул, достаточен для вывода r : существует формула
fp(x) языка L, такая, что p ` fp(x) и T (r) ` (8x)(fp(x) ! r(x) . Мы покрыли
открыто-замкнутое множество hri открытыми множествами hfpi . По компактности, конечное число среди них, соответствующее формулам f1; : : : ; fm ,
достаточно для этого и hri = hf1 _ _ fmi . Значит, T (r) ` (8x)(r(x) $
f1(x) _ _ fm(x)) , это в точности означает, что r определимо в M .
Теперь покажем, совершенно аналогичным доказательству теоремы 9.01
способом, что существует элементарное расширение (M 0; r0) модели (M; r)
(и не только элементарное расширение M 0 модели M !), где M 0 имеет автоморфизм s , переводящей a на b, и s не является автоморфизмом для r0 .
Пусть T { теория, необязательно полная, в языке L(r), полученном добавлением к L нового символа отношения r. Говорят, что r определяется явно
в T , если существует формула f языка L такая, что T ` (8x)(f (x) $ r(x)) .
Отношение r определяется неявно, если для любой модели M множества TL
предложений из T в языке L (не забудьте, что T замкнута относительно вывода), существует не более одного отношения r на базе M , такого, что (M; r)
{ модель T . Ясно, что явная определимость влечет неявную: в случае явного
определения каждая модель TL превращается в модель для T , интерпретируя
r через f (x), и это { единственная возможность.
Теорема 9.3 (Теорема Бета) Теория T в языке L(r) определяет отношение
r явно с помощью формулы языка L тогда и только тогда, когда она его определяет неявно.
180
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
Доказательство. Сначала предположим, что существуют формулы
r1(x); : : :; rm(x) языка L такие, что
T ` (8x)(r(x) $ r1(x)) _ _ (8x)(r(x) $ rm(x)) :
Если m = 1 , то r явно определяется. Предположим, что m 2 и что r неявно
определимо; рассмотрим множества аксиом T1; : : :; Tm в языке L , полученные
заменой всюду в T отношения r на, соответственно, r1; : : :; rm .
По неявной определимости r мы имеем T1 [ T2 ` (8x)(r1(x) $ r2(x)) .
Значит, по компактности, существует формула f (r) из T такая, что f (r1) ^
f (r2) ` (8x)(r1(x) $ r2(x)) , где f (r1) и f (r2) обозначают то, что получается при
замене в f (r) отношения r на r1 и r2 соответственно. Повторяя этот аргумент
для других пар мы, в конечном счете, найдем формулу g(r) из T , такую, что:
{ в каждой модели T предложение g(r1) _ _ g(rm ) истинно;
{ если g(ri) истинно, то единственной возможной интерпретацией для r
является ri : (8x)(r $ ri) истинно;
{ и очевидно, если имеем g(ri) ^ g(rj ) , то мы имеем
также (8x)(ri $ rj ) и
V
V
в этом случае мы видим, что T ` (8x)(r(x) $ 1in(g(ri ) ! ri(x))) , что
является явным определением r .
В противном случае, по компактности существует модель (M; r) теории T , где r
не определимо в M с помощью формулы L ; по теореме Свенониуса существует
элементарное расширение (M 0; r0) модели (M; r) с автоморфизмом s модели M 0
сдвигающим r0 : (M 0; r0) и (M 0; sr0) { две модели T , что противоречит неявной
определимости r .
Если (M; r) { конечная структура, то она не имеет собственных элементарных расширений. Тогда теорема Свенониуса утверждает, что r сохраняется
при всех автоморфизмах M тогда и только тогда, когда оно определимо (без параметров!) в M . Вот это и есть частный случай фундаментальной теоремы из
"Абстрактной теории Галуа" Марка Краснера, установившего дуальность между множествами отношений замкнутых относительно "логических операций"
и их группами автоморфизмов; в случае множества с бесконечным носителем,
для этого нужно вводить инфинитарные языки.
Заметим также, что, если E { конечное множество из n элементов и если
G { произвольная подгруппа группы перестановок E , то G { группа автоморфизмов n-арного отношения Ga = fb : b = sa; s 2 Gg орбиты по G n-ки a,
биективно нумерующей E .
9.b Компактные, насыщенные, однородные,
универсальные модели
Теперь мы введем ряд определений; модель M теории T называется
{-компактной, если для любого множества формул f (a; x) языка L(M [ fxg)
9.b
Модели компактные, насыщенные и пр.
181
совместного с T (M ) и имеющего мощность меньше { , существует x в M такой,
что (M; x) будет моделью для него; другими словами, каждый неполный тип
(но, возможно, полный!) с параметрами в M , имеющий аксиоматизацию по
модулю T (M ) из меньше, чем { формул, реализуется в M .
По определению, любая модель !-компактна: если ff1(a1; x); : : :; fn (an; x)g
совместно с T (M ) , то это значит M ` (9x)(f1(a1; x) ^ ^ fn(an; x)) . Модель М
называется {-насыщенной, если для каждого подмножества A в M , мощности
меньше { , каждый тип из S1(A) реализуется в M .
Мы снова здесь встречаем понятие !-насыщенной модели из главы 5. Ясно, что {-насыщенная модель {-компактна, если неполный тип мощности
меньше чем { , то параметры, вовлеченные в его формулы, образуют множество A мощности меньше { , и пополняется до некоторого типа p из S1(A) ,
который реализуется в M элементом, тем более реализующим . Обратно,
если { jT j+ , то {-компактная модель {-насыщена, поскольку число формул
языка L(A [fxg) равно Max(jAj; jT j) . Понятие {-насыщенной модели намного
интереснее чем понятие {-компактной модели. Модель называется насыщенной, если она конечна или мощности { и является { -насыщенной. Заметим,
что модель мощности { не может быть {+ -компактной, поскольку множество
формул x 6= a , для всех a из M , совместно; значит, насыщенная модель имеет
свойство максимальной насыщенности, которую позволяет её мощность.
Модель M называется {-универсальной, если любая модель T мощности
не больше { изоморфна элементарному ограничению M . Иногда говорят, что
модель универсальна, если она универсальна в своей мощности.
Модель M {-(слабо) однородна, если для любых двух подмножеств A и B в
M мощностей меньше { и одного типа (A и B пронумерованы одним и тем же
ординалом меньшим чем { и если в T (A) заменить каждый a на b того же
индекса, то получаем T (B )), для любого a из M существует b из M такой, что
A [fag и B [fbg имеет одинаковый тип. Часто говорят о (слабой) однородности
вместо !-однородности; так как это нарушает параллельные соглашения для
насыщенных моделей, мы его отвергаем. Модель M {-сильно однородна, если
для любых двух подмножеств (или точнее -последовательностей) A и B в M
одного типа, мощности меньше { , существует автоморфизм s модели M , такой,
что sA = B . Если M {-сильно однородная, то она {-однородна, поскольку
A [ fag и sA [ fsag имеют одинаковый тип.
Мы видим также, что конечная структура имеет все, какие нам угодно,
свойства насыщенности, универсальности и, по теореме 9.1, однородности. Заметим, что если M {-компактна, то каждый неполный -тип имеющий меньше
чем { формул, где { ординал, меньший { , реализуется в M . На самом деле,
пусть F { множество формул вида f (a; x1 ; : : : ; xn ) , где 1; : : :; n < , совместное с T (M ) и мощности, меньшей { . Если оно конечно, то можно взять
конъюнкцию его формул, и если оно бесконечно, то мы можем замкнуть это
множество относительно конечных конъюнкций, что не повышает мощность.
Тогда, пусть F0 { множество, полученное 9-квантификацией во всех формулах из F всех свободных переменных x, кроме x0 : по {-компактности F0
реализуется элементом b0 из M . Пусть F1 { множество, полученное из F заменой x0 на b0 , и потом 9-квантификацией по всем переменным, кроме x1 :
182
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
это действительно совместное множество, содержащее меньше { формул языка L(M ) [ fx1g и реализующееся некоторым элементом b1 из M . Продолжая
эту процедуру, мы реализуем последовательно все x элементами b.
Сходные рассуждения доказывают, что если M {-насыщена, A M и
jAj < { , то каждый тип из S{ (A) (и не только каждый тип из S(A) для всех
< { ) реализуется в M . Сначала реализуем тип x0 над A , потом тип x1
над A [ fx0g; : : : , тип x над множеством A [ fx0; x1; : : :; x ; : : : g< мощности,
меньшей {, и т.д.
Точно так же, если M {-слабо однородна и если A и B { подмножества
M одного типа и мощности, меньшей {, и если C { подмножество M мощности {, то существует D M такое, что A [ C и B [ D имеют одинаковый
тип (заметим, что две -последовательности имеют одинаковый тип, если любые два конечных кортежа их соответствующих друг другу элементов имеют
одинаковый тип: реализуйте одну за другой переменные типа D).
Теперь докажем несколько теорем.
Теорема 9.4 Две !-слабо однородные модели 1-эквивалентны тогда и толь-
ко тогда, когда они реализуют одни и те же (чистые) типы из Sn(T ) для
каждого n .
Доказательство. Пусть M и N 1-эквивалентны, для каждого a из M
существует b из N такой, что (M; a) и (N; b) 1-эквивалентны. Значит, a и b
имеют одинаковый тип и M и N реализуют одни и те же чистые типы.
Обратно, пусть M и N !-слабо однородны и реализуют одни и те же чистые
типы. Пусть a и b имеют одинаковый тип, первый из M , второй из N (так
как M и N модели полной теории T , то мы можем даже брать a = b = ; ) .
Добавим c к a , тогда существуют b0 и d0 в N такие, что a_c и b0_ d0 имеют
одинаковый тип, по однородности N найдется также элемент d такой, что b_ d
имеет тот же тип, что и a_c .
Мы видим, в частности, что две счетные !-слабо однородные модели изоморфны, как только они реализуют одни и те же чистые типы.
Следствие 9.5 Счетная !-слабо однородная модель !-сильно однородна.
Доказательство. Если a и b имеют одинаковый тип в M , то структуры
(M; a) и (M; b) счетны, !-слабо однородны и реализуют одни и те же чистые
типы. На самом деле, чистый тип в (M; a) есть не что иное, как тип из Sn(a) .
Значит, они изоморфны.
Теорема 9.6 Если { jT j , то модель M теории T {-насыщена тогда и
только тогда, когда она { -слабо однородна и { -универсальна.
Доказательство. Всякая {-насыщенная модель M {-универсальна, поскольку она реализует все типы {-последовательностей. Проверим ее одно-
родность. Рассмотрим два подмножества A и B модели M одного типа с
9.b
183
Модели компактные, насыщенные и пр.
jAj = jB j < { и элемент a из M типа p над A. Пусть q { тип, полученный
из p при замене в каждой его формуле параметров из A на их двойники из B .
Так как A и B имеют одинаковый тип, то, если p ` f (x; a) , то M ` (9x)f (x; a)
и M ` (9x)f (x; b) . Значит, q также является совместным множеством формул.
Это { тип над B , который по насыщенности реализуется элементом b из M ,
откуда и получаем её однородность.
Пусть теперь M {-однородна и {-универсальна. Пусть A { подмножество
M , jAj < {, и p { тип над A , который реализуется в некотором элементарном расширении N элементом a. По теореме Левенгейма-Сколема мы можем
реализовать тип A_a над ; в модели N мощности, не превосходящей {. Обозначим его реализацию в N через A0_a0 (с естественным злоупотреблением,
продолжая нумерацию A0 на последующий a0 ; это обозначение более или менее эквивалентно A0 [ fa0g, различие является чисто психологическим, оно
использовалось до этого). По {-универсальности M модель N вкладывается
элементарно в M . В силу {-однородности M существует a1 в M такой, что
A0_a0 и A_a1 имеют одинаковый тип, следовательно, a1 реализует p.
Теорема 9.7 Две насыщенные модели одинаковой мощности полной теории
T изоморфны.
Доказательство. Пусть M = fag<{ и N = fbg<{ { наши две модели.
Построим индукцией по { две последовательности инъекций f подмно-
жеств M в N и g подмножеств N в M , таких, что область определения f
содержит fa ; g< и имеет мощность не больше 2jj , а область определения
g содержит fb g< и имеет мощность не больше 2jj , кроме того, если < ,
то f расширяет f и g расширяет g , и наконец, f{ и g{ { взаимно обратные
изоморфизмы M на N и N на M . Для этого поступаем так:
{ если { предельный, то f { предел всех f для < , т.е. общее
расширение всех f на объединение их областей определения, и g { предел
всех g , в частности, f0 = g0 = ? ;
{ если = +1 , то значит мы уже построили f и g , область определения
f состоит из области значений g , и элемента a , если его там еще нет. Если
a 2 Im(g ) , то f(a) = g?1(a) ; и мы берем в качестве f(a) элемент b из
N такой, что Im(g ) [ fag и Dom(g ) [ fbg имеют одинаковый тип. Далее
мы строим g с областью определения Im(f) [ fbg полагая, что если b 2
Im(f) , то g (b) = f?1(b) , и беря в качестве g (b) элемент a из M такой, что
Im(f) [ fbg и Dom(f) [ fag имеют одинаковый тип.
Все было сделано так, чтобы f{ g{ = IdN и g{ f{ = IdM . Поскольку эти отображения сохраняют типы, они тем более сохраняют формулы без
квантора.
Как следствие этой теоремы, мы видим, что насыщенная модель мощности
{ (т.е. {-насыщенная и мощности {) {-сильно однородна. Действительно,
если A; B 2 M , jAj = jB j < { и A и B имеют одинаковый тип, то (M; A) и
(M; B ) две насыщенные модели одинаковой мощности и одной и той же полной
теории, значит, они изоморфны.
184
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
Теорема 9.7 (а также 9.5), на самом деле, частный случай одного немного более тонкого результата, обобщающего 9.4, касающегося всех однородных
моделей. Все опирается на следующий результат, достаточно озадачивающий,
если вдуматься.
Теорема 9.8 Модель M {-слабо однородна тогда и только тогда, когда она
!-слабо однородна и обладает следующим свойством насыщенности: если A {
подмножество M , jAj < { и если p { тип над A, у которого каждое ограничение на конечную часть A реализуется в M , то M реализует p.
Доказательство. Сначала мы предположим, что M {-однородна, и покажем индукцией по мощности A, что она обладает искомым свойством. Это
очевидно, если A конечно. Представим A, индексируя его своим кардиналом,
как объединение возрастающей и непрерывной цепи A с jAj < jAj (A образовано элементами A , имеющими, индекс, меньший ). По индуктивному
предположению ограничение p типа p на A реализуется элементом a из M .
Построим индукцией по возрастающую цепь A0 подмножеств M так, чтобы
a0_A0 имел бы тот же тип над ;, что и a_A , значит, что и _ A для > .
На предельных шагах это получается само собой, на последовательных шагах
мы реализуем, благодаря {-однородности, тип над a0_A0 , соответствующий
типу A+1 над a+1_A . В конечном счете, мы получим A0 того же типа над
; , что и A , такое, что a0 над ним реализует тип p0 , соответствующий p . По
{-однородности p должен быть реализован элементом a из M .
Чтобы доказать обратное, рассмотрим A и A0 в M одного типа над ; , jAj =
0
jA j < { и элемент a из M типа p над A. Пусть p0 { тип над A0, соответствующий p. Если b { конечный кортеж из A, соответствующий b0 из A0, тогда по
!-однородности ограничение p0 на b0 реализуется в M . Из рассматриваемого
свойства M следует, что p0 также реализуется в M .
Следствие 9.9 Если M {-слабо однородна, то она реализует {-тип над ; ,
как только она реализует каждый его фрагмент содержащий лишь конечное
число переменных.
Доказательство. Пронумеруем переменные x; < { нашего {-типа.
Предположим, что нам удалось реализовать множеством A M тип первых
переменных x0; : : : ; x ; : : :; < . Чтобы можно было реализовать тип p от
переменной x над A , по 9.8 достаточно убедиться, что каждое его конечное
ограничение реализуется в M . Это следствие !-однородности M и того факта,
что тип (x0 ; : : : ; xn ; x) реализуется где-то в M !
Следствие 9.10 Модель M {-насыщенна тогда и только тогда, когда она {слабо однородна и реализует все n-типы.
Доказательство. Следует из 9.8 и 9.6 (для прямой части предположение
{ jT j не нужно) .
9.c
185
Блестящие модели
Следствие 9.11 Две {-слабо однородные модели мощности { полной теории
T изоморфны как только они реализуют одни и те же n-типы; на самом деле,
они { -сильно однородны.
Доказательство. Мы снова повторяем "челночные" рассуждения теоремы 9.7, замечая, что две модели реализуют одни и те же типы {-последователь-
ностей. Для сильной однородности, если A и B два подмножества M одного
типа, jAj = jB j < { , то заметим, что (M; A) и (M; B ) две {-однородные структуры, реализующие одни и те же n-типы, значит они изоморфны.
Вопрос о существовании насыщенных моделей изучается в следующем параграфе (теорема 9.15); он прояснится по настоящему только в главе 14, когда
мы узнаем, что такое стабильная теория. Однако, прямо сейчас, мы докажем
один простой результат.
Теорема 9.12 Теория T имеет счетную насыщенную модель тогда и только
тогда, когда Sn (T ) конечно или счетно для любого n .
Доказательство. Так как счетная модель может реализовать только
лишь счетное число типов, условие теоремы необходимо. Обратно, мы знаем
из главы 5, что T имеет !-насыщенную модель N . Заметим, что для любого
кортежа a параметров Sn(a) счетно, поскольку тип b над a то же самое, что и
тип a_b над ; .
Значит, существует счетное подмножество A0 модели N , где реализуются
все чистые типы. Для конечного a из A0 , множество Sn(a) счетно, и существует лишь счетное число конечных подмножеств A0 . Следовательно, мы
можем реализовать все типы над конечными подмножествами A0 в счетном
подмножестве A1 модели N ; продолжая такую процедуру, построим цепочку
A0 An An+1 : : : счетных подмножеств N , таких, что любой тип
над конечным подмножеством An реализуется в An+1 ; их объединение M {
элементарное ограничение N (оно удовлетворяет тесту Тарского) и является,
очевидно, счетной !-насыщенной моделью T . Заметим, что мы не сделали
никаких ограничений на мощность T : смотрите лемму 9.18.
9.c Блестящие модели
Рассмотрим модель M теории T и предложение f (r1 ; : : :; rk ) в языке, содержащем символы языка L теории T , элементы из M и новые символы r1; : : :; rk ,
которые можно считать предикатными (мы можем к этому свести, введя функции через их графы). Мы говорим, что это предложение совместно с T (M ),
если T (M ) [ ff (r1; : : :; rk )g совместно, т.е. существует элементарное расширение N модели M , на носителе которого мы можем интерпретировать r1; : : :; rk
отношениями так, чтобы удовлетворять f (r1; : : :; rn ) .
Назовем модель M блестящей (на английском resplendent), если для любого предложения f (r1; : : :; rk ) совместного с T (M ) , существуют интерпретации
186
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
r1; : : : ; rk на носителе M , удовлетворяющие f . Например, если язык L содержит лишь конечное число символов отношений, функций и констант, блестящая модель является !-сильно однородной, поскольку по теореме 9.1, если a
и b имеют одинаковый тип, то совместно предложение, утверждающее, что
существует автоморфизм s переводящий a на b , что выражается формулой
f (s).
Следующий результат поможет нам доказать существование блестящих моделей.
Теорема 9.13 (о дизъюнктной совместности) Пусть Ti { семейство теорий и Li { язык теории Ti для каждого i. Предположим, что общее пересечение L всех этих языков является пересечением любого двух из них и обозначим
через Ti;L множество следствий теории Ti в языке L. Тогда, если объединение
всех Ti;L совместно, то равным образом совместно объединение всех Ti .
Доказательство. Сначала предположим, что даны лишь две теории T1
и T2 в языках L1 и L2 с пересечением L. Прежде всего заметим, что если
T (совместная!) теория в языке L , содержащая T1;L , то T1 [ T совместно.
Действительно, если это не так, то по компактности мы нашли бы f в T1 и g в
T такие, что ff; gg несовместно, т.е. любая модель f есть модель и для :g , так
что f ` :g; так как g в языке L , то :g 2 T1;L и T1;L не может быть включен
в T . Таким образом, если мы возьмем произвольную полную теорию T языка
L , содержащую T1;L [ T2;L , то мы получим модель M теории T1 и модель N
теории T2 такие, что их обеднения на L, будучи моделями полной теории T ,
будут элементарно эквивалентны.
Если мы себе позволим применять теорему Шелаха (смотрите замечание
после леммы 4.12), утверждающую, что для некоторого ультрафильтра U ультрастепени M U и N U являются изоморфными L-структурами, то можно непосредственно слепить модель для T1 [ T2 . Но поскольку мы не планируем
доказательство этой теоремы, то выберем менее элегантный способ. По 4.12
L-структура ML обеднение до языка L модели M элементарно вкладывается
в L-структуру некоторой ультрастепени N1 = N U модели N . В свою очередь,
L-структура N1 вкладывается в L-структуру элементарного расширения M .
Повторяя эту процедуру ! раз, мы получим следующие три элементарные цепи в языках L, L1 и L2 соответственно:
ML N1;L M1;L Nn;L Mn;L Nn+1;L : : : ;
M M1 Mn : : : ; N N1 Nn : : :
Предел M! моделей Mn и предел N! моделей Nn имеют общее L-обеднение,
и отсюда получаем модель для T1 [ T2 . Если имеется лишь конечное число
теорий Ti , то доказываем постепенно, что их объединение совместно; общий
случай следует из компактности.
Этот результат позволяет прояснить один момент, который, может быть,
живо заинтересовал слишком проницательного читателя: если формула
f (r1; : : :; rn) содержит константы только из подмножества A модели M , то
для ее совместности с T (M ) достаточна ее совместность с T (A) .
9.c
187
Блестящие модели
Теорема 9.14 Если { jT j и если M { модель T мощности {, то она имеет
блестящее элементарное расширение той же мощности.
Доказательство. Выберем по одному экземпляру каждого предложения
f (r1; : : :; rn) с параметрами в M , совместного с T (M ); фразой "экземпляр"
я хочу сказать, что мы воздержимся от повторений формул, отличающихся
лишь именами новых отношений. Поскольку новые символы могут браться,
например, из фиксированного счетного набора, а мощность языка L теории
T не больше { и M имеет только { элементов, то число таких предложений
не превосходит {. Теперь, мы разделяем словари всех этих предложений таким образом, чтобы произвольные два из них не имели общих символов, кроме
символов из L(M ). Для этого нам нужен язык L1 , расширяющий L, но мощность которого остается {, и мы получим из этих предложений множество T1,
содержащее T (M ), которое совместно по лемме о дизъюнктной совместности.
По теореме Левенгейма, эта теория имеет модель M1 мощности { ; как
L-структура, это модель T (M ), т.е. элементарное расширение M и каждое
предложение, совместное с T (M ), в нем реализуется. Теперь мы можем применить ту же процедуру к структуре M1 и получить L2-структуру M2 , которая,
как L1-структура, является элементарным расширением M1 и позволяет интерпретировать каждый экземпляр предложения, совместного с T (M1). Далее
эта процедура итерируется. Таким образом, получается последовательность
структур Mn мощности { (в языках Ln возрастающих на каждом шаге, но
остающихся в мощности {). Как L-структуры, они образуют элементарную
цепь: в действительности, эта цепь Ln -элементарна начиная с n ; и ее предел
M! будет L-структурой, являющейся блестящим расширением M мощности { ;
она будет даже блестящей L! -структурой.
В большей общности, мы говорим, что модель {-блестяща, если для каждой теории в языке, содержащем столько символов, сколько в языке L
теории T , но меньше, чем { символов констант из M и меньше, чем { новых
символов (отношений, функций и констант), совместной с T (M ) (т.е. T (M ) [ совместно), существует интерпретация новых символов на носителе M , превращающая ее в модель для . Например, {-блестящая модель {-насыщена
потому, что тип над A есть теория в L(A; x); по теореме 9.1 она {-сильно однородна.
Теорема 9.15 Если jT j { , то каждая модель T мощности 2{ элементарно вкладывается в { + -блестящую модель мощности 2{ .
Доказательство по существу совпадает с доказательством предыдущей
теоремы; если теории, у которых новые символы дизъюнктны, совместны с
T (M ), то с ней совместно и их объединение. Так как в 2{ существует (2{ ){ =
2{{ = 2{ подмножеств мощности { , то как только зафиксируем подмножество A в M мощности { и добавим { новых символов отношений арности n
для каждого n (что дает всего { ! = { новых символов!), этот новый язык
будет иметь { формул и даст не более 2{ теорий, совместных с T (M ). Таким
образом, мы должны рассмотреть всего 2{ 2{ = 2{ теорий, у которых мы
188
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
разъединяем языки, что дает нам в итоге язык L1 мощности 2{ ; по теореме
Левенгейма-Сколема мы получаем модель M1 рассматриваемой теории T1.
На втором этапе, мы не применяем сразу ту же конструкцию к M1 потому, что L1 стал очень большим и обяжет нас рассматривать более 2{ новых
теорий: поэтому мы довольствуемся проверкой тех, что включают только символы языка L (а не L1), не более { констант из M1 и не более { новых символов;
мы получаем теорию T2 в языке L2 , пересечение которого с L1 равно L ; в этих
условиях, из-за дизъюнктных языков, совместность T2 с теорией L-структуры
M1 влечет совместность T2 с теорией L1-структуры M1 . И таким образом, мы
получаем L1 [ L2-структуру M2 , которая как L2-структура есть модель T2 , а
как L1-структура { элементарное расширение M1 (не надо терять то, что мы
сделали на первом этапе!), имеющую мощность 2{ .
Теперь, повторяем эту конструкцию {+ раз, при этом модель, построенная
на каждом этапе, является элементарным расширением относительно всех языков, введенных до этого, но позволяет интерпретировать новые теории только
относительно языка L ; и в итоге, мы получаем {+ -блестящую модель мощности {+ 2{ = 2{ .
Упражнение 9.16 Докажите, что если jT j { , то каждая модель T мощности { имеет ! -сильно однородное элементарное расширение той же мощ-
ности.
Если < { , то {-насыщенная модель -насыщена; значит, теорема 9.15
нам утверждает, что каждая модель имеет -насыщенное расширение (и мы
можем даже ограничить его мощность; мы оставляем это читателю в качестве
упражнения).
Итак, мы имеем {+ -насыщенные модели мощности 2{ ; так как может существовать 2{ типов над множеством параметров мощности { , то мы не можем
добиться лучшего. Если мы допускаем обобщенную гипотезу континуума, то
{+ = 2{ и мы получаем (единственную с точностью до изоморфизма) насыщенную модель мощности 2{ . Но без гипотез теории множеств невозможно доказать существование насыщенной модели произвольной теории T . Напротив,
она существует, если теория T обладает некоторыми свойствами стабильности,
что мы увидим в главе 14. Свойства блестящести модели часто затруднительны для проверки; единственный общезначимый факт { это то, что насыщенная
модель блестяща, более точно:
Теорема 9.17 Насыщенная модель M теории T мощности { (т.е. {-насыщенная и мощности { ) {-блестяща.
В первое время предположим, что { > jT j. Пусть { теория, совместная с
T (M ) , в языке L0 , содержащем только множество параметров A из M , jAj < {,
и добавляющем к языку L теории T меньше, чем { новых символов. Мы пронумеруем M своим кардиналом, M = fa0; : : : ; a; : : : g<{ , и построим индукцией
по < { элементарную цепь моделей N теории с jNj max(jL0j; jj) < {,
9.c
189
Блестящие модели
L-структуры которых элементарно вложены в M . Начинаем с модели N0 теории мощности jL0j, полученной по теореме Левенгейма-Сколема, L-структура
которой, по {-универсальности, вложена в M .
На предельных шагах мы берем в качестве N объединение уже построенных N ; < ;
jNj X max(jL0j; jj) jj max(jL0j; jj) = max(jL0j; jj);
<
так что предположение о мощности N выполняется.
На последовательных шагах, заметим, что тип a над N в смысле L реализуется в расширении N+1 модели N мощности max(jL0j; jj) , L-структуру
которого мы можем вложить в M по {-универсальности. Я хочу сказать, что
мы можем реализовать в M тип N+1 над N [ fag в смысле L. Если мы
обозначим через N{ предел всех N , являющийся моделью , то мы заметим, что он содержит все a и, значит, его L-структура { весь M : мы смогли
действительно обогатить M до модели .
Для случая когда { = jT j , мы поступаем почти так же, но с маленькой
предосторожностью; так как существенно то, что N имеют мощности, меньшие
{ , мы вводим язык L0 (на самом деле, язык L) только поэтапно, т.е. мы в
качестве N берем не модель , а множество параметров в смысле этой теории,
удовлетворяющего тесту Тарского для первых формул. Это проходит даже
в счетном случае, где благодаря перенумерованию, аналогичного тому, что мы
применяли по поводу метода Генкина, нам удается построение, шаг за шагом,
модели N! как предела конечных последовательностей.
Наконец, если { < jT j , то следующая лемма показывает, что существует подмножество L1 мощности { в L , достаточное для интерпретации всех
формул теории T : приходим к случаю { = jT j .
Лемма 9.18 Если T имеет насыщенную модель мощности { , то существует фрагмент L1 языка L теории T мощности { , такой, что каждая
формула L эквивалентна формуле L1 по модулю T .
Доказательство. Так как {-насыщенная модель реализует все n-типы,
то jSn(T )j { . Для любой пары p; q различных типов в Sn(T ) мы выберем
формулу fpq , содержащуюся в p, но не содержащуюся в q. Существует не
более { таких формул fpq . Докажем, что любая формула f выражается, по
модулю T , в виде булевой комбинации конечного числа fpq ; пусть p лежит в
hf i : дополнение hf i покрывается множествами hfqp i , где q пробегает h:f i и
по компактности, конечного числа среди них достаточно для этого покрытия;
беря пересечение их дополнений, мы получаем hfp i , содержащее p и содержащееся в hf i; снова по компактности hf i { объединение конечного числа hfpi.
Отсюда получаем, что каждая формула от n переменных является булевой
комбинацией формул вида fpq , откуда следует результат.
На языке топологии, это означает, что бесконечный вполне несвязный компакт содержит открыто-замкнутых множеств не больше чем число точек и, по
190
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
теореме Стоуна о представлении, что булева алгебра мощности { имеет, по
крайней мере, { ультрафильтров.
9.d Свойства сохраняющиеся при интерпретациях
Структура N называется интерпретируемой, или определимой, в структуре M , если выполняются следующие условия:
{ носитель N образуется из определимого подмножества A в M n для некоторого n (т.е. элементами A являются кортежи, удовлетворяющие некоторой формуле L), факторизованного по определимому отношению E -эквивалентности в M (эта эквивалентность становится равенством в N );
{ каждое m-арное отношение r на N определяется в M следующим образом:
существует формула f (x1; : : : ; xm) языка L такая, что M ` f (a1; : : : ; am)
тогда и только тогда, когда кортежи a1; : : : ; am лежат в A и если их классы
c1; : : : ; cm образуют кортеж из N , удовлетворяющий r ;
{ каждая функция, каждая константа из N имеет график, определимый
как в предыдущем пункте.
Например, определимая подгруппа группы или фактор-группа G по определимой нормальной подгруппе являются в ней интерпретируемыми. Мы уже
рассмотрели такие примеры интерпретации в арифметике: тогда это было проще потому, что за исключением конечных структур, мы могли всегда предполагать, что носителем N является множество ! всех натуральных чисел и
отношением E является отношение настоящего равенства. Действительно, мы
располагали биекцией между ! и !n ; если A бесконечно и определимо, то его
"функция нумерации" была определимой биекцией между A и !. И наконец, в
арифметике каждое определимое отношение эквивалентности обладает определимой функцией выбора: возьмите в каждом классе элемент с наименьшим
кодовым номером.
Если T { теория M и если N интерпретируемо в M , то говорят (некорректно), что ее теория T 0 интерпретируема в T . Если формулы, участвующие
в определении структуры N , имеют параметры в M , то мы уточняем (если
только не оговорено противное): N "интерпретируема с параметрами в M ".
Назовем "хорошей моделью" теории T 0 такую модель, которая получается из
некоторой модели T так же, как N получается из M ; не каждая модель T 0
является хорошей, но каждая имеет хорошее элементарное расширение потому, что ультрастепень хорошей модели хороша. Хорошие модели T 0 образуют
то, что называется "псевдоэлементарным классом", т.е. класс обеднений на
язык L моделей некоторой теории в языке L0, расширяющем L .
9.e
191
Рекурсивно насыщенные модели
Лемма 9.19 Пусть N интерпретируемо (даже с параметрами) в M , пусть
0 { теория, совместная с T 0(N ) , и пусть { теория, полученная из 0
в результате замены всех символов языка N их интерпретациями в M и
релятивизации всех кванторов на N (мы можем представлять E -класс одним
из его элементов; меняем (9x) на (9x 2 A) и (8x) на (8x 2 A) ; еще нужно
заменить равенство на E ); тогда совместно с T (M ) .
Доказательство. Можно считать, что язык теории T (M ) и язык теории
T 0(N )
не пересекаются. Тогда, пусть T1 { теория в общем языке, содержащая
T (M ), T 0(N ) и также интерпретацию N в M . По лемме о дизъюнктной совместности T1 [ 0 имеет модель; эта модель является также моделью для ! Мы
можем также, повторяя доказательство леммы о дизъюнктной совместности,
сочетать в виде сандвича модели T 0(N ) [ 0 с хорошими моделями T 0(N ).
Как следствие, если { превосходит мощность множества параметров, участвующих в интерпретации N и если M {-блестяща, {-насыщена или {-универсальна, то такой же будет N , поскольку каждой теории, совместной с T 0(N ),
соответствует некоторая теория, совместная с T (M ), и и каждому типу в T 0
соответствует неполный тип в T .
Напротив, нет никакой надежды на то, что однородность сохраняется при
интерпретации, поскольку два элемента одного типа в N могут иметь разные
типы в M , которая более богата. Например, если мы введем унарный предикат A(x) и рассмотрим теорию T , утверждающую, что A и его дополнение
бесконечны, то любая модель T !-сильно однородна. Если мы возьмем в качестве T 0 теорию отношения эквивалентности A(x) $ A(y) , модель T 0 !-сильно
однородна, только если его два класса равномощны.
Заметим, что если N { {-блестящая модель T 0 , где { > max(jT j; jT 0j), то
она хороша. На самом деле это очевидно, если N конечна, поскольку тогда
она единственная модель T 0 ; если она бесконечна, то совместно утверждение
о том, что на носителе N определяется модель M1 теории T , соответствующая
модель N1 которой изоморфна N . Наконец, заметим, что если языки содержат
лишь конечное число символов отношений и функций и если T конечно аксиоматизируема, то тот же самый аргумент доказывает, что блестящая N всегда
хороша.
9.e Рекурсивно насыщенные модели
Понятие рекурсивно насыщенной модели является грубой смесью рекурсивности и теории моделей. Если мы здесь его обсуждаем, то это потому, что
в случае счетной модели это понятие совпадает с понятием блестящей модели
и, следовательно, имеет те же недостатки, так что не воспринимайте это как
удачу; к тому же, доказательство этого факта является хорошей тренировкой
по построению моделей.
Мы рассмотрим конечный язык L , т.е. содержащий лишь конечное число
символов отношений, функций и констант; это требование конечности языка
192
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
является существенным для следующих теорем.
Итак, пусть M { L-структура и кортеж a = (a1; : : :; an) принадлежит M .
Мы можем сопоставить каждому первичному символу языка L(a1; : : : ; an; x) некоторое натуральное число и закодировать числами предложения этого языка,
как это мы делали в главе 7 для предложений языка арифметики. Говорим,
что модель M рекурсивно насыщена, если для любого кортежа a из M и для
любого рекурсивного множества формул f (a; x) , совместного с T (M ) , существует элемент x из M , удовлетворяющий всем эти формулам. Под "рекурсивным множеством формул" мы, конечно, подразумеваем "множество формул, множество кодов которых рекурсивно"; мы видим, что изменение кодов
a1; : : :; an , например, их перестановка, приводит к рекурсивной операции на
кодах формул и что это не меняет рекурсивный или нерекурсивный характер
рассматриваемых множеств формул. Также заметим, что по теореме 7.28 о
плеоназме, брать рекурсивное множество или рекурсивно перечислимое множество формул ничего не меняет в этом деле.
Понятие рекурсивно насыщенной модели является более коварным, чем
оно кажется: тот факт, что некоторые рекурсивные множества формул с параметрами в M совместны или нет, позволяет часто в модели M закодировать
информацию, выходящую далеко за рамки рекурсивности. Не забудем, что
рекурсивные типы, которые мы реализуем, являются неполными типами с параметрами в a : в гипотезе определения говорится, что множество формул
f (a; x) рекурсивно и совместно с T (a) , но не говорится, что оно полно.
Лемма 9.20 Рекурсивно насыщенная модель !-слабо однородна.
Доказательство. Пусть a и b одного типа в M , которая предполагается
рекурсивно насыщенной. Пусть c лежит в M ; поскольку a и b имеют одинаковый тип, то они удовлетворяют одним и тем же формулам вида (9z)f (y; z) ;
следовательно, множество формул f (a; c) ! f (b; x) , являющееся рекурсивным, совместно; значит, оно удовлетворяется элементом d из M и a_c и b_ d
имеют одинаковый тип.
Теорема 9.21 Для данного конечного языка L , бесконечные рекурсивно на-
сыщенные L-структуры образуют псевдоэлементарный класс; более точно,
существует предложение f (R) языка L [ fRg такое, что M рекурсивно насыщена тогда и только тогда, когда в ней можно интерпретировать R так,
чтобы удовлетворить f (R) .
Доказательство. Так как конечное число отношений r1; : : :; rm соответ-
ственно арностей n1; : : : ; nm могут быть заменены (в этом контексте) на одно
отношение их произведения R = r1 rm арности n1 + + nm , мы себе
позволим добавление к L конечного числа следующих символов :
{ три символа унарных отношений E (x); A(x); U (x) ,
{ две унарные функции y = i(x); y = (x) ,
{ четыре бинарные функции z = x + y; z = xy; z = c(x; y); z = t(x; y) ,
9.e
Рекурсивно насыщенные модели
193
{ один символ бинарного отношения Sat(x; y) .
Предложение f (R) получается как конъюнкция следующих предложений,
которые я опишу неформально :
1) Мы утверждаем, что E ("элементы"), A ("арифметика") и U ("кортежи") дизъюнктны и, что i { биекция M на E . Эта манипуляция не является
необходимой; она имеет целью прояснение конструкции.
2) Мы утверждаем, что сложение и умножение, ограниченные на A , образуют модель минимальной арифметики, расширенную конечным числом аксиом, гарантирующих выразимость отношения 2 и (примитивно рекурсивных)
функций, участвующих в кодировке формул (достаточно выразить, что некоторые функции всюду определены).
3) Функция действует из U в A : кортежу она сопоставляет его "длину"; функция c отображает A U в E : если n из A и меньше длины u ,
то c(n; u) будет называться "n-ой координатой u"; мы утверждаем, что два
кортежа одинаковой длины и с одинаковыми координатами равны, что 0-ка
(пустая) существует, что для любого кортежа u и любого элемента e из E кортеж u_ e существует. Эта последняя аксиома гарантирует, что все настоящие
n-ки элементов из E , где n стандартно, представлены в U .
4) Так как язык L конечен, мы можем закодировать его формулы в нашей
арифметике. Значит, мы располагаем понятием формулы f (x) без параметров
и всем, что существует вокруг него. Предикат Sat , называемый выполнимостью, соединяет формулу f с кортежом u , длина которого соответствует числу
свободных переменных f . Добавим следующие аксиомы, где f и g представляют формулы только исходного языка (существенно, что они не содержат
ни Sat ни t ) :
- для каждого первичного символа r языка L (их существует только конечное число)
(8e1) : : : (8en)(Sat(r(x); (e1; : : : ; en)) $ r(i?1(e1); : : : ; i?1(en))) ;
(8f 2 L)(8u)(Sat(f; u) $ :Sat(:f; u)) ;
(8f 2 L)(8g 2 L)(8u)(8v)(Sat(f ^ g; u_ v) $ (Sat(f; u) ^ Sat(g; v))) ;
(8f 2 L)(8g 2 L)(8u)(8v)(Sat(f _ g; u_ v) $ (Sat(f; u) _ Sat(g; v))) ;
(8f 2 L)(8u)(Sat((9x)f;u) $ (9e)Sat(f; u_e)) ;
(8f 2 L)(8u)(Sat((8x)f;u) $ (8e)Sat(f; u_e)) :
Мы видим, что этот конечный список аксиом вынуждает для каждой стандартной формулы f (x) и для каждого настоящего кортежа a из E , что
Sat(f (x); a) истинна тогда и только тогда, когда f (a) истинна для структуры
образа M при i на E .
194
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
5) Теорема о плеоназме 7.28 узаконивает замену 1-списка аксиом на 1список, являющийся даже множеством, определенным арифметической формулой с ограниченными кванторами от двух или трех функций, хорошесть
которой гарантируется нашей аксиоматикой. Кодируя арифметические формулы, мы можем пронумеровать эти множества, скажем F0; : : :; Fn; : : : ; этот
список простирается за пределы стандартных натуральных чисел. Последняя аксиома определяет поведение "функции-свидетеля" t ; она утверждает,
что для любых n , любых m и для любого кортежа a , если существует b, такой,
что кортеж a_b удовлетворяет первым m формулам f (x; y) подходящей арности из Fn , тогда t(n; a) есть этот b. Важно, что m не участвует в выражении
свидетеля.
Теперь наш список аксиом завершен. Легко видеть, что рекурсивно насыщенная модель M превращается в модель f (R) . Мы начнем с выбора биекции
i между M и его подмножеством E таким, что jM j = jM n E j . На счетном подмножестве A дополнения E мы помещаем стандартную модель арифметики и
каждой оставшейся точке биективным образом сопоставим n-ку элементов из
E ; функции длины и координаты интерпретируются стандартным образом.
Далее мы интерпретируем предикат Sat как настоящую выполнимость.
Для свидетеля мы различаем два случая:
{ либо множество Fn вместе с a в качестве параметра определяет совместный тип; так как он рекурсивен, то он реализуется в E некоторым элементом, который мы берем как свидетеля t(n; a) ;
{ иначе, существует наибольшее m такое, что конъюнкция первых m формул из Fn вместе с a в качестве параметра может реализоваться некоторым элементом E : мы берем этот элемент свидетелем.
Предположим обратное, что M превращается в модель f (R) ; мы уже заметили, что в том, что касается формул стандартной сложности и кортежей
стандартной длины, наша аксиоматика вынуждает предикат Sat интерпретировать настоящую выполнимость. Кроме того, если m и n стандартны, то
наша модель может утверждать только m 2 Fn или только m 62 Fn и только,
если это действительно имеет место потому, что Fn определяется формулой с
квантором, ограниченным функциями, хорошесть которой гарантируется f (R),
и наша арифметика не может лгать на этом уровне.
Пусть теперь a { настоящий кортеж из E , n { стандартное число, и рассмотрим множество формул f (a; y) , где f (x; y) пробегает Fn . Предположим,
что в настоящем мире совместно. Мы различаем два случая:
{ модель утверждает, что для любого m существует y , удовлетворяющий
первым m формулам ; в этом случае t(n; a) есть реализация ;
{ модель утверждает, что несовместно, то есть что существует наибольшее m , для которого существует y , удовлетворяющий первым m формулам ; так как в реальности совместно, то обязательно m { нестандартное число, и t(n; a) является снова реализацией .
9.e
195
Рекурсивно насыщенные модели
Как следствие, M реализует действительно все совместные типы, соответствующие Fn . По теореме о плеоназме, она рекурсивно насыщена.
Упражнение 9.22 Рассмотрим теорию T , необязательно полную, в конеч-
ном языке L и без конечных моделей. Докажите, что T рекурсивно аксиоматизируема тогда и только тогда, когда существует предложение f (R)
такое, что моделями T будут в точности обеднения на L моделей f (R).
Следствие 9.23 Блестящая модель рекурсивно насыщена; кроме того, если
f (R) совместно с T (M ), то мы можем интерпретировать R над M так,
чтобы f (R) выполнилось и (M; R) была рекурсивно насыщенной.
Доказательство. Если M блестяща, то предложение f (R) из теоремы
9.21, совместное с T (M ) просто потому, что M имеет !-насыщенное расширение, интерпретируется в M . Второе утверждение следует из того, что если
f (R) совместно с T (M ), то с ней совместно также f (R) ^ g(R; R0 ), где g(R; R0)
{ предложение, гарантирующее рекурсивную насыщенность (L [ fRg)-структуры.
В противоположность с 9.21, блестящие модели не всегда образуют псевдоэлементарный класс; возьмем в качестве T теорию одного отношения эквивалентности, имеющего ровно один n-элементный класс для каждого натурального n. Тип утверждающий, что класс элемента a бесконечен является рекурсивным, значит он реализуется в каждой рекурсивно насыщенной модели.
Тогда утверждение о том, что существует биекция между классом элемента
a и моделью M совместно. Равным образом совместно утверждение, что существует множество A находящееся в биекции с M , образованное из попарно
неэквивалентных элементов. Мы видим также легко, что рекурсивно насыщенная модель должна иметь бесконечное число бесконечных классов.
Как следствие, в блестящей модели M мощности { все бесконечные классы имеют мощность { и их число должно быть равным { : модель M может
быть только насыщенной моделью мощности { . Читатель без труда докажет,
что модель рекурсивно насыщена тогда и только тогда, когда она содержит
бесконечное число бесконечных классов. Итак, возьмем модель M мощности
{ > 2! и U неглавный ультрафильтр над ! . В M U существуют классы мощности 2! , происходящие из ультрастепеней конечных классов; значит, она не
насыщена. Однако, очевидно, что ультрапроизведение не выводит за пределы
псевдоэлементарного класса.
Иногда говорят, что M неизменно блестяща, если каждый раз, когда f (R)
совместно с T (M ) , можно интерпретировать R так, чтобы f (R) выполнилось
и (M; R) была блестящей; на самом деле в 9.14 была построена неизменно
блестящая модель. Одним из следствий последней теоремы этого параграфа, принадлежащей Жан-Пьеру Рессэру, является то, что счетная рекурсивно
насыщенная модель неизменно блестяща; но в общем, мы не знаем ничего о
неизменной блестящести.
Мы видим, что в 9.23 конечность языка L совершенно необходима, потому,
что она позволяет выразить в конечном числе условий адекватность предиката
196
Глава 9
НАСЫЩЕННЫЕ МОДЕЛИ
выполнимости. Если предположим, например, что язык содержит счетное число констант a0; : : :; an; : : : и, рассмотрим полную теорию T , утверждающую,
что все an различны, то увидим, что каждая модель T блестяща; на самом деле, предложение с дополнительными символами содержит только лишь первые
n элементов в ai и ограничение произвольной модели T на язык, состоящий из
этих n первых констант ai , насыщено; простая модель T опускает рекурсивный
тип, утверждающий, что x отличен от всех an .
Эта теорема допускает обращение в счетном случае.
Теорема 9.24 Если L язык, содержащий лишь конечное число символов отношений, функций и констант, то каждая счетная рекурсивно насыщенная
L-структура блестяща.
Доказательство. Итак, пусть M { наша счетная рекурсивно насыщенная
модель, которую мы пронумеруем M = fa0; : : : ; an; : : : g ; пусть f (a; r1; : : : ; rm) {
предложение, содержащее кортеж a элементов из M и новые символы r1; : : :; rm
и совместное с T (M ) , т.е. по лемме о дизъюнктной совместности (9.10) совместное с T (a) .
Проведем конструкцию Генкина для этого предложения, целиком оставаясь внутри модели M . Для этого мы добавим к языку L(a; r1; : : :; rm) новые
символы bij констант и рассмотрим такое назначение свидетелей, что каждая
формула, содержащая только параметры со вторым индексом, меньшим k ,
имеет своего свидетеля со вторым индексом k. Рассмотрим теорию, состоящую из f (a; r1; : : : ; rm) , из предложений, отождествляющих n элементов из a
с n первыми из bi;0 и из предложений вида
(9x)(g(b; x) ! g(b; bg(b;x))) ;
где bg(b;x) { свидетель для g(b; x).
Заметим, что это множество формул рекурсивно и совместно с T (a) . Для
проверки возьмите нумерацию Генкина счетной модели T (a)[ff (a; r1; : : : ; rm)g .
Как обычно, мы заменим нумерацию элементов bij с помощью рекурсивной
биекции ! ! на ! и они станут b0; : : : ; bn; : : : .
Следствия этого рекурсивного семейства предложений образуют 1-множество. Равным образом, 1-множеством будут все его следствия, выразимые
в языке L(a; b0). Так как это неполный, рекурсивно перечислимый тип и совместный с T (a) , то он реализуется элементом b00 . Значит мы можем выбрать
тип b0 над a в языке L0 = L(r1; : : :; rm) таким образом, что его ограничение
на язык L будет типом b00 над a . Поэтому можно предполагать, что b0 есть
b00 , это сведется к наложению L0-структуры на некоторое элементарное расширение M . Поскольку b0 интерпретируется как b00 , множество предложений,
которые мы должны удовлетворить, f (a; r1; : : : ; rm) и предложения Генкина,
будет все еще рекурсивным и совместным с T (a_ b00) .
Тогда можно повторять операцию, на n-ом этапе мы уже выбрали b00; : : :; b0n?1
в M так, чтобы множество, образованное из f (a; r1; : : : ; rm) и предложений
Генкина, было совместно с T (a; b00; : : :; b0n?1) . Множество следствий в языке
L(a; b00; : : :; b0n?1; bn) этих предложений является рекурсивно перечислимым и
9.f
197
Исторические и библиографические примечания
совместным с T (a; b00; : : : ; b0n?1) , что позволяет нам интерпретировать bn некоторым элементом b0n из M .
Кроме этого, если bn имеет вид bi0 , то мы можем его интерпретировать произвольным элементом a из M . Действительно, тип a над a[fb00; : : : ; b0n?1g совместен с T (a; b00; : : :; b0n?1) [ff (a; r1; : : :; rm)g, поскольку, если 9-квантифицировать
a в конечном фрагменте этого типа, мы получим следствие из T (a; b00; : : : ; b0n?1).
Так как предложения Генкина совсем не влияют на bi0 , то можно брать нумерацию Генкина модели f (a; r1; : : :; rm) [ T (a; b00; : : :; b0n?1 ; a) такую, что bi0 = a.
Как следствие, по ходу процедуры систематически проинтерпретируем элементы bi0 как ai . В нумерации Генкина мы, таким образом, окончательно проинтерпретировали все bij элементами из M и не оставили в стороне ни один
элемент M . Это означает, что мы наложили на M L0-структуру, являющуюся
моделью предложения f (a; r1; : : : ; rm).
9.f Исторические и библиографические
примечания
Теорема Бета появилась в [БЕТ, 1953], а теорема Свенониуса { в
[СВЕНОНИУС, 1959a]. Результаты такого жанра сильно притягивали к себе логиков 50-х годов. Абстрактная теория Галуа увидела свет в [КРАСНЕР, 1938],
где, кроме всего, Краснер детально описал гигантский алгоритм элиминации
кванторов для алгебраически замкнутых полей в одном бесконечном языке.
История понятия насыщенных моделей достаточно запутана, ее предыстория имеется в [ХАУСДОРФ, 1914], где определены насыщенные плотные порядки; понятия {-однородности и {-универсальности, по видимому, принадлежит [ЙОНССОН, 1956] и [ЙОНССОН, 1960], а также, для счетного случая,
[ФРАИССЕ, 1954] ; в любом случае, единственность, без гарантии существования, и однородность насыщенной модели были фактами, полностью установленными во времена [МОРЛИ-ВОТ, 1962]; однородные модели и их описание
через n-типы, реализующиеся в них были изучены в [КЕЙСЛЕР-МОРЛИ, 1967].
Термин "блестящая модель" был введен в [БАРВАЙС-ШЛИПФ, 1976], но
понятие было известно раньше, в частности, [ЧЭН-КЕЙСЛЕР, 1973] предлагает читателю блестящесть насыщенной модели как упражнение! Иногда говорят "реляционно-универсальность" вместо !-блестящести. Лемма 9.13 о
дизъюнктной совместности взята из [РОБИНСОН, 1956]. Теорема 9.23 { фольклорная; первое доказательство 9.24 было дано в [РЕССЭР, 1972]; что касается
упражнения 9.22, то оно взято прямо из [КРЕЙГ-ВОТ, 1958]. О вредной стороне
рекурсивной насыщенности почитайте в [ПУАЗА, 1984].
Глава 10
Простые модели
{ Rzkd sdsd, bd sxod !
{ Bah ! On s'y habitue : : :
M.R.
10.a Теорема об опускании типов : : : : : : : : 199
10.b Простые модели, атомные
модели: счетный случай : : : : : : : : : : : : : 201
10.c Теории с конечным
числом счетных моделей : : : : : : : : : : : : : 204
10.d Конструируемые модели : : : : : : : : : : : : : 205
10.e Минимальные модели : : : : : : : : : : : : : : : : 209
10.f Не единственность
простой модели : : : : : : : : : : : : : : : : : : : : : : : : 211
10.g Исторические и библиографические примечания : : : : : : : : : : : : 217
198
10.a
Теорема об опускании типов
199
10.a Теорема об опускании типов
B предыдущей главе мы строили самые богатые модели по возможности
реализации типов: в сущности, мы амальгамировали структуры, контролируя
кардинал теоремой Левенгейма-Сколема. Но мы понимаем, что для построения других моделей, надо найти те, которые опускают некоторые типы, и
понять, при каких условиях можно реализовать какой-то тип, при этом опуская другой. Для этого мы располагаем в основном двумя методами. В одном
случае, где необходимы гипотезы о стабильности, мы справляемся с положением полностью; изучение стабильных теорий начнется следующей главе и будет
длиться до конца книги. Другой случай, который мы изучаем здесь, и который
основывается на одном топологическом свойстве, имеет очень общее значение,
но применяется только тогда, когда все счетно.
Напоминаем, что подмножество A топологического пространства E называется плотным, если любое непустое открытые подмножество E содержит
точку A. Легко видеть, что пересечение двух, и значит также конечного числа, открытых плотных множеств открыто и плотно. Говорят, что E имеет
свойство Бэра если для каждого счетного семейства O1 ; : : :; On ; : : : открытых
плотных множеств, их пересечение снова плотно, в частности, если E { непустое, то оно также непустое. Подмножество X такого пространства называется жирным, или котощим, если оно содержит счетное пересечение открытых
плотных множеств ; оно называется тощим если его дополнение жирно, то
есть если оно содержится в счетном объединении замкнутых множеств с пустыми внутренностями. Значит, счетное пересечение жирных множеств жирно,
счетное объединение тощих множество тоще.
Когда мы хотим показать существование x со свойством P (x), можно построить объект x, удовлетворяющий P , или показать, что множество x, удовлетворяющих P , не пусто: одна из возможностей { показать, что это множество
является жирным в топологическом пространстве, имеющем свойство Бэра.
Теорема 10.1 Компактные и локально компактные пространства (каждая
точка имеет базу компактных окрестностей) имеют свойство Бэра.
Доказательство. Покажем сначала, что любой компакт E локально компактен; пусть a { точка E , и пусть O { открытая окрестность a; так как пространство отделимо, то для каждой точки b вне O существует открытая окрестность Ub точки a и открытая окрестность Vb точки b, такие, что Ub \ Vb = ;;
дополнение O замкнуто, значит компактно и покрывается открытыми множествами, следовательно, конечное число среди них V1; :::; Vn достаточно для этого
покрытия; дополнение V1 [ ::: [ Vn , замкнутое и содержащееся в O, является
окрестностью a, так как оно содержит открытое множество U1 \ \ Un .
Пусть таким образом E локально компактно; O1 ; : : : , On ; : : : { счетная
последовательность открытых плотных подмножеств в E , и U { непустое открытое подмножество в E : нам надо найти точку, лежащую в U и в каждом
On . Пусть a1 { точка из U \ O1 , которая является её окрестностью; a1 имеет
компактную окрестность K1 , содержащуюся в U \ O1. Таким образом, K1 содержит открытое U1 , содержащее a1 . Пусть а2 { точка U1 \ O2 , обладающая
200
Глава 10
ПРОСТЫЕ МОДЕЛИ
компактной окрестностью K2 U1 \ O2 , и K2 содержит открытую окрестность
U2 точки а2 и т.д. , на (n + 1)-ом этапе выбирается an+1 из Un \ On+1 , имеющая компактную окрестность Kn+1 точки an+1 , которая содержит открытую
окрестность Un+1 . Пересечение убывающего семейства Kn непустых компактов непусто, и содержится в U и в каждой O.
Рассмотрим теперь теорию T , не обязательно полную, но в счетном языке.
Обозначим через H (T ) и назовем пространством перечислений Генкина моделей T следующее подпространство S! (T ), или скорее S!! (T ) : как в разделе
4.c, рассмотрим символы переменной aij (обозначенные a, а не x, чтобы передать оттенок), и перечисление формул f (a; x) таких, что если а E0 [ [ En ,
где Ek = fa0k; : : :; ank ; : : : g , то формула f (a; x) имеет свидетеля af (a;x) в En+1 :
это назначение свидетелей зафиксируем раз и навсегда. Пространство Генкина
{ замкнутое подмножество S!! (T ), определенное формулами (9x)f (a; x) !
f (a; af (a;x)) : если формула f (a; x) истинна для некоторого x , она истинна для
своего свидетеля. Как видно, точка этого компактного пространства, замкнутого в S!! (T ) , соответствует перечислению Генкина конечной или счетной
модели T ; нам не нужно больше вводить f H для элиминации кванторов, так
как мы знаем теперь теорему компактности!
Индукцией по j определим пакет P (aij ), присоединенный к aij , следующим
образом:
{ если j = 0 , то P (ai0) = fai0g ,
{ если j 6= 0 , тогда aij { свидетель единственной формулы f (a; x) , где
вторые индексы всех элементов a меньше j ; пакет aij является по определению объединением пакетов элементов a ещё плюс aij . Отсюда ясно,
что всегда P (aij ) { конечное множество.
Лемма 10.2 Пусть F { замкнутое множество с пустой внутренностью в
Sn(T ), определенное формулой fu (x); тогда, каков бы ни был кортеж a из aij ,
формулы fu (a) определяют замкнутое множество с пустой внутренностью
в H (T ) .
Доказательство. Пусть hg(b)i { непустое открыто-замкнутое подмножество H (T ) : мы должны доказать, что hg(b) \ ([h:fu (a)i) содержит точку
из H (T ). Рассмотрим объединение пакетов элементов, представленных в a
и b , и пусть c { кортеж из aij , который необходимо добавить к a и b, чтобы получить это объединение. Пусть F (a; b; c) { конъюнкция формул g(b) и
(9x)f (; x) ! f (; af (;x)) для каждого свидетеля af (;x) , присутствующего в
a_b_ c; это формула, которая использует в качестве параметров только a_b_ c.
Так как hg(b)i\H (T ) не пустое, мы берем оттуда один элемент : он представляет перечисление Генкина конечной или счетной модели M для T , которая
удовлетворяет каждой из формул (9x)f (; x) ! f (; af (;x)). Следовательно,
M ` F (a; b; c) , M ` (9y)(9z)F (a; y; z) , и формула (9y)(9z)F (x; y; z) определяет
непустое открыто-замкнутое подмножество Sn (T ).
Далее, это открытое множество не может целиком содержаться в \hfu (x)i,
и существует счетная модель N для T с кортежом a0, удовлетворяющим формуле (9y)(9z)F (a0; y; z) и не удовлетворяющим всем fu ; пусть b0 и c0 в N , такие,
10.b
201
Простые модели, атомные модели
что N ` F (a0; b0; c0) : теперь можно брать перечисление Генкина N так, чтобы
элементы из a0_ b0_ c0 имели те же индексы i; j , что им соответствует в a_b_c ;
это возможно, так как формула F утверждает в точности то, что можно брать
aij как свидетеля необходимой формулы. Это перечисление Генкина является
точкой H (T ), удовлетворяющей g(b), и не удовлетворяющей всем fu (a).
Теорема 10.3 (об опускании типов) Пусть T { теория, не обязательно
полная, счетного языка; пусть An { тощее подмножество Sn (T ) для каждого натурального n; тогда существует модель T , опускающая каждый тип
каждого An .
Доказательство. Каждое множество An содержится в счетном объеди-
нении замкнутых множеств Fnm(x) с пустой внутренностью в Sn (T ). По предыдущей лемме каждый раз, когда заменяем в Fnm кортеж x кортежом переменных, взятых из перечисления Генкина, получаем замкнутые множества
с пустой внутренностью в H (T ). Все эти Fnm(a) образуют счетное семейство
замкнутых множеств с пустой внутренностью и их объединение тощее; так как
H (T ) { непустой компакт, дополнение этого объединения плотно, значит, непусто. И точка этого дополнения является перечислением Генкина модели T ,
опускающей любой тип каждого An .
Примером замкнутого множества с пустой внутренностью является множество, состоящее из одной неизолированной точки: если T счетна, таким
образом, существует модель T , что опускает этот тип. Напротив, если T полна
и p { изолированная точка, то она является единственной, удовлетворяющей
некоторой формуле f (x), и так как T ` (9x)f (x), любая модель реализует p.
Напомним, что если T полна, то n-типы, реализованные в модели N для T
образуют, плотное подмножество Sn (T ).
В теореме опускания типов, все счетно, как язык, так и модель, которая
строится: это вызвано счетной природой свойства Бэра. Отметим, что если
T { теория алгебраически замкнутых полей нулевой характеристики, то тип
"x трансцендентен над Q ", являющийся единственным неизолированным типом S1(;) (остальные изолированы своим минимальным уравнением над Q),
опускается только в единственной модели T , являющейся алгебраическим замыканием Q ; все несчетные модели его реализуют.
10.b Простые модели, атомные
модели: счетный случай
Мы рассматриваем здесь полную теорию T . Подмножество A модели M
теории T называется атомным (по умолчанию : над ;), если тип любой n-ки
из A изолирован в Sn (T ); если A B M , говорят, что B атомно над A ,
если B атомно в смысле T (A) , то есть если тип любого кортежа b из B над A
изолирован. Отметим, что A атомно над A.
202
Глава 10
ПРОСТЫЕ МОДЕЛИ
Лемма 10.4 Тип a_b изолирован, если и только если тип a изолирован и тип
b над a изолирован.
Доказательство. Пусть f (x; y) { формула, изолирующая тип a_b ; тогда
тип а изолирован формулой (9y)f (x; y), и тип b над a изолируется формулой
f (a; y). Обратно, пусть g(x) { формула, изолирующая тип a , и h(a; y) { формула с параметрами из a, изолирующая тип b над a, тогда тип a_b изолирован
формулой g(x) ^ h(x; y).
Замечание. Главным аргументом в доказательстве леммы является то, что
отображение, которое типу a_b сопоставляет тип a, является открытой, непрерывной сюръекцией Sn+m (T ) на Sn(T ).
Лемма 10.5 Если A атомно, то A атомно над a для каждого конечного подмножества a из A.
Доказательство. Тип a_b изолирован, значит тип b над a изолирован.
Лемма 10.6 Если A B C , B атомно над A и C атомно над B , тогда
C атомно над A .
Доказательство. Пусть c C и f (b; x) { формула с параметрами в B ,
изолирующая тип c над B ; пусть g(a; y) { формула с параметрами в A, изолирующая тип b над A; тип c над A изолируется формулой (9y)g(a; y) ^ f (y; x).
Если A B C , C атомно над A и B n A бесконечно, то C не обязательно
атомно над B ; например, модель M теории бесконечного множества (язык
состоит из равенства) атомна только над своими конечными подмножествами.
Теорема 10.7 Атомная модель !-слабо однородна; две атомные модели одной
и той же полной теории 1-эквивалентны.
Доказательство. Пусть a и b имеют одинаковый тип в атомной модели;
добавляем к a , и пусть f (x; y) { формула, изолирующая тип a_. Кортеж a
удовлетворяет формуле (9y)f (x; y) , значит, таков же и b, имеющий тот же тип,
что и a, и можно в модели найти , такой, чтобы a_ и b_ имели один и тот
же тип. Так как T полна, каждая модель T реализует все её изолированные
типы (так как, если hf (x)i не пустое, T ` (9x)f (x)) , и две атомные модели T
реализуют одни и те же чистые типы; они, значит, 1-эквивалентны по 9.4
Говорят, что модель проста если она вкладывается элементарно в любую
модель T ; если A M и M { простая модель T (A), то говорят, что она проста
над A.
Теорема 10.8 Полная счетная теория T имеет простую модель, если и только если она имеет атомную модель; и в этом случае она имеет с точностью
до изоморфизма только одну простую модель M , которая является её единственной атомной счетной моделью ; эта модель ! -сильно однородна и проста над каждым своим конечным подмножеством.
10.c
203
Теории с конечным числом счетных моделей
Доказательство. Если M реализует не изолированный тип p , то по теореме об опускании типов, существует модель N для T , опускающая p , и M не
может вкладываться элементарно в N и поэтому M не проста. Если M проста,
то значит она атомна, и счетна поскольку T имеет счетные модели; если у T
есть атомная модель, то по теореме Левенгейма она имеет такую же счетную
модель. Покажем, что эта модель M и проста.
Рассмотрим перечисление M типа !: M = fao; : : :; an; : : : g и пусть N {
какая-нибудь модель T ; так как тип a0 изолирован, его можно реализовать в
N ; после этого, так как тип a1 над a0 изолирован (лемма 10.4), можно также его
реализовать в N , и т.д. реализуя последовательно типы an+1 над fa0; : : : ; ang,
получают элементарное вложение M в N . Две атомные счетные модели, будучи 1-эквивалентными, изоморфны; по 9.5 они также !-сильно однородны.
Если M атомна и счетна, она остаётся атомной и счетной, а значит простой,
над каждым из своих конечных подмножеств.
Возможно, что простая модель M для T имеет собственные элементарные ограничения; очевидно, такое ограничение N модели M { также простая
модель T ; в счетном случае, где имеется единственность простой модели, N
изоморфна M . Если A { бесконечное подмножество простой модели M , M не
обязательно проста над A; сначала потому, что, возможно, что не существует
простой модели над A; ещё потому, что если она существует, скажем N , то
N вкладывается элементарно в M , таким образом, N { также простая модель
T , но, даже если имеется единственность простой модели, M и N могут быть
изоморфными, но не быть A-изоморфными.
Теорема 10.9 Счетная полная теория T имеет простую модель если и толь-
ко если для любого n изолированные типы в Sn (T ) образуют плотное множество.
Доказательство. Если M атомна, то типы, реализованные в M и явля-
ющиеся изолированными, образуют плотное множество. Обратно, если изолированные типы образуют плотное множество, дополнение к ним замкнуто
с пустой внутренностью, которое может опускаться по теореме об опускании
типов.
Теорема 10.10 Если T полная счетная теория такая, что для любого n Sn (T )
конечно или счетно, тогда для каждого конечного множества параметров a ,
T имеет простую модель над a .
Доказательство. Так как тип b над a определен типом a_b , каждое Sn (a)
также счетно. Таким образом, достаточно понять, что в счетном компакте изолированные точки образуют плотное множество; однако множество неизолированных точек является объединением счетного числа замкнутых множеств
с пустой внутренностью; по теореме 10.1 его дополнение плотно.
204
Глава 10
ПРОСТЫЕ МОДЕЛИ
10.c Теории с конечным
числом счетных моделей
Полная счетная теория T называется !-категоричной (или @0-категоричной) если она имеет с точностью до изоморфизма только одну счетную модель;
тогда по теореме Левенгейма ясно, что эта счетная модель { простая.
Теорема 10.11 (Рылль-Нардзевского) Полная счетная теория T !-категорична, если и только если для любого n множество Sn(T ) конечно.
Доказательство. Если Sn (T ) бесконечно для некоторого n, то по компактности оно не может состоять только из изолированных точек; значит, оно
содержит неизолированный тип p, и T имеет счетную модель, которая его реализует, и другую, которая его опускает: она не !-категорична. Обратно, если
Sn(T ) конечно для любого n, то оно дискретно, и любая модель T атомна.
a_b
Так как тип
определен типом a и типом b над a, то условие "Sn (T )
конечно для любого n" эквивалентно условию "S1(a) конечно для каждого
кортежа параметров a". Это условие можно также переформулировать так :
для любого n число формул f (x) от n свободных переменных x1; : : : ; xn, рассмотренные с точностью до эквивалентности по модулю T , конечно; действительно, множеств вида hf (x)i конечное число () Sn(T ) конечно.
Отметим, что две произвольные модели T являются 1-эквивалентными,
если и только если она !-категорична; и в этом случае её каждая модель !насыщенна. Примеры !-категоричных теорий: теория конечной структуры,
теория бесконечного множества, отношения эквивалентности из бесконечного
числа бесконечных классов, плотного порядка без концевых элементов, безатомные булевы алгебры. Как следствие 10.11, имеем следующий, немного
неожиданный результат.
Теорема 10.12 Если структура N интерпретируема в !-категоричной структуре (т.е. её теория !-категорична), то N также ! -категорична.
Доказательство. Тип кортежа в смысле N определен типом кортежа
который его представляет в M (см. раздел 9.d); для каждого n число n-типов
в M конечно, точно так же, как и в N .
В этой последней теореме, интерпретируемость означает интерпретируемость без параметра. Если мы хотим доказать такую же теорему, разрешая
параметры, надо чтобы общее число параметров, участвующих в интерпретации N в M , было конечным, что, например, имеет место всегда, если язык N
конечен (если M !-категорична, то (M; a) также !). Невозможно, чтобы полная
счетная теория имела точно две счетные модели с точностью до изоморфизма,
как утверждает следующая теорема:
Теорема 10.13 Полная счетная не !-категоричная теория имеет по крайней
мере три счетные попарно неизоморфные модели.
10.d
205
Конструируемые модели
Доказательство. Если, для некоторого n множество Sn(T ) несчетно, то по-
скольку любой тип реализуется в некоторой счетной модели и каждая счетная
модель может реализовать только счетное число типов, T имеет несчетное число счетных моделей. Однако, если для любого n множество Sn(T ) счетно, то
T имеет простую модель M1 по теореме 10.10 , и счетно-насыщенную модель
M2 по теореме 9.12 ; если T не !-категорична, то для некоторого n множество
Sn(T ) бесконечно и содержит неизолированную точку p, которая опускается в
M1 и реализуется в M2 , следовательно M1 и M2 не изоморфны.
Пусть a { реализация p ; так как Sn (T ) бесконечно и любой тип над ; имеет
расширение над a, то Sn(a) также бесконечно и содержит не изолированную
точку; снова по теореме 10.10, существует простая модель над a, которая не
проста, так как он реализует p, и не насыщенна, так как она атомна над a :
это наша третья модель M3 .
Пример полной теории с тремя счетными моделями: язык содержит бинарный предикат и счетный список констант fa0; : : : ; an; : : : g ; аксиомы выражают, что { плотная цепь без концевых точек, и что a0 < a1 < < an <
an+1 < : : : . Легко видеть, что эта теория T полна и элиминирует кванторы;
единственный не изолированный тип p из S1(T ) содержит все формулы x > an .
В модели M1 последовательность an конфинальна; в M2 она мажорирована,
но не имеет наименьшую мажоранту; и в M3 она имеет наименьшую мажоранту a : это простая модель над a. С помощью этого примера, можно достаточно
легко построить полную теорию, имеющую ровно n счетных моделей с точностью до изоморфизма, для каждого конечного n > 3.
Отметим, что если язык L счетен, то имеется только 2! L-структур с носителем !. Действительно, так как каждое n-арное отношение является подмножеством счетного !n, их имеется 2! ; каждому символу языка надо назначить
отношение, что дает отображение ! в 2! , и (2! )! = 2!! = 2! . С точностью
до изоморфизма, полная счетная теория может иметь только самое большее
2! счетных моделей, и мы знаем, что этот максимум достигается (теория дискретных порядков без концевых элементов); кроме того есть такие (теория
алгебраически замкнутых полей данной характеристики, теория следования
на целых числах), что имеют точно ! счетных моделей.
Предположение Вота утверждает, что полная счетная теория, имеющая
бесконечное число счетных моделей с точностью до изоморфизма, имеет их !
или 2! . Если принимать континуум-гипотезу, то 2! = !+ , и предположение
становится неинтересным! Значительным аргументом в его пользу является
теорема Морли, которая утверждает что такая теория имеет либо @0, либо @1,
либо 2@0 моделей; хотя остается исключить только @1 , в случае когда оно не
равно 2@0 , предположение Вота является все ещё открытой проблемой.
10.d Конструируемые модели
Говорят, что множество параметров A конструируемо, если существует его
ординальное перечисление A = f: : :a; : : : g, такое, что для любого тип a над
206
Глава 10
ПРОСТЫЕ МОДЕЛИ
A =def fa g< изолирован; такое перечисление, не обязательно инъективное,
называется конструкцией A. Говорят, что B конструируемо над A, если оно
таково в смысле T (A), т.е. если существует ординальное перечисление fbg
множества B , такое, что для любого тип b изолирован над A [ fb g< .
В этом последнем случае, если A B , то так как элементы A выделены
в языке, они виртуально присутствуют в каждом множестве параметров: их
добавление не меняет типы; они атомны над каждым множеством параметров.
По этой причине при конструкции B над A очень часто довольствуются перечислением точек B n A. Если надо, точки из A можно вставлять неважно куда,
и получить конструкцию в предыдущем смысле.
Аналогично, если элемент a принадлежит A, то его можно перепрыгнуть,
сохраняя конструкцию: если оставим только первые случаи появления элементов A в конструкции, то получим инъективную конструкцию. Отметим, что
если A конструируемо, то оно атомно; чтобы это понять, докажем индукцией
по , что A атомно ; если пределен, то A = [A , и кортеж из A является
кортежом из некоторого A ; для A+1 = A [ fag : так как A атомно и A+1
атомно над A , утверждение следует из леммы 10.6 .
Лемма 10.14 Если множество A конструируемо, то оно конструируемо также над любым кортежом a из A; в действительности, каждая конструкция
A над ; является конструкцией над a.
Доказательство. Так как A конструируемо над A , оно атомно над A ,
и тип a_ a над A изолирован; это значит, что тип a над A [ fag также
изолирован (лемма 10.4).
Пусть A { конструируемое множество; мы выберем некоторую конструкцию, и кроме того, для любого мы выберем формулу f(b; x), изолирующую
тип a над A . Элемент b таким образом из A , он составлен из элементов
a с индексами, меньшими чем . Тогда мы определяем индукцией по пакет
элемента a как объединение пакетов элементов из b и плюс a ; понятно,
что этот пакет P для a { конечное множество, и что f (b ; x) { формула с
параметрами из P для любого a из P . Говорят, что подмножество C в A
замкнуто, если вместе с каждым элементом в C содержится его пакет; иначе
говоря, C является объединением пакетов.
Лемма 10.15 Замкнутое подмножество C конструируемого множества A
конструируемо.
Доказательство. Покажем, что если a 2 C , то его тип над C = A \ C
изолирован. Его тип над A изолирован формулой f(b; x) : два элемента,
которые удовлетворяют этой формуле, имеют один и тот же тип над A , и
тем более над каждым подмножеством A , содержащим b . Так как C
содержит b , образованный из элементов C , индексы которых строго меньше
, эта формула изолирует также тип a над C . Индексы элементов a 2 C
образуют вполне упорядоченное множество; достаточно перенумеровать C его
ординалом, чтобы получить конструкцию.
10.d
207
Конструируемые модели
Лемма 10.16 Если C { замкнутое подмножество конструируемого множества A, то тип C (над ;) определяется формулами f(b; a), для a 2 C .
Доказательство. Заметим, что каждое C = A \ C замкнуто, и покажем
индукцией, что формулы f (b ; a ), a 2 C, определяют его полный тип; если
= 0 , то C0 = ; и его { тип полный, поскольку T полна; если { предельный
и ненулевой, пусть g(c) { формула с параметрами из C ; тогда все элементы
c лежат в некотором C , < , и по гипотезе индукции либо g(c), либо :g(c)
выводится из f (b ; a ), a 2 C . Если { последователь и = + 1, то тип
C определяется f (b ; a ) , a 2 C , а тип a ( { наибольший элемент в !)
над C определяется формулой f (b ; a ) .
Лемма 10.17 Если C { замкнутое подмножество конструируемого множе-
ства A (относительно данной конструкции A и выбора фиксированных изолирующих формул), то A конструируемо над C , и каждое перечисление A =
f: : :b; :::g, где B = fa g< замкнуто (относительно конструкции, выбранной вначале) для каждого предельного , является конструкцией A над C .
Доказательство. Покажем сначала, что A атомно над C ; пусть a { конеч-
ное подмножество A , и пусть a_b { объединение пакетов элементов a ; тогда
множество C [ fa; bg замкнуто, и по предыдущей лемме, тип a_b над C изолирован конъюнкцией формул f(b; a), a 2 a [b ; и так как тип a_b изолирован
над C , тип a над C изолирован.
Покажем, что каждое перечисление как в условии предложения является
конструкцией A над C . Любой ординал имеет вида + n , где пределен (рассмотрите наименьший ординал, не имеющий такой вид : он не может быть ни
предельным, ни последователем); по предположению B так же, как и B [ C ,
замкнуто для предельного ; следовательно, тип (b; b+1; : : :; b+n) над B [ C
изолирован, что влечет, что тип b+n над B [ fb; : : :; b+n?1g [ C = B+n [ C
изолирован. Тогда ясно, что оригинальная конструкция является конструкцией A над C .
Мораль всего этого в том, что мы получаем другую конструкцию A, если
его перенумеровываем не разъединяя маленькие пакеты. Мы видим, в частности, что если множество мощности { конструируемо, то оно имеет конструкцию типа { : если оно конечно, то каждое перечисление является конструкцией, и если оно бесконечно, то оно имеет { пакетов, которые нумеруем один
за другим.
Некоторые конструируемую модель называют строго простой моделью;
дело в том, что конструируемая модель действительно проста: если N { произвольная модель T , то так как тип a над A всегда изолирован, можно реализовать последовательно все эти типы в N . По теореме Левенгейма, мощность конструируемой модели (даже любого конструируемого множества параметров), меньше или равна jT j ; конструируемая над A модель проста над A
и имеет мощность, меньшую или равную Max(jAj; jT j) .
Глава 10
208
ПРОСТЫЕ МОДЕЛИ
Отметим, что каждое перечисление типа ! счетной атомной модели, и вообще, счетного атомного множества параметров, является конструкцией. Следующая теорема утверждает единственность конструируемой модели, если она
существует, и это без всякого предположения о мощности теории; мы показываем это челноком, который действует не поэлементно, а пакет за пакетом так,
чтобы сохранять атомность моделей на каждом этапе.
Теорема 10.18 (Рессэр) Если полная теория T имеет конструируемую мо-
дель, то она имеет единственную такую модель с точностью до изоморфизма и эта модель !-сильно однородна.
Доказательство. Пусть M и N { две конструируемые модели T ; так как
каждая из них, как простая, вкладывается в другую, они оба имеют один и
тот же кардинал { ; мы заметили, что можно найти конструкции длины { ,
перечисляя пакеты не разъединяя. Таким образом, M = fag<{ = [<{ A ,
и N = fbg<{ = [<{ B .
Тогда индукцией по построим последовательность f изоморфизмов из
M в N , и последовательность g частичных изоморфизмов из N в M , таких,
что:
если < , то f { ограничение fB, и g { ограничение g ;
g является расширением f?1 , и f+1 является расширением g?1 ;
Dom f , Im f , Dom g и Im g являются замкнутыми множествами;
Dom f и Im f имеют один и тот же тип, Im g и Dom g имеют один и
тот же тип;
{ если пределен, то f { предел f , < и g { предел g , < ;
{ если < , то a 2 Dom f , и b 2 Dom g .
{
{
{
{
Для этого, мы берем f0 = g0 = ; , и вообще на предельных этапах, берем
предел уже построенных частичных изоморфизмов. Для = + 1 поступаем
так: сначала построим f следующим образом; добавляем к образу g , который
замкнут, пакет P для a ; так как M атомна над Im g , тип P над этим
множеством изолирован, и в модели N можно найти такой P0 , чтобы Im g [ P
и Dom g [ P0 имели один и тот же тип, и продолжить g?1 до f0 так, чтобы
f0(P ) = P0 . Проблема в том, что P0 не замкнуто в N ; чтобы его замкнуть,
надо к нему добавить конечное множество P0 1 , и так как модель N атомна
над Im f0 , тип P0 1 над Im f0 [ P0 изолирован, и можно найти в M такой P1,
что Dom f0 [ P [ P1 и Im f0 [ P0 [ P0 1 имели один и тот же тип; продолжим
тогда f0 до f1 так, чтобы f1(P1) = P0 1 . Надо теперь замкнуть Dom f1
добавляя к нему конечное число элементов, и продолжать изоморфизмы таким
образом, беря замыкание то области, то образа, проходя ! раза челноком: это
возможно, так как каждый раз для замыкания добавляется только конечное
число параметров и модели атомны, одна над Domfn , а другая над Im fn .
Естественно, полагаем для f+1 = f равным пределу этих fn .
10.e
209
Минимальные модели
Затем построим g исходя из f , добавляя b к его области определения, и
наконец замыкая образы и области определений челноком типа ! . Отображения f{ и g{ , полученные в конце являются взаимно обратными изоморфизмами. Чтобы понять однородность, заметим, что если M конструируема, и если a
и b имеют один и тот же тип в M , то (M; a) и (M; b) { конструируемые модели
одной и той же теории; значит, они изоморфны.
Отметим, что дифференциальное замыкание, которое мы построили в разделе 6.b является конструируемой моделью; мы показали его !-однородность,
и его единственность в качестве конструируемой модели; но сейчас мы пока
неспособны показать его единственность в качестве простой модели (если поле
K , для которого берут дифференциальное замыкание, несчетно). Неизвестны примеры (несчетных !) теорий, имеющих простую модель, но не имеющей
конструируемых моделей; и так как две простые модели вкладываются элементарно одна в другой, все известные простые модели { атомные.
10.e Минимальные модели
Модель называется минимальной, если она не имеет собственного элементарного ограничения; она минимальна над A, если это минимальная модель
T (A). Если полная теория T имеет простую модель и минимальную модель,
то, так как первая вкладывается во вторую, T имеет только единственную простую модель, являющуюся её единственной минимальной моделью. Но кроме
этого мы в общем ничего не можем сказать о минимальных моделях.
Очень специальный случай простой минимальной модели был уже изучен в
разделе 6.a , когда алгебраическое замыкание множества параметров является
моделью. Еще более крайний случай, когда рациональное замыкание множества параметров A, образованное из определимых элементов его алгебраического замыкания (т.е. a удовлетворяет формуле f (x) с параметрами в A такой,
что T (A) ` (9!x)f (x)), само является моделью.
Это иллюстрировано в арифметике; в этой теории, каждой формуле '(x; y) ,
сопоставляют определимую функцию f'(x) , которая x сопоставляет наименьший y , удовлетворяющий '(x; y) , если он существует, и сопоставляет 0, если
такого y нет. Тогда ясно, что если A { подмножество модели M арифметики (или даже полной теории, содержащей арифметику Пеано), замыкание A
множества A определимыми функциями (без параметров) в арифметике удовлетворяет тесту Тарского: A { рациональное замыкание A и является элементарным ограничением M ; это простая минимальная модель над A. Мы видим
также, что эта модель определена единственным образом с точностью до изоморфизма над A, так как отношения вида f (a) = g(a); f (a) + g(a) = h(a); : : :
полностью описаны типом A. Таким образом, в арифметике имеем простую
минимальную модель над каждым множеством параметров; простая модель
над ; является, очевидно, стандартной моделью.
Отметим, что если a алгебраичен над A, то его тип над A изолирован; действительно, берем формулу f (x) с параметрами в A, удовлетворяющуюся n
210
Глава 10
ПРОСТЫЕ МОДЕЛИ
точками, в том числе и a, с минимальным n: мы не можем отличить типы этих
n точек, и эта формула изолирует тип a над A. Так как, алгебраический над
A элемент остается таковым над любым надмножеством A, любое ординальное перечисление алгебраического замыкания A является конструкцией над A.
Мы видим, что теория порядка целых чисел, так же, как и теория следования
на целых числах, имеет простую минимальную модель, которая не является
алгебраическим замыканием пустого множества; действительно, в этом случае
алгебраических элементов над ; не существует.
Также легко построить теории с минимальными моделями и без простых
моделей. Рассмотрим теорию T1 на языке, включающем символ s унарной
функции и унарный предикат A(x), состоящую из аксиом теории следования
на целых числах (s является биекцией без цикла). Назовем "блоком" копию
Z , снабженную унарным отношением; модели T1 состоят из блоков. Чтобы
получить теорию T , добавляем к T1 следующие аксиомы для каждого распределения " = f"0; : : : ; "ng символов, состоящих либо из ничего, либо из : :
(9x)("0A(x) ^ "1A(sx) ^ ^ "n A(snx)) :
Таким образом, в модели T любое распределение " реализовано последовательными элементами. Так как распределения "; "_" , : : :; "_ : : : _"; : : : должны
также быть реализованы, каждое " появляется там в действительности бесконечное число раз, и обязательно на произвольно больших расстояниях (т.е. бесконечных или произвольно больших конечных) от данной точки. По компактности из этого заключаем, что !-насыщенная модель T содержит бесконечное
число копий каждого блока; Поскольку две такие модели 1-эквивалентны,
отсюда следует, что T { полная теория с элиминацией кванторов.
Если в модели T стираем блок B , не являющийся моделью T , то получаем
снова модель T : если блок B не реализует распределение , то "_ должно
быть реализовано в другом блоке для любого распределения ". Таким образом, минимальная модель T { это блок, который является моделью T . Легко
видеть, что их существует 2! попарно не изоморфных; берем сначала копию
следования на отрицательных целых числах, с унарным предикатом A, таким,
чтобы ?1 и ?2 были в A , и чтобы все распределения " реализовались; достаточно выбрать перечисление этих распределений "0; : : :; "n; : : : и помещать их
впритык одного за другим. Каждому подмножеству X в ! мы сопоставляем
блок BX , имеющий построенное выше распределение на целых отрицательных
числах и такой, что если x 0 , то x 2 A, если и только если x = 2y + 1,
для y 2 X . Так как ?1 и ?2 являются наибольшими двумя подряд идущими
элементами в BX , удовлетворяющими A, здесь 0 обнаруживается, и BX и BY
изоморфны, только если X = Y . Так как имеются несколько минимальных
моделей, не существует простой модели. Кроме того, если мы назовем "периодическим" блок, полученный повторением одного и того же распределения ",
то видим, что модель T , составленная из периодических блоков, не содержит
никакую минимальную модель.
Упражнение 10.19 Рассмотрим компактное и тотально вполне несвязное
топологическое пространство E , а также функцию f , которая каждой изолированной точке E сопоставляет целое число n 1 или символ 1. Каждому
10.f
Неединственность простой модели
211
открыто-замкнутому подмножеству A в E сопоставляется унарный символ
отношения RA (x) и рассматривается следующая теория TE;f :
- (8x):R;(x) , и(9x)RA(x) для каждого A 6= ;
- (8x)(RA(x) $ :R:A (x)) , (8x)(RA\B (x) $ (RA(x) ^ RB (x)))
- если A является атомом, то есть если A изолирует точку p из E , то
выразим, что имеется точно f (p) элементов, удовлетворяющих RA , если f (p)
конечно, и что их бесконечное число, если f (p) есть 1.
1 Покажите, что типу в TE;f соответствует ультрафильтр открытозамкнутых подмножеств E , то есть, по компактности, одна точка E ;
как устроены !-насыщенные модели этой теории?
2 Покажите, что TE;f полна, с элиминацией кванторов и S1(TE;f ) = E .
3 Покажите, что, с точностью до интерпретации примитивных символов языка, TE;f есть общий случай теории структуры языка, содержащего только символы унарных отношений (см. 1.4).
4 Покажите, что TE;f имеет простую модель, если и только если изолированные точки E образуют в нем плотное множество.
5 Покажите, что если стереть элемент неизолированного типа в модели TE;f , то получается элементарное ограничение; показать, что эта
теория имеет минимальную модель тогда и только тогда, когда она
имеет простую модель и если, кроме того, f (p) конечно для каждого p:
тогда минимальная модель является алгебраическим замыканием ;.
10.f Неединственность простой модели
В этом разделе, мы рассматриваем цепь I с наименьшим элементом 0. Обозначим через I + множество ненулевых элементов I . Мы собираемся изучить
простые богатые I -значные пространства (см. раздел 6.d); отметим мимоходом, что любое богатое I -значное пространство атомно над I : если I счетно,
то счетное богатое I -значное пространство { единственное простое богатое I значное пространство. Обозначим через E (I ) пространство, образованное из
отображений I + в !, принимающих почти всюду значение 0, за исключением
конечного числа точек, снабженное следующим расстоянием: если a = (ai)i2I +
и b = (bi)i2I + , a 6= b , то d(a; b) равно наибольшему индексу i, такому, что
ai 6= bi ; иначе говоря, если d(a; b) i , то две последовательности принимают
одни и те же значения для любого j > i .
Непосредственно видно, что E (I ) { богатое I -значное пространство. Если
a = (ai)i2I + { точка E (I ) , мы назовем пакетом a множество P (a) элементов b = (bi)i2I + таких, что bi = 0 для ai = 0; так как последовательность ai
принимает только конечное число ненулевых значений, P (a) { счетное множество. Говорим, что подмножество A в E (I ) замкнуто, если оно является
объединением пакетов, т.е. для любого a из A пакет P (a) содержится в A.
212
Глава 10
ПРОСТЫЕ МОДЕЛИ
Лемма 10.20 Если A замкнуто в E (I ), то E (I ) атомно над I [ A .
Доказательство. Покажем сначала, что любая точка a из E (I ) имеет
изолированный тип над I [ A ; если A { пустое, то это уже известно. Иначе, A
содержит элемент из P (a), например нулевую последовательность (что является элементом всех пакетов), и среди них существует тот, который находится
на минимальном расстоянии от a: действительно, расстояние от a до элемента
P (a) есть 0 или один из индексов i, таких, что ai 6= 0; Итак, пусть b в P (a) на
минимальном расстоянии от a. Если d(a; b) = 0, то a = b и его тип изолирован
над A, так как это элемент из A; иначе d(a; b) = i 6= 0, что влечет ai 6= 0 и
bi = 0 (иначе, заменяя в b элемент bi на ai , мы бы получили элемент b0 из
P (b) \ P (a) на меньшем расстоянии от a); тогда я утверждаю, что формула
d(x; b) = i изолирует тип a над A [ I .
Для этого надо показать, что это условие ограничивает значение d(x; c)
для каждого c из A; если d(b; c) = j < i, тогда d(x; c) = i; если d(b; c) = j > i,
тогда d(x; c) = j . Возможно ли d(b; c) = i ? Если бы это было так, то, так как
bi = 0, элемент ci был бы ненулевой, и элемент c0 , полученный заменой в c
элемента ci на ai был бы в пакете для c, значит, лежал бы в A, и на меньшем
расстоянии, чем b. Если теперь a { кортеж точек, то тип каждой из них над
A[I изолирован формулой как выше, и чтобы изолировать тип всего n-кортежа
кроме этого достаточно уточнить, на каких расстояниях расположены между
собой его элементы.
Лемма 10.21 Семейство E (I ) конструируемо над I .
Доказательство. Перечислим сначала все пакеты, пусть это список
fAg<{ ; затем берем перечисление A0 типа ! (все пакеты счетны), за ним
перечисление A1 типа ! , и т.д. ; в итоге получаем перечисление E (I ) типа
! { , что является конструкцией по предыдущей лемме, так как для любого
предельного элементы индекса, меньшего , образуют замкнутое множество.
Таким образом, для каждого порядка I существует единственное богатое
I -значное пространство, конструируемое над I . Мы собираемся теперь определить, при каком условии это единственное простое богатое пространство над
I . Отметим, что E (I ) не может быть минимальным, так как почти очевидно,
что если стереть точку богатого I -значного пространства, то снова имеем богатое I -значное пространство. Простые I -значные модели необходимо, очевидно,
искать среди подпространств E (I ).
Лемма 10.22 Если I вполне-упорядочено и A { подмножество E (I ) без равносторонних бесконечных многогранников, то E (I ) атомно над A [ I .
Доказательство. Для изолированности типа a = (a1; : : :; an) над A [ I
достаточно, чтобы тип каждого ai был изолирован над этим множеством. Для
этого достаточно, добавить к конъюнкции формул, изолирующих типы ai, формулы, выражающие расстояния ai между собой. Итак, пусть a E (I ). Так
10.f
213
Неединственность простой модели
как I вполне упорядочено, существует элемент b из A на минимальном расстоянии от a. Если d(a; b) = 0, то a 2 A и его тип над A [ I изолирован; если
d(a; b) = i 6= 0, то рассмотрим максимальный равносторонний многогранник
fb = b0; : : : ; bmg со стороной i, содержащий b и содержащийся в A (мы знаем,
что на самом деле все эти многогранники имеют одно и то же число элементов;
он может состоять из одного b); тогда тип a над A [ I изолирован формулой
d(x; b0) = i ^ ^ d(x; bm) = i ; действительно, если c 2 A, то d(c; bh) 6= i для
некоторого h и d(x; c) определен ультраметрическим неравенством.
Таким образом, мы видим, что если I вполне упорядочена, то каждое подмножество A в E (I ) конструируемо над I ; достаточно его перечислять, никогда
не вводя равносторонний бесконечный многогранник до конца, например, перечисляя последовательно
A \ 1I + ; : : : ; A \ nI + ; : : : (напомним; что n = f0; : : : ; n ? 1g);
так как равносторонние многогранники E (I ) \ nI + имеют не более n элементов. В этом случае, E (I ) единственное простое богатое пространство над I :
действительно, тогда любая простая модель, обязанная вкладываться в E (I ),
конструируема. Проверьте в качестве упражнения, что E (I ) просто над A [ I ,
если и только если любой равносторонний максимальный многогранник в A
либо конечен, либо максимален в E (I ) . Чтобы обобщить эту последнюю лемму, нам нужен один легкий, но, тем не менее, тонкий результат теорий моделей,
глубина которого станет ясно позже:
Теорема 10.23 Пусть M { модель полной теории T , B { подмножество M ,
a и b { кортежи из M . Если тип a над b имеет только единственное расширение над B [fbg (т.е. если тип a над B [fbg определен своим ограничением над
B ), тогда тип b над B имеет только единственное расширение над B [fag; и
если, кроме того, тип b над B [fag изолирован, тогда тип b над B изолирован.
Доказательство. Условие предложения означает, что каждая формула
f (a; y), имеющая кроме a параметры из B и удовлетворяющаяся b, выводима
по модулю T (B [fag), из типа b над B ; это означает также, что тип a_b над B
аксиоматизируем типом a над B и типом b над B , что является симметричным
условием условием относительно a и b. Если мы предположим, что тип b над
B [ fag изолирован формулой f (a; y), то можно найти формулу g(y) над B ,
удовлетворяющуюся b, которая её влечет по модулю T (B [ fag). Эта формула
g(y) изолирует тип b над B ; действительно, если b0 { кортеж из элементарного
расширения M , удовлетворяющий g(y), то a_b0 удовлетворяет f (x; y), значит b
и b0 имеют один и тот же тип над B [ fag, и тем более B .
Лемма 10.24 Если каждое анти вполне-упорядоченное подмножество I конечно или счетно (т.е. если I не содержит строго убывающую последовательность, индексированную @1 ), то для любого a из E (I ) и любого A E (I )
тип a над A [ I определен (т.е. аксиоматизируем по модулю T (A [ I )) конеч-
ным или счетным семейством формул.
214
Глава 10
ПРОСТЫЕ МОДЕЛИ
Доказательство. Это ясно, если A { пустое, так как E (I ) атомно над
I (и как впрочем все точки имеют один и тот же тип на I ); если a 2 A, то
его тип изолирован формулой x = a. Пусть теперь a 62 A 6= ;. Если в A
существует b на минимальном расстоянии i от a, рассмотрим равносторонний
многогранник B со стороной i, максимальный в A и содержащий b; так как
E (I ) содержит только счетные равносторонние многогранники, B конечен или
счетен, B = fb0; : : :; bn ; : : : g, где b = b0 . Тогда условия d(x; bn) = i определяют
тип a над A [ I . Иначе, рассмотрим непустое множество J элементов j из I
таких, что в A существует b с d(a; b) = j ; это множество не имеет наименьшего
элемента, и так как в I не существует убывающей последовательности типа
@1, коинициальность J , то есть конфинальность обратного ему порядка, есть
! ; Итак, пусть i0 > i1 > > in > : : : { коинициальная последовательность
в J с bn 2 A; n 2 !, такая, что d(a; bn) = in ; я утверждаю, что условия
d(x; bn) = in определяют тип a над A [ I ; действительно, для любого c из A
необходимо, чтобы d(c; bn ) > in для некоторого n, иначе d(a; c) будет меньше
каждого элемента J .
Теорема 10.25 Если I не содержит строго убывающую последовательность,
индексированную @1 , то E (I ) { единственное простое богатое пространство
над I ; более точно, каждое подмножество B в E (I ) конструируемо над I .
Доказательство. Каждый элемент a из E (I ) имеет свой пакет P (a) (для
понятия пакета, введенного в начале этого раздела; мы могли бы также брать
понятие пакета для некоторой конструкции E (I )); каждый пакет счетен, и
E (I ) атомно над каждым замкнутым множеством, то есть над каждым множеством, которое является объединением пакетов. Мы собираемся сопоставить
каждому элементу b из B замкнутое счетное подмножество Q1(b) в E (I ), содержащее b и такое, что тип каждого элемента Q1(b) над B был определен своим
ограничением на Q(b) = B \ Q1(b).
Для этого начнем с b: берем его пакет P (b) , и к нему добавим для каждого
кортежа a из этого пакета счетное подмножество Ba из B , такое, что тип a
над B [ I был единственным расширением своего ограничения на Ba [ I : всего
добавляется только счетное число элементов. Потом замыкаем это множество,
снова добавляем параметры из B , и т.д. Повторяем такую процедуру ! раз.
Теперь я утверждаю, что B атомно над любым множеством C , являющимся объединением некоторых Q(b); мы обозначим через C1 объединение соответствующих Q1(b). Достаточно показать, что любой элемент b из B имеет тип,
изолированный над C [ I ; действительно, как мы часто отмечали, кортеж имеет изолированный тип над C [ I как только каждый из его элементов имеет
изолированный тип над C [ I , так как все расстояния между элементами этого
кортежа лежат в I . Так как C1 замкнуто, тип b над C1 [ I изолирован и даже
изолирован формулой вида d(x; a) = i, с единственным параметром a; тип b
над I [ C [ fag изолирован той же формулой. Однако тип a над B определен своим ограничением над C . Значит, тип a над I [ C [ fbg { единственное
расширение своего ограничения на C [ I . По симметрии (Теорема 10.23) тип
b над I [ C [ fag { единственное расширение своего ограничения на I [ C , и
10.f
215
Неединственность простой модели
так как первый изолирован, то второй также изолирован. Теперь достаточно
расположить одно за другим перечисления типа ! (счетных) множеств Q(b),
чтобы получить конструкцию B .
Эта теорема допускает обобщение, так как единственные использованные
факты об E (I ) { теоремы 10.23 и 10.24; на самом деле мы можем показать,
что если M является конструируемой моделью T и если для любого a из M и
любого A M существует счетное подмножество A0 в M , такое, что тип
a над A0 определяет тип a над A, тогда M { единственная простая модель T .
Единственная разница со случаем богатых ультраметрических пространств
заключается в том, что для изолированности типа кортежа из M уже не достаточна изолированность типа каждого из его элементов. Так же, как и в
10.25, следующим образом покажем, что каждое подмножество B из M конструируемо. Рассмотрим ординальное перечисление b для B , и возрастающую
последовательность C подмножеств M такую, что :
{ каждое C замкнуто, каждое C+1 n C счетно,
{ b лежит в B+1 = C+1 \ B ,
{ тип C над B определен своим ограничением на B = C \ B ,
{ C является объединением C , < , для предельного .
Чтобы построить эту последовательность C поступаем так: нет проблем,
если пределен; чтобы получить C+1 из C , сначала добавим b ; потом
замыкаем это множество, добавив конечное множество точек; для каждого
кортежа из этого множества, добавляем счетное подмножество B 0 из B , такое,
что тип этого кортежа над C[B был определен своим ограничением на C[B 0 ;
потом вновь замыкаем, и добавляем параметры так, чтобы определять типы
на C [ B , и повторяем это ! раз. Тип кортежа, извлеченного из C+1 ,
над B определен своим ограничен