максимум) на этом значении. Простейший отрезок колоды -- это две последовательно расположенные в ней карты. (Такие карты мы в дальнейшем будем называть КАРТАМИ-СОСЕДЯМИ.) Если имеющаяся в нашем распоряжении большая колода действительно была получена с помощью описанного выше механизма ``блочного тасования'' из нескольких одинаковых малых колод, то многие из карт-соседей в ней БЫЛИ СОСЕДЯМИ И В ИСХОДНЫХ МАЛЫХ КОЛОДАХ. Конечно, в ходе тасования появятся и новые ``ложные'' пары карт-соседей. Но все же доля ``истинных'' (исходных) соседей среди всех пар карт-соседей большой колоды будет значительной. Для нас важно, что эта доля будет оказывать существенное влияние на статистический характер распределения подобных пар в большой колоде. При этом, ``ложные'' соседи создадут, естественно, некоторый ``случайный шум'', смазывающий картину распределения в колоде ``истинных'' соседей. Однако систематическую часть этого шума удается скомпенсировать, а случайная оказывается невелика в реальных примерах (см. ниже). Используя описанную модельную задачу, перейдем к неформальному описанию методик статистического анализа хронологических списков. 4. 6. МЕТОД ГИСТОГРАММ ЧАСТОТ РАЗНЕСЕНИЯ СВЯЗАННЫХ ИМЕН. ОПРЕДЕЛЯЕТ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ДУБЛИКАТАМИ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на модельном примере изложим идею и основные шаги методики. На формальном уровне она изложена в главе 2. Обозначим буквой К большую перетасованную колоду карт, описанную выше. Наша задача -- ОПРЕДЕЛИТЬ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ЭКЗЕМПЛЯРАМИ МАЛЫХ ИСХОДНЫХ КОЛОД В К. Пусть к к -- некая пара последовательных карт в К (то есть к и 1 2 1 к -- соседи). Предположим, что к и к -- ``истинные'' соседи, то есть 2 1 2 они были соседями также и в исходных малых колодах, до тасования. Тогда пары вида к к, разбросанные по колоде К, будут отмечать в 1 2 ней положения своих малых колод (откуда они пришли). Сдедовательно, расстояния (разнесения) между такими парами будут равны сдвигам (разнесениям) между экземплярами малых колод в К. Это -- идеальная ситуация. В реальности, конечно, по экземплярам одной только пары к к в колоде К судить о сдвигах 1 2 между дубликатами (малыми колодами) в К нельзя, даже если сама пара к к -- ``истинная''. В самом деле некоторые экземпляры этой 1 2 пары могут случайным образом быть разбиты при тасовании и информация о соответствущем сдвиге в этом случае потеряется. С другой стороны, среди экземпляров пары к к могут 1 2 встретиться и ``ложные'', случайно возникшие при тасовании, и в этом случае мы зарегистрируем ложный сдвиг. Кроме того, мы заранее не знаем -- ``истиная'' ли данная пара карт-соседей в К или нет. Поэтому поступим следующим образом. Чтобы исключить потерю информации при случайном разбиении пар к к в ходе тасования, 1 2 будем рассматривать карты к и к в колоде К по отдельности. 1 2 Итак, ПОДСЧИТАЕМ РАССТОЯНИЯ МЕЖДУ ВСЕМИ ПАРАМИ КАРТ В К, ПРИ УСЛОВИИ ОДНАКО, ЧТО ХОТЯ БЫ В ОДНОМ МЕСТЕ КОЛОДЫ К ЭТИ (ТАКИЕ ЖЕ) КАРТЫ ВСЕ ЖЕ СТОЯТ РЯДОМ (ЯВЛЯЮТСЯ СОСЕДЯМИ). В чем смысл этого условия? Оно позволяет выделить такую совокупность пар карт, в которой ``истинные'' карты-соседи составляют заметную долю. В самом деле, пусть к к -- ``истинная'' 1 2 пара карт-соседей. Поскольку все исходные малые колоды были до тасования одинаковы, то эта пара существовала перед тасованием в N экземплярах (где N -- число исходных малых колод). Чтобы данная пара карт НЕ ПОПАЛА в нашу совокупность, необходимо, чтобы ВСЕ N экземпляров этой пары были разъединены при тасовании. Вероятность этого события МАЛА. С другой стороны, для ``ложной'' пары карт-соседей условием ПОПАДАНИЯ в указанную совокупность является случайная встреча этих карт при тасовании, что при неполном ``блочном'' тасовании ТАКЖЕ МАЛОВЕРОЯТНО. Таким образом, большинство ``ИСТИННЫХ'' пар карт-соседей ПОПАДУТ в нашу совокупность, а большинство ``ЛОЖНЫХ'' -- НЕ ПОПАДУТ в нее. В итоге, существенную часть этой совокупности составят ``истинные'' пары карт-соседей. Рассмотрев все пары карт, которые где-либо в К оказались соседями, и вычислив для каждой такой пары значение разнесения (то есть количество карт, разделяющих эту пару в колоде К), мы получим набор целых чисел -- значений разнесения между соседями в К. По этому набору построим график -- ГИСТОГРАММУ ЧАСТОТ РАЗНЕСЕНИЙ КАРТ-СОСЕДЕЙ следующим образом. Отложим по горизонтальной оси все возможные значения разнесений между картами в колоде К (ясно, что разнесения не могут превосходить длины К), а по вертикальной оси -- частоту, с которой данное значение встречается в наборе разнесений. По такой гистограмме легко выделяются ``необычно'' частые значения разнесений: на местах таких значений гистограмма имеет ярко выраженный локальный максимум (всплеск). Например, если гистограмма частот разнесений карт-соседей имеет вид как на рис. 18, то существует два ``необычно частых'' значения разнесений: р и р. 1 2 Если ``необычно'' частых значений разнесения между картами-соседями в колоде К нет, то соответствующая гистограмма ВООБЩЕ НЕ БУДЕТ СОДЕРЖАТЬ ВСПЛЕСКОВ (доказательство см. в главе 2). В ЭТОМ СЛУЧАЕ СЛЕДУЕТ ПРЕДПОЛОЖИТЬ, ЧТО ДУБЛИКАТОВ ОПИСАННОГО ВЫШЕ ТИПА В КОЛОДЕ К НЕТ. В противном случае, дубликаты по-видимому имеется и их следует проанализировать. Сдвиги между дубликатами (исходными колодами) в этой структуре определяются как значения, на которых гистограмма делает всплески. 4. 7. МЕТОД ПОСТРОЕНИЯ МАТРИЦ СВЯЗЕЙ. ПРЕДНАЗНАЧЕН ДЛЯ ПОИСКА ДУБЛИКАТОВ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на приведенном выше модельном примере изложим лишь ОБЩУЮ ИДЕЮ методики. Метод был предложена авторами в [10, 12]. Подробно он изложена в главе 3. Анализ дубликатов (исходных малых колод) в колоде К можно осуществить на основе следующих простых соображений. Предположим, что имеющаяся в нашем распоряжении колода К была действительно получена описанным выше способом из нескольких экземпляров более короткой (исходной) колоды. Рассмотрим два отрезка А и А колоды К. Будем называть отрезки А и А 1 2 1 2 ДУБЛИКАТАМИ, если они соотвественно содержат карты, которые в экземплярах исходной колоды находились рядом (рис. 19). Заметим, что при этом может случиться, что отрезки А и А 1 2 вовсе не содержат одинаковых карт и тем не менее, являются дубликатами. Такая ситуация возникает, когда в отрезок А при 1 тасовании попали одни карты из некоторого малого отрезка А исходной колоды, а в отрезок А -- другие карты из того же 2 ``прообраза'' А (рис. 19). Подобная ситуация возникает и в реальных хронологических списках имен, когда в одном дубликате использованы одни имена, а в другом -- другие имена одних и тех же людей. Однако в любом случае, если А и А -- действительно 1 2 дубликаты, то есть содержат части, восходящие к общему прообразу А в исходной короткой колоде, то среди множества экземпляров их прообраза А, разбросанных при тасовании по колоде К и как-то искаженных при этом, должны встретиться и такие экземпляры, которые содержат как карты, попавшие из А в А, так и карты, 1 попавшие в А (на рис. 19 такой экземпляр А обведен кружком). 2 Следовательно, в том случае, когда А и А -- дубликаты, 1 2 вероятность встреч карт из А и А где-нибудь в колоде К, БОЛЬШЕ, 1 2 чем аналогичная вероятность в случае, когда А и А дубликатами 1 2 не являются (естественно, имеются в виду не сами экземпляры карт из А и А, а такие же карты). 1 2 В самом деле, в первом случае действует описанный механизм, объединяющий карты из А и А в колоде К, а во втором -- это 1 2 объединение может произойти лишь чисто случайным образом. Приведенные соображения позволяют предложить методику, разделяющую всевозможные пары отрезков А и А колоды К на два 1 2 множества: множество пар-дубликатов (в статистическом смысле) и множество ``независимых'' пар. Эта методика требует значительного объема вычислений на ЭВМ. При применении к хронологическим спискам имен ее результатом является так называемая МАТРИЦА СВЯЗЕЙ списка, дающая его разложение на систему дублирующих друг друга ``слоев''. Методика была впервые предложена авторами в [11-13]. Подробное изложение метода см. в главе 3. p3'2'1 Глава 2. ОПРЕДЕЛЕНИЕ СДВИГОВ В ХРОНОЛОГИИ ПО ГИСТОГРАММАМ
ЧАСТОТ РАЗНЕСЕНИЙ СВЯЗАННЫХ ИМЕН 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 1. 1. БОЛЬШАЯ КОЛОДА КАРТ И СОСТАВЛЯЮЩИЕ ЕЕ МАЛЫЕ КОЛОДЫ Вернемся к модельной задаче о колодах карт (уже описанной в предыдущем параграфе), в терминах которой будут сформулированы необходимые определения. Предположим, что в нашем распоряжении имеется некоторая последовательность карт К (колода карт), которая может содержать ПОВТОРЯЮЩИЕСЯ КАРТЫ. Будем говорить, что колода К СОДЕРЖИТ ДУБЛИКАТЫ, если она получена из нескольких одинаковых по составу и порядку более коротких колод карт Х (также содержащих, возможно, повторяющиеся карты), которые были сложены подряд в одну общую колоду ХХ... Х, а затем получившаяся таким образом БОЛЬШАЯ КОЛОДА БЫЛА ПЕРЕТАСОВАНА. Мы допускаем, что перед тасованием каждый экземпляр исходной колоды Х был как-то ИСКАЖЕН. Под ИСКАЖЕНИЯМИ будем понимать случайное исключение, дублирование или замену отдельной карты или же последовательности подряд стоящих карт. Предположим однако, что локальные искажения в различных частях каждой из исходных колод НЕЗАВИСИМЫ друг от друга. Если же исследуемая колода ДУБЛИКАТОВ НЕ СОДЕРЖИТ (то есть порядок карт в ней не порожден описанным выше механизмом), будем называть порядок карт в колоде ПРАВИЛЬНЫМ. 1. 2. ФОРМУЛИРОВКА ПРОБЛЕМЫ Задача состоит в том, чтобы по известной последовательности карт в колоде К проверить гипотезу Н о том, что порядок карт в К 0 -- ПРАВИЛЬНЫЙ, то есть К не содержит дубликатов. Если гипотеза Н 0 отвергается, то требуется определить ВЕЛИЧИНЫ СДВИГОВ между экземплярами исходной колоды Х, расположенными в колоде К (и не до конца разрушенными при тасовании -- см. рис. 17). Для решения этой задачи сформулируем следствие гипотезы Н, 0 допускающее проверку методами математической статистики. 1. 3. РАЗБИЕНИЕ БОЛЬШОЙ КОЛОДЫ Пусть общее число карт в колоде К равно n и из них m различных. Разобъем колоду К на отрезки ОДИНАКОВОЙ ДЛИНЫ: К = ( К, К,..., К ), 1 2 N где через N обозначено общее количество отрезков разбиения. Пусть каждый из этих отрезков содержит p карт. Разбиение выберем так, чтобы число карт в отрезке разбиения было существенно меньше общего числа карт в колоде К: p \а<\А n. 1. 4. РАЗНЕСЕНИЕ ПАРЫ КАРТ КАК СЛУЧАЙНАЯ ВЕЛИЧИНА Рассмотрим конечную вероятностную схему равновероятного выбора с возвращением двух карт из колоды К. Это значит, что происходит случайный равновероятный выбор карты в колоде К, эта карта запоминается и возвращается в колоду. Затем также равновероятно выбирается вторая карта. Результатом выбора является (случайный) протокол, в котором записаны порядковые номера в колоде обеих выбранных карт k, k в 1 2 порядке их выбора. Определим случайную величину \Вз\А, которую мы назовем РАЗНЕСЕНИЕМ выбранной пары карт. Пусть i и i -- порядковые 1 2 номера отрезков колоды К, в которых содержатся выбранные карты k и k. По определению положим: 1 2 \Вз\А = |i -- i |. 1 2 Таким образом, РАЗНЕСЕНИЕ \Вз\А -- ЭТО АБСОЛЮТНАЯ ВЕЛИЧИНА РАЗНОСТИ НОМЕРОВ ОТРЕЗКОВ РАЗБИЕНИЯ, СОДЕРЖАЩИХ ВЫБРАННЫЕ КАРТЫ. 1. 5. ЛОКАЛЬНОЕ ИСКАЖЕНИЕ ЛЕТОПИСИ -- КОЛОДЫ КАРТ Пусть А -- некоторое событие, определяемое заданной структурой колоды К (то есть порядком карт в ней и ее разбиением на отрезки) и выбранной парой карт. Событие А назовем ЛОКАЛЬНЫМ СОБЫТИЕМ (локальным условием), если наступление этого события может быть обеспечено заменой карт в одном из отрезков разбиения колоды К (заменой, возможно зависящей от случая). Другими словами, локальное событие -- это такое событие, которое может быть обусловлено ЛОКАЛЬНЫМ ИСКАЖЕНИЕМ колоды К. МАТЕМАТИЧЕСКИЙ ПРИМЕР. Событие А, состоящее в том, что в 0 некотором отрезке разбиения содержатся карты сразу обоих выбранных видов является ЛОКАЛЬНЫМ СОБЫТИЕМ. В самом деле, изменив две карты, скажем, в первом отрезке разбиения так, чтобы в нем оказались такие же карты, как и выбранные, мы обеспечим наступление события А. 0 Если же говорить об исторических хрониках, МОДЕЛЬЮ КОТОРЫХ является колода карт К, то содержательный смысл понятия ``локальное событие'' состоит в следующем. Такие события, с одной стороны, могут возникать в итоге сознательных действий хрониста или переписчика, а с другой стороны, для их возникновения не требуется переделки всего текста хроники. Скажем, в примере с событием А хронист, включивший в 0 какое-то место хроники имена двух персонажей, сделал это на основании своих вполне осознанных представлений о том, что они жили одновременно (или имели сходную судьбу и т. п.) и ему для этого не надо было перекраивать заново весь текст хроники. В отличие от этого, ГЛОБАЛЬНЫЕ характеристики распределения имен в длинных исторических хрониках, мало чувствительные к их локальным искажениям, НЕ МОГЛИ КОНТРОЛИРОВАТЬСЯ ОТДЕЛЬНЫМИ ХРОНИСТАМИ. Изменение глобальных характеристик могло произойти лишь на заключительном этапе компиляции (согласования) крупных хроник и включения их в единую хронологическую шкалу. Поэтому именно ГЛОБАЛЬНЫЕ характеристики полезны при исследовании ``скрытой'' структуры летописей. 1. 6. ЛОКАЛЬНАЯ СВЯЗЬ КАРТ В ``ПРАВИЛЬНОЙ КОЛОДЕ'' НЕ ВЛИЯЕТ НА ГЛОБАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ТАКИХ ЖЕ КАРТ 6. В основе предлагаемой методики лежит следующее интуитивно очевидное утверждение о статистических свойствах ПРАВИЛЬНОГО ПОРЯДКА карт в колоде К. ГИПОТЕЗА Если колода К не содержала дубликатов или же ее тасование было достаточно полным и структура дубликатов (коротких идентичных друг другу колод) в ней полностью разрушена, то ЛОКАЛЬНОЕ УСЛОВИЕ, НАЛОЖЕННОЕ НА ПАРУ ВЫБРАННЫХ КАРТ, НЕ МОЖЕТ ПОВЛИЯТЬ НА ХАРАКТЕР ГЛОБАЛЬНОГО РАСПРЕДЕЛЕНИЯ ТАКИХ ЖЕ КАРТ ВО ВСЕЙ БОЛЬШОЙ КОЛОДЕ. В частности, локальное условие не должно влиять и на закон распределения случайной величины \Вз\А вне некоторой окрестности нуля, определяемой радиусом затухания взаимной зависимости отрезков разбиения колоды К. В самом деле, распределение \Вз\А является ГЛОБАЛЬНОЙ характеристикой порядка карт в целом и мало чувствительно к хаотичным локальным изменениям этого парядка. Это значит, что в случае ПРАВИЛЬНОГО порядка карт в К, условное распределение случайной величины \Вз\А при условии произвольного локального события А должно СОВПАДАТЬ вне некоторой окрестности нуля с безусловным распределением \Вз\А. Иначе говоря, из гипотезы Н вытекает такое следствие: 0 СЛЕДСТВИЕ ГИПОТЕЗЫ H. 0 Пусть А -- некоторое локальное событие, а \Ве\А -- радиус затухания зависимости между отдельными отрезками разбиения колоды К. (В качестве единицы измерения этого радиуса возьмем длину отрезка разбиения. Таким образом \Ве\А -- целое число.) Тогда распределение P{\Вз\А = x|A, \Вз\А \Д>\А \Ве\А} должно совпадать с распределением P{\Вз\А = x|\Вз\А \Д>\А \Ве\А}. С другой стороны, в случае, когда гипотеза Н неверна и 0 колода К содержит дубликаты, указанные распределения могут очень сильно разниться на всем интервале возможных значений случайной величины \Вз\А (0\Д<\Вз\Д<\АN-1). МАТЕМАТИЧЕСКИЙ ПРИМЕР. Возьмем событие А, определенное выше 0 и предположим, что колода К содержит дубликаты. Тогда для некоторых отрезков разбиения К, такие же как и в К карты будут i i содержаться также в дубликатах даного отрезка. Таким образом, пары карт, тождественных с некоторыми картами из К, будут i распределены по колоде К не совсем произвольно. А именно, они будут ``собираться'' в дискретно расположенной серии дубликатов отрезка К. i Значит и разнесение этих пар будет особенно часто принимать значения либо близкие к нулю, либо равные сдвигам между дубликатами этой серии в колоде К. Поскольку условие А 0 существенно ограничивает выбор пар карт -- рассматриваются лишь те, которые (сами или тождественные им) хоть раз попали в один и тот же отрезок разбиения колоды К, -- то описанная ситуация с дубликатами будет довольно типичной для ограниченного таким образом множества пар. Это изменит распределение случайной величины \Вз\А (по сравнению с ее распределением на множестве всех пар) и заставит ее чаще принимать те значения, которые характерны для расстояний между дубликатами в К. Таким образом, условное распределение \Вз\А при условии А будет существенно отличаться от ее безусловного 0 распределения. Сформулированное следствие позволяет проверять гипотезу Н в 0 конкретных хрониках. Более того, анализ условных распределений вида P{\Вз\А = x|A} с различными локальными событиями А дает возможность определить величины сдвигов между дубликатами в К. p3'2'2 2. РАЗНЕСЕНИЯ СВЯЗАННЫХ ИМЕН 2. 1. ПРАВИЛЬНЫЙ ХРОНОЛОГИЧЕСКИЙ СПИСОК ИМЕН В главе 1 было введено понятие ХРОНОЛОГИЧЕСКОГО СПИСКА ИМЕН, снабженного разбиением на главы и приведены примеры реальных хронологических списков. В настоящем разделе мы рассмотрим задачу проверки гипотезы Н_0 о том, что хронология того или иного хронологического списка имен является ПРАВИЛЬНОЙ. Уточним понятие правильного списка по сравнению с определением, данным в главе 1. А именно, будем называть хронологию списка имен Х ПРАВИЛЬНОЙ, если список не является результатом размножения и последующего ``поблочного тасования'' (склейки со сдвигом и локального перемешивания) некоторого другого, БОЛЕЕ КОРОТКОГО списка Y. В противном случае будем говорить, что список Х СОДЕРЖИТ ДУБЛИКАТЫ. Под дубликатами понимаются первоначально одинаковые (при тасовании они могут быть искажены) отрезки различных экземпляров списка Y, содержащиеся в Х (см рис. 17). Также как и в модельной задаче, мы допускаем возможность СЛУЧАЙНЫх искажений каждого из экземпляров списка Y, лежащих в основе списка Х, однако предполагаем, что локальные искажения в удаленных друг от друга частях списков ВЗАИМНО НЕЗАВИСИМЫ. 2. 2. СОПРЯЖЕННЫЕ ИМЕНА И ИМЕНА-РОВЕСНИКИ. МАТЕМАТИЧЕСКИЙ ФОРМАЛИЗМ Следуя описанной в предыдущем разделе методике, рассмотрим вероятностную схему случайного равновероятного выбора с возвращением двух имен из списка Х и определим случайную величину \Вз\А -- РАЗНЕСЕНИЕ выбранной пары имен. Напомним обозначения характеристик списка Х: n -- общее число имен в списке Х (с учетом кратности их вхождения в список); m -- число различных имен списка Х; N -- число глав списка Х. Имена списка Х мы будем обозначать буквами a_i, где индекс указывает на порядковый номер данного имени в списке: X = {a_1, a_2,..., a_n}. Обозначим через I множество различных имен списка Х. Это множество состоит из m имен (m\Ве\А} = P{\Вз\А=x|\Вз\Д>\Ве\А}, где \Ве\А - радиус затухания зависимости в списке Х. Здесь мы без ограничения общности будем считать, что \Ве\А=0. Общий случай сводится к этому простой модификацией вероятностой схемы (\ВW\А_2, \ВS\А_2, P_2). p3'3'1 Глава 3. МАТРИЦЫ СВЯЗЕЙ ДЛЯ ХРОНОЛОГИЧЕСКИХ СПИСКОВ ИМЕН 1. КАК УЗНАТЬ -- КАКИЕ ИМЕННО ЧАСТИ ЛЕТОПИСИ ЯВЛЯЮТСЯ ДУБЛИКАТАМИ? В предудущей главе с помощью гистограмм частот разнесений связанных имен проверялась гипотеза об отсутствии дубликатов в данном хронологическом списке имен. В тех случаях, когда присутствие дубликатов было обнаружено, определялись типичные сдвиги между дубликатами в списке. Однако метод гистограмм частот связанных имен не дает прямого ответа на следующий основной вопрос: КАКИЕ ИМЕННО ЧАСТИ СПИСКА ЯВЛЯЮТСЯ ДУБЛИКАТАМИ И В КАКОЙ МЕРЕ? Напомним, что в соответствии с понятием слоистой хроники, два отрезка хронологического списка называются ДУБЛИКАТАМИ, если они содержат соответственно ДУБЛИРУЮЩИЕ ДРУГ ДРУГА СЛОИ. В данной главе мы опишем метод, позволяющий отвечать на этот вопрос. Результатом его применения к историческому хронологическому списку будет являться так называемая ``МАТРИЦА СВЯЗЕЙ'' (фрагментов) данного списка. Это -- КВАДРАТНАЯ ТАБЛИЦА, показывающая в какой мере те или иные отрезка списка имен являются дубликатами друг друга ("связаны'' между собой). Мы уже вкратце описали идею метода, пользуясь модельной задачей о колоде карт (см. главу 1). Проведем теперь эти рассуждения уже не для модельной задачи, а для РЕАЛЬНЫХ хронологических списков. Пусть имеется список имен Х, который может содержать ошибки, пропуски и (или) дубликаты. НЕИЗВЕСТНЫЙ НАМ ИСТИННЫЙ СПИСОК ИМЕН, лежащий в основе реального списка Х, обозначим через Y. Таким образом, Y - ВООбРАЖАЕМЫЙ список имен, содержащий полные неискаженные данные (скажем, об именах правителей данного государства) для длительного исторического промежутка времени I_Y. РЕАЛЬНЫЙ список имен Х, который находится в нашем распоряжении является ИСКАЖЕНИЕМ, ``зашумлением'' списка Y с возможной потерей доли информации. Предположим, что промежуток времени I_Y был описан МНОГИМИ летописцами -- очевидцами или современниками происходящих событий. Каждый из них составлял свою короткую летопись Z_i по современным ему событиям. Поскольку мы изучаем сейчас не весь текст летописи, а только имена, извлеченные из нее, то можем считать (для удобства), что каждый летописец составлял некий короткий хронологический список имен, который мы также обозначим через Z_i. Если промежуток времени I_Y описывался K летописцами, то в основе наших знаний о события, происходивших на этом промежутке, лежит K коротких летописей Z_1, Z_2,..., Z_K (включая и утраченные летописи). Множество этих летописей (коротких хронологических списков имен) мы обозначим через {Z_i}. Множество {Z_i} образует некоторое покрытие списка Y. Это покрытие мы будем считать: а) Достаточно плотным, то есть предположим, что каждый отдельный год из промежутка I_Y описывался не одним, а сразу несколькими летописцами независимо друг от друга. б) Состоящим из уже искаженных -- как-то разреженных и местами ошибочных коротких хронологических списков. В самом деле, даже в своем исходном виде каждая из летописей Z_1, Z_2,..., Z_K упоминала, возможно, не все имена правителей, не всех исторических деятелей, участвующих в событиях. Кроме того, при последующем переписывании и компиляциях появлялись ошибки, пропуски, произвольные вставки и т. п. Для простоты рассуждений мы будем считать все эти ошибки присущими летописям Z_i с самого начала. Итогом работы по составлению хронологии в ее современном виде явилась некоторая новая склейка списков Z_i (новое совмещение их на оси времени), которая и породила известный нам хронологический список имен Х. Рассмотрим два отрезка \ВД\А_1, \ВД\А_2 списка имен Х и попытаемся ответить на вопрос: нет ли такой пары Z_i, Z_j коротких хронологических списков из множества {Z_i}, которые в списке Y (в реальности) относились к одному и тому же месту, а в списке Х оказались ``подклеенными'' к \ВД\А_1 и \ВД\А_2 соответственно? Так же как и в модельном примере с картами (см. главу 1), заключаем, что если такая пара есть, то увеличивается вероятность того, что имена из \ВД\А_1 и \ВД\А_2 окажутся близко друг от друга где-то в списке Х (за счет третьей, ``склеивающей'' летописи Z_m, смешивающей имена из Z_i и Z_j). p3'3'2 2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СВЯЗЕЙ МЕЖДУ ДУБЛИКАТАМИ В ЛЕТОПИСИ Пусть дан хронологический список имен Х. Начиная с этого места забудем на время о разбиении списка Х на главы. В отличие от задачи определения ВЕЛИЧИН СДВИГОВ между дубликатами, для построения МАТРИЦЫ СВЯЗЕЙ временна'я шкала в списке не используется. После построения матрицы мы снова воспользуемся ею для СОДЕРЖАТЕЛЬНОЙ интерпретации результатов. Для уточнения понятий ``отрезок списка'' и ``близость в списке'' введем следующие определения. ОПРЕДЕЛЕНИЕ. Для i-го имени a_i в списке имен Х = {a_1,..., a_n} его ОПРЕДЕЛЯЮЩЕЙ ОКРЕСТНОСТЬЮ РАДИУСА k назовем отрезок списка: \ВД\А_{a_i}(k) = \ВД\А_i(k) = \ВД\А_i = {a_{i-k},..., a_{i+k}}, (k1. Ю k_i(k_i- 1) Для уникального имени в списке (то есть при i=j, k_i=1) понятие связи такого имени с самим собой не вводится. Поясним выбор нормировки в этом определении. Эта нормировка выбиралась так, чтобы связь любой пары имен из списка Х являлась бы случайной величиной со средним, не зависящим от выбора этой пары. При этом предполагалось, что вероятностный механизм возникновения правильного хронологического списка Х таков, что при условии, что нам известно все множество имен списка, но неизвестен их порядок, все перестановки имен (все варианты выбора их порядка) равновероятны. Другими словами, мы вводим следующее предположение. ПРЕДПОЛОЖЕНИЕ. ЗНАНИЕ ЛИШЬ НЕУПОРЯДОЧЕННОГО МНОЖЕСТВА ИМЕН ПРАВИЛЬНОГО ХРОНОЛОГИЧЕСКОГО СПИСКА Х НЕ МОЖЕТ НЕСТИ В СЕБЕ НИКАКОЙ ИНФОРМАЦИИ О ПОРЯДКЕ СЛЕДОВАНИЯ ЭТИХ ИМЕН В СПИСКЕ Х. В этом предположении справедлива следующая лемма. ЛЕММА 1. Пусть дан правильный хронологический список Х. Предположим, что максимальная кратность имени в этом списке, а также параметр p (длина связывающей окрестности) много меньше длины списка Х. Тогда среднее значение ненормированной связи двух имен u_i и u_j, входящих в список Х с кратностями k_i и k_j соответственно, пропорционально числу З | k_ik_j при iЬj, c(u_i, u_j) = c(k_i, k_j) = { | k_i(k_i-1)/2 при i=j. Ю ДОКАЗАТЕЛЬСТВО. а) Рассмотрим случай iЬj. Схему равновероятных размещений имен в списке Х можно представить как итог последовательного размещения n имен по n местам в списке. При этом, каждое имя равновероятно занимает одно из оставшихся свободными мест. Очередность размещения имен может быть выбрана произвольно, но будучи выбранной должна быть фиксирована. Поэтому можно считать, что перед размещением k_j экземпляров имени u_j все k_i экземпляров имени u_i уже размещены. По предположению, k_i, k_j, p \а<\А n (напомним, что n обозначает длину списка Х). Поэтому числом случаев, когда два экземпляра имени u_i оказались в списке Х рядом (на расстоянии, меньшем, чем p) можно пренебречь по сравнению с общим числом способов размещения k_i экземпляров имени u_i в списке Х. Представим теперь размещение k_j экземпляров имени u_j в виде последовательности испытаний Бернулли, причем успехом в одном испытании будем считать попадание в связывающую окрестность к одному из уже размещенных экземпляров имени u_i. Тогда значение ненормированной связи l_0(u_i, u_j) равно числу успехов в этой схеме Бернулли. Вероятность успеха в одном испытании при этом пропорциональна числу k_i уже размещенных имен u_i (точнее говоря, пренебрегая влиянием случайного перекрытия связывающих окрестностей этих имен, получаем, что эта вероятность равна 2pk_i/n). Общее количество испытаний при этом равно k_j. Среднее число успехов (=среднее значение ненормированной связи l_0(u_i, u_j)) пропорционально произведению вероятности успеха в одном испытании на число испытаний, то есть пропорционально k_ik_j. Это и утверждается в лемме. б) Рассмотрим случай i=j. Выберем последовательность размещения имен таким образом, чтобы сначала размещались все k_i экземпляров имени u_i, а затем -- все остальные имена. Пусть первый экземпляр имени u_i уже размещен. Вероятность того, что при размещении второго экземпляра он попадет в связывающую окрестность к уже размещенному первому экземпляру этого имени, равна 2p/n (здесь мы пренебрегаем вероятностью того, что первый экземпляр попал на самый край списка, и захват его связывающей окрестности оказался меньше, чем 2p, по сравнению с вероятностью того, что это не так). Аналогично, пренебрегая малыми вероятностями перекрытий связывающих окрестностей (слагаемыми второго порядка), получаем, что третий экзеипляр имени u_i попадает в связывающую окрестность к одному из уже размещенных экземпляров с вероятностью 2(2p/n) и т. д. Для i-того экземпляра эта вероятность равно (i-1)2p/n. Введем случайные величины \Вh\А_i (2 \Д<\А i \Д<\А k_i), положив по определению \Вh\А_i=1 если i-й экземпляр имени u_i при своем размещении попал в связывающую окрестность к одному из уже размещенных (i-1) экземпляров этого имени, и \Вh\А_i=0 иначе. Тогда, согласно приведенным рассуждениям, P{\Вh\А_i=1} = (i-1)2p/n, (2 \Д<\А i \Д<\А k_i). Заметим теперь, что число ``встреч'' имен u_i в списке Х (где под встречей понимается попадание пары имен в связывающую окрестность друг к другу) равняется сумме случайных величин \Вh\А_i: k_i l_o(u_i, u_j) = \ВS\А \Вh\А_i. i=2 Следовательно, математическое ожидание (среднее значение) связи l_0(u_i, u_j) равно k_i k_i 2p M[l_0(u_i, u_j)] = M[ \ВS\А \Вh\А_i] = \ВS\А M[\Вh\А_i] = -- (1+... +(k_i-1))= i=2 i=2 n 2p k_i(k_i-1) = -- --------Д. n 2 Дело в том, что математическое ожидание суммы случайных величин равно сумме их математических ожиданий, а M[\Вh\А_i] = P{\Вh\А_i=1} = (i-1)2p/n.) Лемма доказана. СЛЕДСТВИЕ. Среднее значение связи l(u_i, u_j) двух имен, входящих в правильный хронологический список Х, НЕ ЗАВИСИТ от выбора пары имен (u_i, u_j) и, следовательно, является ХАРАКТЕРИСТИКОЙ СПИСКА Х и параметров модели. Это среднее мы будем обозначать через \Ва\А(Х). Из доказательства леммы следует, что \Ва\А(Х) = 2p/n. Генеральное (теоретическое) среднее \Ва\А(Х) мы будем называть СРЕДНИМ ПО РАЗМЕЩЕНИЯМ в отличие от эмпирического СРЕДНЕГО ПО МАТРИЦЕ, получаемого усреднением фактических значений связи пар имен по всем парам имен, входящих в данный список Х. Последнее название объясняется тем, что значения связи пар имен списка естественным образом составляют некоторую квадратую матрицу. ЗАМЕЧАНИЕ. Сформулированное выше предположение aposteriori подтверждается для реальных правильных хронологических списков (летописей) тем, что для них ЭМПИРИЧЕСКОЕ СРЕДНЕЕ ПО МАТРИЦЕ практически совпадает с ГЕНЕРАЛЬНЫМ СРЕДНИМ ПО РАЗМЕЩЕНИЯМ \Ва\А(Х) (вычисленным с помощью этого предположения). Если же список содержит дубликаты, то для него, как показали расчеты, среднее по матрице обычно чуть больше, чем среднее по размещениям. Но различие между этими величинами было НЕВЕЛИКО для всех рассмотренных нами реальных исторических списков. Это -- отражение того обстоятельства, что даже в том случае, когда хронологический список имен содержит дубликаты, доля пар-дубликатов среди общего количества всех пар определяющих окрестностей, обычно невелика. В соответствии с описанной в главе 1 моделью возникновения дубликатов в хронологический списках (см., например, модельную задачу о колодах карт), введем меру связи двух произвольных определяющих окрестностей \ВД\А_r, \ВД\А_s в списке Х. Эта мера отражает количество ``связывающих летописей'' для данной пары отрезков списка, нормированное таким образом, чтобы при отсутствии дубликатов в списке, оно сохраняло бы приблизительно одно и то же значение для всех пар определяющих окрестностей списка Х. Более точно, мера связи двух отрезков списка подбиралась таким образом, чтобы в случае правильного списка (который мы, в соответствии со сделанным предположением, рассматриваем как некоторый случайный элемент) среднее значение этой меры не зависело бы от выбора конкретной пары отрезков, то есть было бы единым для всего списка Х. ОПРЕДЕЛЕНИЕ. Пусть дан хронологический список имен Х и фиксированы параметры модели k и p. Назовем СВЯЗЬЮ ДВУХ ОПРЕДЕЛЯЮЩИХ ОКРЕСТНОСТЕЙ \ВД\А_r и \ВД\А_s списка Х число r+k s+k c \ \ L_0(\ВД\А_r, \ВД\А_s) = -------- l(a_i, a_j). (2k + 1)^2 / / i=r-k j=s-k jЬi Здесь c -- постоянная масштаба, задаваемая из соображений удобства вычислений (мы брали значение c=25). ЛЕММА 2. Если хронологический список имен Х не содержит дубликатов (является правильным) и выполнены предположения Леммы 1, то среднее значение по размещениям для связи L_0(\ВД\А_r, \ВД\А_s) НЕ ЗАВИСИТ от \ВД\А_r и \ВД\А_s и равно c\Ва\А(Х). Доказательство. Утверждение Леммы 2 следует из Леммы 1 и из того, что среднее значение суммы случайных величин равно сумме их средних значений. Заметим, что число слагаемых в двойной сумме, определяющей значение связи L_0(\ВД\А_r, \ВД\А_s), равно множителю (2k + 1)^2, стоящему в знаменателе. Следовательно, среднее значение по размещениям для связи L_0(\ВД\А_r, \ВД\А_s) равняется среднему значению по размещениям для связи l(a_i, a_j), умноженному на c, то есть равно c\Ва\А(Х). Лемма 2 доказана. p3'3'4 4. ЗАВИСИМОСТЬ СВЯЗИ $L_0$ ОТ ЧИСЛА ОБЩИХ ИМЕН В ОПРЕДЕЛЯЮЩИХ ОКРЕСТНОСТЯХ Изучим характер зависимости между величиной связи $L_0$ двух определяющих окрестностей \ВД\А_r и \ВД\А_s и количеством общих имен в этих окрестностях (с учетом кратности вхождения имен в \ВД\А_r и \ВД\А_s). ОПРЕДЕЛЕНИЕ. ЧИСЛОМ ОБЩИХ ИМЕН двух определяющих окрестностей \ВД\А_r(k) и \ВД\А_s(k) в списке Х (с учетом кратностей) назовем число: r+k s+k \ \ O(\ВД\А_r, \ВД\А_s) = \Вд\А(a_i, a_j), / / i=r-k j=s-k где \Вд\А(a_i, a_j)=1 если a_i=a_j (то есть имена a_i и a_j одинаковы) и равно нулю иначе. Другими словами, O(\ВД\А_r, \ВД\А_s) -- это число пар из декартового произведения \ВД\А_r\Иx\ВД\А_s, таких, что в паре стоят одинаковые имена. В рассмотренных нами случаях реальных хронологических списков, описывающих древнюю и средневековую историю Европы, обнаружилось весьма примечательное обстоятельство: ЗНАЧЕНИЯ L_0(\ВД\А_R, \ВД\А_S) И O(\ВД\А_R, \ВД\А_S) СВЯЗАНЫ МЕЖДУ СОБОЙ ТАКИМ ОБРАЗОМ, ЧТО ПРИ УВЕЛИЧЕНИИ O(\ВД\А_R, \ВД\А_S) УВЕЛИЧИВАЕТСЯ (В СТАТИСТИЧЕСКОМ СМЫСЛЕ) И L_0(\ВД\А_R, \ВД\А_S). Этот вывод был получен на основе сравнения гистограмм частот значений L_0(\ВД\А_r, \ВД\А_s) при условии, что значение O(\ВД\А_r, \ВД\А_s) фиксировано.) Может показаться, что значение связи L_0(\ВД\А_r, \ВД\А_s) увеличивается при увеличении O(\ВД\А_r, \ВД\А_s) непосредственно за счет общих имен в \ВД\А_r и \ВД\А_s (механизмы, приводящие к такому увеличению даже в правильных списках действительно существуют, но они очень слабы). Однако это не так. Чтобы показать это, введем еще две меры связи определяющих окрестностей \ВД\А_r и \ВД\А_s в хронологическом списке Х. Пусть дана пара определяющих окрестностей \ВД\А_r и \ВД\А_s в списке Х. Определим соответствующие РАЗРЕЖЕННЫЕ ОПРЕДЕЛЯЮЩИЕ ОКРЕСТНОСТИ следующим образом: \ВД\А'_r= {множество различных имен из \ВД\А_r}; \ВД\А'_s= {множество различных имен из \ВД\А_s}; \ВД\А''_{r, s} = {множество имен из \ВД\А'_r, не совпадающих ни с какими именами из \ВД\А_s}; Таким образом, окрестности \ВД\А_r, \ВД\А'_s и \ВД\А''_{r, s} разрежены таким образом, что в них не осталось различных имен. Кроме того, окрестность \ВД\А_{r, s} не содержит имен, общих с \ВД\А_s или с \ВД\А'_s. ОПРЕДЕЛЕНИЕ. Положим c \ L_1(\ВД\А_r, \ВД\А_s) = --------Д l(a, b), / |\ВД\А'_r|\Иx\А|\ВД\А'_s| a\ВEД\А_r, b\ВEД\А'_s c \ L (\ВД\А_r, \ВД\А_s) = ----------Д l(a, b). 2 / |\ВД\А''_{r, s}|\Иx\А|\ВД\А'_s| a\ВEД\А''_{r, s}, b\ВEД\А'_s Здесь через |ч| обозначена длина (разреженной) определяющей окрестности, то есть число имен в ней. Легко проверить, что определенная таким образом величина связи L_2 НЕ ЗАВИСИТ ОТ ПОРЯДКА определяющих окрестностей: L_2(\ВД\А_r, \ВД\А_s) = L_2(\ВД\А_s, \ВД\А_r). Величина связи L_2(\ВД\А_r, \ВД\А_s) уже не связана напрямую с общими именами в \ВД\А_r и \ВД\А_s -- эти имена в ее определении вообще не участвуют. Оказалось однако, что для реальных списков, относящихся к древней и средневековой истории Европы, зависимость связи L_2(\ВД\А_r, \ВД\А_s) от O(\ВД\А_r, \ВД\А_s) остается прежней (такой же, как и описанная выше зависимость L_0(\ВД\А_r, \ВД\А_s) от O(\ВД\А_r, \ВД\А_s) ). То же верно и для связи L_1(\ВД\А_r, \ВД\А_s). Итак, в примерах, относящихся к древней и средневековой истории Европы (о них -- ниже) было обнаружено, что в основе двух внешне не связанных друг с другом величин L_2(\ВД\А_r, \ВД\А_s) и O(\ВД\А_r, \ВД\А_s) лежит некий общий фактор (общая причина), приводящий к их статистической зависимости. Таким фактором может являться наличие дубликатовв хронологических списках имен. В самом деле, как было показано выше, дублирующие друг друга определяющие окрестности в хронологическом списке имеют (в среднем) повышенное значение связи L_0. То же верно и для связей L_1, L_2. Но с другой стороны, и значение O(\ВД\А_r, \ВД\А_s) для них должно быть в среднем выше, чем для пар независимых определяющих окрестностей, так как дубликаты иногда (не далеко не всегда! ) используют одни и те же имена (точнее: использут одинаковые имена чаще, чем недубликаты, что и приводит к повышению значения O(\ВД\А_r, \ВД\А_s) ). Таким образом, присутствие в списке Х дубликатов приводит к прямой зависимости (в статистическом смысле) величины L_2(\ВД\А_r, \ВД\А_s) от O(\ВД\А_r, \ВД\А_s). Эту зависимость мы и обнаруживаем в упомянутых примерах. ЗАМЕЧАНИЕ. Может показаться, что для различения дубликатов в хронологических списках можно было бы использовать значения O(\ВД\А_r, \ВД\А_s) с тем же успехом, что и L_0(\ВД\А_r, \ВД\А_s). Отметим, что подсчет O(\ВД\А_r, \ВД\А_s) вычислительных сложностей не представляет какова бы ни была длина списка (т. к. сложность его вычисления вообще не зависит от длины списка). Между тем, вычисление связей L_0, L_1 или L_2 для реальных списков, которые содержат сотни и тысячи имен, требует многочасовых вычислений на современных ЭВМ (сложность их вычисления пропорциональна квадрату длины списка). Однако, использование O(\ВД\А_r, \ВД\А_s) в качестве меры связи отрезков списка, дает слишком ``зашумленную'' картину и не позволяет, в реальных примерах, надежно определить дубликаты в нем. Дело в следующем. Если O(\ВД\А_r, \ВД\А_s) велико, то, как правило, велико и значение L_0, L_1 или L_2. Но обратное верно далеко не всегда. При больших значениях связи L_0, L_1 или L_2 соответствующее значение O(\ВД\А_r, \ВД\А_s) часто оказывается небольшим. Это означает, что дубликаты в значительной доле случаев используют РАЗЛИЧНЫЕ имена для обозначения одних и тех же деятелей (иначе они были бы все видны ``на глаз''). Использование же связей типа L_0 позволяет ``выжать'' из хронологического списка ту информацию о его структуре, которая на глаз не видна и определить дубликаты даже в том случае если все имена, используемые в них, попарно различны. Для всех рассмотренных нами хронологических списков использование связей L_0, L_1 и L_2 приводило к одному и тому же виду ответа (обнаруживались одни и те же системы дубликатов). Поэтому мы будем иногда говорить просто о связи L, подразумевая под этим одну из связей L_0, L_1 или L_2. p3'3'5 5. РАЗЛИЧЕНИЕ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ПАР ОПРЕДЕЛЯЮЩИХ ОКРЕСТНОСТЕЙ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ ИМЕН Перейдем к описанию способа определения порогов в множестве значений связи $L(\Delta_r, \Delta_s)$, разделяющих зависимые и независимые пары определяющих окрестностей $\Delta_r, \Delta_s$. Приводимые ниже рассуждения имеют КАЧЕСТВЕННЫЙ характер. Они оправдываются aposteriori, так как позволяют получить более четкую картину структуры списка. Важно, что наиболее существенные черты этой картины оказываются (во всех рассмотренных нами реальных примерах) нечуствительными не только к выбору параметров модели $k$ и $p$ (а также к приведенным выше изменениям в определении самой связи, что уже отмечалось), но и к колебаниям указанных порогов. Пусть дан хронологический список имен Х. Зафиксируем для него параметры модели $(k, p)$ и построим набор гистограмм частот появления значений связи $L_0(\Delta_r, \Delta_s)$ ($L_1$ или $L_2$), при условии, что значение $O(\Delta_r, \Delta_s)$ постоянно (для каждой из гистограмм оно свое). В рассмотренных нами реальных списках все эти гистограммы имели вид приблизительно как на рис. 28. В КАЧЕСТВЕ ЗНАЧЕНИЯ ПОРОГА, ОТДЕЛЯЮЩЕГО СВЯЗЬ $L_0$ ($L_1$, $L_2$) ДЛЯ НЕЗАВИСИМЫХ ПАР ОПРЕДЕЛЯЮЩИХ ОКРЕСТНОСТЕЙ $(\Delta_R, \Delta_S)$ ОТ СВЯЗИ ДЛЯ ЗАВИСИМЫХ ПАР $(\Delta_R, \Delta_S)$ ВОЗЬМЕМ НАИМЕНЬШЕЕ ЗНАЧЕНИЕ, ПРИ КОТОРОМ СООТВЕТСТВУЮЩАЯ ГИСТОГРАММА ПАДАЕТ ДО НУЛЯ (ЭТО ЗНАЧЕНИЕ ДЛЯ КАЖДОЙ ПАРЫ $(\Delta_R, \Delta_S)$, ВООБЩЕ ГОВОРЯ, СВОЕ, Т. К. ОНО ЗАВИСИТ ОТ ВЕЛИЧИНЫ $O(\Delta_R, \Delta_S)$). Связь, превосходящую такой порог, будем называть СУЩЕСТВЕННОЙ связью, а связь, не превосходящую его - НЕСУЩЕСТВЕННОЙ связью. ОПРЕДЕЛЕНИЕ. МАТРИЦЕЙ СВЯЗЕЙ $M(k, p, L_i, Х)$, $0\lei\le2$, хронологического списка имен Х называется построенная по этому списку квадратная верхнетреугольная матрица размера $(n-k)\times(n-k)$, в ячейке $(r, s)$ которой стоит значение $$ M_{r, s} = \cases L_i(\Delta_r, \Delta_s), & \text{если связь $L_i(\Delta_r, \Delta_s)$ определяющих} \\ & \text{окрестностей $\Delta_r$ и $\Delta_s$ существенна и $r\le s$;} 0, & \text{в противном случае. } \endcases $$ p3'4'1 Глава 4. ИССЛЕДОВАНИЕ ХРОНОЛОГИИ
ОСНОВЕ СТАТИСТИЧЕСКОГО АНАЛИЗА СПИСКОВ ИМЕН 1. СПИСОК ИМЕН ИМПЕРАТОРОВ РИМА 1. 1. ОПИСАНИЕ СПИСКА ``РИ'' Список имен римских императоров был составлен А. Т. Фоменко по [15]. Этот список является хронологическим перечнем всех известных сегодня имен и прозвищ всех императоров и фактических правителей следующих ``Римских'' империй: 1. Царского Рима, традиционная датировка которого: VIII век до н. э. -- VI век до н. э. Основным источником по истории Царского Рима считается ``История Рима от основания Города'' Тита Ливия. Считается, что столицей этой империи был город Рим в Италии. 2. Античной Римской империи, основанной Суллой, Помпеем, Юлием Цезарем и Августом. Традиционная датировка: I век н. э. - III век н. э. Столицей этой империи считается также итальянский Рим. 3. Средневековой Римской империи III-V вв. н. э., якобы - также в итальянском Риме. Эта империя была основана Аврелианом и разрушена в результате ``нашествия варваров'', датируемого в скалигеровской хронологии V веком н. э. 4. Римской империи Каролингов. Каролинги именовались римскими императорами и короновались в Риме. Якобы, -- в итальянском. Столица Каролингов располагалась вне Италии, в городе ``Ахене''. 5. Священной римской империи германской нации. Традиционная датировка -- X-XIII века н. э. Императоры этой империи - Гогенштауфены, -- были германскими императорами, но они именовались ``римскими'' и короновались в Риме. 6. Империи Габсбургов XIII-XVIII веков. Габсбурги также именовались римскими императорами, хотя имели свою столицу в Австрии, в Вене. Считается, что перечисленные империи продолжали одна другую как ``римские'' империи. Нам сообщают, что все их императоры именовались ``римскими'' и по большей части короновались в итальянском Риме. Поэтому имена этих императоров естественным образом выстраиваются в единый хронологический список ``имен римских императоров''. Мы будем иногда называть этот список для краткости списком РИ. Таким образом, рассматриваемый здесь список имен римских императоров (список РИ) начинается с Ромула -- легендарного основателя Царского Рима и кончается Габсбургами середины XVIII века. Этот список имеет два хронологических разрыва. Дело в том, что были периоды времени, когда, согласно скалигеровской хронологии, ``римских императоров'' (то есть императоров Западного, итальянского Рима) вообще не было. Таких периодов -- два. В эти периоды Скалигер помещает две римские республики: 1. знаменитую античную республику VI в. до н. э. -- I в. до н. э., начавшуюся после падения Царского Рима и закончившуюся при Сулле; 2. средневековую римскую республику VI-VII веков н. э., так называемый ``папский Рим''. Таким образом, в списке РИ возникает две больших лакуны. Это затрудняет нормировку списка и делает ее неоднозначной. Напомним, что при применении методики гистограмм частот разнесений связанных имен, хронологический список предварительно нормируется. Если только он не оказался равномерно плотным с самого начала. Нормировка необходима для того, чтобы безусловное распределение случайной величины $\zeta$ имело линейную гистограмму частот. То есть линейную функцию плотности распределения. Эта линейность значительно упрощает качественный анализ гистограмм частот разнесений связанных имен, на основе которого определяются величины сдвигов между статистическими дубликатами в том или ином хронологическом списке. Поскольку список РИ не может быть однозначно нормирован, мы вообще не будем нормировать его. Вместо этого, наряду с гистограммами частот связанных имен для списка РИ каждый раз будет приводиться для сравнения и соответствующая гистограмма безусловного распределения случайной величины $\zeta$, которая в этом случае не будет линейной. 1. 2. АНАЛИЗ ГИСТОГРАММ ЧАСТОТ РАЗНЕСЕНИЙ СВЯЗАННЫХ ИМЕН ДЛЯ СПИСКА РИМСКИХ ИМПЕРАТОРОВ ``РИ'' И ОТДЕЛЬНЫХ ЕГО ЧАСТЕЙ На рис. 28 приведена гистограмма частот разнесений имен-ровесников $f_2(x)$ и для сравнения -- гистограмма $f_1(x)$ безусловного распределения $\zeta$ (пунктирная линия). При этом размер главы взят равным 30 годам. Радиус затухания зависимости в списке взят равным 90 годам. Таким образом, $\epsilon = 90$ лет (или 3 главы по 30 лет). 1. 2. 1. СДВИГИ НА 240 И 800 ЛЕТ В СПИСКЕ РИМСКИХ ИМПЕРАТОРОВ Из гистограммы на рис. 28 следует, что список римских императоров содержит статистические дубликаты. Ясно выделяются два сдвига, величины которых легко определить по резким всплескам графика $f_2(x)$ по сравнению с $f_1(x)$. Отметим, что поскольку список РИ не нормирован, то имеют смысл лишь относительные всплески -- по сравнению с гистограммой $f_1(x)$ безусловного распределения. Это -- сдвиги на 240 и 800 лет (приблизительно). См. рис. 28. Второй из них отвечает 780-летнему сдвигу -- одному из основных сдвигов в скалигеровской хронологии, обнаруженному А. Т. Фоменко [2], [20]. Что касается двух других основных хронологических сдвигов на 330 и 1050 лет, то сдвиг на 330 лет на рис. 28 не выражен, а сдвиг на 1050 лет выражен слабо. Это, конечно, не означает, что эти сдвиги не присутствуют в списке РИ. Просто в данном случае они не обнаруживаются примененной методикой. И понятно -- почему. Дело в том, что самое большое скопление имен императоров на хронологической оси приходится в римской истории на III век новой эры -- время многократных императорских соправлений. Поэтому именно в III веке и ``родилось'' большинство имен списка. Это привело к тому, что гистограмма частот разнесений имен-ровесников улавливает в наибольшей степени хронологические разнесения между дубликатами эпохи III века, а разнесения между дубликатами других эпох она улавливает существенно слабее (может и вовсе не отразить их). Ниже, при рассмотрении частных гистограмм частот разнесений связанных имен для списка РИ, мы увидим и другие сдвиги, не видные на общей гистограмме. Как мы теперь понимаем (см. [23]), при создании в XIV-XVII веках неправильной, искусственно удлиненой за счет дублирования событий, хронологии всемирной истории, в первую очередь (наиболее часто) дублировались евангельские события XI века и современные им. Эти дубликаты евангельской эпохи XI века новой эры довольно густо заполняют знакомую нам из школы скалигеровскую античную и средневековую историю. Например, в период II-III веков н. э. дубликат евангельской эпохи расположен приблизительно в 240 году новой эры. Это, естественно, сразу же отражается в списке имен римских императоров и фактических правителей Рима -- около 240 года там появляется ``Юлия Меса'', то есть ``Солнце Мессия'' -- одно из наименований Христа. При этом сама биография женщины-правительницы ``Юлии Месы'', сочиненная средневековыми историками, с биографией Христа ничего общего не имеет и отражает совсем другие события евангельской же эпохи -- но ИМЯ Христа попало и императорский список именно благодаря этому персонажу. Таковы пути перемещения информации в хаосе средневековой исторической неразберихи. Далее, система дубликатов в списке РИ, сцепленная с отрезком списка III века новой эры, как уже было отмечено, в основном определяет вид гистограммы частот разнесений имен-ровесников ДЛЯ ВСЕГО списка РИ. Поскольку в III век попадает дубликат евангельской эпохи, то наиболее заметными сдвигами оказываются его хронологическое расстояние от оригинала. А именно, первое расстояние составляет примерно 800 лет, потому что отсчитывая от середины XI века получим 1050-240=810. А второе расстояние равно примерно 240. В самом деле, отсчитывая от эпохи, куда ошибочно отнесли Христа, получим около 240 лет. Это есть разность между 240 и нулем -- началом новой эры, которым датируется рождение Христа в скалигеровской хронологии. Эти два сдвига -- на 240 и на 800 лет мы и видим на гистограмме частот разнесений имен-ровесников для списка РИ (см. рис. 28). Они четко выделяются на графике, имеющем два резких всплеска на значениях разнесения 240 и 780-810 лет. 1. 2. 2. ДУБЛИКАТЫ ГОТСКО-ТРОЯНСКОЙ ВОЙНЫ ЯВЛЯЮТСЯ НАИБОЛЕЕ ЯРКИМИ А. Т. Фоменко [2], [20] было обнаружено, что наиболее массивными дубликатами в скалигеровской хронологии европейской истории являются дубликаты серии ``МТ'', то есть дубликаты готско-троянской войны. Эти дубликаты расположены как правило в начале и в конце всех древних и средневековых ``Римских империй''. Естественно ожидать, что они дадут основной вклад и во всплески на гистограммах частот разнесений связанных имен. Проиллюстрируем это на примере пары дублирующих друг друга римских империй -- античной империи Iв. до н. э. -- IIIв. н. э. и средневековой империи III-Vвв. н. э. Напомним, что в начале первой из них стоят имена Суллы, Помпея, Цезаря и Августа, а в начале второй -- Аврелиана, Диоклетиана, Констанция Хлора и Константина Великого. На рис. 29 приведено для сравнения два графика. На них изображены ыгистограммы частот разнесений имен-ровесников для различных частей списка РИ. В первом случае была взята часть списка 80 г. до н. э. -- 560г. н. э., охватывающая целиком обе указанные выше дублирующие друг друга римские империи. См. график слева. Отметим, что в этом случае гистограмма на рис. 29 четко показывает сдвиг между этими двумя империями -- он равен приблизительно 240-270 лет. Во втором случае была та же часть списка, но за исключением начальной (80-20 гг. до н. э.) и конечной (VI в. н. э.) эпох, несущих основную информацию о готско-троянских войнах в начале первой и в конце второй из указанной пары римских империй. Хорошо видно, как в результате этого исключения, гистограмма перестала ``чувствовать'' сдвиг. Она приняла вид, характерный для списков без дубликатов. См. правый график на рис. 29. 1. 2. 3. РИМСКАЯ ИСТОРИЯ 750-1750 годов Проанализируем более подробно конец списка римских императоров. Если рассмотреть лишь часть этого списка, расположенную после средневековой римской республики VI-VII вв., то лакун в этой части списка уже не будет (они будут отрезаны). Эта часть списка РИ заключена в хронологических границах 750-1750 гг. Она оказывается достаточно равномерной на хронологической шкале -- как показали расчеты, гистограмма частот безусловного распределения случайной величины $\zeta$ для нее практически линейна. Гистограмма частот разнесений имен ровесников (график $f_2(x)$) для указанной части списка РИ приведена на рис. 30. Видно, что в этой части списка есть дубликаты со сдвигом на 330 лет. См. рис. 30. Гистограмма ``чувствует'' также и сдвиг приблизительно на 500 лет, тоже очень характерный для римской истории этого периода [2]. 1. 2. 4. ГАБСБУРГИ Возьмем теперь империю Габсбургов XIV-XVII веков и проанализируем ее отдельно. На рис. 31 представлены два графика: 1) $f_1(x)$ -- безусловное распределение случайной величины $\zeta$ для Габсбургов (пунктир на рис. 31). Список Габсбургов не был нормирован, поэтому эта гистограмма не является линейной. 2) $f_2(x)$ -- гистограмма частот разнесений имен-ровесников для Габсбургов (сплошная линия на рис 31). Резкое различие гистограмм $f_1$ и $f_2$ свидетельствует о том, что даже в этой, достаточно поздней эпохе римской истории присутствуют статистические дубликаты. Наиболее характерный хронологический сдвиг между ними -- около 150 лет. См. рис. 31. Возможно, это говорит о том, что XIV век в истории Габсбургов является частичным отражением более поздней эпохи их истории -- второй половины XV -- первой половины XVI веков (со сдвигом на 150 лет вверх). Это не исключено, поскольку в начале XV века в истории проходит граница, значение которой становится понятным только теперь. Это -- так называемая ``великая схизма'' в истории якобы только латинской католической церкви. В скалигеровской хронологии в этом месте осталось только громкое название -- ``великая схизма'', то есть ``великий церковный раскол''. И -- никаких, оправдывающих это название, крупных событий. Согласно же нашей реконструкции истории, ИМЕННО В ЭТО ВРЕМЯ произошло крупнейшее событие, во многом определившее дальнейший ход истории -- РАСКОЛ ЦЕРКВЕЙ. См. нашу реконструкцию в основном тексте книги, а также [23]. Историю, бывшую до раскола, потом наверняка долго и усердно ``исправляли''. Это, в частности, относится и к истории Габсбургов. Окончательно она была написана, видимо, уже в конце XVI-XVII веках, то есть через 150-200 лет после раскола. При этом в свою ``дораскольную'' (уже забытую или же казавшуюся им ``неправильной'') историю Габсбурги, по-видимому, добавили кое-что из своей более поздней ``правильной'' истории. В результате мы и видим резкий всплеск на рис. 31. Любопытно сравнить рис. 31 с аналогичной гистограммой для Византийской империи примерно той же эпохи. См. ниже рис. 41. Мы видим, что у византийцев, начиная с XIII века более или менее все в порядке с хронологией -- по крайней мере в списке имен византийских императоров статистические дубликаты не обнаруживаются уже начиная с XIII века. См. рис. 41 и 42 ниже. В то же время, в списке Габсбургов статистические дубликаты пропадают лишь после 1500 года. Это мы отчетливо увидим ниже, при рассмотрении матрицы связей для списка имен римских императоров. См. рис. 35 ниже. Но предварительный вывод можно сделать уже из анализа рис. 31. В самом деле, 150-летний сдвиг, бросающийся в глаза на рис. 31, делит хронологический период 1300-1650 гг. (по которому построен график) приблизительно пополам. Таким, образом, первая половина списка Габсбургов со сдвигом на 150 лет дублирует (в статитистическом смысле) его вторую половину. Хронологическая граница между этими половинами должна проходить где-то около середины этого периода (1475 г.), то есть приблизительно в 1500 г. 1. 2. 5. ЧАСТНЫЕ ГИСТОГРАММЫ ДЛЯ СПИСКА РИМСКИХ ИМПЕРАТОРОВ. ХРОНОЛОГИЧЕСКИе СДВИГИ В СПИСКЕ Для более детального изучения системы хронологических сдвигов между статистическими дубликатами списка римских императоров, построим для его частей частные гистограммы частот разнесений имен-ровесников. Напомним, что мы определили частную гистограмму списка как гистограмму, в которой учитываются не все разнесения имен-ровесников (например), а только те из них, которые оказались связанными (в нашем случае -- ``вместе родились'', вошли в список впервые одновременно, в одной и той же главе) в какой-то определенной части списка. При этом, разнесения ищутся по всему списку. По таким частным гистограммам легче определять сдвиги, характерные для дубликатов, ``сцепленных'' с той или иной частью списка, поскольку сдвиги между другими дубликатами они ``не чувствуют''. На рис. 32 -- 34 приведены частные гистограммы частот разнесений имен-ровесников для списка РИ. Для их расчета были выбраны следующие части списка РИ. 1) Период 753 г. до н. э. -- 50 г. н. э. См. рис. 32. 2) Период 50 г. н. э. -- 870 г. н. э. См. рис. 33. 3) Период 870 г. н. э. -- 1750 г. н. э. См. рис. 34. Из рис. 32 следует, что дубликаты глав, расположенных в начале списка (эти главы соответствуют ``Царскому Риму'' Тита Ливия), имеют систему сдвигов, практически совпадающую с системой трех основных сдвигов, обнаруженных А. Т. Фоменко [4] в европейской традиционной (скалигеровской) истории. Отметим, что эти сдвиги были обнаружены А. Т. Фоменко в результате статистического анализа данных совершенно другой природы. А именно -- длительностей правления. Мы же здесь рассматриваем только имена правителей. Таким образом, СТАТИСТИЧЕСКИЙ АНАЛИЗ СОВЕРШЕННО НЕ ЗАВИСИМЫХ МЕЖДУ СОБОЙ ДАННЫХ ПРИВОДИТ К ОДНОМУ И ТОМУ ЖЕ РЕЗУЛЬТАТУ. Это -- сдвиги на 330, 780 и 1050 лет (приблизительно). См. рис. 32. Проявляет себя и сдвиг на 240 лет, который мы видели выше при анализе общего графика. См. рис. 28. Он оказывается характерным для античной и ранне-средневековой римской истории. См. рис. 28, 32, 33. Возможное происхождение этого сдвига мы уже подробно обсуждали выше, при рассмотрении общей гистограммы разнесений. Для римской истории после IX века н. э. (в той мере, в какой она отражена в списке имен императоров) наиболее характерным является хронологический сдвиг на 300 лет. См. рис. 34. По-видимому, это -- сдвиг между эпохой XIII-XVI вв. и частично дублирующей ее эпохой X-XIII вв. Отметим, что соответствующий этому сдвиги параллелизм в римской истории, обнаруженный А. Т. Фоменко [2], [20], является одним из основных параллелезмов статистической хронологии. Система дубликатов, сцепленных с ранне-средневековой римской историей, имеет более сложную структуру. См. рис. 33. Хронологические сдвиги в этой системе дубликатов равны приблизительно 250, 650, 900, 1150 и 1250 лет. Обсудим их вкратце. Первый сдвиг -- на 250 лет мы уже подробно обсуждали выше. Этот сдвиг отмечен наиболее массивным всплеском на рис. 33. Сдвиги на 650 и 900 лет, возможно, являются, разностями: они получаются если из основных сдвигов на 780 и 1050 лет вычесть приблизительно 100-летний ``византийский'' сдвиг (см. ниже), присутствующий и в римской истории. Дело в том, что между римской и византийской историей нами также обнаружен был статистический параллелизм. Например -- между римской историей I-IV веков н. э. и византийской историей VIII-IX веков. Сдвиг на 1250 лет (приблизительно) накладывает римскую историю начала новой эры на события конца XIII века, то есть на оригинал готско-троянской войны. Это -- очень яркий параллелизм в римской истории, обнаруженный А. Т. Фоменко [2], [20]. Список имен римских императоров ``чувствует'' этот параллелизм, что и отражается в виде резкого вспеска на рис. 33. 1. 3. МАТРИЦА СВЯЗЕЙ ДЛЯ СПИСКА РИМСКИХ ИМПЕРАТОРОВ И ЕГО РАЗЛОЖЕНИЕ НА СОСТАВЛЯЮЩИЕ ХРОНИКИ Определения матрицы связей для хронологического списка и других, относящихся к таким матрицам понятий, были даны выше. Матрица связей для списка имен Римских императоров представлена в условном виде на рис. 35. Черным цыетом отмечены максимальные значения связи. Области в матрице, седержащие