[an error occurred while processing the directive]  
[an error occurred while processing the directive]   [an error occurred while processing the directive]

Гипотезы, предположения, факты

ЗАКОН НЕЧЕТНОСТИ ЧИСЛА БУКВ В РУССКИХ ПАЛИНДРОМАХ

Палиндромы (в переводе с греческого - бегущие назад), то есть слова и предложения, которые читаются одинаково как слева направо, так и справа налево, известны с античных времен. Они породили особый литературный жанр - палиндроматику. Ему отдали дань Гаврила Державин, Афанасий Фет, Валерий Брюсов и многие другие поэты и писатели. Сегодня этот жанр по-прежнему популярен (см. "Наука и жизнь" № 9, 1970 г.; №№ 2, 5, 1998 г.; № 2, 2003 г.). Но палиндромы - это не просто литературное развлечение. Предстоит еще понять законы их образования, способные привести к появлению новых идей в информационных технологиях.

О палиндромах теперь знает едва ли не каждый читатель. Уже вышли десятки книг, целиком состоящие из палиндромных произведений. Многие тысячи строк-палиндромов "висят" в Интернете. Кажется, уже даже защищена докторская диссертация (А. Бубновым), посвященная палиндромам. И тем удивительнее, что в этой особой литературно-лингвистической форме вдруг открываются неожиданные свойства, достаточно простые для наблюдения, но пока незамеченные и потому неисследованные (это подтвердила координатор Справочного центра Института русского языка имени В. Виноградова кандидат филологических наук О. Грунченко). Итак, покажем, что для русских палиндромов выполняется "закон нечетности числа букв", совершенно нехарактерный для обычных слов или фраз.


Частотное распределение слов-палиндромов русского языка (синяя линия), иллюстрирующая "закон нечетности числа букв" n в словах-палиндромах. N - относительная частота слов. Красным показана гистограмма обычных слов.

В качестве исходного материала рассмотрим Список слов-палиндромов , в котором собрана, по-видимому, подавляющая часть слов этого вида (включая производные формы), имеющихся в основном лексиконе русского языка, который насчитывает примерно 130 тысяч лексем. Источниками Списка послужили словарик из Антологии русского палиндрома [Антология , 2002, с.136] и коллекция автора. В Список из примерно 130 слов-палиндромов не вошли имена собственные, редко употребляемые в русском языке: географические названия (Яя, Анна и др.), иностранные фамилии и имена (Отто, Ала, Кук и т.п.), редко употребляемые сокращения и слова, где приравнены е и ё. В то же время в него включены примеры неологизмов, которые все чаще встречаются в палиндромных стихах и удачно отражают поэтические образы, например, девовед, икотопотоки, слова из молодежного жаргона (лабал, лажал), несколько распространенных сокращений (СОС, СЭС, РСФСР), известные имена и названия (Аза, Азиза, Асса), а также научно-технические термины (кек, тартрат). Это сделано, чтобы показать потенциальные возможности некоторого расширения Списка слов-палиндромов и одновременно продемонстрировать, что указанный ресурс в целом подчиняется "закону нечетности". Ввиду особого интереса к образованию подобных новословий-палиндромов они помещены также и в Дополнительный список, заимствованный из Антологии с минимальной корректировкой.

Первый неожиданный результат был получен при частотном анализе распределения слов по числу букв. Почти все слова-палиндромы русского языка насчитывают нечетное число букв, от 1 до 11 (синие линии на гистограмме). Ничего подобного нет среди обычных, то есть несимметричных, слов (красные линии на гистограмме, демонстрирующие частотность слов, взятой из Частотного словаря русского языка, 1977, с.930). Гистограммы различаются настолько разительно, что нет смысла приводить математические выкладки по проверке статистической гипотезы о значимости указанного различия. Хотя сделать это несложно, и можно показать, что риск ошибки в сделанном выводе не превышает 0,01%.

Интереснее и сложнее вопрос о том, какому теоретическому закону распределения подчиняется объединение букв в симметричные слова. Как видно из колоколообразной сглаживающей кривой на графике из Частотного словаря, распределение обычных слов в основном словаре (не в текстах!) русского языка подчиняется нормальному (гауссовскому) закону распределения (см. "Наука и жизнь" № 2, 1995 г.). Математическое ожидание (среднее число) составляет приблизительно 9 букв. Между тем у слов-палиндромов оно равно 4,1 буквы, а среднее квадратичное отклонение (СКО) составляет 1,7 буквы. Эмпирический закон зафиксирован, но его математическое описание, моделирование или хотя бы аналитическая подгонка требуют специального исследования. Ведь этот закон явно не соответствует ни природе появления случайного события (сложение букв в слово-палиндром), ни внешнему подобию основным законам распределения, изучаемым в курсах математической статистики (равномерному, показательному, пуассоновскому, геометрическому и гипергеометрическому). Ясно только, что будущая формула закона должна содержать множитель (-1)2п-1 и асимптотический член, возможно экспоненциальный, быстро стремящийся к нулю при n → ∞ , где n - число букв в слове.


Основной список слов-палиндромов (включая предлоги, союзы, частицы, стандартные междометия, имена собственные с учетом падежей, глаголы с учетом спряжения и времен, а также некоторые распространенные сокращения; е≠ё).

Простейшее лингвистическое (хотя и явно недостаточное) объяснение наблюдаемого "закона нечетности" можно предложить, рассмотрев противоположную (чисто умозрительную) гипотезу. Допустим, что в языке частотность симметричных слов с четным и нечетным числом букв была бы одного порядка. Тогда в словах с четным числом букв существовали бы десятки слов со сдвоенным центром в виде двух одинаковых гласных или же согласных. И действительно, таких слов немало: баллон, галлон, перрон, зуммер, триггер, выжжен, поддав, веер, леер, пиит и т. д. Только вот палиндромов среди них почти нет, кроме, пожалуй, слов массам и устаревшего итти, а также имен собственных Анна, Алла, АССА, Отто. Еще менее характерны сдвоенные гласные: с натяжкой можно привести единственный пример еле-еле, в котором центром служит дефис, а не двойная гласная. Между тем подобные гласные характерны, например, для голландского и эстонского языков и несколько менее - для английского (пооп, deed, sees). Сдвоенные гласные, по-видимому, вообще нехарактерны для славянских языков. Любопытно, что и среди трех дюжин искусственных слов-неологизмов содержится всего лишь одно слово-палиндром с четным числом букв - ИНООНИ.

Итак, "закон нечетности" распространяется исключительно на буквенно-симметричные словоформы, то есть на палиндромы! Однако, разумеется, это утверждение требует более строгой математико-лингвистической проверки путем подсчета слов со сдвоенным центром, имеющих как четное, так и нечетное число букв.

Замечательно, что действие "закона нечетности" распространяется не только на слова, но и на палиндромные фразы и более сложные тексты. Случайная выборка из 114 фраз у 33 авторов показала, что их доля с четным числом букв составляет 12,3%. У классика жанра Д. Авалиани она равна 13,5% в выборке из 200 фраз. Отсюда средняя доля центро-симметричных фраз, то есть фраз с центральной буквой, близка к 88% (тоже, кстати, цифровой палиндром!).

Отметим, что в число относительно редких четнобуквенных палиндромов входит класс "оборотней" - редкой разновидности палиндромов, обе половины которых имеют равное число букв и представляют собой законченные в смысловом отношении фразы, иногда совершенно несвязанные по смыслу. И это порой придает им неожиданную пикантность. Широко известен классический оборотень На Ритке снег. Генсек - тиран (С. Федин). Еще примеры: На вид Лавр опытен = Не ты порвал диван? / Лечу, сев на руле. - На в лоб! = Болван ел уран, вес учел (Б. Горобец).

Естественен вопрос: а для чего все это нужно? Законы словообразования (если они действительно законы, выраженные количественно) действуют специфично и объективно на данное множество элементов, помогают формировать ту научную базу данных, которая необходима для создания и совершенствования новых информационных технологий, в частности кодирования и декодирования сообщений, переводов, распознавания образов (слов, слогов) в сигнале на фоне шума. И здесь нужны сведения о частотности слов в речи и литературе различных стилей. Эту работу еще предстоит выполнить.

Список новословий-палиндромов

Амфирифма
Сологолос
(В. Рыбинский)

Анархоохрана
Микрозорким
Маревоверам
Суперэпус
Синепенис
Трах-арт
Тревыверт
(В. Гершуни)

Лохохохол
(Джети)
Автоботва
Аквалавка
Пракарп
Ретропортер
(Б. Гринберг)

Оленинело
(Ю. Телесин)

Девовед
Монгологном
Мордодром
(В. Хромов)

Икотопотоки
(Л. Адрианов)

Артсестра
Иноони
(Г. Лукомников)

Коненок
(К. Соприцкий)

Киторотик
(П. Нагорских)

Речевечер
(С. Красовицкий)

МакроЛоркам
МикроГорьким
Сотанатос
Солововолос
(С. Федин)

Тревоговерт
(Д. Минский)

Китокотик
Лифонофил (лифон жарг.- лифчик)
Недороден
Ротомотор
(Б. Горобец)

Конещенок
Недеееден
(Б. Гольдштейн)

Молотолом (фольклор)

Доктор геолого-минералогических наук, кандидат физико-математических наук Б. Горобец.
[an error occurred while processing the directive]  
[an error occurred while processing the directive] [an error occurred while processing the directive]