Самый красивый транслит среди экономных и обратимых.
[b]Версия 24.09.2024. Посвящается Жене Бубновой и Вите Хименко.
Каждая русская буква (кроме Й/Ь/Ы) транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой без потери информации.
Для транслитерации 33 русских букв нам достаточно 26 латинских букв, *никакие* дополнительные символы *не* использованы.
При этом результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что *диграфы* использованы для *менее* частотных русских букв. Например: Ь/Й - J обычно, Ъ - YY всегда.[/b]
[b]Только для *девяти* русских букв использованы диграфы:
Я - JA, Ё - JO, Ю - JU, Й - J(J), Ь - J(I), Щ - JW.
Э - YE, Ы - Y(I), Ъ - YY.
// J - левый модификатор *мягкости*.
// Y - левый модификатор *твёрдости*.
// Буква J менее громоздка, чем Y.
// Ей нужно отдать предпочтение в роли модификатора,
// поэтому в транслите он используется чаще.
Диграфы не нужны для шипящих "ш/ж/ч" и "ц":
Ш - W, Ж - X, Ч - C, Ц - Q.
Здесь соответствие по графическому сходству букв.[/b]
[b]Результат транслита RV9 *обратим* для любого текстового файла,
то есть для *любой* мешанины букв *разных* языков.
Если же на входе текст на *правильном* *русском* языке,
то текст на выходе будет *краток и красив*![/b]
——
Представьте, что русофобы победили во всемирном масштабе и теперь по Сети, по международной сети интернет, запрещается, строго запрещается передавать *любые* русские буквы. Как же теперь общаться миролюбивому русскоязычному населению планеты?
Есть один способ - *транслитерация* называется. Заменяем каждую русскую букву на одну или две латинских. Две латинских буквы нам заведомо хватит.
Но есть проблема! Получатель нашей латинской абракадабры на другом конце планеты, находясь во враждебном империалистическом окружении, должен однозначно восстановить исходный русский текст.
Транслит должен быть обратимым. Обратимым, хотя бы для текста, составленного на *правильном* русском языке. Это как минимум.
А в идеале, желательно, чтобы транслит был строго обратимым, даже в том случае, когда в исходнике содержится *произвольная* последовательнось букв *разных* языков. Скажем, два мягких знака подряд тоже допустимы.
У населения могут быть и другие хотелки.
Наш транслит не должен быть заумным, шокирующим. Он должен быть более менее привычным.
Строка не должна быть рваной. Не допустимы всякие там апострофы и закорючки при транслитерации русских букв. Нельзя использовать никакие другие символы, кроме латинских букв, для нашей транслитерации.
И желательно, чтобы транслит был экономным: количество латинских букв в результате транслитрации не должно быть значительно больше количества русских букв в исходнике.
Если транслит предназначен для русского языка, то он должен учитывать *особенности* сочетаемости букв в русском языке.
Результат транслитерации текста, составленного на *правильном* русском языке, должен быть *кратким и красивым*.
Короче, встречайте...
RV9 - лучший транслит среди красивых, экономных и обратимых.
Без лишних слов, прямо сейчас, покажу товар лицом.
Смотрите и удивляйтесь!
// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? ОБЪЁМ объяснения. Восход. Пощади ЩУКУ.
Буквы 'Й', 'Ь', 'Ы' и 'Ъ' - не одно и то же.
Ударение в слове Москв`а. Теорема Пифагора: a^2+b^2=c^2.
——
Власти РФ утвердили официальный транслит для русского и других языков, использующих кириллицу.
https://docs.cntd.ru/document/1200026226
Однако этот транслит по жизни нигде не применяется.
Это *плохой* транслит. Он даже *не* обратимый (ЬЬ=Ъ).
И вот какой результат он даёт...
// Утверждённый гостовский транслит ГОСТ 7.79-2000 (система Б)
Xrushhyov, ves` bul`on s``el? Na ch`yu e`to zhopu svoj kon`yak l`yosh`?
Krast`sya za cy`ganom. Na rajone el, pil e`l`.
Klon vidit zhyolty`j klyon i el`.
Bor`ba naxala za xlopok v cirke.
Noch` i moshh`, noch`yu vsej moshh`yu pishhala my`sh` vozle shiny`.
Vizhu shyolk, a gde shhyoloch`? Chyorny`j genij chertej.
Eyo pal`to. Fajer. Fraer. Kojot. Kayuk. Pod``ezd.
Me`r N`yu-Jorka ubit kop`yom. Bledny`j poe`t i bedny`e lyudi.
Prezident Y`n umy`lsya na e`tom steklyannom parashyute s drozh`yu.
Vse vsyo ponyali? OB``YOM ob``yasneniya. Vosxod. Poshhadi SHHUKU.
Bukvy 'J', '`', 'Y`' i '``' - ne odno i to zhe.
Udarenie v slove Moskv?a. Teorema Pifagora: ?a^2+?b^2=?c^2.
// Транслит RV9 - красивый, экономный, обратимый и *почти* простой.
Hrujwjov, vesj buljion syyel? Na cjju yeto xopu svoj konjjak ljjowj?
Krastjsja za cyganom. Na rajjone el, pil yelj.
Klon vidit xjoltyj kljon i elj. Borjba nahala za hlopok v qirke.
Nocj i mojwj, nocjju vsej mojwjju pijwala mywj vozle winy.
Vixu wjolk, a gde jwjolocj? Cjornyj genij certej.
Ejo paljto. Fajer. Fraer. Kojjot. Kajuk. Podyyezd.
Myer Njju-Jjorka ubit kopjjom. Blednyj poyet i bednyie ljudi.
Prezident Yn umylsja na yetom stekljannom parawjute s droxjju.
Vse vsjo ponjali? OByYjOM obyyjasnenija. Voshod. Pojwadi jWUKU.
Bukvy 'jJ', 'jI', 'yI' i 'yY' - ne odno i to xe.
Udarenie v slove Moskv``a. Teorema Pifagora: `a^2+`b^2=`c^2.
——
Красивый, экономный и обратимый транслит RV9 не будет совсем простым.
Для русских букв "Й/Ь/Ы" придётся учитывать иx окружение при транслитерации.
А именно, критична буква *за* этими тремя. От последующей буквы зависит вариант транслитерации. Иногда потребуются две латинские буквы для передачи одной русской, зато транслит будет обратимым.
// RV9.
// Латинская буква ‘y’ - ЛЕВЫЙ модификатор ТВЁРДОСТИ.
// Латинская буква ‘j’ - ЛЕВЫЙ модификатор МЯГКОСТИ.
// 2 буквы - знаки, которые сами по себе не означают никакие звуки.
1. ь - j обычно, но 'ji' перед "а/о/у".
2. ъ - yy всегда (в правильном русском не бывает "ыы", ыы -> yiyi ).
// 5 букв - твёрдые гласные, модификатор ‘y’ - здесь делает твёрдым,
// русская буква "э" встречается редко,
// поэтому можно перевести её двумя латинскими.
3. a - а
4. э - ye
5 ы - y обычно, но 'yi' - перед "е/и/ы".
6. о - o
7. у - u
// 5 букв - мягкие гласные, они смягчают предшествующую согласную,
// модификатор ‘j’ здесь делает мягким,
// русская буква "е" встречается часто,
// поэтому передаём её одной латинской.
8. я - ja
9. е - e
10. и - i
11. ё - jo
12. ю - ju
// 1 буква - полугласная, всегда мягкая,
13. й - j обычно, но 'jj' перед "а/о/у".
Русские буквы "ь/й" обычно транслитерируются одинаково, но это не делает транслит RV9 необратимым. Эти буквы не используются в одинаковом контексте, в одинаковом окружении.
В тексте, написанном на правильном русском языке,
буква "мягкий знак" всегда идёт *после* согласной.
А буква "и краткая" никогда *не* встречается после согласной
// 2 буквы - всегда мягкие согласные (они шипящие).
14. щ - jw.
15. ч - c (как в итальянском, русская буква "ч" используется чаще, чем "ц").
// 3 буквы - всегда твёрдые согласные.
// соответствие букв по графическому сходству.
16. ш - w (укорочена средняя вертикаль).
17. ж - x (убрана средняя вертикаль).
18. ц - q (обе буквы с хвостиком).
// 15 букв - согласные, которые могут быть и твёрдыми и мягкими.
// соответствие букв фонетическое и традиционное.
19. р - r
20. л - l
21. м - m
22. н - n
23. б - b
24. п - p
25. в - v
26. ф - f
27. д - d
28. т - t
29. з - z
30. с - s
31.г - g
32. к - k
33. х - h
---
Для закрепления правил RV9 транслитерируем русский алфавит целиком.
*Действующий русский алфавит с транслитом букв.*
1. а/a б/b в/v г/g д/d
6. е/e ё/jo ж/x з/z
10. и/i й/j(j) к/k л/l м/m н/n
16. о/o п/p р/r с/s т/t
21. у/u ф/f х/h ц/q
25. ч/c ш/w щ/ww
28. ъ/yy ы/y(i) ь/j(i)
31. э/ye ю/ju я/ja
*Новый русский алфавит с транслитом букв.*
1. ь/j(i) ъ/yy // знаки мягкий и твёрдый
3. а/a я/ja е/e э/ye и/i ы/y(i) // гласные, частотные раньше
о/o ё/jo у/u ю/ju
13. й/j(j) // полугласный
14. р/r л/l м/m н/n // сонорные, не имеют глухой пары
18. б/b п/p в/v ф/f // согласные переднего ряда
22. д/d т/t з/z с/s ц/q // взрывные раньше щелевых, а звонкие - глухих.
27. г/g к/k // согласные заднего ряда
29. ж/x ш/w щ/jw ч/c // двухфокусные, шипящие
33. x/h // глоточный глухой
——
// Транслит RV9 - красивый, экономный, обратимый и *почти* простой.
Hrujwjov, vesj buljion syyel? Na cjju yeto xopu svoj konjjak ljjowj?
Krastjsja za cyganom. Na rajjone el, pil yelj.
Klon vidit xjoltyj kljon i elj. Borjba nahala za hlopok v qirke.
Nocj i mojwj, nocjju vsej mojwjju pijwala mywj vozle winy.
Vixu wjolk, a gde jwjolocj? Cjornyj genij certej.
Ejo paljto. Fajer. Fraer. Kojjot. Kajuk. Podyyezd.
Myer Njju-Jjorka ubit kopjjom. Blednyj poyet i bednyie ljudi.
Prezident Yn umylsja na yetom stekljannom parawjute s droxjju.
Vse vsjo ponjali? OByYjOM obyyjasnenija. Voshod. Pojwadi jWUKU.
Bukvy 'jJ', 'jI', 'yI' i 'yY' - ne odno i to xe.
Udarenie v slove Moskv``a. Teorema Pifagora: `a^2+`b^2=`c^2.
——
Обрати внимание:
Bul[b]ji[/b]on - бульон.
Bul[b]jo[/b]n - булён - нет такого слова.
Ra[b]jj[/b]on - район.
Ra[b]jo[/b]n - раён - нет такого слова.
Bedn[b]yi[/b]e - бедные.
Bedn[b]ye[/b] - беднэ - нет такого слова.
——
Аналогичным образом *большие* русские буквы замещаются большими же латинскими: Ю - jU. Но модификаторы, это всегда *маленькие* латинские буквы.
В исходном тексте могут присутствовать не только русские, но также и *латинские* буквы. В процессе транслитерации русские буквы заменяются на латинские. При этом *не* должна возникнуть путаница между старыми и новыми латинскими буквами.
Поэтому в нашем транслите RV9 нужен *третий левый модификатор*. Модификатор *гравис*. Это знак ударения, который выглядит так (`).
Перед *каждой* *латинской* буквой исходника в процессе её транслитерации ставим гравис. В процессе обратной транслитерации этот гравис необходимо учесть. Латинские буквы будут восстановлены в исходнике в неизменном виде.
Кстати, если в исходнике присутствует знак гравис, то в результате транслита его надо продублировать, получится (``). Это важно для обратимости транслита RV9.
Все символы исходника, *отличные* от русских и латинских букв, и также от грависа, переносятся в результат транслитерации *без всякого изменения*.
Подводя итог: в обратимом транслите RV9 имеется три левых модификатора: Модификатор Мягкости 'j', Модификатор Твёрдости 'y'
и Модификатор Латинской Буквы - гравис '`'.
––
*Конфигурационный файл транслита RV9.*
lat.lit = a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z.
rus.glas = а, е, и, о, у, я, э, ы, ё, ю.
rus.sogl = б, в, г, д, ж, з, й, к, л, м, н, п, р, с, т, ф, х, ц, ч.
rus.aou = а, о, у.
rus.eiy= е, и, ы.
// везде + большие
а -> a // #1
е -> e
и -> i
о -> o
у -> u
ж -> x // #6
ш -> w
ч -> c
ц -> q
р -> r // #10
л -> l
м -> m
н -> n
б -> b // #14
п -> p
в -> v
ф -> f
д -> d // #18
т -> t
з -> z
с -> s
г -> g // #22
к -> k
х -> h
я -> ja // #25
э -> ye
ё -> jo
ю -> ju
щ -> jw
ъ -> yy
й <rus.glas >!rus.aou -> j // #31
ь <rus.sogl >!rus.aou -> j
ы >!rus.eiy -> y // #33
й -> jj
ь -> ji
ы -> yi // #36
... // аналогичного для *больших* русских букв.
Ы -> уI // #72
lat.lit -> `lat.lit // #73 - #124
` -> `` // #125
——
*Конфигурационный файл обратного транслита iRV9.*
Применяйте правила последовательно,
когда найдёте подходящее - сделайте замену
и сдвиньтесь на две или на одну букву,
соответственно выбранному правилу.
lat.lit = a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z.
lat.glas = a, e, i, o, u.
lat.sogl = b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, z.
// везде + большие
`` -> `
`lat.lit -> lat.lit
// в результате работы транслита RV9 большие буквы J/Y
// возможны только после грависа.
jj <lat.glas -> й
ji -> ь
jw -> щ
ja -> я
jo -> ё
ju -> ю
yy -> ъ
ye -> э
yi -> ы
j <lat.glas -> й
j <lat.sogl -> ь
y -> ы
a -> а
e -> е
i -> и
o -> о
u -> у
w -> ш
x -> ж
q -> ц
c -> ч
h -> х
...
... // аналогично для больших латинских букв,
// но модификаторы всегда маленькие: jW -> Щ.
——
Сводка всех транслитов Михайленко:
http://mihajlenko.anihost.ru/viewtopic.php?f=22&t=856
Крайняя версия RV9:
http://mihajlenko.anihost.ru/viewtopic.php?f=22&t=850&p=1123#p1123
Обсудить:
http://filolingvia.com/publ/samyj_krasivyj_translit_sredi_ehkonomnykh_i_obratimykh_rv9/299-1-0-7527
——
Скопируйте мои сайты, пока жив!
http://mihajlenko.anihost.ru и http://mi.anihost.ru
Помощь Каналу:
1. МИР 2202 2004 3443 2371 в Сбербанке.
2. Кошелёк Яндекс-Деньги. Теперь ЮMoney. = МИР 2204 1202 0074 1078
3. Pay Pal. http://www.paypal.me/NickMikhailenko или на адрес n1954@mail.ru в платёжной системе PayPal
——
Источник: Http://mihajlenko.anihost.ru |