RV8 - лучший транслит среди обратимых. 22.08.2021.

RV8 - лучший транслит среди обратимых. 22.08.2021.

Сообщение Nikolaj.Mihajlenko » 03 июн 2021, 02:29

RV8 - лучший простой транслит среди обратимых. 23.08.2021.

Translit RV8(optimalynyiy).

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой. Не использованы дополнительные символы, нам достаточно 26 латинских букв.  Диграфы не нужны для шипящих "ш/ж/ч". Нам хватило семь диграфов ja, jo, ju, ye, yi, yy, ww, они используются для оставшихся 7 русских букв из 33 букв русского алфавита. Результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что  диграфы использованы для менее частотных русских букв. Например: Ь/Й - Y, Ъ - YY. Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Что такое транслит и зачем он нужен? Иногда русские буквы недоступны, а латинские под рукой. Время от времени каждому приходится записывать русские слова латинскими буквами. Но делаем мы это как бог на душу положит. Прочитать чужой транслит можно, но приходится напрягаться. А если бы все придерживались одной системы, то всем бы это ОБЛЕГЧИЛО жизнь! Вы согласны со мной?

А что государство? Оно позаботилось о нас! Есть государственный стандарт для транслитерации кириллический текстов, утверждённый официально в 2000 году.
http://docs.cntd.ru/document/1200026226

Но мало кто о нём знает. И, возможно, никто и нигде его не использует. На практике царит хаос. Это печально.

Да и ХОРОШ ли утверждённый государством транслит? Чего ВООБЩЕ стоит ждать от хорошего транслита?

1. Должны быть использованы традиционные соответствия между русскими и латинскими буквами по характеру типичных для них звуков: ф-f, к-k, л -l...

2. Желательно, чтобы правила транслитерации были простыми. Без оговорок типа "если и когда".  Русская буква - Латинская буква, и всё. Но раз латинских букв 26, а русских 33, то некоторые русские буквы должны быть представлены двумя латинскими.

3. Желательно при транслитерации не использовать дополнительные небуквенные символы: типа апострофа, кавычек или скобок.

4. Текст, полученный в итоге транслитерации, не должен быть значительно длиннее исходника. Представьте, что вы набираете его на мобильнике, а не на полноценной компьютерной клавиатуре. Желательна краткость кода.

5. Не обязательно, но желательно, чтобы при транслитерации не происходила потеря информации. Если наш транслит обратим, то легко написать компьютерную программу, которая по результату транслитерации восстанавливает русский текст, записанный русскими буквами, причём в точности. Передача по линии без русских букв возможна. Их восстановят в приёмнике!

Много лет я перебирал разные варианты. Вы можете познакомиться с ними по ссылкам:

http://mihajlenko.anihost.ru/viewforum.php?f=22
https://www.youtube.com/playlist?list=PL1gTe4Zho-QDAqoxmloiDcflXlYcx7_Z5

Мой лучший краткий (для мобильников) транслит - RV4. Если же нужна обратимость, то ничего лучше RV8 не придумаешь.

Как в деле транслитерации государство могло бы помочь людям? Как реально, а не на бумаге, ввести ОБЩИЙ стандарт?

Этап 1.

Отрытый государственный конкурс по транслитам разных категорий. Каждый может предложить свой вариант. В прессе активно обсуждаются участники и варианты. Может быть целый год обсуждают. Премия победителям - 1 миллион рублей в каждой категории.

Этап 2.

Внедрение. Государство имеет ресурсы, чтобы убедить важнейших игроков в интернете представить на своих сайтах критически важную информацию также и в утверждённом государством транслите, предварительно одобренном обществом. При этом мобильные операторы будут рекомендовать в случае необходимости использовать государственный стандарт, за его использование будут давать скидку. Именно ТАК транслит можно внедрить в практику. Для общего использования. Один - обратимый, другой - краткий, для мобильников.

---

RV8 - этот оптимальный транслит даёт достаточно краткий, ОБРАТИМЫЙ результат, правила транслита просты и апостроф в качестве дополнительного знака не потребуется.

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

Власти РФ утвердили официальный транслит для русского и других языков, использующих кириллицу. Однако этот транслит практически не используется. Вот какой результат он даёт...

// Утверждённый гостовский транслит ГОСТ 7.79-2000 (система Б)
Xrushhyov, ves` bul`on s``el? Na ch`yu e`to zhopu svoj kon`yak l`yosh`?
Krast`sya za cyganom. Na rajone el, pil e`l`.
Klon vidit zhyolty`j klyon i el`.
Bor`ba naxala za xlopok v cirke.
Noch` i moshh`, noch`yu vsej moshh`yu pishhala my`sh` vozle shiny`.
Vizhu shyolk, a gde shhyoloch`? Chyorny`j genij chertej.
Eyo pal`to. Fajer. Fraer. Kojot. Kayuk. Pod``ezd.
Me`r N`yu-Jorka ubit kop`yom. Bledny`j poe`t i bedny`e lyudi.
Prezident Y`n umy`lsya na e`tom steklyannom parashyute s drozh`yu.
Vse vsyo ponyali? Ob``yom ob``yasneniya.

Что можно сказать о нём? Слишком часто используется дополнительный символ - знак ударения (`). Строка получается рваной, читать неприятно. В угоду английскому языку использованы диграфы sh, ch, zh. Для русской буквы "щ" потребовалось аж три латинских "shh". Латинская "h" использована в качестве ПРАВОГО модификатора, поэтому ради обратимости транслита русскую букву "х" передают латинской буквой "x" по графическому сходству букв. Но это не стыкуется эстетически с англофильским характером данного транслита. В Англии ‘x’ читается [кс] .

Предложенный транслит обратим для правильного русского текста. Но для произвольного набора символов он не является обратимым. Поскольку "ьь" и "ъ" передаются одинаково (``).

Вот что Вам предлагает Николай Михайленко...

// Транслит RV8, лучший среди обратимых. Простой, краткий и без апострофа!
Hruwwjov, vesy bulyon syyel? Na cyju yeto xopu svoy konyjak lyjowy?
Krastysja za cyiganom. Na rayone el, pil yely.
Klon vidit xjoltyiy kljon i ely. Boryba nahala za hlopok v qirke.
Nocy i mowwy, nocyju vsey mowwyju piwwala myiwy vozle winyi.
Vixu wjolk, a gde wwjolocy? Cjornyiy geniy certey.
Ejo palyto. Fayer. Fraer. Koyot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxyju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата транслита RV8 в сравнении с действующим гостовским транслитом (который не действует фактически нигде).

Перехожу непосредственно к описанию лучшего транслита среди обратимых. Чтобы ненароком не потерять обратимости транслита мы сначала сделаем "железобетонный" транслит RV8+, который точно обратим, даже в применении к любой смеси латинских и русских букв, а затем, используя особенности русского языка сделаем из него экономный транслит RV8. 

// RV8+, RV8.
// Транслит с плюсом строго обратим
// в применении к *произвольному* набору букв,
// RV8 обратим для *правильного* текста на *русском* языке.
// После русской буквы сначала указана её транслитерация в RV8+,
// а потом в RV8, если второй вариант не совпадает с первым.

// Латинская буква ‘y’ - ЛЕВЫЙ модификатор ТВЁРДОСТИ,
// её утроение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
y - yyy (латинская буква)

// Латинская буква ‘j’ - ЛЕВЫЙ модификатор МЯГКОСТИ/КРАТКОСТИ ,
// её удвоение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
j - jj (латинская буква)

// 2 буквы - знаки, не означают звуки сами по себе.
ь - jy (мягкий знак) - y (после согласной)
ъ - yj (твёрдый знак) - yy (после согласной).

// 5 букв - твёрдые гласные, модификатор ‘y’ - здесь делает твёрдым,
// русская буква "э" встречается редко,
// поэтому переводим её двумя латинскими.
a - а
э - ye
ы - yi (бледные - blednyie)
о - o
у - u

// 5 букв - мягкие гласные, они смягчают предшествую согласную,
// модификатор ‘j’ здесь делает мягким,
// русская буква "е" встречается часто, поэтому передаём одной латинской.
я - ja
е - e
и - i
ё - jo
ю - ju

// 1 буква - полугласная, всегда мягкая,
// модификатор ‘j’ здесь делает кратким.
й - ji - y (НЕ после согласной)

// 3 буквы - всегда твёрдые согласные
ш - w (укорочена средняя вертикаль)
ж - x (убрана средняя вертикаль)
ц - q (обе буквы с хвостиком)

// 2 буквы - всегда мягкие согласные (шипящие),
// модификатор ‘j’ здесь делает мягким,
щ - jw - ww (две буквы "ш" подряд - не бывает в правильном русском тексте!)
ч - c (как в итальянском, буква "ч" используется чаще, чем "ц")

// 15 букв - согласные, которые могут быть и твёрдыми и мягкими.
р - r
л - l
м - m
н - n

б - b
п - p
в - v
ф - f

д - d
т - t
з - z
с - s

г - g
к - k

х - h
---

2 + 5 + 5 + 1 + 3 + 2 + 15 == 33 == 26 + 7.
Всего 33 букв в русском алфавите! А в латинском - 26! 

Латинская буква "y" используется и для "й", и для "ь". Зато буква "j" используется только как модификатор, сама по себе она не обозначает русской буквы. Таким образом, 26-ти латинским буква соответствуют 26 русских. Смотрите:

a-а b-б c-ч d-д
e-е f-ф g-г
h-х i-и j-НЕТ k-к
e-е f-ф g-г
l-m n-н o-о p-п
q-ц r-р s-с t-т
u-у v-в w-ш
x-ж y-(й/ь) z-з

Для баланса нужно добавить семь латинских диграфов, чтобы представить 33 русских. К 26 латинским буквам добавлены семь диграфов: ja, jo, ju, ye, yi, yy, ww. Совпало! Перевод русской буквы в латинскую происходит без учёта окружения русской буквы, а диграфы используются для МЕНЕЕ частотных букв. Транслит получился простой и экономный!
---

Для больших (прописных) букв действуют те же правила, что и маленьких (строчных)
---

Правила обратной транслитерации для RV8+.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yj - ъ

jj - j
ja - я
jо - ё
ju - ю
jw - щ
ji - й
jy - ь

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Правила обратной транслитерации для RV8.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yy - ъ
y (после согласной) - ь
y (не после согласной) - й

jj - j
ja - я
jо - ё
ju - ю
ww - щ

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Посмотрите теперь осознанно на исходник и результат транслитерации...

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

// Транслит RV8, лучший среди обратимых. Простой, краткий и без апострофа!
Hruwwjov, vesy bulyon syyel? Na cyju yeto xopu svoy konyjak lyjowy?
Krastysja za cyiganom. Na rayone el, pil yely.
Klon vidit xjoltyiy kljon i ely. Boryba nahala za hlopok v qirke.
Nocy i mowwy, nocyju vsey mowwyju piwwala myiwy vozle winyi.
Vixu wjolk, a gde wwjolocy? Cjornyiy geniy certey.
Ejo palyto. Fayer. Fraer. Koyot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxyju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата простого и обратимого транслита RV8!

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой. Не использованы дополнительные символы, нам достаточно 26 латинских букв.  Диграфы не нужны для шипящих "ш/ж/ч". Нам хватило семь диграфов ja, jo, ju, ye, yi, yy, ww, они используются для оставшихся 7 русских букв из 33 букв русского алфавита. Результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что  диграфы использованы для менее частотных русских букв. Например: Ь/Й - Y, Ъ - YY. Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Для закрепления правил RV8 транслитерируем русский алфавит целиком.

Действующий русский алфавит с транслитом букв.

а/a б/b в/v г/g д/d
е/e ё/yo ж/x з/z
и/i й/y к/k л/l м/m н/n
о/o п/p р/r с/s т/t
у/u ф/f х/h ц/q
ч/c ш/w щ/ww
ъ/yy ы/yi ь/y
э/ye ю/ju я/ja

Новый русский алфавит с транслитом букв.

ь/y ъ/yy // знаки мягкий и твёрдый

а/a я/ja е/e э/ye и/i ы/yi // гласные, частотные раньше
о/o ё/jo у/u ю/ju

й/y // полугласный

р/r л/l м/m н/n // сонорные, не имеют глухой пары

б/b п/p в/v ф/f // согласные переднего ряда
д/d т/t з/z с/s ц/q // взрывные раньше щелевых, а звонкие - глухих.

г/g к/k // согласные заднего ряда

ж/x ш/w щ/ww ч/c // двухфокусные, шипящие

x/h // глоточный глухой
---

Достоинством транслита RV8 является его ПРОСТОТА: при замене русской буквы не надо учитывать её окружение! Транслит этот также экономный: семь необходимых диграфов используются для МЕНЕЕ частотных букв.

Можно ли сделать транслит более экономным, чем RV8. Если не требовать лёгкой обратимости транслита, то ДА!

Смотрите RV4 - лучший транслит для мобильников, очень экономный. Хоть при работе этого транслита инфа частично теряется, но результат транслитерации будет легко понятен носителю русского языка. Так хитро этот транслит устроен!

Перейти от RV8 к RV4 очень просто. Правила транслитерации нужно видоизменить в следующих пунктах:

Русская буква - RV8 -- RV4.

1. й - y - j
2. ь - y - j
3. ъ - yy - j
4. ы - yi - y
5. э - ye - e
6. щ - ww - wj

Плюс, в RV4 действуют правила сокращения, которых не надо в обратимом RV8.

Смотрите RV4 - лучший транслит для мобильников, очень экономный.
https://maxpark.com/community/4109/content/7408052

Пробуйте!

--------------------------------------------------------------------------------------

Мы использовали для передачи Й/Ь латинскую букву "Y", а разве не будет натуральнее и красивее употребить для этой цели латинскую букву "J", как это имеет место в сверхэкономном транслите RV4? Да, такое такое возможно, но транслит RV9 будет сложнее, чем RV8. Для русских букв "Ь/Й/Ы" придётся учитывать иx окружение при транслитерации. Красивый, экономный и обратимый транслит RV9 не будет простым.

// RV8+, RV9.
// Транслит с плюсом строго обратим
// в применении к *произвольному* набору букв,
// RV9 обратим для *правильного* текста на *русском* языке.
// После русской буквы сначала указана её транслитерация в RV8+,
// а потом в RV9, если второй вариант не совпадает с первым.

// Латинская буква ‘y’ - ЛЕВЫЙ модификатор ТВЁРДОСТИ,
// её утроение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
y - yyy (латинская буква)

// Латинская буква ‘j’ - ЛЕВЫЙ модификатор МЯГКОСТИ/КРАТКОСТИ ,
// её утроение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
j - jjj (латинская буква)

// 2 буквы - знаки, не означают звуки сами по себе.
ь - jy (мягкий знак) - j (после согласной, но не перед "а/о/у")
ъ - yj (твёрдый знак) - yy (после согласной).

// 5 букв - твёрдые гласные, модификатор ‘y’ - здесь делает твёрдым,
// русская буква "э" встречается редко,
// поэтому переводим её двумя латинскими.
a - а
э - ye
ы - yi - y ((после согласной, но НЕ перед "е/и") ИЛИ перед согласной)
о - o
у - u

// 5 букв - мягкие гласные, они смягчают предшествую согласную,
// модификатор ‘j’ здесь делает мягким,
// русская буква "е" встречается часто, поэтому передаём одной латинской.
я - ja
е - e
и - i
ё - jo
ю - ju

// 1 буква - полугласная, всегда мягкая,
// модификатор ‘j’ здесь делает кратким.
й - ji - j (НЕ после согласной и НЕ перед "а/о/е")

// 3 буквы - всегда твёрдые согласные
ш - w (укорочена средняя вертикаль)
ж - x (убрана средняя вертикаль)
ц - q (обе буквы с хвостиком)

// 2 буквы - всегда мягкие согласные (шипящие),
// модификатор ‘j’ здесь делает мягким,
щ - jw - ww (две буквы "ш" подряд - не бывает в правильном русском тексте!)
ч - c (как в итальянском, буква "ч" используется чаще, чем "ц")

// 15 букв - согласные, которые могут быть и твёрдыми и мягкими.
р - r
л - l
м - m
н - n

б - b
п - p
в - v
ф - f

д - d
т - t
з - z
с - s

г - g
к - k

х - h
---

// Транслит RV9 - красивый, экономный, обратимый, но не простой.
Hruwwjov, vesj buljyon syyel? Na cjju yeto xopu svoj konjjak ljjowj?
Krastjsja za cyganom. Na rajione el, pil yelj.
Klon vidit xjoltyj kljon i elj. Borjba nahala za hlopok v qirke.
Nocj i mowwj, nocjju vsej mowwjju piwwala mywj vozle winy.
Vixu wjolk, a gde wwjolocj? Cjornyj genij certej.
Ejo paljto. Fajer. Fraer. Kojyot. Kajuk. Podyyezd.
Myer Njju-Jiorka ubit kopjjom. Blednyj poyet i bednyie ljudi.
Prezident Yn umylsja na yetom stekljannom parawjute s droxjju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---------------------------------------------------------------------------------------

Помимо транслитов мной разрабатывается новая орфография русского языка. Речь не о простой замене русских букв на латинские, а о система правил для передачи русских звуков (не букв!) на письме с использованием классических латинских букв - система LM.

См. https://newsland.com/community/4109/content/novaia-latinitsa-nikolaia-mikhailenko-lm-versiia-2/7315188

Не путайте простые транслиты RV8/RV4 с системой LM (Латиница Михайленко) - это новая орфография для русского языка с использованием латинских букв. LM пока в зародыше, там много новых правил. Желательно чтобы буквы регулярно соответствовали звукам языка, но надо отобразить и устойчивость морфем и учесть связи русских слов с иностранными языками, и избавиться от того, что утратило всякий смысл. LM - сложная система для решения сложной задачи.

Hruwõv, ves̃ bul̃jon sjel? Na cju ęto xopu svoj koñjak l̃jow?
Krast̃sã za qyganom. Na rajone jel, pil ęl̃.
Klon vidit xoltyj klõn i jel̃. Bor̃ba nahala za hlopok v qyrke.
Noc i mow̃, nocju vsej mow̃ju piwãla myw vozle wyny.
Vixu wolk, a gde wõloc? Cornyj genij certej.
Jejo pal̃to. Fajjer. Frajer. Kojot. Kajuk. Podjezd.
Męr Ñju-Jorka ubit kop̃jom. Blednyj poęt i bednye lũdi.
Prezident Yn umylsã na ętom steklãnnom parawute s droxju.
Vy vsõ ponãli? Objom objasnenija.

Onegin dobryj moj prijatel̃
Rodilsã na bregah Nevy
Gde moxęt byt̃ rodilis̃ Vy
Ili gulãli moj citatel̃

Мягкий знак здесь передаётся тильдой над согласной или следующей за ней гласной. Твёрдый знак оказался не нужен. Буква "я" переходит в "ã" после согласной, и "ja" в остальных случаях. Буквы "Ш/Щ" передаются одной буквой "W", которая варьируется по мягкости. "J/C" - всегда мягкие, "X/Q" - всегда твёрдые. После твёрдых согласных никогда не пишутся мягкие гласные "I/E". Таково начало правил новой русской орфографии - Латиницы Михайленко (LM).

Перейдёт ли Россия на латиницу через 50 лет? Голосование!
https://maxpark.com/community/4109/content/6705649

---
"Строгие Правила на Канале Николая Михайленко. Бояться!"
http://maxpark.com/community/5946/content/2517452

Nikolaj.Mihajlenko
Администратор
 
Сообщения: 1015
Зарегистрирован: 25 сен 2010, 16:25

Re: RV8 - лучший транслит среди обратимых. 22.08.2021.

Сообщение Nikolaj.Mihajlenko » 23 авг 2021, 15:40

Nikolaj.Mihajlenko
Администратор
 
Сообщения: 1015
Зарегистрирован: 25 сен 2010, 16:25


Вернуться в Вечные двигатели и технические штучки

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

cron