RV8+. Железобетонный транслит русских букв.

RV8+. Железобетонный транслит русских букв.

Сообщение Nikolaj.Mihajlenko » 03 июн 2021, 02:29

Каждая русская буква транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой без потери информации.

Для транслитерации 33 русских букв нам достаточно 26 латинских букв, *никакие* дополнительные символы *не* использованы.

При этом результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что *диграфы* использованы для *менее* частотных русских букв.

Только для *девяти* русских букв использованы диграфы:
Я - JA, Ё - JO, Ю - JU, Й - JJ, Ь - JI, Щ - JW.
Э - YE, Ы - YI, Ъ - YY.
// J - левый модификатор *мягкости*.
// Y - левый модификатор *твёрдости*.
// Буква J менее громоздка, чем Y.
// Ей нужно отдать предпочтение в роли модификатора.

Диграфы не нужны для шипящих "ш/ж/ч" и "ц":
Ш - W, Ж - X, Ч - C, Ц - Q.
Здесь соответствие по графическому сходству букв.

Для обратимости транслита так же важно, чтобы в исходном тексте не было латинских букв. Если же латинские буквы имеются, то перед каждой из них нужно поставить знак ударения - гравис (`).

Это означает, что в нашем транслите появился новый левый модификатор - гравис. И конечно, этот дополнительный знак нужно учесть в процессе обратной транслитерации для восстановления латинских букв в исходнике.

Результат транслита RV8+ *обратим* для любого текстового файла,
то есть для *любой* мешанины букв *разных* языков.

В этом и состоит его "железобетонность". Он не учитывает особую сочетаемость букв в составе правильного русского слова.

Действующий русский алфавит с транслитом букв.

1. а/a б/b в/v г/g д/d
6. е/e ё/jo ж/x з/z
10. и/i й/jj к/k л/l м/m н/n
16. о/o п/p р/r с/s т/t
21. у/u ф/f х/h ц/q
25. ч/c ш/w щ/jw
28. ъ/yy ы/yi ь/ji
31. э/ye ю/ju я/ja

Транслит RV9 строится на базе RV8+ и даёт более красивый и короткий разультат для текста на правильном русском языке.
——


RV8 - лучший транслит среди простых и обратимых.

Translit RV8(optimalynyiy).

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой.

Для транслитерации 33 русских букв нам достаточно 26 латинских букв, никакие дополнительные символы не использованы.

33 - 26 = 7. Для семи русских букв использованы диграфы:
Я - JA, Ё - JO, Ю - JU, Э - YE, Ы - YI, Ъ - YY, Щ - WW.
J - левый модификатор мягкости.
Y - левый модификатор твёрдости.

При этом результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что диграфы использованы для *менее* частотных русских букв.
Например: Ь/Й - Y, Ъ - YY.

Диграфы не нужны для шипящих "ш/ж/ч" и "ц":
Ш - W, Ж - X, Ч - C, Ц - Q.
Здесь соответствие по графическому сходству букв.

Результат транслита RV8 обратим для любого текста на *правильном* русском языке. Но не для произвольного набора русских букв!

Действительно, давайте транскрибируем отдельно стоящую русскую букву "и краткое". Полученная латинская буква "игрек", окружённая пробелами, при обратной транслитерации может пониматься как русская буква "и краткое" или же, как "мягкий знак". Обратимости на произвольной последовательности нет!

Транслит RV8+ строго обратим для произвольной последовательности русских букв:
Ь - JY, Й - JI, Щ - JW, Ъ - YJ.

Для обратимости транслита RV8 так же важно, чтобы в исходном тексте не было латинских букв. Если же латинские буквы имеются, то перед каждой из них нужно поставить точку.

Это означает, что в нашем транслите появился новый левый модификатор - точка. И конечно, эту дополнительную точку нужно учесть в процессе обратной транслитерации для восстановления латинских букв в исходнике.

Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Что такое транслит и зачем он нужен?

Иногда русские буквы недоступны, а латинские под рукой. Время от времени каждому приходится записывать русские слова латинскими буквами.

Но делаем мы это как бог на душу положит. Прочитать чужой транслит можно, но приходится напрягаться.

А если бы все придерживались одной системы, то всем бы это ОБЛЕГЧИЛО жизнь! Вы согласны со мной?

А что государство? Оно позаботилось о нас!

Есть государственный стандарт для транслитерации кириллический текстов, утверждённый официально в 2000 году.
http://docs.cntd.ru/document/1200026226

Но мало кто о нём знает. И, возможно, никто и нигде его не использует. На практике царит хаос. Это печально.

Да и ХОРОШ ли утверждённый государством транслит? Чего ВООБЩЕ стоит ждать от хорошего транслита?

1. Должны быть использованы традиционные соответствия между русскими и латинскими буквами по характеру типичных для них звуков: ф-f, к-k, л -l...

2. Желательно, чтобы правила транслитерации были простыми. Без оговорок типа "если и когда".  Русская буква - Латинская буква, и всё. Но раз латинских букв 26, а русских 33, то некоторые русские буквы должны быть представлены двумя латинскими.

3. Желательно при транслитерации не использовать дополнительные небуквенные символы: типа апострофа, кавычек или скобок.

4. Текст, полученный в итоге транслитерации, не должен быть значительно длиннее исходника. Представьте, что вы набираете его на мобильнике, а не на полноценной компьютерной клавиатуре. Желательна краткость кода.

5. Не обязательно, но желательно, чтобы при транслитерации не происходила потеря информации. Если наш транслит обратим, то легко написать компьютерную программу, которая по результату транслитерации восстанавливает русский текст, записанный русскими буквами, причём в точности. Передача по линии без русских букв возможна. Их восстановят в приёмнике!

Много лет я перебирал разные варианты. Вы можете познакомиться с ними по ссылкам:

http://mihajlenko.anihost.ru/viewforum.php?f=22
https://www.youtube.com/playlist?list=PL1gTe4Zho-QDAqoxmloiDcflXlYcx7_Z5

Мой лучший краткий (для мобильников) транслит - RV4. Если же нужна обратимость, то ничего лучше RV8 не придумаешь.

Как в деле транслитерации государство могло бы помочь людям? Как реально, а не на бумаге, ввести ОБЩИЙ стандарт?

Этап 1.

Отрытый государственный конкурс по транслитам разных категорий. Каждый может предложить свой вариант. В прессе активно обсуждаются участники и варианты. Может быть целый год обсуждают. Премия победителям - 1 миллион рублей в каждой категории.

Этап 2.

Внедрение. Государство имеет ресурсы, чтобы убедить важнейших игроков в интернете представить на своих сайтах критически важную информацию также и в утверждённом государством транслите, предварительно одобренном обществом. При этом мобильные операторы будут рекомендовать в случае необходимости использовать государственный стандарт, за его использование будут давать скидку. Именно ТАК транслит можно внедрить в практику. Для общего использования. Один - обратимый, другой - краткий, для мобильников.

---

RV8 - этот оптимальный транслит даёт достаточно краткий, ОБРАТИМЫЙ результат, правила транслита просты и апостроф в качестве дополнительного знака не потребуется.

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

Власти РФ утвердили официальный транслит для русского и других языков, использующих кириллицу. Однако этот транслит практически не используется. Вот какой результат он даёт...

// Утверждённый гостовский транслит ГОСТ 7.79-2000 (система Б)
Xrushhyov, ves` bul`on s``el? Na ch`yu e`to zhopu svoj kon`yak l`yosh`?
Krast`sya za cyganom. Na rajone el, pil e`l`.
Klon vidit zhyolty`j klyon i el`.
Bor`ba naxala za xlopok v cirke.
Noch` i moshh`, noch`yu vsej moshh`yu pishhala my`sh` vozle shiny`.
Vizhu shyolk, a gde shhyoloch`? Chyorny`j genij chertej.
Eyo pal`to. Fajer. Fraer. Kojot. Kayuk. Pod``ezd.
Me`r N`yu-Jorka ubit kop`yom. Bledny`j poe`t i bedny`e lyudi.
Prezident Y`n umy`lsya na e`tom steklyannom parashyute s drozh`yu.
Vse vsyo ponyali? Ob``yom ob``yasneniya.

Что можно сказать о нём? Слишком часто используется дополнительный символ - знак ударения (`). Строка получается рваной, читать неприятно. В угоду английскому языку использованы диграфы sh, ch, zh. Для русской буквы "щ" потребовалось аж три латинских "shh". Латинская "h" использована в качестве ПРАВОГО модификатора, поэтому ради обратимости транслита русскую букву "х" передают латинской буквой "x" по графическому сходству букв. Но это не стыкуется эстетически с англофильским характером данного транслита. В Англии ‘x’ читается [кс] .

Предложенный транслит обратим для правильного русского текста. Но для произвольного набора символов он не является обратимым. Поскольку "ьь" и "ъ" передаются одинаково (``).

Вот что Вам предлагает Николай Михайленко...

// Транслит RV8, лучший среди обратимых. Простой, краткий и без апострофа!
Hruwwjov, vesy bulyon syyel? Na cyju yeto xopu svoy konyjak lyjowy?
Krastysja za cyiganom. Na rayone el, pil yely.
Klon vidit xjoltyiy kljon i ely. Boryba nahala za hlopok v qirke.
Nocy i mowwy, nocyju vsey mowwyju piwwala myiwy vozle winyi.
Vixu wjolk, a gde wwjolocy? Cjornyiy geniy certey.
Ejo palyto. Fayer. Fraer. Koyot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxyju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата транслита RV8 в сравнении с действующим гостовским транслитом (который не действует фактически нигде).

Перехожу непосредственно к описанию лучшего транслита среди обратимых. Чтобы ненароком не потерять обратимости транслита мы сначала сделаем "железобетонный" транслит RV8+, который точно обратим, даже в применении к любой смеси латинских и русских букв, а затем, используя особенности русского языка сделаем из него экономный транслит RV8. 

// RV8+, RV8.
// Транслит с плюсом строго обратим
// в применении к *произвольному* набору букв,
// RV8 обратим для *правильного* текста на *русском* языке.
// После русской буквы сначала указана её транслитерация в RV8+,
// а потом в RV8, если второй вариант не совпадает с первым.

// Латинская буква ‘y’ - ЛЕВЫЙ модификатор ТВЁРДОСТИ,
// её утроение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
y - yyy (латинская буква)

// Латинская буква ‘j’ - ЛЕВЫЙ модификатор МЯГКОСТИ/КРАТКОСТИ ,
// её удвоение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
j - jj (латинская буква)

// 2 буквы - знаки, не означают звуки сами по себе.
ь - jy (мягкий знак) - y (после согласной)
ъ - yj (твёрдый знак) - yy (после согласной).

// 5 букв - твёрдые гласные, модификатор ‘y’ - здесь делает твёрдым,
// русская буква "э" встречается редко,
// поэтому переводим её двумя латинскими.
a - а
э - ye
ы - yi (бледные - blednyie)
о - o
у - u

// 5 букв - мягкие гласные, они смягчают предшествую согласную,
// модификатор ‘j’ здесь делает мягким,
// русская буква "е" встречается часто, поэтому передаём одной латинской.
я - ja
е - e
и - i
ё - jo
ю - ju

// 1 буква - полугласная, всегда мягкая,
// модификатор ‘j’ здесь делает кратким.
й - ji - y (НЕ после согласной)

// 3 буквы - всегда твёрдые согласные
ш - w (укорочена средняя вертикаль)
ж - x (убрана средняя вертикаль)
ц - q (обе буквы с хвостиком)

// 2 буквы - всегда мягкие согласные (шипящие),
// модификатор ‘j’ здесь делает мягким,
щ - jw - ww (две буквы "ш" подряд - не бывает в правильном русском тексте!)
ч - c (как в итальянском, буква "ч" используется чаще, чем "ц")

// 15 букв - согласные, которые могут быть и твёрдыми и мягкими.
р - r
л - l
м - m
н - n

б - b
п - p
в - v
ф - f

д - d
т - t
з - z
с - s

г - g
к - k

х - h
---

2 + 5 + 5 + 1 + 3 + 2 + 15 == 33 == 26 + 7.
Всего 33 букв в русском алфавите! А в латинском - 26! 

Латинская буква "y" используется и для "й", и для "ь". Зато буква "j" используется только как модификатор, сама по себе она не обозначает русской буквы. Таким образом, 26-ти латинским буква соответствуют 26 русских. Смотрите:

a-а b-б c-ч d-д
e-е f-ф g-г
h-х i-и j-НЕТ k-к
e-е f-ф g-г
l-m n-н o-о p-п
q-ц r-р s-с t-т
u-у v-в w-ш
x-ж y-(й/ь) z-з

Для баланса нужно добавить семь латинских диграфов, чтобы представить 33 русских. К 26 латинским буквам добавлены семь диграфов: ja, jo, ju, ye, yi, yy, ww. Совпало! Перевод русской буквы в латинскую происходит без учёта окружения русской буквы, а диграфы используются для МЕНЕЕ частотных букв. Транслит получился простой и экономный!
---

Для больших (прописных) букв действуют те же правила, что и маленьких (строчных)
---

Правила обратной транслитерации для RV8+.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yj - ъ

jj - j
ja - я
jо - ё
ju - ю
jw - щ
ji - й
jy - ь

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Правила обратной транслитерации для RV8.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yy - ъ
y (после согласной) - ь
y (не после согласной) - й

jj - j
ja - я
jо - ё
ju - ю
ww - щ

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Посмотрите теперь осознанно на исходник и результат транслитерации...

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

// Транслит RV8, лучший среди обратимых. Простой, краткий и без апострофа!
Hruwwjov, vesy bulyon syyel? Na cyju yeto xopu svoy konyjak lyjowy?
Krastysja za cyiganom. Na rayone el, pil yely.
Klon vidit xjoltyiy kljon i ely. Boryba nahala za hlopok v qirke.
Nocy i mowwy, nocyju vsey mowwyju piwwala myiwy vozle winyi.
Vixu wjolk, a gde wwjolocy? Cjornyiy geniy certey.
Ejo palyto. Fayer. Fraer. Koyot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxyju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата простого и обратимого транслита RV8!

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой. Не использованы дополнительные символы, нам достаточно 26 латинских букв.  Диграфы не нужны для шипящих "ш/ж/ч". Нам хватило семь диграфов ja, jo, ju, ye, yi, yy, ww, они используются для оставшихся 7 русских букв из 33 букв русского алфавита. Результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что  диграфы использованы для менее частотных русских букв. Например: Ь/Й - Y, Ъ - YY. Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Для закрепления правил RV8 транслитерируем русский алфавит целиком.

Действующий русский алфавит с транслитом букв.

а/a б/b в/v г/g д/d
е/e ё/yo ж/x з/z
и/i й/y к/k л/l м/m н/n
о/o п/p р/r с/s т/t
у/u ф/f х/h ц/q
ч/c ш/w щ/ww
ъ/yy ы/yi ь/y
э/ye ю/ju я/ja

Новый русский алфавит с транслитом букв.

ь/y ъ/yy // знаки мягкий и твёрдый

а/a я/ja е/e э/ye и/i ы/yi // гласные, частотные раньше
о/o ё/jo у/u ю/ju

й/y // полугласный

р/r л/l м/m н/n // сонорные, не имеют глухой пары

б/b п/p в/v ф/f // согласные переднего ряда
д/d т/t з/z с/s ц/q // взрывные раньше щелевых, а звонкие - глухих.

г/g к/k // согласные заднего ряда

ж/x ш/w щ/ww ч/c // двухфокусные, шипящие

x/h // глоточный глухой
---

Достоинством транслита RV8 является его ПРОСТОТА: при замене русской буквы не надо учитывать её окружение! Транслит этот также экономный: семь необходимых диграфов используются для МЕНЕЕ частотных букв.

Можно ли сделать транслит более экономным, чем RV8. Если не требовать лёгкой обратимости транслита, то ДА!

Смотрите RV4 - лучший транслит для мобильников, очень экономный. Хоть при работе этого транслита инфа частично теряется, но результат транслитерации будет легко понятен носителю русского языка. Так хитро этот транслит устроен!

Перейти от RV8 к RV4 очень просто. Правила транслитерации нужно видоизменить в следующих пунктах:

Русская буква - RV8 -- RV4.

1. й - y - j
2. ь - y - j
3. ъ - yy - j
4. ы - yi - y
5. э - ye - e
6. щ - ww - wj

Плюс, в RV4 действуют правила сокращения, которых не надо в обратимом RV8.

Смотрите RV4 - лучший транслит для мобильников, очень экономный.
http://mihajlenko.anihost.ru/viewtopic.php?f=22&t=818

Пробуйте!
------------------------------------------------------------------------

RV9 - лучший транслит среди красивых и обратимых.

Мы использовали для передачи Й/Ь латинскую букву "Y" (модификптор твёрдости), а разве не будет натуральнее и красивее употребить для этой цели латинскую букву "J" (модификатор мягкости), как это имеет место в сверхэкономном транслите RV4?

Да, такое такое возможно, но транслит RV9 будет сложнее, чем RV8. Для русских букв "Ь/Й/Ы" придётся учитывать иx окружение при транслитерации. Красивый, экономный и обратимый транслит RV9 не будет простым.


---------------------------------------------------------------------------------------

Помимо транслитов мной разрабатывается новая орфография русского языка. Речь не о простой замене русских букв на латинские, а о система правил для передачи русских звуков (не букв!) на письме с использованием классических латинских букв - система LM.

См. https://newsland.com/community/4109/content/novaia-latinitsa-nikolaia-mikhailenko-lm-versiia-2/7315188

Не путайте простые транслиты RV8/RV4 с системой LM (Латиница Михайленко) - это новая орфография для русского языка с использованием латинских букв. LM пока в зародыше, там много новых правил. Желательно чтобы буквы регулярно соответствовали звукам языка, но надо отобразить и устойчивость морфем и учесть связи русских слов с иностранными языками, и избавиться от того, что утратило всякий смысл. LM - сложная система для решения сложной задачи.

Hruwõv, ves̃ bul̃jon sjel? Na cju ęto xopu svoj koñjak l̃jow?
Krast̃sã za qyganom. Na rajone jel, pil ęl̃.
Klon vidit xoltyj klõn i jel̃. Bor̃ba nahala za hlopok v qyrke.
Noc i mow̃, nocju vsej mow̃ju piwãla myw vozle wyny.
Vixu wolk, a gde wõloc? Cornyj genij certej.
Jejo pal̃to. Fajjer. Frajer. Kojot. Kajuk. Podjezd.
Męr Ñju-Jorka ubit kop̃jom. Blednyj poęt i bednye lũdi.
Prezident Yn umylsã na ętom steklãnnom parawute s droxju.
Vy vsõ ponãli? Objom objasnenija.

Onegin dobryj moj prijatel̃
Rodilsã na bregah Nevy
Gde moxęt byt̃ rodilis̃ Vy
Ili gulãli moj citatel̃

Мягкий знак здесь передаётся тильдой над согласной или следующей за ней гласной. Твёрдый знак оказался не нужен. Буква "я" переходит в "ã" после согласной, и "ja" в остальных случаях. Буквы "Ш/Щ" передаются одной буквой "W", которая варьируется по мягкости. "J/C" - всегда мягкие, "X/Q" - всегда твёрдые. После твёрдых согласных никогда не пишутся мягкие гласные "I/E". Таково начало правил новой русской орфографии - Латиницы Михайленко (LM).

Перейдёт ли Россия на латиницу через 50 лет? Голосование!
https://maxpark.com/community/4109/content/6705649

---
"Строгие Правила на Канале Николая Михайленко. Бояться!"
http://maxpark.com/community/5946/content/2517452

Nikolaj.Mihajlenko
Администратор
 
Сообщения: 1088
Зарегистрирован: 25 сен 2010, 16:25

Re: RV8 - лучший транслит среди обратимых. 22.08.2021.

Сообщение Nikolaj.Mihajlenko » 23 авг 2021, 15:40

Nikolaj.Mihajlenko
Администратор
 
Сообщения: 1088
Зарегистрирован: 25 сен 2010, 16:25

Re: RV8+ (он же RJY) - железобетонный транслит русских букв.

Сообщение Nikolaj.Mihajlenko » 30 июл 2024, 03:49

Только для *девяти* русских букв использованы диграфы:
Я - JA, Ё - JO, Ю - JU, Й - JJ, Ь - JI, Щ - JW,
Э - YE, Ы - YI, Ъ - YY.
// J - левый модификатор мягкости.
// Y - левый модификатор твёрдости.

Диграфы не нужны для шипящих "ш/ж/ч" и "ц":
Ш - W, Ж - X, Ч - C, Ц - Q.
Здесь соответствие по графическому сходству букв.


RV8+ (он же RJY) - железобетонный транслит русских букв.

RV8 - лучший транслит среди простых и обратимых.
Translit RV8(optimalynyiy).

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой.

Для транслитерации 33 русских букв нам достаточно 26 латинских букв, никакие дополнительные символы не использованы.

33 - 26 = 7. Для семи русских букв использованы диграфы:
Я - JA, Ё - JO, Ю - JU, Э - YE, Ы - YI, Ъ - YY, Щ - WW.
J - левый модификатор мягкости.
Y - левый модификатор твёрдости.

При этом результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что диграфы использованы для *менее* частотных русских букв.
Например: Ь/Й - Y, Ъ - YY.

Диграфы не нужны для шипящих "ш/ж/ч" и "ц":
Ш - W, Ж - X, Ч - C, Ц - Q.
Здесь соответствие по графическому сходству букв.

Результат транслита RV8 обратим для любого текста на *правильном* русском языке. Но не для произвольного набора русских букв!

Действительно, давайте транскрибируем отдельно стоящую русскую букву "и краткое". Полученная латинская буква "игрек", окружённая пробелами, при обратной транслитерации может пониматься как русская буква "и краткое" или же, как "мягкий знак". Обратимости на произвольной последовательности нет!

Транслит RV8+ строго обратим для произвольной последовательности русских букв:
Ь - JY, Й - JI, Щ - JW, Ъ - YJ.

Для обратимости транслита RV8 так же важно, чтобы в исходном тексте не было латинских букв. Если же латинские буквы имеются, то перед каждой из них нужно поставить точку.

Это означает, что в нашем транслите появился новый левый модификатор - точка. И конечно, эту дополнительную точку нужно учесть в процессе обратной транслитерации для восстановления латинских букв в исходнике.

Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Что такое транслит и зачем он нужен?

Иногда русские буквы недоступны, а латинские под рукой. Время от времени каждому приходится записывать русские слова латинскими буквами.

Но делаем мы это как бог на душу положит. Прочитать чужой транслит можно, но приходится напрягаться.

А если бы все придерживались одной системы, то всем бы это ОБЛЕГЧИЛО жизнь! Вы согласны со мной?

А что государство? Оно позаботилось о нас!

Есть государственный стандарт для транслитерации кириллический текстов, утверждённый официально в 2000 году.
http://docs.cntd.ru/document/1200026226

Но мало кто о нём знает. И, возможно, никто и нигде его не использует. На практике царит хаос. Это печально.

Да и ХОРОШ ли утверждённый государством транслит? Чего ВООБЩЕ стоит ждать от хорошего транслита?

1. Должны быть использованы традиционные соответствия между русскими и латинскими буквами по характеру типичных для них звуков: ф-f, к-k, л -l...

2. Желательно, чтобы правила транслитерации были простыми. Без оговорок типа "если и когда". Русская буква - Латинская буква, и всё. Но раз латинских букв 26, а русских 33, то некоторые русские буквы должны быть представлены двумя латинскими.

3. Желательно при транслитерации не использовать дополнительные небуквенные символы: типа апострофа, кавычек или скобок.

4. Текст, полученный в итоге транслитерации, не должен быть значительно длиннее исходника. Представьте, что вы набираете его на мобильнике, а не на полноценной компьютерной клавиатуре. Желательна краткость кода.

5. Не обязательно, но желательно, чтобы при транслитерации не происходила потеря информации. Если наш транслит обратим, то легко написать компьютерную программу, которая по результату транслитерации восстанавливает русский текст, записанный русскими буквами, причём в точности. Передача по линии без русских букв возможна. Их восстановят в приёмнике!

Много лет я перебирал разные варианты. Вы можете познакомиться с ними по ссылкам:

viewforum.php?f=22
https://www.youtube.com/playlist?list=P ... lXlYcx7_Z5

Мой лучший краткий (для мобильников) транслит - RV4. Если же нужна обратимость, то ничего лучше RV8 не придумаешь.

Как в деле транслитерации государство могло бы помочь людям? Как реально, а не на бумаге, ввести ОБЩИЙ стандарт?

Этап 1.

Отрытый государственный конкурс по транслитам разных категорий. Каждый может предложить свой вариант. В прессе активно обсуждаются участники и варианты. Может быть целый год обсуждают. Премия победителям - 1 миллион рублей в каждой категории.

Этап 2.

Внедрение. Государство имеет ресурсы, чтобы убедить важнейших игроков в интернете представить на своих сайтах критически важную информацию также и в утверждённом государством транслите, предварительно одобренном обществом. При этом мобильные операторы будут рекомендовать в случае необходимости использовать государственный стандарт, за его использование будут давать скидку. Именно ТАК транслит можно внедрить в практику. Для общего использования. Один - обратимый, другой - краткий, для мобильников.

---

RV8 - этот оптимальный транслит даёт достаточно краткий, ОБРАТИМЫЙ результат, правила транслита просты и апостроф в качестве дополнительного знака не потребуется.

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

Власти РФ утвердили официальный транслит для русского и других языков, использующих кириллицу. Однако этот транслит практически не используется. Вот какой результат он даёт...

// Утверждённый гостовский транслит ГОСТ 7.79-2000 (система Б)
Xrushhyov, ves` bul`on s``el? Na ch`yu e`to zhopu svoj kon`yak l`yosh`?
Krast`sya za cyganom. Na rajone el, pil e`l`.
Klon vidit zhyolty`j klyon i el`.
Bor`ba naxala za xlopok v cirke.
Noch` i moshh`, noch`yu vsej moshh`yu pishhala my`sh` vozle shiny`.
Vizhu shyolk, a gde shhyoloch`? Chyorny`j genij chertej.
Eyo pal`to. Fajer. Fraer. Kojot. Kayuk. Pod``ezd.
Me`r N`yu-Jorka ubit kop`yom. Bledny`j poe`t i bedny`e lyudi.
Prezident Y`n umy`lsya na e`tom steklyannom parashyute s drozh`yu.
Vse vsyo ponyali? Ob``yom ob``yasneniya.

Что можно сказать о нём? Слишком часто используется дополнительный символ - знак ударения (`). Строка получается рваной, читать неприятно. В угоду английскому языку использованы диграфы sh, ch, zh. Для русской буквы "щ" потребовалось аж три латинских "shh". Латинская "h" использована в качестве ПРАВОГО модификатора, поэтому ради обратимости транслита русскую букву "х" передают латинской буквой "x" по графическому сходству букв. Но это не стыкуется эстетически с англофильским характером данного транслита. В Англии ‘x’ читается [кс] .

Предложенный транслит обратим для правильного русского текста. Но для произвольного набора символов он не является обратимым. Поскольку "ьь" и "ъ" передаются одинаково (``).

Вот что Вам предлагает Николай Михайленко...

// Транслит RV8+, железобетонный. Простой и строго обратимый.!
Hrujwjov, vesji buljion syyel? Na cjiju yeto xopu svojj konjijak ljijowjj?
Krastjisja za cyiganom. Na rajjone el, pil yelji.
Klon vidit xjoltyijj kljon i eljj. Borjiba nahala za hlopok v qirke.
Nocji i mojwji, nocjiju vsejj mojwju pijwala myiwji vozle winyi.
Vixu wjolk, a gde jwjolocji? Cjornyijj genijj certejj.
Ejo paljito. Fajjer. Fraer. Kojjot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxjiju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата транслита RV8 в сравнении с действующим гостовским транслитом (который не действует фактически нигде).

Перехожу непосредственно к описанию лучшего транслита среди обратимых. Чтобы ненароком не потерять обратимости транслита мы сначала сделаем "железобетонный" транслит RV8+, который точно обратим, даже в применении к любой смеси латинских и русских букв, а затем, используя особенности русского языка сделаем из него экономный транслит RV8.

// RV8+, RV8.
// Транслит с плюсом строго обратим
// в применении к *произвольному* набору букв,
// RV8 обратим для *правильного* текста на *русском* языке.
// После русской буквы сначала указана её транслитерация в RV8+,
// а потом в RV8, если второй вариант не совпадает с первым.

// Латинская буква ‘y’ - ЛЕВЫЙ модификатор ТВЁРДОСТИ,
// её утроение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
y - yyy (латинская буква)

// Латинская буква ‘j’ - ЛЕВЫЙ модификатор МЯГКОСТИ/КРАТКОСТИ ,
// её удвоение в исходном тексте (если она там есть)
// необходимо для обратимости транслита.
j - jj (латинская буква)

// 2 буквы - знаки, не означают звуки сами по себе.
ь - jy (мягкий знак) - y (после согласной)
ъ - yj (твёрдый знак) - yy (после согласной).

// 5 букв - твёрдые гласные, модификатор ‘y’ - здесь делает твёрдым,
// русская буква "э" встречается редко,
// поэтому переводим её двумя латинскими.
a - а
э - ye
ы - yi (бледные - blednyie)
о - o
у - u

// 5 букв - мягкие гласные, они смягчают предшествую согласную,
// модификатор ‘j’ здесь делает мягким,
// русская буква "е" встречается часто, поэтому передаём одной латинской.
я - ja
е - e
и - i
ё - jo
ю - ju

// 1 буква - полугласная, всегда мягкая,
// модификатор ‘j’ здесь делает кратким.
й - ji - y (НЕ после согласной)

// 3 буквы - всегда твёрдые согласные
ш - w (укорочена средняя вертикаль)
ж - x (убрана средняя вертикаль)
ц - q (обе буквы с хвостиком)

// 2 буквы - всегда мягкие согласные (шипящие),
// модификатор ‘j’ здесь делает мягким,
щ - jw - ww (две буквы "ш" подряд - не бывает в правильном русском тексте!)
ч - c (как в итальянском, буква "ч" используется чаще, чем "ц")

// 15 букв - согласные, которые могут быть и твёрдыми и мягкими.
р - r
л - l
м - m
н - n

б - b
п - p
в - v
ф - f

д - d
т - t
з - z
с - s

г - g
к - k

х - h
---

2 + 5 + 5 + 1 + 3 + 2 + 15 == 33 == 26 + 7.
Всего 33 букв в русском алфавите! А в латинском - 26!

Латинская буква "y" используется и для "й", и для "ь". Зато буква "j" используется только как модификатор, сама по себе она не обозначает русской буквы. Таким образом, 26-ти латинским буква соответствуют 26 русских. Смотрите:

a-а b-б c-ч d-д
e-е f-ф g-г
h-х i-и j-НЕТ k-к
e-е f-ф g-г
l-m n-н o-о p-п
q-ц r-р s-с t-т
u-у v-в w-ш
x-ж y-(й/ь) z-з

Для баланса нужно добавить семь латинских диграфов, чтобы представить 33 русских. К 26 латинским буквам добавлены семь диграфов: ja, jo, ju, ye, yi, yy, ww. Совпало! Перевод русской буквы в латинскую происходит без учёта окружения русской буквы, а диграфы используются для МЕНЕЕ частотных букв. Транслит получился простой и экономный!
---

Для больших (прописных) букв действуют те же правила, что и маленьких (строчных)
---

Правила обратной транслитерации для RV8+.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yj - ъ

jj - j
ja - я
jо - ё
ju - ю
jw - щ
ji - й
jy - ь

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Правила обратной транслитерации для RV8.
Применяйте правила последовательно, когда найдёте подходящее - сделайте замену и сдвиньтесь на три, две или одну букву соответственно выбранному правилу.

yyy - y
yi - ы
ye - э
yy - ъ
y (после согласной) - ь
y (не после согласной) - й

jj - j
ja - я
jо - ё
ju - ю
ww - щ

r - р
l - л
m - м
n - н
...
x - ж
w - ш
c - ч

h - х
---

Посмотрите теперь осознанно на исходник и результат транслитерации...

// Тестовый пример для транслитерации:
Хрущёв, весь бульон съел? На чью это жопу свой коньяк льёшь?
Красться за цыганом. На районе ел, пил эль.
Клон видит жёлтый клён и ель.
Борьба нахала за хлопок в цирке.
Ночь и мощь, ночью всей мощью пищала мышь возле шины.
Вижу шёлк, а где щёлочь? Чёрный гений чертей.
Её пальто. Файер. Фраер. Койот. Каюк. Подъезд.
Мэр Нью-Йорка убит копьём. Бледный поэт и бедные люди.
Президент Ын умылся на этом стеклянном парашюте с дрожью.
Все всё поняли? Объём объяснения.

// Транслит RV8, лучший среди обратимых. Простой, краткий и без апострофа!
Hruwwjov, vesy bulyon syyel? Na cyju yeto xopu svoy konyjak lyjowy?
Krastysja za cyiganom. Na rayone el, pil yely.
Klon vidit xjoltyiy kljon i ely. Boryba nahala za hlopok v qirke.
Nocy i mowwy, nocyju vsey mowwyju piwwala myiwy vozle winyi.
Vixu wjolk, a gde wwjolocy? Cjornyiy geniy certey.
Ejo palyto. Fayer. Fraer. Koyot. Kajuk. Podyyezd.
Myer Nyju-Yorka ubit kopyjom. Blednyiy poyet i bednyie ljudi.
Prezident Yin umyilsja na yetom stekljannom parawjute s droxyju.
Vse vsjo ponjali? Obyyjom obyyjasnenija.
---

Оцените краткость и красоту результата простого и обратимого транслита RV8!

Каждая русская буква, транслитерируется НЕЗАВИСИМО от её окружения. Результат можно обратить ПРОСТОЙ программой. Не использованы дополнительные символы, нам достаточно 26 латинских букв. Диграфы не нужны для шипящих "ш/ж/ч". Нам хватило семь диграфов ja, jo, ju, ye, yi, yy, ww, они используются для оставшихся 7 русских букв из 33 букв русского алфавита. Результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что диграфы использованы для менее частотных русских букв. Например: Ь/Й - Y, Ъ - YY. Переход от ОБРАТИМОГО транслита RV8 к СВЕРХЭКОНОМНОМУ RV4 (для мобильников) происходит ЭЛЕМЕНТАРНО!

Для закрепления правил RV8 транслитерируем русский алфавит целиком.

Действующий русский алфавит с транслитом букв.

а/a б/b в/v г/g д/d
е/e ё/yo ж/x з/z
и/i й/y к/k л/l м/m н/n
о/o п/p р/r с/s т/t
у/u ф/f х/h ц/q
ч/c ш/w щ/ww
ъ/yy ы/yi ь/y
э/ye ю/ju я/ja

Новый русский алфавит с транслитом букв.

ь/y ъ/yy // знаки мягкий и твёрдый

а/a я/ja е/e э/ye и/i ы/yi // гласные, частотные раньше
о/o ё/jo у/u ю/ju

й/y // полугласный

р/r л/l м/m н/n // сонорные, не имеют глухой пары

б/b п/p в/v ф/f // согласные переднего ряда
д/d т/t з/z с/s ц/q // взрывные раньше щелевых, а звонкие - глухих.

г/g к/k // согласные заднего ряда

ж/x ш/w щ/ww ч/c // двухфокусные, шипящие

x/h // глоточный глухой
---

Достоинством транслита RV8 является его ПРОСТОТА: при замене русской буквы не надо учитывать её окружение! Транслит этот также экономный: семь необходимых диграфов используются для МЕНЕЕ частотных букв.

Можно ли сделать транслит более экономным, чем RV8. Если не требовать лёгкой обратимости транслита, то ДА!

Смотрите RV4 - лучший транслит для мобильников, очень экономный. Хоть при работе этого транслита инфа частично теряется, но результат транслитерации будет легко понятен носителю русского языка. Так хитро этот транслит устроен!

Перейти от RV8 к RV4 очень просто. Правила транслитерации нужно видоизменить в следующих пунктах:

Русская буква - RV8 -- RV4.

1. й - y - j
2. ь - y - j
3. ъ - yy - j
4. ы - yi - y
5. э - ye - e
6. щ - ww - wj

Плюс, в RV4 действуют правила сокращения, которых не надо в обратимом RV8.

Смотрите RV4 - лучший транслит для мобильников, очень экономный.
viewtopic.php?f=22&t=818

Пробуйте!
------------------------------------------------------------------------

RV9 - лучший транслит среди красивых и обратимых.
Мы использовали для передачи Й/Ь латинскую букву "Y" (модификптор твёрдости), а разве не будет натуральнее и красивее употребить для этой цели латинскую букву "J" (модификатор мягкости), как это имеет место в сверхэкономном транслите RV4?

Да, такое такое возможно, но транслит RV9 будет сложнее, чем RV8. Для русских букв "Ь/Й/Ы" придётся учитывать иx окружение при транслитерации. Красивый, экономный и обратимый транслит RV9 не будет простым.


---------------------------------------------------------------------------------------
Помимо транслитов мной разрабатывается новая орфография русского языка. Речь не о простой замене русских букв на латинские, а о система правил для передачи русских звуков (не букв!) на письме с использованием классических латинских букв - система LM.

См. https://newsland.com/community/4109/con ... -2/7315188

Не путайте простые транслиты RV8/RV4 с системой LM (Латиница Михайленко) - это новая орфография для русского языка с использованием латинских букв. LM пока в зародыше, там много новых правил. Желательно чтобы буквы регулярно соответствовали звукам языка, но надо отобразить и устойчивость морфем и учесть связи русских слов с иностранными языками, и избавиться от того, что утратило всякий смысл. LM - сложная система для решения сложной задачи.

Hruwõv, ves̃ bul̃jon sjel? Na cju ęto xopu svoj koñjak l̃jow?
Krast̃sã za qyganom. Na rajone jel, pil ęl̃.
Klon vidit xoltyj klõn i jel̃. Bor̃ba nahala za hlopok v qyrke.
Noc i mow̃, nocju vsej mow̃ju piwãla myw vozle wyny.
Vixu wolk, a gde wõloc? Cornyj genij certej.
Jejo pal̃to. Fajjer. Frajer. Kojot. Kajuk. Podjezd.
Męr Ñju-Jorka ubit kop̃jom. Blednyj poęt i bednye lũdi.
Prezident Yn umylsã na ętom steklãnnom parawute s droxju.
Vy vsõ ponãli? Objom objasnenija.

Onegin dobryj moj prijatel̃
Rodilsã na bregah Nevy
Gde moxęt byt̃ rodilis̃ Vy
Ili gulãli moj citatel̃

Мягкий знак здесь передаётся тильдой над согласной или следующей за ней гласной. Твёрдый знак оказался не нужен. Буква "я" переходит в "ã" после согласной, и "ja" в остальных случаях. Буквы "Ш/Щ" передаются одной буквой "W", которая варьируется по мягкости. "J/C" - всегда мягкие, "X/Q" - всегда твёрдые. После твёрдых согласных никогда не пишутся мягкие гласные "I/E". Таково начало правил новой русской орфографии - Латиницы Михайленко (LM).

Перейдёт ли Россия на латиницу через 50 лет? Голосование!
https://maxpark.com/community/4109/content/6705649

---
"Строгие Правила на Канале Николая Михайленко. Бояться!"
http://maxpark.com/community/5946/content/2517452

Nikolaj.Mihajlenko
Администратор

Сообщения: 1081
Зарегистрирован: 25 сен 2010, 19:25
Вернуться к началу
Re: RV8 - лучший транслит среди обратимых. 22.08.2021.
Сообщение Nikolaj.Mihajlenko » 23 авг 2021, 18:40

Обсудить можно здесь:
https://newsland.com/community/4109/con ... 21/7459625
http://filolingvia.com/publ/rv8_luchshi ... 9-1-0-7467
Nikolaj.Mihajlenko
Администратор

Сообщения: 1081
Зарегистрирован: 25 сен 2010, 19:25
Вернуться к началу
Re: RV8+ (он же RJY) - железобетонный транслит русских букв.
Сообщение Nikolaj.Mihajlenko » менее минуты назад

этом результат транслитерации НЕ сильно раздут в сравнении с русским оригиналом, потому что диграфы использованы
Nikolaj.Mihajlenko
Администратор

Сообщения: 1081
Зарегистрирован: 25 сен 2010, 19:25
Вернуться к началу
Показать сообщения за:
Все сообщения
Поле сортировки
Время размещения

по возрастанию

Ответить
Сообщений: 3 • Страница 1 из 1
Вернуться в Новые умные транслиты для русского языка.

Перейти:
Новые умные транслиты для русского языка.

Быстрые действия:
Закрыть тему

КТО СЕЙЧАС НА КОНФЕРЕНЦИИ
Сейчас этот форум просматривают: Nikolaj.Mihajlenko и гости: 2

Список форумовПодписаться на темуВ закладкиНаша команда • Удалить cookies конференции • Часовой пояс: UTC + 3 часа
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB
Администраторский раздел
Nikolaj.Mihajlenko
Администратор
 
Сообщения: 1088
Зарегистрирован: 25 сен 2010, 16:25


Вернуться в Калькирующий язык Русанто (с Эсперанто)

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2