середа, 9 квітня 2008 р.

Досконала транслітерація


Перед тим, як почати говорити про проблему української транслітерації, доцільно сформулювати, а що саме нам мені потрібно. Отже, в порядку пріоритетности:
  1. Однозначність. Правила транслітерування мають бути однозначними в обидва боки. Це означає, що будь-який український текст можна транслітерувати, а потім з цього транслітерованого результату однозначно відновити початковий текст.

    Без цього я взагалі не розумію, кому така транслітерація допоможе... Зокрема, якщо в одних закордонних паспортах пишуть Olexandr, а в инших Oleksandr, це мабуть щось таки говорить про розумові здібності співробітників МЗС.

  2. Використовувати тільки основні символи латинського алфавіту. Це означає — ніякої розширеної латинки! Якщо транслітерацію використовувати тільки для написання прізвищ, звичайно можна повимахуватися модифікованими символами, але все рівно слід зважати на те, що ці символи легко губляться.

    Якщо ж використовувати транслітерацію для практичних потреб (написання SMS або текстового набору поза Україною), стандартна латинка — єдине рішення. Ці букви є на всіх клавіатурах, мобільних пристроях й инших системах вводу, не кажучи вже про те, що вони завжди кодуються одним байтом.

  3. Простота. Правила перекодування мають бути простими для того, щоб людина могла писати латинськими буквами не користуючись таблицями логарифмів без необхідности запам'ятовувати довгий список правил і виключень. Можна звичайно спробувати вигадати щось складне, але в цьому разі можна бути абсолютно певним, що ніхто таким користуватися не буде, навіть сам автор.

  4. Зрозумілість. Хотілося б, щоб люди, які не знають української мови, все ж змогли прочитати, хоча б приблизно, відтрансльований текст. Це навіть не вимога, а просто побажання — думаю, нам не варто аж так сильно перейматися проблемами неосвічених людей!
Власне, проблеми з буквами а, б, в, ґ, д, е, з, к, л, м, н, о, п, р, с, т, у, ф не виникає взагалі, оскільки вони мають свої латинські відповідники. букви є, і, ї, ц, ч, щ, ю, я, як я вже писав, можна викинути. Отже, залишається менше десятка...

Букви г, ж, х, ш традиційно транслюються відповідно як gh, zh, kh, sh. Це правило, на мою думку, прекрасно відповідає всім чотирьом вимогам, і вигадати щось краще дуже важко, якщо взагалі можливо.

Букви и, і, ї та й потребують окремого розгляду. Звичайно і та ї можна викинути, і це було б доцільно, якби ми намагалися транслітерувати якимись абстрактними символами. Але латинка має букву i, якає аналогом саме для української і. До того ж, не всім може сподобатися ідея вживати м'який знак на початку слова для позначення початкової і.
Букву ї тоді можна представити як йі, і нам залишається визначити правила транслітерації для и та й.
Букви и звичайно транслітерують як y, а й — як j. Це відповідає трьом першим вимогам. Що стосується останньої, то аналог букви и взагалі знайти важко, а j традиційно вживається для позначення короткого и в слов'янських мовах, які користуються латинською абеткою. Але тут слід зробити невелике зауваження. Проблема з вимогою №4 полягає в тому, що в романо-германських мовах буква j читається дуже по-різному. До того ж, насправді, використовувати для и та й окремі символи зовсім необов'язково. Якщо и та й транслітерувати як y, то
  • українське написання можна відновити в більшості випадків завдяки чергуванню,
  • читатися така транслітерація буде краще, оскільки сама буква y звичайно читається коротко біля голосних.
Звичайно тут є певні проблеми: наприклад з и на початку слова або перед голосною, як у слові виокремити. Але в цьому разі після y доцільно ставити апостроф, причому так він використовуватиметься за прямим призначенням: для відділення букв.
Звичайно, цей варіянт є перекосом на користь пункту №4 за рахунок простоти, тобто більш пріоритетного пункту №3. Але важливо зазначити, що тут у нас є вибір: або транслітерувати и та й окремими буквами y та j (простіше), або одною y з допомогою апострофа в поодиноких випадках (зрозуміліше иноземцям), або ж певний компромісний варіянт (наприклад, транслітерувати й як y тільки перед голосними е, і, у, а, тобто для є, ї, ю, я, коли вони позначають два звуки).

М'який знак звичайно транслітерують за допомогою апострофа. І тут, за великим рахунком, докопатися нема до чого. Це традиційно, просто, а пункт №4 — це всього лише побажання... Навіть з апострофом для розділення y з голосними (як варіянт) неможливо сплутати. Але є чисто технічні труднощі:
  • Апостроф — це не буква, тому не розрізняється великий м'який знак (в курсиві) і маленький (в тексті).
  • Апостроф вживається для відділення не тільки букв є, ї, ю, я, але й для відділення инших букв, наприклад у французьких прізвищах (згадаймо класичного д'Артаньяна). При транслітерації такі апострофи будуть втрачені або ж неправильно відновлені при зворотній конвертації.
  • Оскільки апостроф після транслітерації означає зовсім не те саме, що в українському тексті, це суттєво ускладнює редаґування українського тексту за допомогою транслітератора.
Як правильно розв'язати ці проблеми я не знаю. Одним з варіянтів є використання букви q, яка за зовнішнім виглядом схожа на перевернутий м'який знак. Але, на мою думку, це аж занадто радикальне іґнорування вимоги №4. З q замість ь українська латинка стає абракадаброю не тільки для иноземців, але й для українців зі слабкими нервами. Втім, можливо, вихід існує, адже у нас є буква h, яка
На жаль, очевидно, на цьому шляху є велика проблема. Ми не можемо писати м'який знак після ґ, з, к, с. Припустимо навіть що після ґ ми м'який знак взагалі не очікуємо, а м'яку к позначатимемо, наприклад, тою ж q. Але з і с м'якими бувають дуже часто! І що з цим робити???

Якщо знайти відповідь на це запитання, можна було б створити прості правила транслітерації, для всіх потреб!

Нема коментарів

Дописати коментар