Як виглядає китайська клавіатура?

Як виглядає китайська клавіатура?

Як виглядає китайська клавіатура?

Ви, ймовірно, уявляли її собі як цілий орган — грандіозна споруда довжиною в пару метрів з сотнями і тисячами клавіш. Насправді, більшість китайців використовують звичайну клавіатуру з латинською розкладкою QWERTY. Але як за допомогою неї можна набрати таку силу-силенну різних ієрогліфів?

Історія питання: друкарські машинки

За кілька тисяч років хитромудрі китайці встигли довести кількість ієрогліфів до 50000 з хвостиком. І хоча число потрібних у повсякденному житті знаків не вимірюються десятками тисяч, все одно, як не крути, стандартний набір старої друкарні — 9000 літер.

Довгий час набір здійснювався за принципом «на кожен ієрогліф — окремий друкований елемент». Тому працювати доводилося з машинками-монстрами на зразок такої:

Друкарська машинка фірми «Шуанге», 1947 рік (принцип дії винайдений японцем Кіото Сугімото в 1915 році).

Друкарська машинка фірми «Шуанге», 1947 рік (принцип дії винайдений японцем Кіото Сугімото в 1915 році).

Основний її елемент — банк ієрогліфів, які перебувають на чорнильній подушці. Над ієрогліфами закріплена механічна система: рукоятка, «лапка» для обхвату і бобіна з аркушем паперу. Керований машиністом механізм здатний переміщатися вліво, вправо, вперед і назад. Щоб набрати текст, машиніст довго шукає з лупою потрібний ієрогліф, поміщає над ним систему і натисканням на ручку приводить в дію «лапку», яка витягує ієрогліф і на ходу, розгортаючи, друкує його на аркуші паперу. При цьому бобіна з листом трохи провертається, надаючи місце для наступного символу. Зрозуміло, процес друку на такому агрегаті виходить вкрай повільним — досвідчений оператор міг набирати не більше 11 ієрогліфів в хвилину.

У 1946 році відомий китайський філолог Лінь Юйтан запропонував варіант друкарської машинки, побудованої на зовсім новому принципі — розкладі ієрогліфів на складові частини.

Електромеханічна друкарська машинка Лінь Юйтан, 1946 р.

Електромеханічна друкарська машинка Лінь Юйтан, 1946 р.

На відміну від габаритних попередниць, нова машинка не була більшою за своїх латинських аналогів, та й клавіш на ній було небагато. Справа в тому, що клавіші відповідали не ієрогліфам, а їх складовим частинам. У центрі пристрою знаходилося «магічне око»: коли машиніст натискав комбінацію клавіш, в «оці» з’являвся варіант ієрогліфа. Щоб підтвердити вибір, потрібно було натиснути додатковий функціональний ключ. При наявності всього 64 клавіш така машинка легко могла забезпечити набір 90,000 знаків і швидкість 50 знаків в хвилину!

Хоча Лінь Юйтан примудрився отримати на свій винахід патент в США, в маси вона так і не пішла. Не дивно, адже виробництво одного такого апарату коштувало на той момент близько 120 000 доларів. До того ж в день, коли була призначена презентація для компанії «Ремінгтон», машинка відмовилася працювати — навіть «магічне око» не допомогло. Ідею благополучно відклали до кращих часів.

Проте, в еру широкого поширення комп’ютерів, ідея Лінь Юйтан про розкладанні ієрогліфів на складові частини знайшла нове життя. Вона стала основою структурних методів введення китайських ієрогліфів, про які ми зараз і поговоримо.

(До речі, в 80-і роки тайванська компанія MiTAC навіть розробила безпосередньо на підставі системи кодування Лінь Юйтан свій метод структурного введення — Simplex)

Структурні методи

Таких методів відомо не менше десятка, і всі вони засновані на графічній структурі ієрогліфа. Китайські ієрогліфи — це пазли, що збираються з одних і тих же частин (т.зв. графем). Кількість цих графем не така велика — 208, і їх уже можна «запхати» в звичайну клавіатуру. Правда, вийде близько 8 графем на одну клавішу, але ця проблема легко вирішується.

Один з найпоширеніших методів структурного введення — уби цзисін (Wubing Zixing — «по введенню п’яти рис»). Як же він працює? Відразу попереджаю: складно.

Насправді всі китайські ієрогліфи діляться на чотири групи:

  1. 5 базових рис (一, 丨, 丿, 丶, 乙) і ще 25 дуже часто вживаних ієрогліфів (кожному з них надана клавіша).
  2. Ієрогліфи, між графемами яких є певна відстань. Наприклад, ієрогліф 苗 складається з графем 艹 і 田, між якими є відстань (хоча під час друкування вони трохи «спресовуються» і  може здатися, що відстані між ними немає).
  3. Ієрогліфи, графеми яких з’єднані один з одним. Так, ієрогліф 且 є графемою 月 з’єднаною з горизонтальною лінією; 尺 складається з графеми 尸 і відкидної риси.
  4. Ієрогліфи, графеми яких перетинаються або накладаються одна на одну. Наприклад, ієрогліф 本 — це перетин графем 木 і 一.

Ну ось, ми подумки розбили ієрогліф, який збираємося ввести, на графеми. Що далі? Спочатку подивимося на розкладку уби:
image

На перший погляд може здатися, що графеми розташовані безладно. Насправді це не так. Клавіатура розбита на п’ять зон, по кількості базових рис, (на малюнку вони виділені різними кольорами). Всередині кожної зони клавіші пронумеровані — від центру клавіатури до країв. Номер складається з двох цифр від 1 до 5 — в залежності від того, з яких базових рис складається графема.

Ну що ж, почнемо з найпростіших для введення графем — заголовних графем кожної клавіші (вони виділені великим шрифтом в таблиці). Кожна з них представляє собою один із 25 часто вживаних ієрогліфів, про які йшла мова вище. Щоб ввести такий ієрогліф, досить натиснути чотири рази на відповідну клавішу. Виходить, що 金 = QQQQ, 立 = YYYY і т. п.
image
Таким чином, 毅 = U + E + M + C. Для введення ієрогліфів, що складаються більш ніж з чотирьох графем, потрібно ввести перші три графеми і останню.

Найскладніше вводити ієрогліфи, що складаються з двох або трьох графем. Оскільки їх дуже багато, то неминуче з’являться кілька ієрогліфів, які претендують на одну і ту ж комбінацію клавіш. Щоб їх розрізняти, розробники придумали спеціальний код. Цей код складається з двох цифр, перша — порядковий номер останньої межі ієрогліфа, а друга — номер групи ієрогліфа (згадайте чотири групи, на які поділяються ієрогліфи).

На щастя, при наборі часто використовуваних ієрогліфів не доведеться думати про коди: ієрогліфи будуть з’являтися на екрані вже після перших двох або трьох натискань. А 24 найбільш уживаних знаків можна і зовсім ввести одним натисканням — їм призначені відповідні клавіші.

Недоліки структурного введення очевидні: він складний — нами була описана тільки його дайджест-версія! Щоб освоїти його, китайці навіть спеціальний мнемонічний віршик придумали. Зате структурний метод відкриває можливість сліпого набору тексту, що підвищує максимальну швидкість набору до 160 символів за хвилину. Тому професійні друкарі використовують саме його. І не забуваємо: 160 ієрогліфів за хвилину — це близько 500 натискань клавіш за ту ж хвилину!

Для структурного набору найчастіше використовують саму звичайну клавіатуру QWERTY — адже розташування ієрогліфів на ній все одно доводиться вчити. Але іноді можна зустріти і ось такі клавіатури з графемами на клавішах:

image

Правда, такі клавіатури  в Китаї побачити можна не часто :)

Фонетичні методи

Друкарських машинок, що використовують ці методи набору, просто не існує — своєю появою фонетичні методи зобов’язані виключно комп’ютерам. Адже використовуючи фонетичний метод, ви вводите не сам ієрогліф, а його вимову — і система вже знаходить потрібний ієрогліф. Але ось проблема: в китайській мові стільки знаків, що одній і тій же вимові можуть відповідати десятки ієрогліфів. Потрібний ієрогліф, як правило, доводиться вибирати вручну зі списку, що робить процес введення досить повільним. На допомогу приходять інтелектуальні системи на зразок T9.

Найбільш поширений фонетичний метод — знаменитий піньінь (піньінь). На його основі побудована система фонетичного введення, яка входить в стандартний азіатський Language Pack системи Windows, (починаючи з версії XP — до цього її доводилося ставити додатково). Поглянемо, як вона працює.

Наприклад, ми хочемо ввести слово «блогер» — ванмінь.

Набираємо спочатку Ванг (або wang3 із зазначенням тони, щоб зменшити кількість варіантів). Після натискання пробілу підставляється ієрогліф з читанням ван. Але це не той ван, що нам потрібен. Тиснемо на нього правою кнопкою:

image
Зʼявляється довгий рядок відповідностей. Ми можемо, ламаючи очі, шукати там наш ван або просто ввести другий склад слова — хв. Система розумна — вона сама знайде в словнику слово ванмінь і автоматично вибере потрібний ван і потрібний мінь. Банзай, ми зробили це!

image
Системи введення Google Pinyin і Sogou Pinyin пішли далі — вони запам’ятовують користувальницькі переваги і підказують потрібні слова по контексту.

Ось приклад того, як Google Pinyin аналізує, здавалося б, зубодробильну послідовність

image
і видає правильний варіант набору:

Я бачив, як Ван Чжічжі грав в одному матчі з Яо Міном (мова йде про двох китайських баскетболістів НБА). Особливо приємно, що імена написані правильно.

На Тайвані існує і альтернатива піньінь-системі — введення по Чжуїнь (Zhuyin). Використовується не латинський алфавіт, а складова азбука зі знаками на зразок ієрогліфів. Оскільки значків в абетці небагато, їх легко розкидати по клавіатурі. У Гонконзі є свій варіант романізації для місцевого діалекту — ютпхін (Jyutping), він теж активно використовується для фонетичного вводу.

Основним недоліком систем фонетичного введення є досить низька швидкість друку — близько 50 знаків в хвилину (порівняйте з уби цзисін з його 160 знаками в хвилину). Справа в тому, що введення ієрогліфа за методом піньінь відбувається, в середньому, за шість натискань клавіш, тоді як при введенні по уби цзисін буде досить чотирьох. До того ж, сліпий набір даним методом неможливий. І потім, потрібно знати піньінь / чжуїнь, що далеко не кожному китайцеві підходить, так як з першого класу шкільні знання (якщо і були) вже дещо розсіялися. Та й не завжди легко згадати, як читається якийсь рідкісний ієрогліф. Тому в Китаї все більшої популярності набирає уби цзисін. Проте, піньінь вивчити все одно простіше, ніж структурні методи. Ну, а іноземцю така система просто як бальзам для душі.

Як ми бачимо, для фонетичного введення нам також не буде потрібно якась спеціальна клавіатура — достатньо будь-якої клавіатури з латинською розкладкою QWERTY. Ну, наприклад, цілком підійде та, яка знаходиться перед вами :)

Гібридні методи

Ці методи являють собою якусь комбінацію фонетичних та структурних методів введення. Найпростіший приклад — метод іньсін (Yinxing — «звучання і форма»). Ієрогліф набирається шляхом введення транскрипції і вказівки на графічний елемент. Обмежений набір графічних елементів рознесений по клавіатурі, так що запам’ятати їх теоретично не складно.

На практиці системи гібридного введення поступово вимирають. Вони вимагають від користувача одночасно знання складної комбінаторики структурних систем і доброго володіння транскрипцією. Простіше освоїти досконало щось одне.

Чи є «стандартний» метод?

А ось і ні. У КНР найбільшою популярністю користуються структурний метод уби і фонетичний піньінь. На Тайвані люблять фонетичний метод чжуїнь (оскільки багато вчили в школі саме його, а не піньінь) і морально застарілий структурний метод цанцзе (Cangjie). Він був винайдений в 1976 р і зберіг з того часу всі свої недоліки: цим методом дуже складно вводити пунктуаційні знаки, потрібно завжди вгадувати правильний спосіб розбивки ієрогліфа і пам’ятати складну розкладку (багато тайванців від безвиході навіть наклеюють її на монітор). У Гонконзі цанцзе вчать в школі і віддають йому перевагу перед іншими методами.
Методи, засновані на розпізнаванні

Виходить, що жоден з перерахованих методів клавіатурного введення не є ідеальним. Не дивно, що китайці вирішили вчепитися за свою останню надію — розпізнавання. Зараз розпізнавання як мови, так і рукописного введення входить в стандартний мовний пакет для Windows 7. Передбачається, що перед використанням краще перевести систему в «режим навчання» як мінімум хвилин на 15, щоб дати їй час адаптуватися до почерку і особливостей мови.

Але методи, засновані на розпізнаванні, так і не набули широкого розповсюдження. Введення за допомогою клавіатури, як і раніше вважається більш надійним.

Розпізнавання усної китайської мови ускладнюється тим, що людей з ідеальним вимовою дуже небагато. Діалектні особливості проявляються то тут, то там і псують всю картину. Про іноземців, для яких освоїти чотири тони — вже подвиг, і говорити не доводиться.

Рукописне введення ієрогліфів виявляється справою простішою, до того ж зараз існує безліч PDA, які підтримують цей метод вводу. Але і цей метод не досяг широкого застосування. Справа в тому, що китайці в своїй більшості пишуть нечленороздільним курсивом і перебудуватися на повільне вимальовування кожної риси їм буває складно. Часто проблема в тому, що вони просто не пам’ятають нормальний порядок рис, тому що звикли писати скорочені форми. Ось і виходить, що введення, засноване на розпізнаванні, використовується в основному тими людьми, які вивчають мову, чим активно користуються онлайн-словники. Наприклад, на сайті популярного Nciku всім бажаючим пропонується намалювати потрібний ієрогліф за допомогою миші, а потім вибрати із пропонованих системою варіантів:

image
І все-таки вона існує!

Експериментальна китайська клавіатура, безглузда і нещадна.

Експериментальна китайська клавіатура, безглузда і нещадна.

Адже саме так ви її собі уявляли?

Так, так, китайські клавіатури з тисячами клавіш існують. Правда зі зрозумілих причин вони не йдуть в серійне виробництво, залишаючись таким собі артефактом.

Але, погодьтеся, все-таки приємно усвідомлювати, що така клавіатура десь є!

Читайте также:

Copy Protected by Chetan's WP-Copyprotect.