На титульную страницу 11 Декабря, №5

 
Композиционный ввод.
Проще простого.

    Проще простого о композиционном вводе. Не стоит лукавить — композиционный ввод это самый простой способ ввода, но для того, чтобы это понять, нужно сначала понять, что такое композиционный ввод вообще. Об этом и будет этот текст. Хотя мне придётся упомянуть и  другие способы ввода. Это неизбежно, поскольку уже заголовок этого текста использует сравнительную степень прилагательных. С чем сравнивать? Простой вопрос. И непростой вопрос. С чем сравнивать. И зачем сравнивать. Зачем? "Я и так знаю как писать иероглифы", - сказал мне один хороший китайский мальчик лет тридцати пяти — сорока, которому я пока­зывал, как я выполняю домашние задания по переводу китайского текста. Его задания. Он дал мне простенькую книжку для иностранных студентов, изучающих китайский и попросил перевести её на английский. По-русски он не говорил. Текст был по частям переведен за 8 за­нятий. Это был мой единственный "натурный эксперимент" по выяснению эффективности использования композиционного ввода. После того, как был выполнен перевод первой главы, я пока­зал Чао, так звали мальчика, текст этой главы на своём ноутбуке. Вторая глава была сдана так же: устный перевод текста на английский и дополнительно пере­писанный текст на китайском.  В этот раз Чао спросил меня: "Борис, сколько времени Вы тратите на домашнее задание?" "Час — полтора", - ответил я. Молчание и недоверчивый взгляд в ответ. На следующем занятии я показал ему, как ищу иероглифы в электронном (котовском) словаре и предложил научить его композиционному вводу. "Зачем? Я и так знаю как писать иерогли­фы", - был его ответ.
    Так за восемь занятий на моём ноутбуке появился текст в 11442 иероглифа. Точный хро­нометраж я не вёл, но больше полутора часов не занимался китайским ни разу. Для вящей убедительности посчитаем все мои восемь занятий полуторачасовыми. Мы получим 43200 секунд. Это 3,77 секунды на иероглиф. Меньше четырёх секунд. Ладно бы просто перепи­сать иероглиф чётко, правильно, типографским шрифтом. Вы так можете, по чёрточкам? А потом найти его в словаре, соотнести с соседями по значению и собрать в более-менее осмысленное предложение по-русски. Контрольный эксперимент проводить нужно?
    Не нужно. Совершенно понятно, что натурный эксперимент закончился оглушитель­ным провалом. Осчастливить человечество не удалось. "Я и так знаю, как писать иерогли­фы"… Рукописный ввод имеет одно неоспоримое преимущество перед всеми другими систе­мами ввода, а именно, нет никакой необходимости переучиваться, если ты однажды освоил рукописный ввод. Скорость? Наплевать,  "я и так знаю, как писать иероглифы". Качество? Неважно, у меня проблем нет, свой смартфон я могу "научить" распознавать любые каракули рукописного ввода. Способ передачи следующим поколениям? Просто "делай как я": наши предки так учились, мы так учились, - почему же нынешние школяры должны учиться иначе? Долго? А мы нику­да не спешим… Оп! Вот эта лазейка в стене непробиваемых аргументов! А мы-то спешим. У нас нет десяти лет на освоение четырёх-пяти тысяч иероглифов, как у китайских школьни­ков. Нам нужно всё здесь и сейчас. Вот прямо сейчас и начнём.

    Принцип композиционного ввода заключается в том, что все иероглифы состоят из неких стандартных компонентов, число которых конечно и заведомо меньше числа иероглифов. На самом деле иероглифы можно разделить на вполне произвольное число компонентов: так, так или так. Но нам не интересны произвольные компоненты иероглифа, нам нужны компонен­ты, которые повторяются и в других иероглифах и повторяются достаточно часто. И тут оказывается, что эти компоненты могут сами выступать в качестве отдельных иероглифов и имеют вполне определённые имена: глаз (目), рука (手), вода (水), огонь (火), человек (人), лошадь (马), птица (鸟), дерево (木). А некоторые из них в качестве отдельных иероглифов не замечены, но имена тоже имеют: откидная (丿), крюк (亅), крышка (冖). И уж совсем малое их число даже имён не имеют, но мы, по аналогии с ранее упомянутыми, дадим и им имена: козырёк (), крюк вправо (㇙). Вот эти поименованые компоненты иероглифов будем называть знаками. При этом мы понимаем, что знак может быть и отдельным иероглифом, но в составе другого иероглифа он является просто знаком, т. е. поименованым графическим объектом. Таким образом, мы решили, что иероглифы состоят из знаков. Иероглиф может состоять из одного знака, как иероглиф птица (鸟), гора  (山), или из нескольких знаков, как иероглиф остров (岛) из знаков птица и гора. И здесь важно понять, что иероглиф состоит из знаков и только знаков, что в иероглифе ничего кроме знаков нет. Иероглиф делм на знаки, и делм нацело. Уже это позволяет нам начать составлять иероглифы из их компонентов (про которые мы уже знаем, что это знаки): знаки женщина (女) и ребёнок (子) это иероглиф хороший (好). Вот и всё. Остальное — детали.
    Но как раз в деталях и скрываются бесы. И первое убежище бесов — варианты знаков. Знак сердце (心) в иероглифах может выглядеть ещё и так  忄, и так ⺗ (см., например, иероглифы  性 и 恭). А знак нож (刀) сверху иероглифа выглядит так — ⺈ (负), а сбоку так —刂  (划). Таких знаков с вариантами 18 шт., их вместе с вариантами придётся просто запомнить. Вообще количество знаков, из которых можно "составить" иероглифы, зависит от системы письма. Например, для современного китайского в упрощённом начертании нужно 200 таких знаков, для современного японского тоже 200, но несколько иных, для тангутского достаточно 168 шт. Строго говоря, эти "строительные кирпичики" иероглифов в структурной иероглифике имеют специальное название — графы. Кому это интересно и кому нужны строгие формальные определения, читайте "Введение в структурную иероглифику".
    Второе убежище бесов — число знаков в иероглифах. Больше половины иероглифов состоят из одного, двух и трёх знаков. В китайском их 59 %, в тангутском 61%, в японском 65%. А что дальше? По собственному опыту скажу — после трёх знаков ввод становится скучным. "Высматривать" четвёртый и пятые знаки становится неинтересно. Внимание перемещается на поиск нужного иероглифа в предложенных кандидатах. Никакого желания помнить последовательность знаков иероглифа нет и в помине. Сколько можно? Я ввёл уже три знака, а результат где? Эффективный ввод должен ограничиваться тремя знаками. Не больше. А что делать с почти половиной иероглифов, которые состоят из большего количества знаков?
    Простой иероглиф — гусь (鹅). Совершенно очевидно он состоит из трёх знаков: рука (手), копьё (戈), птица (鸟). При том, что последовательность знаков рука-копьё встречается в иероглифах 16 раз, копьё-птица — 3 раза, а последовательность рука-птица единственный раз в иероглифе гусь. Как бы мы не вводили эти знаки: рука и птица или птица и рука, — ни в одном иероглифе кроме гуся вместе они не встречаются. Вот такая характеристическая последовательность знаков, которая отличает один иероглиф от всех остальных и называется маркёром. "Рука-копьё" — маркёр гуся. У каждого иероглифа есть маркёр, причём, и это важно, маркёр диной не более трёх знаков. Последовательность из трёх знаков однозначно определяет каждый иероглиф. Обратите внимание, я сказал "последовательность", и это тоже важно. Чтобы не морочить голову ни себе, ни машине, маркёр проще запомнить и предъявлять на ввод именно как последовательность первого, второго и третьего знака, если их в маркёре три. А бывает, как мы видели на примере гуся, и 2 знака. И таких "двузначных" маркёров 64,5 %. А если соотнести частоту этих маркёров с частотой употребления иероглифов, то окажется, что в 82-х случаях из ста при наборе произвольного текста вы будите использовать лишь 2 клика на иероглиф.
Ещё один маленький бесёнок спрятался в наборе знаков, из которых "собираются" иероглифы. Это не знак вовсе, если быть точным. Это именно граф. Если вам недосуг обращаться к строгим определениям структурной иероглифики, просто запомните, что есть особый "знак-не-так". Изображается он обычной типографской звёздочкой — "*". Как отличить иероглиф птица (鸟) от иероглифа чёрный (乌) ? Просто скажем, что чёрный это то же что и птица, но слегка "не то". Иероглиф чёрный будем обозначать как 鸟*. Другими словами, чёрный состоит из одного "слегка изменённого" знака птица. Или вот задача: различить иероглифы  员 и呗, если оба состоят из одних и тех же знаков (口 и 贝). Решается она просто: иероглиф  员 оставляем "как есть"(口贝), а к знакам иероглифа 呗 добавляем "знак-не-так" (口贝*).
Вот и всё. Ничего кроме этого не нужно. Чтобы ввести иероглиф, например, чтобы найти его в словаре, не нужно никого спрашивать, как его написать по пиньиню (а это что за гусь?), как его начертить по чёрточкам, как его найти по "ключу". Вы не знаете, что такое "ключ"? И слава богу. Он вам не нужен. Просто смотрим и видим. Вся информация необходимая для его ввода сосредоточена в самом иероглифе, она очевидна.
    Всё, что нужно сделать, это выучить 200 знаков и начать писать. "Выучить" означает привыкнуть видеть их в иероглифах, приучить свои глазки узнавать их безошибочно в иероглифах во всех возможных вариантах и безошибочно находить их на матрице клавиатуры. Если вы решились на это безумие, милости прошу. К вашим услугам инструменты для облегчения процесса освоения композиционного ввода в Загрузках и их описания:
    Краткое описание инструментов. (Описания продуктов предыдущего поколения, но принципы их организации те же.)
    Школа китайского быстроПисания.
    Уроки скорописи.
    Мама мыла раму.
    Подсказки для словаря.
    Очень важно знать как выглядят варианты знаков в иероглифах. Внимательно читать всем и старательно привыкать к этим вариантам.
   
    Удачи.

    Б.П.


На титульную страницу К началу страницы 11 Декабря, №5