На титульную страницу 11 Декабря, №5

 Вольному — воля.

    Ладно, с тангутами худо-бедно разобрались. Можем. Но тангуты за свои триста лет сочинили где-то около шести тысяч знаков, а китайцы наваяли столько… В общем, только в блоке Юникода CJK Unified Ideographs 20992 иероглифа. Для определённости с них и начнём. И пока на них и закончим. Как сказал один хороший человек (подозреваю, втайне он брал меня на "слабо"), остальные, хоть их там ещё тысяч 70, нужны "полутора калекам". А "калеки" мо­гут позволить себе водить пальчиком по таблице Юникода и по ключу, и количеству чёрточек найти всё, что им заблагорассудится. Итак, 20992 иероглифа можно уже вводить с помощью виртуальной клавиатуры на основе технологии композационного ввода. Понятно, не сразу. Человек, который никогда не пользовался композиционным вводом или хотя бы не видел описания клавиатуры для композиционного ввода иероглифов современного ки­тайского языка упрощённого начертания, будет мучительно водить пальце-мышкой по кла­виатуре в поиске чего-то знакомого. Немного попотев, он поймёт, что знакомого-то много. На матрице в 240 символов втиснуты почти все 214 ключей Канси в обоих вариантах и традици­онном, и упрощённом и ещё 23 дополнительных знаков. О том, почему и зачем выбраны именно эти знаки, читайте в книжках. А если вам лень читать, можете поверить (или не ве­рить) мне на слово. В такого рода разделении иероглифов на элементы много условности и произвола, но и условность, и произвол нивелируются тем, что все "распиленные" иероглифы описываются полностью именно этим набором знаков. И не говорите мне, это "неправиль­ный" знак, а это "правильный", а этого знака в наборе не хватает, а этот явно лишний. Вы вправе заменить мой произвол своим. Полностью. Т.е. описав с помощью своего набора знаков весь корпус в 20992 иероглифов, и, при этом, если количество коллизий вашего описания будет меньше 1,6 %, и однозначно за три клика мыши будет вводиться больше 95 % иероглифов. Это уже я беру вас на "слабо", дерзайте.
    А пока я предлагаю вам пользоваться тем, что есть. А есть такая "программка" :).




    Ничего не напоминает? Это набор знаков, большинство из которых графически совпадают с ключами Канси, включая и их варианты. К ним добавлены крайне необходимые знаки на ключи не похожие. Их придётся запомнить. Подробное, хотя и не формализованное описание этих знаков и их представления в иероглифах представлено тут и тут. Я не уверен, что вы "прониклись" и установили себе на машину шрифт PalladiumII, поэтому уж не обессудьте, читайте pdf-ки. Обязательно установите шрифт PalladiumII, который находится в zip-архиве клавиатуры или скачайте его прямо с сайта и установите на свою машину "для всех пользователей", иначе Ява его не увидит. Отдельное спасибо Эндрю Весту (Andrew C. West - 魏安) за шрифт BabelStone Han v. 15.0.5, откуда я скопировал в Палладия II около полусотни глифов.
    Знаки расположены на матрице, несколько условно, от верхнего левого угла к правому нижнему по степени увеличения графической сложности и по степени уменьшения частоты встречаемости. Последняя кнопка Shift (11) справа внизу меняет на матрице знаки упрощённого начертания на традиционные. Тоже делает и средняя кнопка мыши, нажатая где-угодно на матрице. Слева вверху "окно графов" (1), а справа от него "окно иероглифов" (2). Кликом по любой кнопке на матрице отправляем соответствующий граф в окно графов. Как только он туда долетел, в окне иероглифов появляются иероглифы в описании которых присутствует данный граф. Мы знаем, что "каждый иероглиф описывается последовательностью графов, которая…" (см. книжку). А если не умничать, то все иероглифы, в которых присутствует похожий на выбранный на клавиатуре знак, окажутся в окне иероглифов. Из окна иероглифов каждого можно отправить в фокус ввода левой кнопкой мыши. А первого в окне иероглифов всегда можно отправить туда просто крутнув колёсико мышки, когда её указатель висит в пределах матрицы знаков, и не к чему ползти мышкой вверх. Алгоритмы построены так, что искомый иероглиф в конечном итоге почти всегда оказывается именно первым в окне иероглифов. Никакого "искусственного интеллекта" тут нет, просто почаще обращайте внимание на первую позицию окна иероглифов.
    Выбор иероглифов в качестве кандидатов происходит в соответствии с указанным вами режимом, содержащимся в нижней строке (9). Самый простой — free, свободная выборка, когда выбираются все иероглифы, где бы искомый знак не находился: в начале, в конце или в середине. Лишь бы он там был. Щёлкнули по знаку 女, в окне иероглифов 736 шт. Как минимум дважды этот знак встречается в двенадцати иероглифах, трижды только в двух. Проверьте (или поверьте). Если хотите, чтобы выбирались только те иероглифы, где выбранные знаки встречаются последовательно, один за одним, но не обязательно с первого, укажите режим выборки serial. Последовательно знаки 女 встречаются в иероглифах только четырежды. Очень полезный режим для выбора иероглифов по подобию. К примеру, хочется мне найти иероглиф очень похожий на этот 椳 (пятка дверного шарнира :) . Начинаю вводить в режиме  serial и вижу:




    Восемнадцать штук, при том, что четырёх из них в словаре Ошанине нет вовсе. Как бы вы выглядели, если бы пытались выбрать их в словаре Ошанина по принципу "ключ + n черт", просмотрев все ключи? Бледно. Вольному — воля, продолжайте считать чёрточки.
    Но вернёмся пока к режимам выборки. Order — по порядку. Первый раньше второго, третий после второго и не обязательно непосредственно один после другого, между ними могут встречаться и иные знаки. Strong — самый простой режим, введённые знаки входят в иероглифы строго по порядку от первого до последнего. И самое "вкусное", режим right — "правильный". Правильный он потому, что 95 % иероглифов при этом режиме вводятся тремя кликами мышки. Вводить нужно первый элемент иероглифа, потом второй и потом последний. Поскольку 11484 иероглифов состоит из одного, двух или трёх компонентов, для них это просто последовательный ввод их состава. А для остальных это именно первый, второй и последний. В этом режиме полезно установить опцию push out (10). В этом случае оставшийся в одиночестве в окне иероглифов сам улетает в фокус ввода. Ввод в режиме right можно осваивать методом "научного тыка". В случае неудачи просто найдите искомый иероглиф в любом другом режиме выборки, например в режиме free. На клавиатуре есть отдельная "залипающая" кнопка для любопытных — gliphinfo (6). Когда она нажата, щелчёк по иероглифу в окне иероглифов не отправляет его в фокус ввода, а выдаёт информацию об этом иероглифе: его шестнадцатеричный код в Юникоде, состав, количество компонентов, какие иероглифы входят в его состав и в какие иероглифы входит он в качестве их части, если я указал это при обработке иероглифов (возможно, что-то и пропустил, не обессудьте). Кнопка 4 удаляет последний граф в окне графов. Кнопка view (5) позволяет вывести в отдельное окно весь набор иероглифов из окна иероглифов (2). Можете рассматривать их там отдельно, а можете и скопировать в буфер обмена и вставить куда угодно. Кнопки backsp (10) и paragraph (11) работают в фокусе ввода, а что делают, догадайтесь сами :).
    Сказанного о работе клавиатуры достаточно.  Понятно, что никому не придёт в голову использовать её для массированного ввода редких текстов. Для этого придётся изрядно попотеть, чтобы запомнить состав и расположение знаков на клавиатуре. А вот ввести нечто уникальное за три-четыре тыка мышью конечно же проще, чем рисовать на сенсорной панели незнакомый и зачастую непонятный иероглиф. Поэтому качайте, осваивайте, пользуйтесь. Тем более, что я не ожидаю очереди из составителей словарей за включением этой (или подобной ей) технологии в качестве альтернативы поиску "по ключу и чёрточкам". Они даже русскую графическую не в сосотоянии реализовать для компьютерного словаря, что уж гневить бога. Поэтому сами, в частном порядке. Обязательно внимательно рассмотрите, как выглядят в иероглифах "вариативные знаки", например 手, 乙, 衣 или 示 в Таблице графов и в пояснениях к вариантам знаков.
    Удачи.

    Б.П.

    Если вы обнаружили какие-то ошибки, если у вас что-то не работает, но очень хочется, чтобы оно таки работало, моя почта к вашим услугам: support@poutko.ru




На титульную страницу К началу страницы 11 Декабря, №5