На титульную страницу 11 Декабря, №5

Проверка на прочность. Тангутское письмо.

    "Ничто на земле не проходит бесследно". Скоро исполнится ровно 800 лет, как нет тангутского государства. Через какое-то время исчез и тангутский язык. Что от него осталось, пусть с этим разбираются филологи. Звуки исчезают, но "рукописи не горят". Только хранятся где-нибудь в архивах  Института восточных рукописей. И дожидаются публикации. Как в своё время дождался публикации "Гимн священным предкам тангутов" и его перевод Евгения Ивановича Кычанова.

    "Ниже воспроизводится текст "Гимна", переписанный от руки, так как фотографии его получаются очень нечёткими из-за плохой сохранности листов оригинала и ещё потому, что первоначальный ксилографический текст, просвечивая сквозь недостаточно плотную серую бумагу, затемняет и без того не всегда ясный текст "Гимна"" (Е.И.Кычанов, "Гимн священным предкам тангутов". Письменные памятники востока. Историко-филологические исследования. Ежегодник 1968 год. - М. "Наука", 1970, стр. 219).
    Начало этого "Гимна" в версии Кычанова выглядит примерно так:

 

    Это скриншот указанного источника в формате .pdf, который хорошие люди выложили когда-то в интернете. Но не оцифрованный, поэтому и саму цитату Евгения Ивановича мне пришлось переписать с монитора. И это через 55 лет после публикации оригинала. А что делать с тангутским текстом? Тоже переписывать от руки? Слава богу, нет. Теперь мы можем организовать ввод тангутских иероглифов непосредственно на компьютере с возможностью и копировать его, и переносить потом куда угодно. Результат одного из способов ввода, фрагмент Гимна, первые 20 его строк в формате .pdf можно посмотреть здесь. Сравните с оригиналом. Это и есть та самая "проверка на прочность" технологии композиционного ввода.
    Идея упростить запоминание и ввод китайских иероглифов на цифровых устройствах без прописей и чёрточек появилась лет десять назад. Комбинаторика "стандартных элементов" и сборка из них иероглифов в начале казалась "дикой идеей" — тыкать мышью в экран и "собирать" таким способом иероглифы. Один мальчик на неком форуме даже назвал меня за это "мышемонстром". Но потом оказалось, что появившиеся сенсорные экраны избавили публику от необходимости вновь напрягаться, осваивать новые навыки и позволили большинству продолжать чертить иероглифы пальцем по экрану, как тысячи лет до этого они чертили их на костях, потом на бамбуковых дощечках, а потом и кисточкой по бумаге. Но эти же сенсорные экраны показали, что ткнуть один раз пальцем в экран проще, чем начертить иероглиф 人, например. Абсолютным рекордсменом скорости ввода на сенсорном экране, конечно, осталась "точка вправо", а уж 黄 или 黑, или, не дай бог, 黩 просто "не воспроизводимы" по сравнению с композиционным вводом.
    В общем, разложить иероглифы на компоненты, а потом собрать их в определённом порядке задача не бог весть. И лет шесть назад появилась технология композиционного ввода для китайских иероглифов упрощённого начертания. Принцип повторяемости и проверяемости научного знания никто не отменял, поэтому и родилась идея проверить подходы структурной иероглифики на другом материале.
    Почему именно тангутские иероглифы? Беззвучный ввод не звучащего языка. Не говоря об условности звуковых реконструкций, стоит отметить технические сложности реализации фонетического ввода для нынешнего описания тангутского языка — излишняя перегруженность диакритикой. Конечно, дорогу осилит идущий, — удалось же реализовать кириллические согласные с диакритикой для фонетики палладия. Но кому может понадобиться фонетический ввод документов, чтение которых ещё нужно найти. На начальном этапе публикации тангутские документы правильнее считать безголосыми. Ну, а уж поиск иероглифов в словаре по графической их структуре не сравнится ни с какой ещё неизвестной фонетикой. Вот вторая, если не основная, возможность для композиционного ввода — электронный словарь. "Прикрутить" композиционный ввод можно к любому готовому словарю: хоть к тангутско-русскому, хоть к тангутско-китайскому, хоть к ним обоим.
    И самое главное это то, что ребята из Юникод-консорциума сделали гигантскую и крайне необходимую работу по "первичной графической формализации" тангутских иероглифов. В девятой версии Юникода (ныне действует уже 15-я) появились блоки Tangut, Tangut Components, и Tangut Supplement. Осталось только провести формализацию состава иероглифов, т. е. "поделить их нацело". При этом к процедуре деления было добавлено два дополнительных требования.
    Во-первых, для разделения иероглифов использовать только компоненты описанные в разделе  Tangut Components, что не требует модификации существующего шрифта Tangut Yinchuan. Хотя предварительно представляется, что ввод можно было бы несколько оптимизировать, увеличив его эффективность (скорость и простоту) введением двух-трёх дополнительных компонентов, отсутствующих в этом разделе. Но было решено пока оставить эту оптимизацию на последующие этапы (если таковые будут), ибо на первом этапе наглядность ввода и простота освоения важнее его скорости.
    Во-вторых был устранен запрет на коллизии в описании иероглифов. Напомню, что структурная иероглифика называет коллизиями одинаковую последовательность графов в описании разных иероглифов (см. Введение в структурную иероглифику). Это привело к потерям уникальности описания 87-ми иероглифов (1.4% всего набора). Проблема связана с отсутствием у меня достоверной информации о разнописях (вариантах), о стилистических вариантах разных переписчиков, об ошибках и влиянии попыток скорописи. Есть люди, которые работают над этим, но это отдельная большая филологическая работа, связанная с анализом текстов. Для меня в этой ситуации некоторая избыточность предпочтительнее недостатка иероглифов или их вариантов. Все коллизии связанные со взаимным расположениям компонентов и мелкими деталями начертания легко разрешаются, как это было в китайской иероглифике, добавлением модифицирующего знака (*), но для этого крайне желательна информация по частоте употребления тангутских иероглифов, которой у меня, увы, тоже нет. Поэтому пока будем мириться с коллизиями.
    А дальше, уж не обессудьте, будет текст тоже в формате .pdf, ибо нет никакой уверенности, что у вас установлен шрифт для отображения тангутских иероглифов. Описывать же особенности тангутской иероглифики без примеров их начертания — дело неблагодарное. Поэтому читайте .pdf и, если вас заинтересовал вопрос ввода тангутских иероглифов, устанавливайте шрифт Tangut Yinchuan и пишите публикатору (т. е. мне) запрос на виртуальную клавиатуру для ввода тангутских иероглифов. А мы перейдём к рассмотрению задачи и обсудим полученные результаты. Предваряя вопросы любопытных (а они есть?) отвечу сразу — композиционный ввод проверку на прочность выдержал, инструмент есть и работает. Итак, продолжение в формате .pdf.

Б.П.

На титульную страницу К началу страницы 11 Декабря, №5