Почти половина письменностей в мире не оцифрованы и находятся под угрозой исчезновения. ANRT (Национальная мастерская исследований типографики) в Нанси, Университет прикладных наук в Майнце и Script Encoding Initiative (Инициатива по кодированию письменностей) Калифорнийского университета в Беркли объединили усилия для решения этой проблемы. Вместе они работают над тем, чтобы внести вымирающие и редкие письменности в юникод и нарисовать поддерживающие их шрифты. Мы узнали у дизайнеров и исследователей из всех трёх институций, как устроен процесс их работы.
Как и почему вы решили оцифровывать и исследовать «недостающие» письменности?
Дебора Андерсон: Эта идея пришла мне в голову, когда я обнаружила, что не могу добавить в публикацию на сайте буквы одного из языков, использовавшихся на территории Италии, потому что не существовало шрифтов, поддерживающих этот язык. Я запустила Scripts Encoding Initiative в Беркли, чтобы в юникоде услышали голоса тех, кто работает с мёртвыми и редкими языками.
Йоханнес Бергерхаусен: Дебора основала SEI в Беркли в 2002 году. Через год я запустил проект Decodeunicode в Майнце. Мы с Деборой познакомились в 2005-м и решили работать вместе.
Мы обновляли сайт decodeunicode с каждой новой версией юникода. После нескольких апдейтов я задался простым вопросом: «А скольких письменностей ещё не хватает? Когда в юникоде будут символы всех существующих письменностей?»
В 2015 году я предложил директору ANRT Тома Уо-Маршану и Деборе запустить проект, посвящённый таким недостающим
Книга «Decodeunicode», 2011. Изображения: Verlag Hermann Schmidt
Морган Пирсон: Я начала учиться в ANRT в 2017-м. Я стала вторым человеком, который работал над Missing
Ануша Хоссейн: Я присоединилась к SEI в этом году. До этого несколько лет изучала цифровые инструменты для работы с текстом, в основном в контексте языков Южной Азии. Меня всегда завораживал диалог между экспертами из разных сфер, который возникает, когда нужно внести в юникод символы какой-то письменности.
Если письменность языка не оцифрована, как его носители общаются в интернете?
ДА: Некоторые пишут от руки, делают фотографии и отправляют их друг другу Иногда люди рисуют свои, нестандартные шрифты и пользуются ими. Но если отправить текст, набранный таким шрифтом, человеку, у которого нет нужного шрифтового файла, текст превратится в набор бессмысленных символов.
МП: Ещё одно
ЙБ: Есть пример с письменностью сунвар
Письменность сунвар была добавлена в Unicode 16.0 в сентябре 2024 года благодаря проекту в Беркли. В индийском городе Гангток носители языка сунвар издавали ежедневную газету, написанную от руки. У газеты даже был какой-то приличный тираж, но за пределами города о ней никто не знал. Без полноценных цифровых шрифтов, поддерживающих язык, текст на нём почти невозможно найти в интернете. Именно поэтому так важно, чтобы все письменные культуры мира были внесены в юникод.
Рукописная газета на языке сунвар, 2005. Изображение: Atlas of Endangered Alphabets
Kaк сделать так, чтобы разработчики операционных систем (например, Apple или Android) добавляли новые раскладки? Компании сами следят за обновлениями юникода, или носителям языка и активистам приходится бороться за то, чтобы их алфавиты появлялись на клавиатурах?
ДА: Компании следят за обновлениями. Но я не знаю, как они решают, какие раскладки стоит добавить. Насколько я понимаю, пользователям иногда приходится самим добиваться того, чтобы их письменность появилась на клавиатурах. Думаю, в такой ситуации очень помогает наличие в руководстве компании человека, который поддерживает активистов. Стив Джобс, например, продвигал идею о том, что устройства Apple должны поддерживать письменность чероки.
Алфавит чероки. Изображение: Википедия
Также полезно, когда активный представитель сообщества готов сотрудничать с компанией
МП: Я бы посоветовала обсудить этот вопрос с Марком Джамрой и Нилом Пателем. Они специализируются на типографической поддержке африканских языков.
Знаки письменности адлам. Леттеринг: Эндрю Тутит
Надо ли студентам ANRT, работающим над шрифтами, учиться говорить на одном из языков, для записи которых используется письменность?
ДА: Морган и Йоханнес ответят на этот вопрос лучше меня, но, мне кажется, это не обязательно. Авторам нужно проанализировать письменность, с которой они имеют дело, и разумеется, им стоит консультироваться с носителями языка, которые пользуются этой письменностью.
МП: Чтобы на языке говорили, у него не обязательно должна быть письменность, а чтобы пользоваться письменностью, не обязательно уметь её читать. Работая над шрифтом, я часто не могу прочитать рукописи и надписи, которые изучаю. Этим занимаются лингвисты и археологи. Но я понимаю, как устроены буквы, их дукты и пропорции, и изучаю саму письменность, а не то, как читать записанные с её помощью тексты.
Как дизайнеру мне важно исследовать исторический и культурный контекст системы письма, чтобы обеспечить максимальную точность и достоверность. Это касается как ситуаций, когда я рисую шрифты для древних письменностей (например, финикийского, набатейского или палеоеврейского письма), так и ситуаций, когда я делаю шрифт для современных арабского, греческого и иврита. Конечно, я постоянно консультируюсь с лингвистами и носителями
Набатейское письмо, 203 год нашей эры. Изображение: Википедия
Палеоеврейское письмо на реплике календаря из Гезера. Оригинал предположительно X-го века до нашей эры. Изображение: Википедия
ЙБ: Часто у языка и письменности неэксклюзивные отношения. Большинство систем письма позволяют писать на нескольких языках. (Латиницей пользуются сотни!) Так что одного-единственного языка, который нужно учить, часто не существует. Кроме того, письменности живут своей жизнью, и у них есть параметры, которые не зависят от языка. И студенты ANRT анализируют письменности с точки зрения их типографического и орфографического строения.
Как вы пришли к выводу, что в мире 292 письменности? Что для вас вообще значит термин «письменность»?
ДА: Эта цифра основана на мнениях разных экспертов. Отличить одну письменность
МП: Мне больше нравится термин «система письма». Система
ЙБ: Эта цифра фиксирует текущее состояние исследований на момент публикации наших постеров и последнего обновления сайта. Число письменностей незначительно меняется каждые два года. Например, уже какое-то время эксперты спорят, следует ли проводить различие между северным палеоиспанским письмом и южным палеоиспанским письмом. По моему скромному мнению, мы можем их свести к одной древней системе. В конце концов, речь идёт о разнице в две или три буквы.
Ещё пример: китайский язык вполне можно разделить на четыре системы письма. Но кто-то может возразить, что на протяжении более 3300 лет это была одна и та же письменность. С другой стороны, можно разделить эту систему письма на ещё более мелкие исторические компоненты и получить ещё больше письменностей…
Классификация — это почти философский вопрос. Мы прагматично принимаем устоявшееся в научном сообществе разделение. Но и это разделение не статично, оно меняется по мере того, как уточняются наши знания.
Свинцовая табличка из Ла Бастиды с надписью на северном палеоиспанском. Изображение: Unicode
Каменная стела из Фонте Велха с надписью на южном палеоиспанском. Изображение: Unicode
Как вы думаете, откроют ли учёные новые письменности?
ДА: Да!
ЙБ: Время от времени в юникод добавляют ранее неизвестные древние письменности. Иногда возникает вопрос, является ли такая письменность разновидностью одной из известных или это отдельная, самостоятельная.
К тому же появляются новые. Например, в 2015-м в Южной Азии изобрели алфавит тото. Для предложения о внесении письменности в юникод важно, чтобы подающие заявку могли доказать существование сообщества людей, которое в течение длительного времени пользуется этой системой письма.
Кстати, из 292 письменностей семь до сих пор не расшифрованы.
Песня «Восходящее солнце» на языке тото. Изображение: Unicode
Как вы выбираете письменности, над которыми будете работать?
ДА: Незначительный приоритет мы отдаём современным письменностям (поскольку они активно используются), но я думаю, что не следует пренебрегать потребностями тех, кто работает с древними системами письма. Раньше я выбирала письменность, руководствуясь тем, есть ли заинтересованные во внесении её в юникод эксперты и носители, способные ответить на вопросы и предоставить нужные для заявки документы.
ЙБ: Мы стараемся начинать рисовать те письменности, над кодировкой символов которых уже работают, или те, которые уже скоро будут включены
АХ: Мы также стараемся возвращаться к старым заявкам, которым почти удалось попасть
МП: Меня восхищают древние письменности Средиземноморья и Юго-Западной Азии. Этот
Самое прекрасное
Аполлон, сидящий перед алтарем. Кипро-слоговое письмо. Изображение: Метрополитен-музей
Можете привести пример письменности, которая существовала очень недолго?
МП: Когда я сказала «письмо», я имела ввиду образец текста, а не письменность. Например, мы находим очень древние тексты, вырезанные или нацарапанные на камне, при этом другие
Но и некоторые системы письма тоже просуществовали очень недолго.
Миштекское письмо, использовавшееся на территории современной Мексики, просуществовало примерно
Символы, которыми пользовались миштеки (реконструкция 2001 года)
Шрифт Kigelia с поддержкой письменность османья
Есть ли у вас любимый глиф? Если да, из какого языка?
МП: Я люблю их все и не смогу выбрать один.
ЙБ: Мой любимый символ — из слогового письма афака. Эта письменность ещё не оцифрована.
АХ: Мой любимый — это, наверное, символ ৎ (/kʰɔɳɖɔ tɔ/ «кусок та»). Это достаточно редко используемая бенгальская буква, но она есть в словах, например, হঠাৎ («внезапный») и চীৎকার («крик»). На тему этой буквы много лет велись бурные дискуссии из-за возможной ошибки в ее названии в юникоде. В обсуждениях принимали участие лингвисты, литературоведы, шрифтовые дизайнеры, СМИ и обычные интернет-пользователи, поскольку каждый ощущал, что его идентичность размоется, если ৎ не будет закодирована определённым образом. Эта история нравится мне тем, что она демонстрирует, как сильные чувства и исторические дискуссии могут возникать и разворачиваться вокруг чего-то, что другие могут принимать как данность. Ну и конечно, ৎ — это просто красивая буква.
Любимый глиф Йоханнеса Любимый глиф Ануши
В своей лекции на конференции AtypI вы говорили, что A — это референсный глиф. Можете дать определение этому термину?
ДА: Это глиф в кодовой таблице, который распознаётся наибольшим количеством людей.
ЙБ: Если точнее, то это «референсный символ». В ячейках юникода находятся символы,
Если такого нет, мы спрашиваем у носителей языка, есть ли у них символ, который они ассоциируют со своей письменностью. Например, для ханьского это иероглиф 永 (U+06C38), который означает «вечный, вечность, неизменный, навсегда, долгий», что хорошо соотносится с тысячелетней историей языка.
Если речь идёт только об алфавите, мы выбираем букву, которая обозначает звук /A/. Например, 𐒀 (U+10480), буква алеф из алфавита османья.
Если мы имеем дело со слоговым письмом, мы выбираем символ, обозначающий слог /KA/. Например, в деванагари это знак क (U+00915).
И наконец, в пикто- и идеографическом письме мы выбираем символ, который означает «человек», «человеческое тело» или «голова». Например, голова с перьями с Фестского диска (U+101D1).
С 2016 по 2019 год Артур
Рефренсный глиф для письменности Фестского диска Рефренсный глиф для деванагари Референсный глиф для письменности османья Референсный глиф для ханьского Референсный глиф для греческого
Какой была первая письменность, над которой вы работали?
ДА: Это было древнеиталийское (этрусское) письмо.
ЙБ: В 2014-м мы в Майнце рисовали клинопись. Это был довольно безумный объём для троих дизайнеров. Первой недостающей письменностью, над которой работали в ANRT, стало палеоиспанское письмо, Артур Франсьетта начал работу над шрифтом для него в 2016-м.
МП: Когда я только пришла в ANRT, я работала над исследовательским проектом
«Цифровая клинопись», книга Йоханнеса Бергерхаузена, 2014. Изображения: Verlag Hermann Schmidt
Noto Sans Elymaic
АХ: Я работаю на своей должности в Беркли первый год, и мы прямо сейчас занимаемся десятью письменностями
Письменность мвангвего. Изображения: Тапиванаше Гарикай
Не могли бы вы рассказать о том, как устроен рабочий процесс в Missing Scripts?
АХ: На сайте Script Encoding Initiative мы ведем список не включённых в юникод письменностей и просим всех, кто ими пользуется, присылать нам информацию об этих письменностях. Мы периодически пересматриваем список, чтобы определить, на какие письменности нам делать упор в следующей серии заявок, и передаём документы своим коллегам по Missing Scripts. Студенты ANRT изучают эти документы, и выбирают письменности, над которыми будут работать. А Йоханнес включает все наши обновления в следующее издание постера World’s Writing Systems.
ДА: Любая готовая
МП: Этап, когда система письма ещё не закодирована и не интегрирована в цифровой
ЙБ: Все заявки можно посмотреть на сайте unicode.org. Любой человек или организация может подать запрос на новые типографические символы, в том числе новые эмодзи. Но такую заявку нужно грамотно обосновать.
Что происходит после того, как вы нарисовали шрифт и отправили предложение в юникод?
ДА: К заявке в юникод должен прилагаться рабочий
МП: После кодировки символов и дизайна шрифта появляется ещё один важный вопрос: как пользователи будут получать доступ к типографическим инструментам? Корректно ли шрифты поддерживают грамматику письменности? Будут ли они бесплатными? Некоторые сообщества не могут себе позволить покупать шрифты. Поэтому шрифтовые студии и крупные компании должны помнить о своей социальной ответственности. Конечно, многое зависит от конкретной письменности, но глупо просто делать шрифты, поддерживающие разные языки мира, если у носителей нет возможности ими пользоваться.
Сколько времени обычно уходит на то, чтобы юникод одобрил заявку?
ДА: Раньше я отвечала, что с момента подачи заявки до внесения в юникод проходит не меньше двух лет, но всё может произойти быстрее, если нужно добавить не письменность, а несколько символов.
ЙБ: Некоторые заявки находятся в работе годами, потому что в них недостаточно аргументов или
АХ: Дебби права. Обычно от подачи финальной заявки до внесения письменности проходит чуть меньше двух лет. Но письменность очень редко включают в стандарт по результатам одной заявки, обычно приходится подавать две или три. Чаще всего с первого контакта с юникодом до публикации проходит около пяти-шести лет. В некоторых особо тяжёлых случаях на это уходило больше десяти! Ну и конечно, эти цифры не учитывают случаи, которые упомянул Йоханнес. Мы с одним из моих студентов работаем над тем, чтобы выяснить, какие факторы влияют на то, сколько времени занимает этот процесс для конкретной письменности.
Материалы с выставки «Missing
В 2018 году вы говорили, что шрифтов, которые поддерживают все письменности, включённые в юникод, не существует. Есть ли такие шрифты сейчас? Noto не один из них?
ДА: В семействе Noto много шрифтов, а не один, поддерживающий все языки. Размер шрифта ограничен, а потому ни один шрифт сегодня не может охватить все 154 998 символов Такое количество символов содержится в версии Юникод 16.0, вышедшей в сентябре 2024 года. Недавно я узнала, что у Noto нет финансирования на поддержку письменностей, добавленных в стандарт в сентябре этого года. Мы думаем над тем, чтобы разработать шрифты для них и передать Google Fonts бесплатно. Но разумеется, можно не только развивать семейство Noto, но и рисовать другие шрифты (это я намекаю на ANRT!).
Noto Sans Balinese Адитьи Баю Перданы
ЙБ: Шрифтовой файл (пока) ограничен 16 битами и 65 536 символами. Но шрифта, в котором есть все 155 000 глифов, распределённые по трём файлам, пока тоже не существует. Это почти неосуществимый проект, в ходе работы над которым появится много вопросов о разнице письменных культур. Какое начертание шрифта должен быть положено в основу такого дизайна? С засечками или без? Ведь нейтрального шрифта не существует. Можно нарисовать все глифы в одном стиле для нашего постера, где каждая письменность представлена одним
Когда в 2011 году мы издали книгу Decodeunicode, в наших кодовых таблицах было больше 50 шрифтов. В случае некоторых письменностей мы радовались, когда находили хоть какой-то шрифт! Сегодня нам определённо понадобится меньше шрифтов, чтобы охватить все символы.
АХ: Любопытно, что у Noto были предшественники. В 2000-е Джеймс Касс выпустил бесплатный шрифт Code2000. Я недавно прочитала, что проект возрождается после 15-летнего перерыва и у него та же цель, что
Code2000
Есть ли другие корпорации — кроме Google, — которые финансируют подобные проекты?
ДА: Я не знаю других корпораций, которые бы этим занимались, но надеюсь, что в будущем они появятся.
Повлияло ли то, что вы делаете, на жизнь сообществ, чьим письменностям вы помогли появиться в юникоде? Были ли какие-то негативные отзывы от них?
ДА: Нужно время на то, чтобы бесплатные шрифты и различные приложения начали поддерживать новые письменности, но мне очень приятно видеть, например, как письмом нко пользуются в фейсбуке. Мы помогали с внесением нко в юникод на самых ранних этапах.
Я не сталкивалась с негативным
Шрифт с поддержкой письменности нко Тапиванаше Гарикая. Изображения: Nan.xyz
МП: Я заметила, что научное сообщество очень интересовалось проектом Polices pour les inscriptions monétaires («Шрифты для надписей на монетах»), над которым я работала вместе с Национальной библиотекой Франции и ANRT. Мы разрабатывали шрифты для программы, которая должна транскрибировать надписи на старинных монетах. Хотя письменности с большинства монет уже внесены в юникод, доступных шрифтов по-прежнему недостаточно. Гуманитарным
ДА: Многим представителям научного сообщества было бы полезно разобраться в шрифтах и процессе оцифровки , чтобы они могли получать именно то, что им нужно для работы.
Редактор, созданный в рамках проекта Polices pour les inscriptions monétaires. Изображение: ANRT
Лоток набатейских монет. Изображение: Национальная библиотека Франции
ЙБ: В один прекрасный день компания Apple представила поддержку языка чероки в очередном обновлении своей операционной системы. Это означало, что представители народа
АХ: Поскольку в одном разделе юникода могут храниться несколько письменностей, вопросы продолжают возникать даже после завершения процесса кодировки символов. В каком-то смысле
Обращались ли к вам носители языка с просьбой сделать больше шрифтов, поддерживающих их язык?
МП: Конечно, пользователи жалуются на это,, но иногда они просто не знают о существующих шрифтах. И проблема не в сложности той или иной письменности. Дело в политических решениях и стратегиях бизнеса. Как известно, в мире всё решают деньги, и именно деньгами определяется, у носителей каких языков будет больше типографических возможностей.
Как часто вам пишут шрифтовые дизайнеры, которые обнаружили в ваших шрифтах какие-то недостатки?
МП: Не очень часто, учитывая количество существующих глифов и письменностей. Но мы приветствуем любые отзывы и советы. Если мы понимаем, что есть более удачная форма, мы обновляем знак в следующей версии юникода. Это часто становится поводом для увлекательных дискуссий, что делает работу над проектом ещё более интересной.
ЙБ: Например, один человек обратил наше внимание на тот факт, что
Письменность Геэз. Изображение: Википедия
Маниускрипт на Геэз, предположительно 1900 год. изображение: Аукционный дом Доминика Винтера
Откуда дизайнерам знать, что контуры несовершенны, если письменность уже не используется в повседневной жизни?
МП: Это сложный вопрос. Мы можем обнаружить ошибки, сравнивая надпись или рукопись с другими памятниками. Качество образца тоже может помочь. Например, если надпись тщательно прорисована на качественном материале, мы можем сделать вывод, что над ней работал опытный мастер и, вероятнее всего, он передал форму верно.
ЙБ: Это почти философский вопрос: существуют ли общие, универсальные правила шрифтового дизайна? Я бы сказал, что да. Например, гравитация. Это ежедневный опыт для нас, людей, и мы отражаем его в своих буквах. Мы стремимся нарисовать букву
Постер со всеми известными человечеству системами письма, 2022. Изображение: Илка Хельмиг
Постер со всеми известными человечеству системами письма, 2022. Изображение: Илка Хельмиг
Чем вы займётесь после того, как все 292 письменности будут внесены в юникод?
ДА: Будем работать дальше! Учёные продолжают открывать новые письменности, а носители языков с редкими письменностями продолжают требовать их включения в юникод. Кроме того, в уже существующие письменности часто требуется добавлять новые символы.
АХ: Будем документировать истории о том, как вносили письменности в юникод. Мы уже начали это делать.
МП: Кроме недостающих письменностей, нам нужно работать над недостающими шрифтами. Есть огромное количество шрифтов, поддерживающих латиницу, но иногда в них не хватает диакритики или определённых
У меня есть и пример с древней письменностью. Финикийский алфавит, положивший начало многим из письменностей, которыми мы пользуемся сегодня (арабскому письму, латинице, кириллице, греческому), пережил много трансформаций, которые нам только предстоит зафиксировать в цифровых шрифтах.
ЙБ: Первая версия юникода вышла в 1991 году, и нам понадобилось 27 лет, чтобы включить в стандарт 150 письменностей. А значит, оставшиеся 142 письменности мы сможем добавить к 2044 году. Чтобы оцифровать 5300 лет письменной истории, понадобится чуть более 50 лет. Не так уж и много! Так что, будем надеяться, наша миссия будет выполнена к 2044-му. Если, конечно, к тому моменту мы не встретимся с инопланетянами.