Один символ из 149 000+ кодовых позиций всех систем письменности человечества. Откройте для себя что-то новое.
Юникод присваивает уникальный номер каждому символу каждой системы письменности, когда-либо созданной человечеством. Версия 15.1 стандарта охватывает 149 813 символов из 161 письменности — от латинского алфавита, которым написано это предложение, до египетских иероглифов, высеченных на стенах храмов четыре тысячи лет назад. Каждый символ занимает фиксированную позицию, называемую кодовой точкой, которая записывается как U+ и четыре-шесть шестнадцатеричных цифр. U+0041 — это заглавная буква A. U+4E16 — это китайский иероглиф «мир». U+16A0 — это руна Феху из Старшего Футарка. Каждая генерация на этой странице случайным образом выбирает кодовую точку с равномерным распределением по семействам письменностей, чтобы вы могли ощутить всё разнообразие человеческого письма.
До появления Юникода каждый регион использовал собственную кодировку символов. Японские компьютеры работали с Shift_JIS. Российские системы использовали KOI8-R. Западноевропейские машины предполагали ISO 8859-1. Документ, созданный на одной системе, отображался как бессмысленный набор символов на другой. В 1987 году Джо Беккер и Ли Коллинз из Xerox совместно с Марком Дэвисом из Apple начали разработку единой универсальной кодировки. Их принцип проектирования: один номер на символ, независимо от платформы, программы или языка. Консорциум Юникода опубликовал версию 1.0 в 1991 году с 7 129 символами. Три десятилетия спустя стандарт вырос в двадцать раз и продолжает расширяться с каждым ежегодным выпуском.
Юникод организует свои 1 114 112 возможных кодовых точек в 17 плоскостей по 65 536 позиций в каждой. Плоскость 0, Базовая многоязычная плоскость, содержит символы, используемые в современном письме: латиницу, греческий, кириллицу, арабский, иероглифы CJK и хангыль. Плоскость 1 содержит исторические письменности, музыкальную нотацию, математические буквенно-цифровые символы и символы игральных карт. Внутри каждой плоскости символы группируются в именованные блоки: «Greek and Coptic» (U+0370 — U+03FF), «Tibetan» (U+0F00 — U+0FFF), «Box Drawing» (U+2500 — U+257F). Эта страница определяет блок для каждого сгенерированного символа, превращая каждое открытие в небольшой урок географии ландшафта Юникода.
Блок объединённых иероглифов CJK (U+4E00 — U+9FFF) содержит 20 992 символа, что делает его крупнейшим непрерывным блоком во всём Юникоде. Эти символы одновременно обслуживают китайский язык, японские кандзи, корейские ханча и вьетнамские тьы-ном (chữ Nôm). Процесс унификации — объединение эквивалентных символов из национальных стандартов в единые кодовые точки — стал одной из самых сложных дипломатических и технических задач в истории кодирования символов. Один иероглиф CJK, сгенерированный этим инструментом, может быть понятен читателям четырёх различных языковых традиций.
Этот инструмент превращает Юникод из абстрактной компьютерной концепции в осязаемый визуальный опыт. Попросите учеников перейти на /unicode/5 и сгенерировать пять символов. Предложите им определить, к какой письменности принадлежит каждый символ, используя указанное название блока. Ученики столкнутся с системами письма, которых никогда раньше не видели: эфиопской, грузинской, тибетской, чероки. Каждый символ станет отправной точкой для исследования культуры и истории, стоящей за этой письменностью.
Для связи с математикой обсудите комбинаторику самого Юникода. Сколько существует возможных четырёхзначных шестнадцатеричных кодовых точек? (65 536 — размер одной плоскости.) Почему большинство символов укладывается в четыре шестнадцатеричных цифры? Базовая многоязычная плоскость была спроектирована для размещения всех современных систем письма. Сколько плоскостей понадобилось бы, если бы у каждого когда-либо жившего человека был свой личный символ? Эти вопросы связывают кодирование символов с экспоненциальным счётом и теорией информации. Инструмент не требует учётных записей, не собирает данные учеников и не устанавливает файлы cookie.
Каждый выбор символа происходит внутри вашего браузера. Сервер доставляет эту страницу. Криптографический генератор случайных чисел вашего устройства выбирает кодовую точку. Никакие данные о выборе никогда не передаются, не записываются и не хранятся на каком-либо сервере. Ваша история открытий хранится в localStorage на вашем устройстве, под вашим полным контролем.
Каждый клик открывает новый символ. Предложите кому-нибудь исследовать свой.
Ежедневное вдохновение
Работы, отобранные жюри A' Design Award, представленные каждое утро.