3 caracteres extraídos de escritas do mundo inteiro. Cada atualização é uma constelação diferente.
O Unicode atribui um número único a cada caractere em todos os sistemas de escrita que a humanidade registou. A versão 15.1 do padrão abrange 149.813 caracteres de 161 escritas, desde o alfabeto latino que renderiza esta frase até hieróglifos egípcios esculpidos em paredes de templos há quatro mil anos. Cada caractere ocupa uma posição fixa chamada codepoint, escrita como U+ seguido de quatro a seis dígitos hexadecimais. U+0041 é a letra maiúscula A. U+4E16 é o caractere chinês para "mundo". U+16A0 é a runa Fehu do Futhark Antigo. Cada geração nesta página seleciona um codepoint aleatoriamente, com peso igual entre famílias de escritas para que encontre toda a diversidade da escrita humana.
Antes do Unicode, cada região usava a sua própria codificação de caracteres. Os computadores japoneses usavam Shift_JIS. Os sistemas russos usavam KOI8-R. As máquinas da Europa Ocidental assumiam ISO 8859-1. Um documento criado num sistema aparecia como texto ilegível noutro. Em 1987, Joe Becker e Lee Collins na Xerox, juntamente com Mark Davis na Apple, começaram a rascunhar uma codificação universal única. O seu princípio de design: um número por caractere, independentemente da plataforma, programa ou idioma. O Consórcio Unicode publicou a versão 1.0 em 1991 com 7.129 caracteres. Três décadas depois, o padrão cresceu vinte vezes e continua a expandir-se a cada lançamento anual.
O Unicode organiza os seus 1.114.112 codepoints possíveis em 17 planos de 65.536 posições cada. O Plano 0, o Plano Multilíngue Básico, contém os caracteres usados na escrita contemporânea: Latim, Grego, Cirílico, Árabe, Ideógrafos CJK e Hangul. O Plano 1 contém escritas históricas, notação musical, alfanuméricos matemáticos e símbolos de cartas de jogar. Dentro de cada plano, os caracteres agrupam-se em blocos nomeados: "Greek and Coptic" (U+0370 a U+03FF), "Tibetan" (U+0F00 a U+0FFF), "Box Drawing" (U+2500 a U+257F). Esta página identifica o bloco de cada caractere que gera, transformando cada descoberta numa pequena lição de geografia da paisagem Unicode.
O bloco CJK Unified Ideographs (U+4E00 a U+9FFF) contém 20.992 caracteres, tornando-o o maior bloco contíguo em todo o Unicode. Estes caracteres servem simultaneamente o chinês, o kanji japonês, o hanja coreano e o chữ Nôm vietnamita. O processo de unificação, que fundiu caracteres equivalentes de padrões nacionais em codepoints únicos, foi um dos desafios diplomáticos e técnicos mais complexos na história da codificação de caracteres. Um único ideógrafo CJK gerado por esta ferramenta pode ser legível para leitores de quatro tradições linguísticas diferentes.
Esta ferramenta transforma o Unicode de um conceito abstrato de computação numa experiência tangível e visual. Peça aos alunos que visitem /unicode/5 e gerem cinco caracteres. Peça-lhes que identifiquem a que escrita cada caractere pertence usando a etiqueta de bloco fornecida. Os alunos encontrarão sistemas de escrita que nunca viram: Etíope, Georgiano, Tibetano, Cherokee. Cada caractere torna-se um ponto de partida para pesquisar a cultura e a história por detrás dessa escrita.
Para uma ligação à matemática, discuta a combinatória do próprio Unicode. Quantos codepoints de quatro dígitos hexadecimais são possíveis? (65.536, o tamanho de um plano.) Porque é que a maioria dos caracteres cabe em quatro dígitos hexadecimais? O Plano Multilíngue Básico foi projetado para conter toda a escrita contemporânea. Quantos planos seriam necessários se cada ser humano que já viveu tivesse o seu próprio caractere pessoal? Estas perguntas ligam a codificação de caracteres à contagem exponencial e à teoria da informação. A ferramenta não requer contas, não recolhe dados dos alunos e não define cookies.
Toda a seleção de caracteres acontece dentro do seu navegador. O servidor entrega esta página. O gerador de números aleatórios criptográficos do seu dispositivo escolhe o codepoint. Nenhum dado de seleção é transmitido, registado ou armazenado em qualquer servidor. O seu histórico de descobertas reside no localStorage do seu dispositivo, sob o seu controlo direto.
Cada clique revela um caractere diferente. Desafie alguém a explorar o seu.
Inspiração Diária
Trabalhos selecionados pelo júri do A' Design Award, apresentados frescos a cada manhã.