20 caracteres extraídos de escrituras de todo el mundo. Cada actualización es una constelación diferente.
Unicode asigna un número único a cada carácter en todos los sistemas de escritura que la humanidad ha registrado. La versión 15.1 del estándar abarca 149.813 caracteres de 161 escrituras, desde el alfabeto latino que muestra esta oración hasta los jeroglíficos egipcios tallados en las paredes de templos hace cuatro mil años. Cada carácter ocupa una posición fija llamada punto de código, escrito como U+ seguido de cuatro a seis dígitos hexadecimales. U+0041 es la letra mayúscula A. U+4E16 es el carácter chino para «mundo». U+16A0 es la runa Fehu del Futhark antiguo. Cada generación en esta página selecciona un punto de código al azar, ponderado equitativamente entre las familias de escrituras para que encuentres toda la diversidad de la escritura humana.
Antes de Unicode, cada región usaba su propia codificación de caracteres. Los ordenadores japoneses usaban Shift_JIS. Los sistemas rusos empleaban KOI8-R. Las máquinas de Europa occidental asumían ISO 8859-1. Un documento creado en un sistema se mostraba como texto ilegible en otro. En 1987, Joe Becker y Lee Collins en Xerox, junto con Mark Davis en Apple, comenzaron a redactar una codificación universal única. Su principio de diseño: un número por carácter, independientemente de la plataforma, el programa o el idioma. El Consorcio Unicode publicó la versión 1.0 en 1991 con 7.129 caracteres. Tres décadas después, el estándar ha crecido veinte veces y continúa expandiéndose con cada publicación anual.
Unicode organiza sus 1.114.112 puntos de código posibles en 17 planos de 65.536 posiciones cada uno. El Plano 0, el Plano Multilingüe Básico, contiene los caracteres utilizados en la escritura contemporánea: latino, griego, cirílico, árabe, ideogramas CJK y hangul. El Plano 1 contiene escrituras históricas, notación musical, alfanuméricos matemáticos y símbolos de cartas de juego. Dentro de cada plano, los caracteres se agrupan en bloques con nombre: «Griego y copto» (U+0370 a U+03FF), «Tibetano» (U+0F00 a U+0FFF), «Dibujo de cajas» (U+2500 a U+257F). Esta página identifica el bloque de cada carácter que genera, convirtiendo cada descubrimiento en una pequeña lección de geografía del panorama Unicode.
El bloque de Ideogramas CJK Unificados (U+4E00 a U+9FFF) contiene 20.992 caracteres, lo que lo convierte en el bloque contiguo más grande de todo Unicode. Estos caracteres sirven simultáneamente para el chino, el kanji japonés, el hanja coreano y el chữ Nôm vietnamita. El proceso de unificación, la fusión de caracteres equivalentes de estándares nacionales en puntos de código únicos, fue uno de los desafíos diplomáticos y técnicos más complejos en la historia de la codificación de caracteres. Un solo ideograma CJK generado por esta herramienta puede ser legible para lectores de cuatro tradiciones lingüísticas diferentes.
Esta herramienta transforma Unicode de un concepto informático abstracto en una experiencia tangible y visual. Haz que cada estudiante visite /unicode/5 y genere cinco caracteres. Pídeles que identifiquen a qué escritura pertenece cada carácter usando la etiqueta de bloque proporcionada. Los estudiantes encontrarán sistemas de escritura que nunca han visto: etiópico, georgiano, tibetano, cheroqui. Cada carácter se convierte en un punto de partida para investigar la cultura y la historia detrás de esa escritura.
Para una conexión con las matemáticas, discute la combinatoria del propio Unicode. ¿Cuántos puntos de código de cuatro dígitos hexadecimales son posibles? (65.536, el tamaño de un plano.) ¿Por qué la mayoría de los caracteres caben en cuatro dígitos hexadecimales? El Plano Multilingüe Básico fue diseñado para contener toda la escritura contemporánea. ¿Cuántos planos necesitarías si cada ser humano que ha existido tuviera su propio carácter personal? Estas preguntas conectan la codificación de caracteres con el conteo exponencial y la teoría de la información. La herramienta no requiere cuentas, no recopila datos de estudiantes y no establece cookies.
Cada selección de carácter ocurre dentro de tu navegador. El servidor entrega esta página. El generador de números aleatorios criptográfico de tu dispositivo elige el punto de código. Ningún dato de selección se transmite, registra ni almacena en ningún servidor. Tu historial de descubrimientos reside en localStorage en tu dispositivo, bajo tu control directo.
Cada clic revela un carácter diferente. Desafía a alguien a explorar el suyo.
Inspiración Diaria
Trabajo seleccionado por jurado del A' Design Award, presentado fresco cada mañana.