Por @Alvy — 7 de Mayo de 2024

Todo lo que hay que saber sobre Unicode

Hoy en día el 98% de los archivos de texto que se manejan en todo tipo de software estan codificados como UTF-8 (Unicode Transformation Format, 8-bit) una forma estándar de codificar caracteres en todas las formas de escritura, emojis incluidos. Hace ya muchas décadas que se modernizó el viejísimo código ASCII aunque el UTF-8 mantiene la compatibilidad hacia atrás, razón por la que transición fue muy poco dolorosa.

En un artículo que tiene ya algún tiempo Niki, un desarrollador que sabe algo de todo esto, ha explicado El mínimo absoluto que todo desarrollador de software debería saber sobre Unicode. Esto incluye la explicación de lo que son los puntos de código, de los que Unicode permite 1,1 millones aunque de momento solo hay definidos unos 170.000 y otros se reservan para «uso privado», como cuando para cierta plataforma (por ejemplo las de Apple) una empresa define un carácter con su logotipo y cosas así.

Una de las complicaciones de UTF-8 es que los caracteres pueden ser secuencias de 1, 2, 3 ó 4 bytes. El UTF-8 es compatible ASCII (del 0 al 127); a partir de ahí el UTF-16 ya complica las cosas con más símbolos para otros sistemas de escritura más allá del alfabeto básico del inglés. Esto incluye sincronía, no superposición y curiosidades como la forma en que se pueden formar los símbolos y los emojis, que también están incluidos en las tablas de Unicode.

Respecto a esto de los símbolos, sistemas de escritura y emojis la cosa tiene su enjundia porque, tal y como se explica, según los diferentes lenguajes de programación la longitud de las cadenas de texto con ellos dista de ser algo obvio. Es decir que un emoji de familia sonriente puede no tener longitud 1, como cabría esperar, sino 7, y puede haber hasta tres formas de escribir «Å» que básicamente es la misma letra pero compuesta o «normalizada» de diversas formas.

Un gran artículo explicativo que sirve para entender todos los detallitos de algo tan importante como es la forma en que codifican los textos, aunque el estándar Unicode sigue evolucionando y de un año a otro se va ampliando, modificando y mejorando.

Relacionado:

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 2 de Mayo de 2024

Chuletas de JavaScript, HTML y CSS interactivas y completas

He visto una referencia a una Chuleta de JavaScript y en la misma página encontré otra sobre HTML y otra más sobre CSS. La diferencia respecto a tenerlas en un papel es que algunos detalles son interactivos, con las típicas utilidades para que todo sea copiar-y-pegar, más rápido y sencillo.

Cada chuleta está organizada en paneles, que más o menos de aquella manera se pueden mover para organizarlos (con un clic en la flechita diagonal). Los que no te sirvan se pueden eliminar. Luego están los que tienen cierta utilidad: en la hoja del CSS, por ejemplo, hay un selector de color, un generador de degradados, visualización de cajas y cosas así.

En la chuleta de HTML hay tablas con caracteres/entidades, generadores de tablas, iframes, enlaces, listas y demás, muy a la antigua usanza.

Son los típicos enlaces que no vienen mal y pueden resultar útiles, así que a añadirlos a la carpeta de enlaces con herramientas.

Relacionado:

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 18 de Abril de 2024

Es más fácil escribir un programa incorrecto que comprender uno correcto.

Los epigramas son «frases breves e ingeniosas, frecuentemente satíricas», algo así como «ocurrencias» o «frases agudas». Y hete aquí que a alguien se le ocurrió hace tiempo escribir (o recopilar) 120 epigramas sobre informática y programación.

Cuidado con el abismo de Turing, en el que todo es posible pero nada de lo fácil es interesante.

Con solo leerlos se ve que tienen cierta viejunez: hablan mucho de Fortran, Lisp y otros lenguajes que eran más populares hace décadas, además de menciones a mini y microordenadores y cosas así. Según parece provienen de Epigrams in Programming, de Alan J. Perlis, de la universidad de Yale, en un artículo publicado en el SIGPLAN de la ACM en 1982.

Todo programa tiene (al menos) dos propósitos: aquel para el que fue escrito y otro para el que no.

Es entretenido revisarlos, en parte por ser una especie de documento de otra época, en parte porque son realmente satíricos y graciosos –si les coges el punto informático, claro– y en parte porque pueden servir como inspiración. O para hacer tazas, camisetas o pósteres, que siempre hay una frase de estas para cada ocasión.

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 18 de Abril de 2024

Los cómics de F/OSS sobre los orígenes de la cultura hacker, los lenguajes y sus personajes

No conocía los Cómics de F/OSS, que están dedicados al software libre y abierto en desde diferentes puntos de vista (FOSS = Free and Open Source Software). Son obra de Joone Hur y se publican desde 2018, a un ritmo lento pero seguro. De momento hay 8 entregas:

Los cómics están muy centrados en personajes, que van desde los orígenes con Babbage y Lovelace a Thomson y Ritchie. Así que sirve como documento histórico tanto por las diversas historias que cuenta como para conocer un poco más a sus protagonistas.

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD