Índice

La codificación de los caracteres

La noción del juego de caracteres usado (charset) es una noción esencial en el desarrollo de páginas web. Este concepto está no obstante plagado de trampas, principalmente en términos de interoperabilidad. ¿Ha recibido alguna vez un correo electrónico en el que algunos caracteres habían sido reemplazados por otros símbolos cabalísticos, como images/p31.png o ve©rificación?

El juego de caracteres determina la forma en que los caracteres de un alfabeto se convierten en bytes en un archivo informático (y viceversa). Ciertos métodos de codificación son específicos de un entorno informático en un idioma o alfabeto dados, otros son multiplataforma y multiidioma. Ejemplos de codificación: ASCII, ISO-8859-1, ISO-8859-15, UTF-8, etc.

ASCII

Juego de caracteres básico, aunque relativamente antiguo, que permite el intercambio de textos en inglés a nivel mundial. Se escogió en el origen de la Web, pero como el inglés no tiene acentos había que codificar los caracteres acentuados y especiales con entidades del tipo é (para la é) o € (para el €).

ISO-8859-1

Extensión de ASCII, ISO-8859-1, también llamado Latin-1 o Europa occidental, es la codificación que se utiliza con frecuencia en nuestra zona mundial. Añade numerosos caracteres latinos, así como otros signos de puntuación o símbolos. Actualmente, su utilización ...