Juegos de caracteres
Un juego de caracteres hace corresponder cada byte con una letra. Aquí caben todos los caracteres pero no los caracteres de todos los idiomas.
Ejemplo inventado:
- 0 = A
- 1 = B
- 64 = a
- 65 = b
- 128 = €
- 255 = $
Juego de caracteres existentes:
- ASCII 1 byte por caracter. MS-DOS
- ANSI 1 byte por caracter. Windows
- Unicode 2 bytes por caracter.
Los juegos de caracteres no son compatibles entre sí porque codifican los caracteres de forma algo diferente. Se nota en los caracteres especiales: acentos, exclamación, interrogante.
Con 2 bytes por caracter se pueden representar 65536 caracteres diferentes.
En el Unicode caben los caracteres de todos los idiomas del Mundo: occidental, griego, cirílico, hebreo, japonés, chino, tailandés, árabe, etc.
La variante más usada de Unicode se llama UTF-8.