DYNADOT HELP

O que é o Unicode?


Unicode é um padrão universal de codificação de caracteres que é usado para suportar caracteres em scripts não-ASCII. A internet foi construída originalmente em ASCII, que se baseia no alfabeto inglês e consiste em apenas 128 caracteres.

O Unicode oferece suporte a todas as línguas em todo o mundo com seus conjuntos de caracteres únicos - o Unicode pode suportar mais de 1 milhão de caracteres! O Unicode atua permitindo mais bits - binary digit - que são unidades de informações em uma máquina. Os caracteres ASCII requerem apenas cerca de 7 bits, enquanto o Unicode usa 16 bits. Isso é necessário porque é preciso mais bits para processar idiomas como o chinês, árabe e russo.

Existem diferentes tipos de Unicode, incluindo UTF-8 e UTF-16, os dois mais comuns. O UTF-8 tornou-se o padrão típico usado na web porque ele ajusta o número de bits usados dependendo do caractere. Isso significa que os caracteres ASCII no UTF-8 apenas ocupam os bits que precisam processar.

O que é punycode?