Converta texto em representação de bytes UTF-8 nos formatos hex, decimal, binário ou codificado em porcentagem. Decodifique sequências de bytes UTF-8 de volta para texto legível. Veja a contagem de caracteres, a contagem de bytes e os detalhes de codificação.
UTF-8 é a codificação de caracteres dominante na web, usada por mais de 98% dos sites. Codifica cada ponto de código Unicode em um a quatro bytes, tornando-a retrocompatível com ASCII e suportando ao mesmo tempo todos os caracteres do padrão Unicode — incluindo emojis, caracteres CJK e símbolos matemáticos.
Os caracteres ASCII (U+0000 a U+007F) usam um único byte, idêntico aos seus valores ASCII. Os caracteres fora deste intervalo usam de 2 a 4 bytes, com os bits iniciais a indicar a quantidade de bytes. Esta codificação de comprimento variável mantém o texto em inglês compacto, ao mesmo tempo que suporta todos os sistemas de escrita do mundo.
Unicode é um conjunto de caracteres que atribui um número único (ponto de código) a cada caractere. UTF-8 é uma codificação que define como esses pontos de código são armazenados como bytes. O Unicode define quais caracteres existem; o UTF-8 define como representá-los em binário.
O UTF-8 usa codificação de comprimento variável por questões de eficiência. Os caracteres ASCII (os mais comuns em inglês) usam apenas 1 byte, mantendo o texto compacto. Os caracteres menos comuns usam de 2 a 4 bytes. Este design torna o UTF-8 retrocompatível com ASCII, ao mesmo tempo que suporta todos os caracteres Unicode.
Observe os padrões de bytes: as sequências multibyte do UTF-8 começam sempre com padrões de bits específicos (110, 1110 ou 11110) seguidos de bytes de continuação que começam com 10. Se os bytes seguirem estes padrões, o texto é provavelmente UTF-8. Sequências inválidas indicam uma codificação diferente.
O mojibake ocorre quando um texto codificado num formato (por exemplo, UTF-8) é descodificado usando um formato diferente (por exemplo, Latin-1). Para o corrigir, identifique a codificação original examinando a sequência de bytes e, em seguida, descodifique com a codificação correta. Esta ferramenta ajuda-o a inspecionar bytes para diagnosticar problemas de codificação.
Codifique ou decodifique strings Base64 diretamente no seu navegador
Converta texto para Base64 ou decodifique Base64 para texto simples
Converta imagens para strings codificadas em Base64
Decodifique strings Base64 de volta para imagens visíveis
Codifique qualquer arquivo para uma string Base64
Decodifique qualquer string Base64 de volta ao seu arquivo original
Decodifique strings Base64 para documentos PDF
Decodifique e inspecione tokens JWT
Codifique ou decodifique URLs com codificação percentual
Converta caracteres especiais em entidades HTML
Converta entre formatos hex e Base64
Decodifique strings Base64 em texto simples legível
Verifique se uma string é uma codificação Base64 válida
Decodifique Base64 e exiba como JSON formatado
Gere data URIs em Base64 a partir de texto ou arquivos
Converta strings Base64 para hexadecimal e vice-versa
Converta SVG em data URIs para CSS e HTML