Convertissez du texte en représentation d'octets UTF-8 au format hex, décimal, binaire ou encodé en pourcentage. Décodez des séquences d'octets UTF-8 en texte lisible. Consultez le nombre de caractères, le nombre d'octets et les détails d'encodage.
UTF-8 est l'encodage de caractères dominant sur le web, utilisé par plus de 98 % des sites. Il encode chaque point de code Unicode en un à quatre octets, ce qui le rend rétrocompatible avec l'ASCII tout en prenant en charge chaque caractère de la norme Unicode — y compris les emoji, les caractères CJK et les symboles mathématiques.
Les caractères ASCII (U+0000 à U+007F) utilisent un seul octet, identique à leurs valeurs ASCII. Les caractères en dehors de cette plage utilisent 2 à 4 octets, les bits de tête indiquant le nombre d'octets. Cet encodage à longueur variable garde le texte anglais compact tout en prenant en charge toutes les écritures du monde.
Unicode est un jeu de caractères qui attribue un numéro unique (point de code) à chaque caractère. UTF-8 est un encodage qui définit la manière dont ces points de code sont stockés sous forme d'octets. Unicode définit quels caractères existent ; UTF-8 définit comment les représenter en binaire.
UTF-8 utilise un encodage à longueur variable par souci d'efficacité. Les caractères ASCII (les plus courants en anglais) n'utilisent qu'un seul octet, ce qui garde le texte compact. Les caractères moins courants utilisent 2 à 4 octets. Cette conception rend UTF-8 rétrocompatible avec ASCII tout en prenant en charge tous les caractères Unicode.
Examinez les motifs d'octets : les séquences multi-octets UTF-8 commencent toujours par des motifs de bits spécifiques (110, 1110 ou 11110) suivis d'octets de continuation commençant par 10. Si les octets respectent ces motifs, le texte est probablement en UTF-8. Des séquences invalides indiquent un encodage différent.
Le mojibake se produit lorsqu'un texte encodé dans un format (par exemple UTF-8) est décodé à l'aide d'un format différent (par exemple Latin-1). Pour le corriger, identifiez l'encodage d'origine en examinant la séquence d'octets, puis décodez avec le bon encodage. Cet outil vous aide à inspecter les octets pour diagnostiquer les problèmes d'encodage.
Encodez ou décodez des chaînes Base64 directement dans votre navigateur
Convertissez du texte en Base64 ou décodez Base64 en texte brut
Convertissez des images en chaînes encodées Base64
Décodez des chaînes Base64 en images visibles
Encodez n'importe quel fichier en chaîne Base64
Décodez n'importe quelle chaîne Base64 vers son fichier d'origine
Décodez des chaînes Base64 en documents PDF
Décodez et inspectez les tokens JWT
Encodez ou décodez des URLs avec l'encodage pourcent
Convertissez les caractères spéciaux en entités HTML
Convertissez entre les formats hex et Base64
Décodez des chaînes Base64 en texte lisible
Vérifiez si une chaîne est un encodage Base64 valide
Décodez du Base64 et affichez-le formaté en JSON
Générez des Data URI Base64 à partir de texte ou de fichiers
Convertissez des chaînes Base64 en hexadécimal et inversement
Convertissez du SVG en Data URI pour CSS et HTML