Encodage des caractères
Vous recevez des mails illisibles écrit en « hiéroglyphe... », cette fiche technique vous permettra de corriger le problème et d'y voir plus clair sur les normes standards de codage de caractères.
Téléchargez la fiche. Qu'est-ce qu'un encodage?
L'ordinateur est une grosse machine à calculer, il est incapable de comprendre le texte, tout ce qu'il sait faire c'est effectuer des calculs sur les nombres.
Lorsque vous tapez sur une touche de votre clavier, cette dernière émet une impulsion électrique qui sera traduite par un ensemble binaire de 0 et de 1. L'ordinateur interprétera cette série de chiffre pour afficher à l'écran la lettre lui correspondant. Voici la définition très générale issue de Wikipedia « Un codage de caractères est un code qui associe un jeu de caractères d'une langue naturelle (comme un alphabet ou un syllabaire) avec un jeu de quelque chose d'autre, comme par exemple des nombres ou des signaux électriques. »
Quand un logiciel veut afficher un texte ou effectuer des traitements sur ce texte, il doit utiliser son propre encodage, sans quoi le texte affiché sera incompréhensible.
Un problème de compatibilité se pose : tous les logiciels doivent utiliser le même encodage de caractères, il faut donc définir un standard à l'aide de normes.
La norme standard Unicode : UTF-8 préconisée par le RGI
Le RGI, référentiel Général d'interopérabilité, rédigé par la DGME direction générale de la modernisation de l'État, référence normes, standards et bonnes pratiques, afin de favoriser les échanges d’informations électroniques entre les administrations et les usagers.
Pour aider les responsables des systèmes d’information de l’administration à améliorer l’interopérabilité de leurs systèmes, il est nécessaire de suivre les recommandations du RGI.
Concernant plus particulièrement l'affichage des sites internet multilangues, par exemple les sites de collectivités touristique, ainsi que l'accessibilité/lisibilité des mails, le RGI préconise l'utilisation de l'UNICODE: UTF8
article de référence du RGI: art 3.1 : « Même si le RGI ne s’applique qu’aux interfaces d’échanges, il est important de noter que le choix d’UTF-8 sur l’ensemble de la chaîne de traitement des caractères (couches de persistance, applicative, de présentation et d’échanges) permet d’améliorer l’interopérabilité. »
L’essor d’Internet et les tendances à la globalisation s’accompagnent des phénomènes suivants
• mise à disposition d’extranets au niveau mondial ;
• internationalisation des sites ;
• mise à disposition de contenus ou de services à des parcs d’utilisateurs, de développeurs ou de clients hétérogènes dispersés dans le monde entier, et équipés de terminaux très divers (PC, Mac, téléphones portables).
L’internationalisation d’un site est souvent une étape cruciale, et souvent assez douloureuse si elle n’est pas préparée.
Voici quelques exemples :
• des sites développés en Europe (en ISO-8859-1) se retrouvent à être complétés ou repris au Japon !
• les outils et claviers ne sont évidemment pas les mêmes selon le type d’alphabet utilisé, etc.• l’ouverture du site à de nouveaux clients expose le serveur au risque de devoir interpréter des requêtes en provenance de formulaires dans des jeux de caractères non prévus dans le projet initial,
• les propres outils de développement peuvent varier dans la même entreprise, selon la localisation des différentes succursales, Ajoutez à cela que même avec beaucoup de bonne volonté et en parlant la même langue,
il est parfois difficile de se comprendre d’un continent à un autre… alors imaginez des machines à la place, et vous aurez une bonne idée de la complexité de la tâche !
Toutefois, plusieurs efforts de standardisation ont été menés, notamment l'Unicode et son format de décodage UTF-8 (UCS transformation format 8 bits).
Il découle de cette standardisation Unicode UTF8:
• une représentation homogène des caractères Unicode ( disparition des caractères gênant la lecture)
• une compatibilité avec l'ancienne norme de codage de caractère : ASCII,
• une compatibilité avec la plupart des navigateurs récents Fire fox, Internet explorer, chrome.
Comme tous les standards qui permettent d’uniformiser l’accès à l’information et de faciliter la compatibilité entre machines, UTF-8 présente un intérêt majeur sur Internet.
Et en effet, dans tous les cas précédents, l’adoption d’UTF-8, jeu de caractères universel par excellence permet d’améliorer la compatibilité des sites au niveau international.
Utilisation de l'UTF8 sous thunderbird
Afin d'envoyer et recevoir des mails en respectant la norme préconisé par le RGI, voici la procédure à suivre:
Sélectionner Outils > Options
Une fenêtre s'affiche, cliquer sur le bouton « Polices ».
Enfin sélectionner courrier entrant : Unicode (UTF-8), ainsi que courrier sortant : Unicode
(UTF-8), cliquer sur OK.














