Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĂ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En règle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � apparaît.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĂ© vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prĂ©ciser que tous les caractères ASCII du code 0 Ă 127 gardent toujours les mĂªmes codes sans changement quelque soit le codage des caractères, ASCII, GBK, Unicode...
Tous les caractères ASCII Ă©tendus du code 0 Ă 255 (2**8=256, uni-octet, mono-byte) peuvent Ăªtre stockĂ©s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractères multi-octet (multi-byte) avec un code supĂ©rieur ou Ă©gal Ă 256, qui ne peuvent Ăªtre conservĂ©s que dans un fichier Unicode comme UTF-8, ou bien dans un format spĂ©cifique (code page pays) tel le GBK pour les idĂ©ogrammes chinois.
Sur le web, un caractère Unicode peut en outre s'exprimer en code entitĂ© HTML, ainsi stockĂ© dans un fichier du codage ASCII. Par exemple, l'idĂ©ogramme è¯ signifiant Langue, peut Ăªtre stockĂ© en mode ASCII par la chaĂ®ne 语, composĂ©e uniquement des ampersand &, dièse #, suivi par des chiffres du numĂ©ro dĂ©cimal de ce caractère en Unicode, et terminĂ© par un point-virgule ;.
ä¸å›½åº”对人类作出较大ç„贡献ï¼
La Chine doit faire une contribution relativement grande à l'Humanité !
ÙˆÙتعÙÙ† على الصÙÙ† تقدÙÙ… اسهامات اكبر للبشرÙØ©!
ĐĐ¸Ñ‚Đ°Đ¹ Đ´Đ¾Đ»Đ¶ĐµĐ½ ÑĐ´ĐµĐ»Đ°Ñ‚ÑŒ Đ±Đ¾Đ»ÑŒÑˆĐ¸Đ¹ Đ²ĐºĐ»Đ°Đ´ Đ² Ñ‡ĐµĐ»Đ¾Đ²ĐµÑ‡ĐµÑÑ‚Đ²Đ¾!
Îίνα θα Ï€ÏÎπει να συμβάλει πεÏισσότεÏο στην ανθÏωπότητα!
ä¸å›½ă¯äººé¡ă«å¤§ăăªè²¢çŒ®ă‚’ă—ă¦ăă ă•ă„ï¼
בסין יש תרו××” גדולה ל×× ×•×©×•×ª!
à¤à¥€à¤¨ मानव जाति के लिठà¤à¤• बड़ा योगदान करना à¤à¤¾à¤¹à¤¿à¤!
จีนควรจะให้มีส่วนร่วมมาà¸à¸‚ึ้นเà¸à¸·à¹ˆà¸à¸¡à¸™à¸¸à¸©à¸¢à¸à¸²à¸•à¸´!
چین باید سهم بیشتری به انسان را!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockĂ©e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffĂ©rents codages. Elle peut devenir illisible si le codage diffère trop. Il faut revenir en UTF-8 si vous avez mal Ă la tĂªte. Testez vous-mĂªme sur votre navigateur en cliquant sur les liens suivants:
[DĂ©tection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois SimplifiĂ© (GB18030) | Chinois SimplifiĂ© (GB2312) | Chinois SimplifiĂ© (GBK) | Chinois SimplifiĂ© (HZ) | Chinois Traditionnel (Big5) | CorĂ©en (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | HĂ©breu (Windows-1255) | HĂ©breu (ISO-8859-8) | HĂ©breu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | ThaĂ¯ (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).