Inversion des codages des caractères UTF-8 et ASCII

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=GBK: Chinois Simplifi茅 (GBK).
Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caract猫re 茅
Mn茅monique
Cause d'Erreur
é
UTF-8 => ASCII
Page stock茅e en fichier local en format Unicode UTF-8 interpr茅t茅e par erreur en ASCII
ASCII => UTF-8
Page stock茅e en fichier local en format ASCII interpr茅t茅e par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carr茅 vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En r猫gle g茅n茅rale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur 脿 l'affichage, le diamant point d'interrogation ou carr茅 vide � appara卯t.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carr茅 vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de pr茅ciser que tous les caract猫res ASCII du code 0 脿 127 gardent toujours les m锚mes codes sans changement quelque soit le codage des caract猫res, ASCII, GBK, Unicode...

Tous les caract猫res ASCII 茅tendus du code 0 脿 255 (2**8=256, uni-octet, mono-byte) peuvent 锚tre stock茅s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caract猫res multi-octet (multi-byte) avec un code sup茅rieur ou 茅gal 脿 256, qui ne peuvent 锚tre conserv茅s que dans un fichier Unicode comme UTF-8, ou bien dans un format sp茅cifique (code page pays) tel le GBK pour les id茅ogrammes chinois.

Sur le web, un caract猫re Unicode peut en outre s'exprimer en code entit茅 HTML, ainsi stock茅 dans un fichier du codage ASCII. Par exemple, l'id茅ogramme 璇� signifiant Langue, peut 锚tre stock茅 en mode ASCII par la cha卯ne 语, compos茅e uniquement des ampersand &, di猫se #, suivi par des chiffres du num茅ro d茅cimal de ce caract猫re en Unicode, et termin茅 par un point-virgule ;.

Citation de Mao pour tester:

涓浗搴斿浜虹被浣滃嚭杈冨ぇ鐨勮础鐚紒

La Chine doit faire une contribution relativement grande 脿 l'Humanit茅 !

賵賷鬲毓賷賳 毓賱賶 丕賱氐賷賳 鬲賯丿賷賲 丕爻賴丕賲丕鬲 丕賰亘乇 賱賱亘卮乇賷丞!

袣懈褌邪泄 写芯谢卸械薪 褋写械谢邪褌褜 斜芯谢褜褕懈泄 胁泻谢邪写 胁 褔械谢芯胁械褔械褋褌胁芯!

螝委谓伪 胃伪 蟺蟻苇蟺蔚喂 谓伪 蟽蠀渭尾维位蔚喂 蟺蔚蟻喂蟽蟽蠈蟿蔚蟻慰 蟽蟿畏谓 伪谓胃蟻蠅蟺蠈蟿畏蟿伪!

涓浗銇汉椤炪伀澶с亶銇并鐚倰銇椼仸銇忋仩銇曘亜锛�

讘住讬谉 讬砖 转专讜诪讛 讙讚讜诇讛 诇讗谞讜砖讜转!

啶氞啶� 啶ぞ啶ㄠさ 啶溹ぞ啶むた 啶曕 啶侧た啶� 啶忇 啶ぁ啶监ぞ 啶啶椸う啶距え 啶曕ぐ啶ㄠぞ 啶氞ぞ啶灌た啶�!

喔堗傅喔權竸喔о福喔堗赴喙冟斧喙夃浮喔掂釜喙堗抚喔權福喙堗抚喔∴浮喔侧竵喔傕付喙夃笝喙€喔炧阜喙堗腑喔∴笝喔膏俯喔⑧笂喔侧笗喔�!

趩蹖賳 亘丕蹖丿 爻賴賲 亘蹖卮鬲乇蹖 亘賴 丕賳爻丕賳 乇丕!

China shall make a relatively great contribution to the Man Kind!

Cette page est stock茅e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diff茅rents codages. Elle peut devenir illisible si le codage diff猫re trop. Il faut revenir en UTF-8 si vous avez mal 脿 la t锚te. Testez vous-m锚me sur votre navigateur en cliquant sur les liens suivants:

[D茅tection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifi茅 (GB18030) | Chinois Simplifi茅 (GB2312) | Chinois Simplifi茅 (GBK) | Chinois Simplifi茅 (HZ) | Chinois Traditionnel (Big5) | Cor茅en (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | H茅breu (Windows-1255) | H茅breu (ISO-8859-8) | H茅breu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Tha茂 (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).

Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
jinMonnaies | zhongHorloge | yiTraduction | ciDictionnaires | xieEcrire | zhuanEncoder

Envoyez vos commentaires (1)

1. Visiteur *.*.182.* - 2015-10-19 10:04:52
賵賷鬲毓賷賳 毓賱賶 丕賱氐賷賳 鬲賯丿賷賲 丕爻賴丕賲丕鬲 丕賰亘乇 賱賱亘卮乇賷丞!
Email Web

Veuillez recopier la cha卯ne :
Texte 脿 recopier.

Chaussures Chinoises > Inversion des codages des caractères UTF-8 et ASCII
  
Fen锚tre contextuelle    Fermer
Veuillez patienter...