網(wǎng)站制作NEWS
常見字符編碼格式
1. GB2312:簡體中文編碼,一個漢字占用兩個字節(jié),在中國大陸是主要的編碼方式。當文檔或網(wǎng)頁中包含繁體中文、日文、韓文等時,這些內(nèi)容可能無法被正確編碼。
2. BIG5:繁體中文編碼,主要在臺灣地區(qū)使用。
3. GBK:支持簡體和繁體中文,但對于其他國家的非拉丁字母語言仍然存在問題。
4. UTF-8:Unicode編碼的一種。Unicode用一些基本的保留字符制定了三套編碼方式,它們分別是UTF-8、UTF-16和UTF-32。在UTF-8中,字符是以8位序列來編碼的,用一個或幾個字節(jié)來表示一個字符。這種方式的最大好處是UTF-8保留了ASCII字符的編碼作為它的一部分。UTF-8俗稱“萬國碼”,可以同屏顯示多語種,一個漢字占用三個字節(jié)。為了實現(xiàn)國際化,網(wǎng)頁應(yīng)盡可能采用UTF-8編碼。當然,處理中文時HTTP頭也要改為UTF-8編碼的——加上``。
5. EUC_KR:用來存儲韓國KSX1001字符集(舊稱KSC5601)的字符。此標準由KSX2901(舊稱KS C 5861)定義。KS X 1001字符使用兩個字節(jié)來表示。“高位字節(jié)”使用0xA1-0xFE,“低位字節(jié)”使用0xA1-0xFE。
6. Shift_JIS:是一個日本電腦系統(tǒng)常用的編碼表。它能容納全角及半角拉丁字母、平假名、片假名、符號及日語漢字。它被命名為Shift_JIS的原因,是它在放置全角字符時,要避開原本在0xA1-0xDF放置的半角假名字符。在微軟及IBM的日語電腦系統(tǒng)中,即使用了這個編碼表。這個編碼表稱為CP932。
7. EUC_JP:用來存儲日本JISx0208以及JISx0212的字集的字符,但日文文字較多使用ISO-2022-JP或Shift_JIS的方法來表示。
8. KOI8-R:KOI-8系列的斯拉夫文字8位元編碼,供俄語及保加利亞語使用。
9. ASCII及其擴展字符集:作用是表征英語及西歐語言。ASCII用7位表示,能表示128個字符;其擴展用8位表示,表示256個字符。范圍是ASCII從00到7F,擴展從00到FF。
10. ISO-8859-1字符集:作用是擴展ASCII,表示西歐、希臘語等。位數(shù)是8位,范圍是從00到FF,兼容ASCII字符集。
11. GB2312字符集:作用是國家簡體中文字符集,兼容ASCII。位數(shù)使用兩個字節(jié)表示,能表示7445個符號,包括6763個漢字,幾乎覆蓋所有高頻率漢字。范圍是高字節(jié)從A1到F7,低字節(jié)從A1到FE。
12. BIG5字符集:作用是統(tǒng)一繁體字編碼。位數(shù)使用兩個字節(jié)表示,表示13053個漢字。范圍是高字節(jié)從A1到F9,低字節(jié)從40到7E,A1到FE。
13. GBK字符集:作用是GB2312的擴展,加入對繁體字的支持,兼容GB2312。位數(shù)使用兩個字節(jié)表示,可表示21886個字符。范圍是高字節(jié)從81到FE,低字節(jié)從40到FE。
14. GB18030字符集:作用是解決中文、日文、朝鮮語等的編碼,兼容GBK。位數(shù)采用變字節(jié)表示(1 ASCII,2,4字節(jié))??杀硎?7484個文字。范圍是1字節(jié)從00到7F;2字節(jié)高字節(jié)從81到FE,低字節(jié)從40到7E和80到FE;4字節(jié)第一三字節(jié)從81到FE,第二四字節(jié)從30到39。
15. UCS字符集:作用是國際標準ISO 10646定義了通用字符集(Universal Character Set)。它是與UNICODE同類的組織,UCS-2和UNICODE兼容。位數(shù)有UCS-2和UCS-4兩種格式,分別是2字節(jié)和4字節(jié)。范圍目前,UCS-4只是在UCS-2前面加了0x0000。
16. UNICODE字符集:作用是為世界650種語言進行統(tǒng)一編碼,兼容ISO-8859-1。位數(shù)有多個編碼方式,分別是UTF-8,UTF-16和UTF-32。
汕頭招聘網(wǎng)站哪個好
多重隨機標簽