網(wǎng)站制作NEWS
常見字符編碼格式
1. GB2312:簡(jiǎn)體中文編碼,一個(gè)漢字占用兩個(gè)字節(jié),在中國(guó)大陸是主要的編碼方式。當(dāng)文檔或網(wǎng)頁(yè)中包含繁體中文、日文、韓文等時(shí),這些內(nèi)容可能無(wú)法被正確編碼。
2. BIG5:繁體中文編碼,主要在臺(tái)灣地區(qū)使用。
3. GBK:支持簡(jiǎn)體和繁體中文,但對(duì)于其他國(guó)家的非拉丁字母語(yǔ)言仍然存在問題。
4. UTF-8:Unicode編碼的一種。Unicode用一些基本的保留字符制定了三套編碼方式,它們分別是UTF-8、UTF-16和UTF-32。在UTF-8中,字符是以8位序列來編碼的,用一個(gè)或幾個(gè)字節(jié)來表示一個(gè)字符。這種方式的最大好處是UTF-8保留了ASCII字符的編碼作為它的一部分。UTF-8俗稱“萬(wàn)國(guó)碼”,可以同屏顯示多語(yǔ)種,一個(gè)漢字占用三個(gè)字節(jié)。為了實(shí)現(xiàn)國(guó)際化,網(wǎng)頁(yè)應(yīng)盡可能采用UTF-8編碼。當(dāng)然,處理中文時(shí)HTTP頭也要改為UTF-8編碼的——加上``。
5. EUC_KR:用來存儲(chǔ)韓國(guó)KSX1001字符集(舊稱KSC5601)的字符。此標(biāo)準(zhǔn)由KSX2901(舊稱KS C 5861)定義。KS X 1001字符使用兩個(gè)字節(jié)來表示?!案呶蛔止?jié)”使用0xA1-0xFE,“低位字節(jié)”使用0xA1-0xFE。
6. Shift_JIS:是一個(gè)日本電腦系統(tǒng)常用的編碼表。它能容納全角及半角拉丁字母、平假名、片假名、符號(hào)及日語(yǔ)漢字。它被命名為Shift_JIS的原因,是它在放置全角字符時(shí),要避開原本在0xA1-0xDF放置的半角假名字符。在微軟及IBM的日語(yǔ)電腦系統(tǒng)中,即使用了這個(gè)編碼表。這個(gè)編碼表稱為CP932。
7. EUC_JP:用來存儲(chǔ)日本JISx0208以及JISx0212的字集的字符,但日文文字較多使用ISO-2022-JP或Shift_JIS的方法來表示。
8. KOI8-R:KOI-8系列的斯拉夫文字8位元編碼,供俄語(yǔ)及保加利亞語(yǔ)使用。
9. ASCII及其擴(kuò)展字符集:作用是表征英語(yǔ)及西歐語(yǔ)言。ASCII用7位表示,能表示128個(gè)字符;其擴(kuò)展用8位表示,表示256個(gè)字符。范圍是ASCII從00到7F,擴(kuò)展從00到FF。
10. ISO-8859-1字符集:作用是擴(kuò)展ASCII,表示西歐、希臘語(yǔ)等。位數(shù)是8位,范圍是從00到FF,兼容ASCII字符集。
11. GB2312字符集:作用是國(guó)家簡(jiǎn)體中文字符集,兼容ASCII。位數(shù)使用兩個(gè)字節(jié)表示,能表示7445個(gè)符號(hào),包括6763個(gè)漢字,幾乎覆蓋所有高頻率漢字。范圍是高字節(jié)從A1到F7,低字節(jié)從A1到FE。
12. BIG5字符集:作用是統(tǒng)一繁體字編碼。位數(shù)使用兩個(gè)字節(jié)表示,表示13053個(gè)漢字。范圍是高字節(jié)從A1到F9,低字節(jié)從40到7E,A1到FE。
13. GBK字符集:作用是GB2312的擴(kuò)展,加入對(duì)繁體字的支持,兼容GB2312。位數(shù)使用兩個(gè)字節(jié)表示,可表示21886個(gè)字符。范圍是高字節(jié)從81到FE,低字節(jié)從40到FE。
14. GB18030字符集:作用是解決中文、日文、朝鮮語(yǔ)等的編碼,兼容GBK。位數(shù)采用變字節(jié)表示(1 ASCII,2,4字節(jié))??杀硎?7484個(gè)文字。范圍是1字節(jié)從00到7F;2字節(jié)高字節(jié)從81到FE,低字節(jié)從40到7E和80到FE;4字節(jié)第一三字節(jié)從81到FE,第二四字節(jié)從30到39。
15. UCS字符集:作用是國(guó)際標(biāo)準(zhǔn)ISO 10646定義了通用字符集(Universal Character Set)。它是與UNICODE同類的組織,UCS-2和UNICODE兼容。位數(shù)有UCS-2和UCS-4兩種格式,分別是2字節(jié)和4字節(jié)。范圍目前,UCS-4只是在UCS-2前面加了0x0000。
16. UNICODE字符集:作用是為世界650種語(yǔ)言進(jìn)行統(tǒng)一編碼,兼容ISO-8859-1。位數(shù)有多個(gè)編碼方式,分別是UTF-8,UTF-16和UTF-32。
汕頭招聘網(wǎng)站哪個(gè)好
多重隨機(jī)標(biāo)簽