小西編碼一鍵轉(zhuǎn)換官方版是由吾愛(ài)網(wǎng)友推薦分享的一款綠色免費(fèi),功能實(shí)用的編碼一鍵轉(zhuǎn)換工具。它的功能非常的直接,能夠?qū)⒆址跐h字、GBK、UTF-8、Unicode等常見(jiàn)字符之間相互轉(zhuǎn)換。如果我們?cè)诠ぷ髦杏龅絹y碼的現(xiàn)象,或者換行失效的問(wèn)題,一般都是文本編碼惹的禍,不同的字符編碼是不能完全兼容的,比如國(guó)內(nèi)常用的是GBK、GBxxxx等編碼,而國(guó)際上流行的UTF-8及UNICODE編碼。通過(guò)小西編碼一鍵轉(zhuǎn)換能夠解決編碼問(wèn)題,支持自動(dòng)轉(zhuǎn)換,打開(kāi)即用,可以說(shuō)是非常的方便實(shí)用,有需求的用戶請(qǐng)下載使用!
功能特色
1、對(duì)漢字、GBK、UTF-8、Unicode等編碼的文件自動(dòng)識(shí)別并按要求互相轉(zhuǎn)換
2、對(duì)DOS格式、UNIX格式、MAC格式的文本自動(dòng)識(shí)別并互相轉(zhuǎn)換
3、對(duì)中文簡(jiǎn)繁體及臺(tái)灣BIG5編碼互相轉(zhuǎn)換(需要指定源、目的編碼格式)
4、支持文件及文件夾操作,支持鼠標(biāo)拖拽
5、完全綠色軟件,直接使用不需安裝
常見(jiàn)字符集編碼
1、ASCII
ASCII碼是7位編碼,編碼范圍是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯?dāng)?shù)字和標(biāo)點(diǎn)符號(hào)等字符。其中0x00-0x1F和0x7F共33個(gè)控制字符。
只支持ASCII碼的系統(tǒng)會(huì)忽略每個(gè)字節(jié)的最高位,只認(rèn)為低7位是有效位。HZ字符編碼就是早期為了在只支持7位ASCII系統(tǒng)中傳輸中文而設(shè)計(jì)的編碼。早期很多郵件系統(tǒng)也只支持ASCII編碼,為了傳輸中文郵件必須使用BASE64或者其他編碼方式。
2、GBK
GBK編碼是GB2312編碼的超集,向下完全兼容GB2312,同時(shí)GBK收錄了Unicode基本多文種平面中的所有CJK漢字。同 GB2312一樣,GBK也支持希臘字母、日文假名字母、俄語(yǔ)字母等字符,但不支持韓語(yǔ)中的表音字符(非漢字字符)。GBK還收錄了GB2312不包含的 漢字部首符號(hào)、豎排標(biāo)點(diǎn)符號(hào)等字符。
GBK的整體編碼范圍是為0x8140-0xFEFE,不包括低字節(jié)是0×7F的組合。高字節(jié)范圍是0×81-0xFE,低字節(jié)范圍是0x40-7E和0x80-0xFE。
低字節(jié)是0x40-0x7E的GBK字符有一定特殊性,因?yàn)檫@些字符占用了ASCII碼的位置,這樣會(huì)給一些系統(tǒng)帶來(lái)麻煩。
有些系統(tǒng)中用0x40-0x7E中的字符(如“|”)做特殊符號(hào),在定位這些符號(hào)時(shí)又沒(méi)有判斷這些符號(hào)是不是屬于某個(gè) GBK字符的低字節(jié),這樣就會(huì)造成錯(cuò)誤判斷。在支持GB2312的環(huán)境下就不存在這個(gè)問(wèn)題。需要注意的是支持GBK的環(huán)境中小于0x80的某個(gè)字節(jié)未必就 是ASCII符號(hào);另外就是最好選用小于0×40的ASCII符號(hào)做一些特殊符號(hào),這樣就可以快速定位,且不用擔(dān)心是某個(gè)漢字的另一半。Big5編碼中也存在相應(yīng)問(wèn)題。
CP936和GBK的有些許差別,絕大多數(shù)情況下可以把CP936當(dāng)作GBK的別名。
3、BIG5
Big5是雙字節(jié)編碼,高字節(jié)編碼范圍是0x81-0xFE,低字節(jié)編碼范圍是0x40-0x7E和0xA1-0xFE。和GBK相比,少了低字節(jié)是0x80-0xA0的組合。0x8140-0xA0FE是保留區(qū)域,用于用戶造字區(qū)。
Big5收錄的漢字只包括繁體漢字,不包括簡(jiǎn)體漢字,一些生僻的漢字也沒(méi)有收錄。GBK收錄的日文假名字符、俄文字符Big5也沒(méi)有收錄。因?yàn)锽ig5當(dāng)中收錄的字符有限,因此有很多在Big5基礎(chǔ)上擴(kuò)展的編碼,如倚天中文系統(tǒng)。Windows系統(tǒng)上使用的代碼頁(yè)CP950也可以理解為是對(duì)Big5的擴(kuò)展,在Big5的基礎(chǔ)上增加了7個(gè)漢字和一些符號(hào)。Big5編碼對(duì)應(yīng)的字符集是GBK字符集的子集,也就是說(shuō)Big5收錄的字符是GBK收錄字符的一部分,但相同字符的編碼不同。
因?yàn)锽ig5也占用了ASCII的編碼空間(低字節(jié)所使用的0x40-0x7E),所以Big5編碼在一些環(huán)境下存在和GBK編碼相同的問(wèn)題,即低字節(jié)范圍為0x40-0x7E的字符有可能會(huì)被誤處理,尤其是低字節(jié)是0x5C("/")和0x7C("|")的字符??梢詤⒖糋BK一節(jié)相應(yīng)說(shuō)明。
盡管有些區(qū)別,大多數(shù)情況下可以把CP950當(dāng)作Big5的別名。
4、UTF-8
UTF-8是UCS字符集的另一種編碼方式,UTF-16的每個(gè)單元是兩個(gè)字節(jié)(16位),而UTF-8的每個(gè)單元是一個(gè)字節(jié)(8位)。UTF-16中用一個(gè)或兩個(gè)雙字節(jié)表示一個(gè)字符,UTF-8中用一個(gè)或幾個(gè)單字節(jié)表示一個(gè)字符。
可以認(rèn)為UTF-8編碼是根據(jù)一定規(guī)律從UCS-2轉(zhuǎn)換得到的,從UCS-2到UTF-8之間有以下轉(zhuǎn)換關(guān)系:
UCS-2 UTF-8
U+0000 - U+007F 0xxxxxxx
U+0080 - U+07FF 110xxxxx 10xxxxxx
U+0800 - U+FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如“啊”字的UCS-2編碼是0x554A,對(duì)應(yīng)的二進(jìn)制是0101 0101 0100 1010,轉(zhuǎn)成UTF-8編碼之后的二進(jìn)制是1110 0101 10 010101 10 001010,對(duì)應(yīng)的十六進(jìn)制是0xE5958A。
UCS-4也是一種UCS字符集的編碼方式,是使用4個(gè)字節(jié)的等寬編碼,可以用UCS-4來(lái)表示BMP之外的輔助面字符。UCS-2中每?jī)蓚€(gè)字節(jié)前再加上0x0000就得到了BMP字符的UCS-4編碼。從UCS-4到UTF-8也存在轉(zhuǎn)換關(guān)系,根據(jù)這種轉(zhuǎn)換關(guān)系,UTF-8最多可以使用六個(gè)字節(jié)來(lái)編碼UCS-4。
根據(jù)UTF-8的生成規(guī)律和UCS字符集的特性,可以看到UTF-8具有的特性:
UTF-8完全和ASCII兼容,也就是說(shuō)ASCII對(duì)應(yīng)的字符在UTF-8中和ASCII編碼完全一致。范圍在0x00-0x7F之內(nèi)的字符一定是ASCII字符,不可能是其他字符的一部分。GBK和Big5都存在的缺陷在UTF-8中是不存在的。
大于U+007F的UCS字符,在UTF-8編碼中至少是兩個(gè)字節(jié)。
UTF-8中的每個(gè)字符編碼的首字節(jié)總在0x00-0xFD之間(不考慮UCS-4支持的情況,首字節(jié)在0x00-0xEF之間)。根據(jù)首字節(jié)就可以判斷之后連續(xù)幾個(gè)字節(jié)。
非首字節(jié)的其他字節(jié)都在0x80-0xBF之間;0xFE和0xFF在UTF-8中沒(méi)有被用到。
GBK編碼中的漢字字符都在UCS-2中的范圍都在U+0800 - U+FFFF之間,所以每個(gè)GBK編碼中的漢字字符的UTF-8編碼都是3個(gè)字節(jié)。但GBK中包含的其他字符的UTF-8編碼就不一定是3個(gè)字節(jié)了,如GBK中的俄文字符。
在UTF-8的編碼的傳輸過(guò)程中即使丟掉一個(gè)字節(jié),根據(jù)編碼規(guī)律也很容易定位丟掉的位置,不會(huì)影響到其他字符。在其他雙字節(jié)編碼中,一旦損失一個(gè)字節(jié),就會(huì)影響到此字節(jié)之后的所有字符。從這點(diǎn)可以看出UTF-8編碼非常適合作為傳輸編碼。
- 下載地址
發(fā)表評(píng)論
0條評(píng)論軟件排行榜
- 1Acme CAD Converter 2023中文版 v8.10.6.1560
- 2pdf2cad v14漢化版 v14.2024.5.0
- 3epubor ultimate中文破解版 v3.0.12.707
- 4pdf轉(zhuǎn)word工具(pdf轉(zhuǎn)換成word轉(zhuǎn)換器) v2.0附注冊(cè)碼
- 5smallpdf轉(zhuǎn)換器免費(fèi)版 v3.6
- 6Freemake Audio Converter(免費(fèi)全能音頻轉(zhuǎn)換器) v1.1.9中文版
- 7skp文件版本轉(zhuǎn)換器
- 8pdf轉(zhuǎn)換成word轉(zhuǎn)換器免費(fèi)版 v1.0.0.1官方版
- 9文字轉(zhuǎn)語(yǔ)音助手 v6.5官方版
- 10autodwg pdf to dwg converter pro 2024(pdf轉(zhuǎn)dwg轉(zhuǎn)換器) v2024 4.7官方版
熱門(mén)推薦
- Solid Converter PDF v9官方版 v9.2.7478.2128120.05M / 簡(jiǎn)體中文
- 文字轉(zhuǎn)語(yǔ)音助手 v6.5官方版64.74M / 簡(jiǎn)體中文
- 智安PDF轉(zhuǎn)換大師軟件 v3.1.4官方版17.9M / 簡(jiǎn)體中文
- 視頻批量轉(zhuǎn)換與水印工具 v9.0官方版11.1M / 簡(jiǎn)體中文
- PDFdu PDF Converter(pdf轉(zhuǎn)換器) v2.3官方版38.35M / 英文
- 北斗PDF轉(zhuǎn)換器官方版 v6.542.1M / 簡(jiǎn)體中文
- pdf to html converter(pdf轉(zhuǎn)html轉(zhuǎn)換器) v3.40官方版5.29M / 英文
- xnconvert圖片轉(zhuǎn)換器 v1.94多國(guó)語(yǔ)言綠色版44.67M / 多國(guó)語(yǔ)言
- 轉(zhuǎn)轉(zhuǎn)大師客戶端 v6.0.1.7官方版14.3M / 簡(jiǎn)體中文