回首頁
修改
Mail
FTP

中




2008年3月18日 星期二

[ASCII]何謂編碼



所謂編碼,最簡單的說,就是人用的文字或符號與電腦內部用的01010101內碼的對照,編碼要有標準(同一對照表),資料才能相互通用。若要讀取不同編碼的電子資料必須經過內碼轉換

在每個電腦系統中,都有一套制定每個符號對應的代碼,這套規則稱為電腦的內碼 (code)。在微電腦最常用的內碼是美國標準資訊交換碼 (American Standard Code for Information Interchange),每個常用的符號都有對應的數字,這套內碼從數字零編到數字127,它只使用7個位元,最高效位元並不使用;後來又有人將最高的1個位元也編入這套內碼中,成為8個位元的延伸EASCII(Extended ASCII),這套內碼加上了許多外文和表格符號,這也是一般PC常用的內碼。

ASCII (ASCII碼、美國標準資訊交換碼)

0與1的代碼,所有的個人電腦都用它來呈現文字。利用美國國家資訊交換標準碼,鍵盤上每個字母和數字符號都用七個0與1的二進位碼序列來表示。例如字母C表示為0010011;而數字3則表示為0110011。不相容的電腦仍然可以在彼此間傳遞文字檔,就是因為大家都使用美國國家資訊交換標準碼來定義字母。
美國國家資訊交換標準碼的字元,現在也出現在網際網路,普羅大眾藝術學院的繪畫裡,只不過還沒進入大型現代藝術美術館就是了(譯註:是指用普通文字畫出來的圖畫:生日蛋糕、卡通人物、風景等等,稱為ASCIIArt,許多電子布告板都有收錄這種圖案的精華)



Unicode 單一碼(以下摘自仟禧網路辭典)

美國的電腦技術可以說是執世界之牛耳,由於電腦上所使用的作業系統為美國人所發明的,所以在文字的選擇上,自然是以英文系統為主的文字,於是有了一個位元組的 ASCII。在電腦尚未發達之時,一個位元組的 ASCII 可表示 128 種符號,後來又將它擴充為八位元的 Extended ASCII,兩百五十六種符號已經可以滿足許多人的需求,但是由於電腦的普及化,使得各行各業,使用各種文字、語言的人都可能使用電腦,於是文字的統一在電腦上一直是各自為政。例如美國市場上推出了一套軟體之後,
在過幾個月可能才會有中文版,等到該軟體改版之後,中文化的工作便緊接著進行,這種反覆的現象一直是電腦未能普及化的原因。有鑑於此,電腦領域勢必要制定一個全球共同的文字標準,期使它能盡量容納各種全球不同的文字,於是誕生了兩個位元組的內碼『Unicode』。這種內碼利用兩個位元組來表示,於是可容納 65,536 個符號,其中前面 128 個符號是 ASCII 字元,其餘的數量可以包含英文、中文、日文、韓文以及其它非英語系國家的常用文字,目前 Unicode 的觀念已經在 Windows 98/NT 當中,因為儲存一個文字所使用的空間都是十六位元 (兩個位元組) ,但是目前仍未能達到一統文字的境界。


0 回應: