ch3-05 review

This commit is contained in:
chai2010
2015-12-28 10:40:45 +08:00
parent 33480e55d6
commit 315fb47435
4 changed files with 42 additions and 45 deletions

View File

@@ -1,8 +1,8 @@
### 3.5.2. Unicode
在很久以前,世界是比較簡單的起碼計算機世界就隻有一個ASCII字符集美国信息交換標準代碼。ASCII更準確地説是美国的ASCII使用7bit來表示128個字符包含英文字母的大小寫、數字、各種標點符號和設置控製符。對於早期的計算機程序来说,這些就足夠了,但是這也導致了世界上很多其他地區的用戶無法直接使用自己的符繫統。隨着互聯網的發展,混合多種語言的數據變得很常見(译注:比如本身的英文原文或中文翻都包含了ASCII、中文、日文等多种语言字符)。如何有效處理這些包含了各種語言的豐富多樣的文本數據呢?
在很久以前,世界是比較簡單的起碼計算機世界就隻有一個ASCII字符集美国信息交換標準代碼。ASCII更準確地説是美国的ASCII使用7bit來表示128個字符包含英文字母的大小寫、數字、各種標點符號和設置控製符。對於早期的計算機程序來説,這些就足夠了,但是這也導致了世界上很多其他地區的用戶無法直接使用自己的符繫統。隨着互聯網的發展,混合多種語言的數據變得很常見(譯註:比如本身的英文原文或中文翻都包含了ASCII、中文、日文等多種語言字符)。如何有效處理這些包含了各種語言的豐富多樣的文本數據呢?
答案就是使用Unicode http://unicode.org ),它收集了這個世界上所有的符繫統包括重音符號和其它變音符號製表符和迴車符還有很多神祕的符號每個符號都分配一個唯一的Unicode碼點Unicode碼點對應Go語言中的rune整類型(译注rune是int32等价类型)。
答案就是使用Unicode http://unicode.org ),它收集了這個世界上所有的符繫統包括重音符號和其它變音符號製表符和迴車符還有很多神祕的符號每個符號都分配一個唯一的Unicode碼點Unicode碼點對應Go語言中的rune整類型(譯註rune是int32等價類型)。
在第八版本的Unicode標準收集了超過120,000個字符涵蓋超過100多種語言。這些在計算機程序和數據中是如何體現的呢通用的表示一個Unicode碼點的數據類型是int32也就是Go語言中rune對應的類型它的同義詞rune符文正是這個意思。