mirror of
https://github.com/gopl-zh/gopl-zh.github.com.git
synced 2025-08-16 03:21:33 +00:00
回到简体
This commit is contained in:
@@ -1,14 +1,14 @@
|
||||
### 3.5.4. 字符串和Byte切片
|
||||
|
||||
標準庫中有四個包對字符串處理尤爲重要:bytes、strings、strconv和unicode包。strings包提供了許多如字符串的査詢、替換、比較、截斷、拆分和合併等功能。
|
||||
标准库中有四个包对字符串处理尤为重要:bytes、strings、strconv和unicode包。strings包提供了许多如字符串的查询、替换、比较、截断、拆分和合并等功能。
|
||||
|
||||
bytes包也提供了很多類似功能的函數,但是針對和字符串有着相同結構的[]byte類型。因爲字符串是隻讀的,因此逐步構建字符串會導致很多分配和複製。在這種情況下,使用bytes.Buffer類型將會更有效,稍後我們將展示。
|
||||
bytes包也提供了很多类似功能的函数,但是针对和字符串有着相同结构的[]byte类型。因为字符串是只读的,因此逐步构建字符串会导致很多分配和复制。在这种情况下,使用bytes.Buffer类型将会更有效,稍后我们将展示。
|
||||
|
||||
strconv包提供了布爾型、整型數、浮點數和對應字符串的相互轉換,還提供了雙引號轉義相關的轉換。
|
||||
strconv包提供了布尔型、整型数、浮点数和对应字符串的相互转换,还提供了双引号转义相关的转换。
|
||||
|
||||
unicode包提供了IsDigit、IsLetter、IsUpper和IsLower等類似功能,它們用於給字符分類。每個函數有一個單一的rune類型的參數,然後返迴一個布爾值。而像ToUpper和ToLower之類的轉換函數將用於rune字符的大小寫轉換。所有的這些函數都是遵循Unicode標準定義的字母、數字等分類規范。strings包也有類似的函數,它們是ToUpper和ToLower,將原始字符串的每個字符都做相應的轉換,然後返迴新的字符串。
|
||||
unicode包提供了IsDigit、IsLetter、IsUpper和IsLower等类似功能,它们用于给字符分类。每个函数有一个单一的rune类型的参数,然后返回一个布尔值。而像ToUpper和ToLower之类的转换函数将用于rune字符的大小写转换。所有的这些函数都是遵循Unicode标准定义的字母、数字等分类规范。strings包也有类似的函数,它们是ToUpper和ToLower,将原始字符串的每个字符都做相应的转换,然后返回新的字符串。
|
||||
|
||||
下面例子的basename函數靈感於Unix shell的同名工具。在我們實現的版本中,basename(s)將看起來像是繫統路徑的前綴刪除,同時將看似文件類型的後綴名部分刪除:
|
||||
下面例子的basename函数灵感于Unix shell的同名工具。在我们实现的版本中,basename(s)将看起来像是系统路径的前缀删除,同时将看似文件类型的后缀名部分删除:
|
||||
|
||||
```Go
|
||||
fmt.Println(basename("a/b/c.go")) // "c"
|
||||
@@ -16,7 +16,7 @@ fmt.Println(basename("c.d.go")) // "c.d"
|
||||
fmt.Println(basename("abc")) // "abc"
|
||||
```
|
||||
|
||||
第一個版本併沒有使用任何庫,全部手工硬編碼實現:
|
||||
第一个版本并没有使用任何库,全部手工硬编码实现:
|
||||
|
||||
<u><i>gopl.io/ch3/basename1</i></u>
|
||||
```Go
|
||||
@@ -41,7 +41,7 @@ func basename(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
簡化個版本使用了strings.LastIndex庫函數:
|
||||
简化个版本使用了strings.LastIndex库函数:
|
||||
|
||||
<u><i>gopl.io/ch3/basename2</i></u>
|
||||
```Go
|
||||
@@ -55,9 +55,9 @@ func basename(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
path和path/filepath包提供了關於文件路徑名更一般的函數操作。使用斜槓分隔路徑可以在任何操作繫統上工作。斜槓本身不應該用於文件名,但是在其他一些領域可能會用於文件名,例如URL路徑組件。相比之下,path/filepath包則使用操作繫統本身的路徑規則,例如POSIX繫統使用/foo/bar,而Microsoft Windows使用c:\foo\bar等。
|
||||
path和path/filepath包提供了关于文件路径名更一般的函数操作。使用斜杠分隔路径可以在任何操作系统上工作。斜杠本身不应该用于文件名,但是在其他一些领域可能会用于文件名,例如URL路径组件。相比之下,path/filepath包则使用操作系统本身的路径规则,例如POSIX系统使用/foo/bar,而Microsoft Windows使用c:\foo\bar等。
|
||||
|
||||
讓我們繼續另一個字符串的例子。函數的功能是將一個表示整值的字符串,每隔三個字符插入一個逗號分隔符,例如“12345”處理後成爲“12,345”。這個版本隻適用於整數類型;支持浮點數類型的支持留作練習。
|
||||
让我们继续另一个字符串的例子。函数的功能是将一个表示整值的字符串,每隔三个字符插入一个逗号分隔符,例如“12345”处理后成为“12,345”。这个版本只适用于整数类型;支持浮点数类型的支持留作练习。
|
||||
|
||||
<u><i>gopl.io/ch3/comma</i></u>
|
||||
```Go
|
||||
@@ -71,11 +71,11 @@ func comma(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
輸入comma函數的參數是一個字符串。如果輸入字符串的長度小於或等於3的話,則不需要插入逗分隔符。否則,comma函數將在最後三個字符前位置將字符串切割爲兩個兩個子串併插入逗號分隔符,然後通過遞歸調用自身來出前面的子串。
|
||||
输入comma函数的参数是一个字符串。如果输入字符串的长度小于或等于3的话,则不需要插入逗分隔符。否则,comma函数将在最后三个字符前位置将字符串切割为两个两个子串并插入逗号分隔符,然后通过递归调用自身来出前面的子串。
|
||||
|
||||
一個字符串是包含的隻讀字節數組,一旦創建,是不可變的。相比之下,一個字節slice的元素則可以自由地脩改。
|
||||
一个字符串是包含的只读字节数组,一旦创建,是不可变的。相比之下,一个字节slice的元素则可以自由地修改。
|
||||
|
||||
字符串和字節slice之間可以相互轉換:
|
||||
字符串和字节slice之间可以相互转换:
|
||||
|
||||
```Go
|
||||
s := "abc"
|
||||
@@ -83,9 +83,9 @@ b := []byte(s)
|
||||
s2 := string(b)
|
||||
```
|
||||
|
||||
從概念上講,一個[]byte(s)轉換是分配了一個新的字節數組用於保存字符串數據的拷貝,然後引用這個底層的字節數組。編譯器的優化可以避免在一些場景下分配和複製字符串數據,但總的來説需要確保在變量b被脩改的情況下,原始的s字符串也不會改變。將一個字節slice轉到字符串的string(b)操作則是構造一個字符串拷貝,以確保s2字符串是隻讀的。
|
||||
从概念上讲,一个[]byte(s)转换是分配了一个新的字节数组用于保存字符串数据的拷贝,然后引用这个底层的字节数组。编译器的优化可以避免在一些场景下分配和复制字符串数据,但总的来说需要确保在变量b被修改的情况下,原始的s字符串也不会改变。将一个字节slice转到字符串的string(b)操作则是构造一个字符串拷贝,以确保s2字符串是只读的。
|
||||
|
||||
爲了避免轉換中不必要的內存分配,bytes包和strings同時提供了許多實用函數。下面是strings包中的六個函數:
|
||||
为了避免转换中不必要的内存分配,bytes包和strings同时提供了许多实用函数。下面是strings包中的六个函数:
|
||||
|
||||
```Go
|
||||
func Contains(s, substr string) bool
|
||||
@@ -96,7 +96,7 @@ func Index(s, sep string) int
|
||||
func Join(a []string, sep string) string
|
||||
```
|
||||
|
||||
bytes包中也對應的六個函數:
|
||||
bytes包中也对应的六个函数:
|
||||
|
||||
```Go
|
||||
func Contains(b, subslice []byte) bool
|
||||
@@ -107,9 +107,9 @@ func Index(s, sep []byte) int
|
||||
func Join(s [][]byte, sep []byte) []byte
|
||||
```
|
||||
|
||||
它們之間唯一的區别是字符串類型參數被替換成了字節slice類型的參數。
|
||||
它们之间唯一的区别是字符串类型参数被替换成了字节slice类型的参数。
|
||||
|
||||
bytes包還提供了Buffer類型用於字節slice的緩存。一個Buffer開始是空的,但是隨着string、byte或[]byte等類型數據的寫入可以動態增長,一個bytes.Buffer變量併不需要處理化,因爲零值也是有效的:
|
||||
bytes包还提供了Buffer类型用于字节slice的缓存。一个Buffer开始是空的,但是随着string、byte或[]byte等类型数据的写入可以动态增长,一个bytes.Buffer变量并不需要处理化,因为零值也是有效的:
|
||||
|
||||
<u><i>gopl.io/ch3/printints</i></u>
|
||||
```Go
|
||||
@@ -132,12 +132,12 @@ func main() {
|
||||
}
|
||||
```
|
||||
|
||||
當向bytes.Buffer添加任意字符的UTF8編碼時,最好使用bytes.Buffer的WriteRune方法,但是WriteByte方法對於寫入類似'['和']'等ASCII字符則會更加有效。
|
||||
当向bytes.Buffer添加任意字符的UTF8编码时,最好使用bytes.Buffer的WriteRune方法,但是WriteByte方法对于写入类似'['和']'等ASCII字符则会更加有效。
|
||||
|
||||
bytes.Buffer類型有着很多實用的功能,我們在第七章討論接口時將會涉及到,我們將看看如何將它用作一個I/O的輸入和輸出對象,例如當做Fprintf的io.Writer輸出對象,或者當作io.Reader類型的輸入源對象。
|
||||
bytes.Buffer类型有着很多实用的功能,我们在第七章讨论接口时将会涉及到,我们将看看如何将它用作一个I/O的输入和输出对象,例如当做Fprintf的io.Writer输出对象,或者当作io.Reader类型的输入源对象。
|
||||
|
||||
**練習 3.10:** 編寫一個非遞歸版本的comma函數,使用bytes.Buffer代替字符串鏈接操作。
|
||||
**练习 3.10:** 编写一个非递归版本的comma函数,使用bytes.Buffer代替字符串链接操作。
|
||||
|
||||
**練習 3.11:** 完善comma函數,以支持浮點數處理和一個可選的正負號的處理。
|
||||
**练习 3.11:** 完善comma函数,以支持浮点数处理和一个可选的正负号的处理。
|
||||
|
||||
**練習 3.12:** 編寫一個函數,判斷兩個字符串是否是是相互打亂的,也就是説它們有着相同的字符,但是對應不同的順序。
|
||||
**练习 3.12:** 编写一个函数,判断两个字符串是否是是相互打乱的,也就是说它们有着相同的字符,但是对应不同的顺序。
|
||||
|
Reference in New Issue
Block a user