mirror of
https://github.com/gopl-zh/gopl-zh.github.com.git
synced 2025-08-05 15:12:33 +00:00
make zh2tw
This commit is contained in:
@@ -1,15 +1,15 @@
|
||||
### 3.5.4. 字符串和Byte切片
|
||||
|
||||
|
||||
标准库中有四个包对字符串处理尤为重要: bytes, strings, strconv, 和 unicode. strings 包提供了许多如字符串的查询, 替换, 比较, 截断, 拆分, 和合并等功能.
|
||||
標準庫中有四個包對字符串處理尤爲重要: bytes, strings, strconv, 和 unicode. strings 包提供了許多如字符串的査詢, 替換, 比較, 截斷, 拆分, 和合併等功能.
|
||||
|
||||
bytes 包也提供了很多类似功能的函数, 但是针对和字符串有着相同结构的 []byte 类型. 因为字符串是只读的, 因此逐步构建字符串会导致很多分配和复制. 在这种情况下, 使用 bytes.Buffer 类型会更有效, 稍后我们将展示.
|
||||
bytes 包也提供了很多類似功能的函數, 但是針對和字符串有着相同結構的 []byte 類型. 因爲字符串是隻讀的, 因此逐步構建字符串會導致很多分配和複製. 在這種情況下, 使用 bytes.Buffer 類型會更有效, 稍後我們將展示.
|
||||
|
||||
strconv 包提供了 布尔型, 整型数, 浮点数和对应字符串间的相互转换, 还提供了双引号的字符串面值形式的转换.
|
||||
strconv 包提供了 布爾型, 整型數, 浮點數和對應字符串間的相互轉換, 還提供了雙引號的字符串面值形式的轉換.
|
||||
|
||||
unicode 包提供了类似 IsDigit, IsLetter, IsUpper, 和 IsLower 等功能, 它们用于给字符分类. 每个函数有一个单一的rune类型的参数, 然后返回一个布尔值. 像 ToUpper 和 ToLower 之类的转换函数将用于rune字符的大小写转换. 所有的这些函数都是遵循Unicode标准定义的字母,数字等分类规范. strings 包也有类似的函数, 它们是 ToUpper 和 ToLower, 将原始字符串的每个字符都做相应的转换, 然后返回新的字符串.
|
||||
unicode 包提供了類似 IsDigit, IsLetter, IsUpper, 和 IsLower 等功能, 它們用於給字符分類. 每個函數有一個單一的rune類型的參數, 然後返迴一個布爾值. 像 ToUpper 和 ToLower 之類的轉換函數將用於rune字符的大小寫轉換. 所有的這些函數都是遵循Unicode標準定義的字母,數字等分類規范. strings 包也有類似的函數, 它們是 ToUpper 和 ToLower, 將原始字符串的每個字符都做相應的轉換, 然後返迴新的字符串.
|
||||
|
||||
下面的 basename 函数的灵感由Unix shell的同名工具而来. 在我们实现的版本中, basename(s) 将看起来像是系统路径的前缀删除, 同时将看似文件类型的后缀名删除:
|
||||
下面的 basename 函數的靈感由Unix shell的同名工具而來. 在我們實現的版本中, basename(s) 將看起來像是繫統路徑的前綴刪除, 同時將看似文件類型的後綴名刪除:
|
||||
|
||||
```Go
|
||||
fmt.Println(basename("a/b/c.go")) // "c"
|
||||
@@ -17,7 +17,7 @@ fmt.Println(basename("c.d.go")) // "c.d"
|
||||
fmt.Println(basename("abc")) // "abc"
|
||||
```
|
||||
|
||||
第一个版本并没有使用任何库, 全部手工实现:
|
||||
第一個版本併沒有使用任何庫, 全部手工實現:
|
||||
|
||||
```Go
|
||||
gopl.io/ch3/basename1
|
||||
@@ -42,7 +42,7 @@ func basename(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
一个简化的版本使用了 strings.LastIndex 库函数:
|
||||
一個簡化的版本使用了 strings.LastIndex 庫函數:
|
||||
|
||||
```Go
|
||||
gopl.io/ch3/basename2
|
||||
@@ -57,10 +57,10 @@ func basename(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
path 和 path/filepath 包提供了关于文件名更一般的函数操作. 使用斜杠分隔路径可以在任何操作系统上工作. 斜杠本身不应该用于文件名, 但是在其他一些领域可能是有效的, 例如URL路径组件. 相比之下, path/filepath 包使用操作系统本身的路径规则, 例如 POSIX 系统使用 /foo/bar, Microsoft Windows 使用 c:\foo\bar 等.
|
||||
path 和 path/filepath 包提供了關於文件名更一般的函數操作. 使用斜槓分隔路徑可以在任何操作繫統上工作. 斜槓本身不應該用於文件名, 但是在其他一些領域可能是有效的, 例如URL路徑組件. 相比之下, path/filepath 包使用操作繫統本身的路徑規則, 例如 POSIX 繫統使用 /foo/bar, Microsoft Windows 使用 c:\foo\bar 等.
|
||||
|
||||
|
||||
让我们继续另一个字符串的例子. 任务是将一个表示整值的字符串, 每隔三个字符插入一个逗号, 例如 "12345" 处理后成为 "12,345". 这个版本只适用于整数类型; 支持浮点数类型的支持留做练习.
|
||||
讓我們繼續另一個字符串的例子. 任務是將一個表示整值的字符串, 每隔三個字符插入一個逗號, 例如 "12345" 處理後成爲 "12,345". 這個版本隻適用於整數類型; 支持浮點數類型的支持留做練習.
|
||||
|
||||
```Go
|
||||
gopl.io/ch3/comma
|
||||
@@ -75,11 +75,11 @@ func comma(s string) string {
|
||||
}
|
||||
```
|
||||
|
||||
输入 comma 的参数是一个字符串. 如果输入字符串的长度小于或等于3的话, 则不需要插入逗号. 否则, comma 将在最后三个字符前切割为两个两个子串, 然后用前面的子串递归调用自身.
|
||||
輸入 comma 的參數是一個字符串. 如果輸入字符串的長度小於或等於3的話, 則不需要插入逗號. 否則, comma 將在最後三個字符前切割爲兩個兩個子串, 然後用前面的子串遞歸調用自身.
|
||||
|
||||
一个字符串包含的字节数组, 一旦创建, 是不可变的. 相比之下, 一个字节切片的原始则可以自由地修改.
|
||||
一個字符串包含的字節數組, 一旦創建, 是不可變的. 相比之下, 一個字節切片的原始則可以自由地脩改.
|
||||
|
||||
字符串和字节切片可以相互转换:
|
||||
字符串和字節切片可以相互轉換:
|
||||
|
||||
```Go
|
||||
s := "abc"
|
||||
@@ -87,9 +87,9 @@ b := []byte(s)
|
||||
s2 := string(b)
|
||||
```
|
||||
|
||||
从概念上讲, []byte(s) 转换是分配了一个新的字节数组保存了字符串数据的拷贝, 然后引用这个字节数组. 编译器的优化可以避免在一些场景下分配和复制字符串数据, 但总的来说需要确保在b被修改的情况下, 原始的s字符串也不会改变. 将一个字节切片转到字符串的 string(b) 操作则是构造一个拷贝, 以确保s2字符串是只读的.
|
||||
從概念上講, []byte(s) 轉換是分配了一個新的字節數組保存了字符串數據的拷貝, 然後引用這個字節數組. 編譯器的優化可以避免在一些場景下分配和複製字符串數據, 但總的來説需要確保在b被脩改的情況下, 原始的s字符串也不會改變. 將一個字節切片轉到字符串的 string(b) 操作則是構造一個拷貝, 以確保s2字符串是隻讀的.
|
||||
|
||||
为了避免转换中不必要的内存分配, bytes包和strings同时提供了许多类似的实用函数. 下面是strings包中的六个函数:
|
||||
爲了避免轉換中不必要的內存分配, bytes包和strings同時提供了許多類似的實用函數. 下面是strings包中的六個函數:
|
||||
|
||||
```Go
|
||||
func Contains(s, substr string) bool
|
||||
@@ -100,7 +100,7 @@ func Index(s, sep string) int
|
||||
func Join(a []string, sep string) string
|
||||
```
|
||||
|
||||
bytes 包中对应的六个函数:
|
||||
bytes 包中對應的六個函數:
|
||||
|
||||
```Go
|
||||
func Contains(b, subslice []byte) bool
|
||||
@@ -111,9 +111,9 @@ func Index(s, sep []byte) int
|
||||
func Join(s [][]byte, sep []byte) []byte
|
||||
```
|
||||
|
||||
唯一的区别是字符串类型参数被替换成了字节切片类型的参数.
|
||||
唯一的區别是字符串類型參數被替換成了字節切片類型的參數.
|
||||
|
||||
bytes 包还提供了 Buffer 类型用于字节切片的缓存. 一个 Buffer 开始是空的, 但是随着 string, byte, 和 []byte 等类型数据的写入可以动态增长, 一个 bytes.Buffer 变量并不需要处理化, 因此零值也是有效的:
|
||||
bytes 包還提供了 Buffer 類型用於字節切片的緩存. 一個 Buffer 開始是空的, 但是隨着 string, byte, 和 []byte 等類型數據的寫入可以動態增長, 一個 bytes.Buffer 變量併不需要處理化, 因此零值也是有效的:
|
||||
|
||||
```Go
|
||||
gopl.io/ch3/printints
|
||||
@@ -137,16 +137,16 @@ func main() {
|
||||
}
|
||||
```
|
||||
|
||||
当向 bytes.Buffer 添加任意字符的UTF8编码, 最好使用 bytes.Buffer 的 WriteRune 方法, 但是 WriteByte 方法对于写入类似 '[' 和 ']' 等 ASCII 字符则更有效.
|
||||
當向 bytes.Buffer 添加任意字符的UTF8編碼, 最好使用 bytes.Buffer 的 WriteRune 方法, 但是 WriteByte 方法對於寫入類似 '[' 和 ']' 等 ASCII 字符則更有效.
|
||||
|
||||
bytes.Buffer 类型有着诸多实用的功能, 我们在第七章讨论接口时层涉及到, 我们将看看如何将它用作一个I/O 的输入和输出对象, 例如 Fprintf 的 io.Writer 输出, 或作为输入源 io.Reader.
|
||||
bytes.Buffer 類型有着諸多實用的功能, 我們在第七章討論接口時層涉及到, 我們將看看如何將它用作一個I/O 的輸入和輸齣對象, 例如 Fprintf 的 io.Writer 輸齣, 或作爲輸入源 io.Reader.
|
||||
|
||||
**练习3.10:** 编写一个非递归版本的comma函数, 使用 bytes.Buffer 代替字符串链接操作.
|
||||
**練習3.10:** 編寫一個非遞歸版本的comma函數, 使用 bytes.Buffer 代替字符串鏈接操作.
|
||||
|
||||
**练习3.11:** 完善 comma 函数, 以支持浮点数处理和一个可选的正负号处理.
|
||||
**練習3.11:** 完善 comma 函數, 以支持浮點數處理和一個可選的正負號處理.
|
||||
|
||||
|
||||
**练习3.12:** 编写一个函数, 判断两个字符串是否是是相互打乱的, 也就是说它们有着相同的字符, 但是对应不同的顺序.
|
||||
**練習3.12:** 編寫一個函數, 判斷兩個字符串是否是是相互打亂的, 也就是説它們有着相同的字符, 但是對應不同的順序.
|
||||
|
||||
|
||||
|
||||
|
Reference in New Issue
Block a user