gopl-zh.github.com/ch4/ch4-02.md
2016-01-31 14:59:55 +08:00

8.0 KiB
Raw Blame History

4.2. Slice

Slice切片代表變長的序列序列中每個元素都有相同的類型。一個slice類型一般寫作[]T其中T代表slice中元素的類型slice的語法和數組很像隻是沒有固定長度而已。

數組和slice之間有着緊密的聯繫。一個slice是一個輕量級的數據結構提供了訪問數組子序列或者全部元素的功能而且slice的底層確實引用一個數組對象。一個slice由三個部分構成指針、長度和容量。指針指向第一個slice元素對應的底層數組元素的地址要註意的是slice的第一個元素併不一定就是數組的第一個元素。長度對應slice中元素的數目長度不能超過容量容量一般是從slice的開始位置到底層數據的結尾位置。內置的len和cap函數分别返迴slice的長度和容量。

多個slice之間可以共享底層的數據併且引用的數組部分區間可能重疊。圖4.1顯示了表示一年中每個月份名字的字符串數組還有重疊引用了該數組的兩個slice。數組這樣定義

months := [...]string{1: "January", /* ... */, 12: "December"}

因此一月份是months[1]十二月份是months[12]。通常數組的第一個元素從索引0開始但是月份一般是從1開始的因此我們聲明數組時直接跳過第0個元素第0個元素會被自動初始化爲空字符串。

slice的切片操作s[i:j]其中0 ≤ i≤ j≤ cap(s)用於創建一個新的slice引用s的從第i個元素開始到第j-1個元素的子序列。新的slice將隻有j-i個元素。如果i位置的索引被省略的話將使用0代替如果j位置的索引被省略的話將使用len(s)代替。因此months[1:13]切片操作將引用全部有效的月份和months[1:]操作等價months[:]切片操作則是引用整個數組。讓我們分别定義表示第二季度和北方夏天月份的slice它們有重疊部分

Q2 := months[4:7]
summer := months[6:9]
fmt.Println(Q2)     // ["April" "May" "June"]
fmt.Println(summer) // ["June" "July" "August"]

兩個slice都包含了六月份下面的代碼是一個包含相同月份的測試性能較低

for _, s := range summer {
	for _, q := range Q2 {
		if s == q {
			fmt.Printf("%s appears in both\n", s)
		}
	}
}

如果切片操作超出cap(s)的上限將導致一個panic異常但是超出len(s)則是意味着擴展了slice因爲新slice的長度會變大

fmt.Println(summer[:20]) // panic: out of range

endlessSummer := summer[:5] // extend a slice (within capacity)
fmt.Println(endlessSummer)  // "[June July August September October]"

另外,字符串的切片操作和[]byte字節類型切片的切片操作是類似的。它們都寫作x[m:n]併且都是返迴一個原始字節繫列的子序列底層都是共享之前的底層數組因此切片操作對應常量時間複雜度。x[m:n]切片操作對於字符串則生成一個新字符串如果x是[]byte的話則生成一個新的[]byte。

因爲slice值包含指向第一個slice元素的指針因此向函數傳遞slice將允許在函數內部脩改底層數組的元素。換句話説複製一個slice隻是對底層的數組創建了一個新的slice别名§2.3.2。下面的reverse函數在原內存空間將[]int類型的slice反轉而且它可以用於任意長度的slice。

gopl.io/ch4/rev

// reverse reverses a slice of ints in place.
func reverse(s []int) {
	for i, j := 0, len(s)-1; i < j; i, j = i+1, j-1 {
		s[i], s[j] = s[j], s[i]
	}
}

這里我們反轉數組的應用:

a := [...]int{0, 1, 2, 3, 4, 5}
reverse(a[:])
fmt.Println(a) // "[5 4 3 2 1 0]"

一種將slice元素循環向左镟轉n個元素的方法是三次調用reverse反轉函數第一次是反轉開頭的n個元素然後是反轉剩下的元素最後是反轉整個slice的元素。如果是向右循環镟轉則將第三個函數調用移到第一個調用位置就可以了。

s := []int{0, 1, 2, 3, 4, 5}
// Rotate s left by two positions.
reverse(s[:2])
reverse(s[2:])
reverse(s)
fmt.Println(s) // "[2 3 4 5 0 1]"

要註意的是slice類型的變量s和數組類型的變量a的初始化語法的差異。slice和數組的字面值語法很類似它們都是用花括弧包含一繫列的初始化元素但是對於slice併沒有指明序列的長度。這會隱式地創建一個合適大小的數組然後slice的指針指向底層的數組。就像數組字面值一樣slice的字面值也可以按順序指定初始化值序列或者是通過索引和元素值指定或者的兩種風格的混合語法初始化。

和數組不同的是slice之間不能比較因此我們不能使用==操作符來判斷兩個slice是否含有全部相等元素。不過標準庫提供了高度優化的bytes.Equal函數來判斷兩個字節型slice是否相等[]byte但是對於其他類型的slice我們必須自己展開每個元素進行比較

func equal(x, y []string) bool {
	if len(x) != len(y) {
		return false
	}
	for i := range x {
		if x[i] != y[i] {
			return false
		}
	}
	return true
}

上面關於兩個slice的深度相等測試運行的時間併不比支持==操作的數組或字符串更多但是爲何slice不直接支持比較運算符呢這方面有兩個原因。第一個原因一個slice的元素是間接引用的一個slice甚至可以包含自身。雖然有很多辦法處理這種情形但是沒有一個是簡單有效的。

第二個原因因爲slice的元素是間接引用的一個固定值的slice在不同的時間可能包含不同的元素因爲底層數組的元素可能會被脩改。併且Go語言中map等哈希表之類的數據結構的key隻做簡單的淺拷貝它要求在整個聲明週期中相等的key必須對相同的元素。對於像指針或chan之類的引用類型==相等測試可以判斷兩個是否是引用相同的對象。一個針對slice的淺相等測試的==操作符可能是有一定用處的也能臨時解決map類型的key問題但是slice和數組不同的相等測試行爲會讓人睏惑。因此安全的做法是直接禁止slice之間的比較操作。

slice唯一合法的比較操作是和nil比較例如

if summer == nil { /* ... */ }

一個零值的slice等於nil。一個nil值的slice併沒有底層數組。一個nil值的slice的長度和容量都是0但是也有非nil值的slice的長度和容量也是0的例如[]int{}或make([]int, 3)[3:]。與任意類型的nil值一樣我們可以用[]int(nil)類型轉換表達式來生成一個對應類型slice的nil值。

var s []int    // len(s) == 0, s == nil
s = nil        // len(s) == 0, s == nil
s = []int(nil) // len(s) == 0, s == nil
s = []int{}    // len(s) == 0, s != nil

如果你需要測試一個slice是否是空的使用len(s) == 0來判斷而不應該用s == nil來判斷。除了和nil相等比較外一個nil值的slice的行爲和其它任意0長度的slice一樣例如reverse(nil)也是安全的。除了文檔已經明確説明的地方所有的Go語言函數應該以相同的方式對待nil值的slice和0長度的slice。

內置的make函數創建一個指定元素類型、長度和容量的slice。容量部分可以省略在這種情況下容量將等於長度。

make([]T, len)
make([]T, len, cap) // same as make([]T, cap)[:len]

在底層make創建了一個匿名的數組變量然後返迴一個slice隻有通過返迴的slice才能引用底層匿名的數組變量。在第一種語句中slice是整個數組的view。在第二個語句中slice隻引用了底層數組的前len個元素但是容量將包含整個的數組。額外的元素是留給未來的增長用的。

{% include "./ch4-02-1.md" %}

{% include "./ch4-02-2.md" %}