gopl-zh.github.com/ch4/ch4-05.md

12 KiB
Raw Blame History

4.5. JSON

JavaScript對象表示法JSON是一種用於發送和接收結構化信息的標準協議。在類似的協議中JSON併不是唯一的一個標準協議。 XML§7.14、ASN.1和Google的Protocol Buffers都是類似的協議併且有各自的特色但是由於簡潔性、可讀性和流行程度等原因JSON是應用最廣泛的一個。

Go語言對於這些標準格式的編碼和解碼都有良好的支持由標準庫中的encoding/json、encoding/xml、encoding/asn1等包提供支持譯註Protocol Buffers的支持由 github.com/golang/protobuf 包提供併且這類包都有着相似的API接口。本節我們將對重要的encoding/json包的用法做個概述。

JSON是對JavaScript中各種類型的值——字符串、數字、布爾值和對象——Unicode本文編碼。它可以用有效可讀的方式表示第三章的基礎數據類型和本章的數組、slice、結構體和map等聚合數據類型。

基本的JSON類型有數字十進製或科學記數法、布爾值true或false、字符串其中字符串是以雙引號包含的Unicode字符序列支持和Go語言類似的反斜槓轉義特性不過JSON使用的是\Uhhhh轉義數字來表示一個UTF-16編碼譯註UTF-16和UTF-8一樣是一種變長的編碼有些Unicode碼點較大的字符需要用4個字節表示而且UTF-16還有大端和小端的問題而不是Go語言的rune類型。

這些基礎類型可以通過JSON的數組和對象類型進行遞歸組合。一個JSON數組是一個有序的值序列寫在一個方括號中併以逗號分隔一個JSON數組可以用於編碼Go語言的數組和slice。一個JSON對象是一個字符串到值的映射寫成以繫列的name:value對形式用花括號包含併以逗號分隔JSON的對象類型可以用於編碼Go語言的map類型key類型是字符串和結構體。例如

boolean         true
number          -273.15
string          "She said \"Hello, BF\""
array           ["gold", "silver", "bronze"]
object          {"year": 1980,
                 "event": "archery",
                 "medals": ["gold", "silver", "bronze"]}

考慮一個應用程序該程序負責收集各種電影評論併提供反饋功能。它的Movie數據類型和一個典型的表示電影的值列表如下所示。在結構體聲明中Year和Color成員後面的字符串面值是結構體成員Tag我們稍後會解釋它的作用。

gopl.io/ch4/movie

type Movie struct {
	Title  string
	Year   int  `json:"released"`
	Color  bool `json:"color,omitempty"`
	Actors []string
}

var movies = []Movie{
	{Title: "Casablanca", Year: 1942, Color: false,
		Actors: []string{"Humphrey Bogart", "Ingrid Bergman"}},
	{Title: "Cool Hand Luke", Year: 1967, Color: true,
		Actors: []string{"Paul Newman"}},
	{Title: "Bullitt", Year: 1968, Color: true,
		Actors: []string{"Steve McQueen", "Jacqueline Bisset"}},
	// ...
}

這樣的數據結構特别適合JSON格式併且在兩種之間相互轉換也很容易。將一個Go語言中類似movies的結構體slice轉爲JSON的過程叫編組marshaling。編組通過調用json.Marshal函數完成

data, err := json.Marshal(movies)
if err != nil {
	log.Fatalf("JSON marshaling failed: %s", err)
}
fmt.Printf("%s\n", data)

Marshal函數返還一個編碼後的字節slice包含很長的字符串併且沒有空白縮進我們將它摺行以便於顯示

[{"Title":"Casablanca","released":1942,"Actors":["Humphrey Bogart","Ingr
id Bergman"]},{"Title":"Cool Hand Luke","released":1967,"color":true,"Ac
tors":["Paul Newman"]},{"Title":"Bullitt","released":1968,"color":true,"
Actors":["Steve McQueen","Jacqueline Bisset"]}]

這種緊湊的表示形式雖然包含了全部的信息但是很難閲讀。爲了生成便於閲讀的格式另一個json.MarshalIndent函數將産生整齊縮進的輸出。該函數有兩個額外的字符串參數用於表示每一行輸出的前綴和每一個層級的縮進

data, err := json.MarshalIndent(movies, "", "    ")
if err != nil {
	log.Fatalf("JSON marshaling failed: %s", err)
}
fmt.Printf("%s\n", data)

上面的代碼將産生這樣的輸出(譯註:在最後一個成員或元素後面併沒有逗號分隔符):

[
	{
		"Title": "Casablanca",
		"released": 1942,
		"Actors": [
			"Humphrey Bogart",
			"Ingrid Bergman"
		]
	},
	{
		"Title": "Cool Hand Luke",
		"released": 1967,
		"color": true,
		"Actors": [
			"Paul Newman"
		]
	},
	{
		"Title": "Bullitt",
		"released": 1968,
		"color": true,
		"Actors": [
			"Steve McQueen",
			"Jacqueline Bisset"
		]
	}
]

在編碼時默認使用Go語言結構體的成員名字作爲JSON的對象通過reflect反射技術我們將在12.6節討論)。隻有導出的結構體成員才會被編碼,這也就是我們爲什麽選擇用大寫字母開頭的成員名稱。

細心的讀者可能已經註意到其中Year名字的成員在編碼後變成了released還有Color成員編碼後變成了小寫字母開頭的color。這是因爲構體成員Tag所導致的。一個構體成員Tag是和在編譯階段關聯到該成員的元信息字符串

Year  int  `json:"released"`
Color bool `json:"color,omitempty"`

結構體的成員Tag可以是任意的字符串面值但是通常是一繫列用空格分隔的key:"value"鍵值對序列因爲值中含義雙引號字符因此成員Tag一般用原生字符串面值的形式書寫。json開頭鍵名對應的值用於控製encoding/json包的編碼和解碼的行爲併且encoding/...下面其它的包也遵循這個約定。成員Tag中json對應值的第一部分用於指定JSON對象的名字比如將Go語言中的TotalCount成員對應到JSON中的total_count對象。Color成員的Tag還帶了一個額外的omitempty選項表示當Go語言結構體成員爲空或零值時不生成JSON對象這里false爲零值。果然Casablanca是一個黑白電影併沒有輸出Color成員。

編碼的逆操作是解碼對應將JSON數據解碼爲Go語言的數據結構Go語言中一般叫unmarshaling通過json.Unmarshal函數完成。下面的代碼將JSON格式的電影數據解碼爲一個結構體slice結構體中隻有Title成員。通過定義合適的Go語言數據結構我們可以選擇性地解碼JSON中感興趣的成員。當Unmarshal函數調用返迴slice將被隻含有Title信息值填充其它JSON成員將被忽略。

var titles []struct{ Title string }
if err := json.Unmarshal(data, &titles); err != nil {
	log.Fatalf("JSON unmarshaling failed: %s", err)
}
fmt.Println(titles) // "[{Casablanca} {Cool Hand Luke} {Bullitt}]"

許多web服務都提供JSON接口通過HTTP接口發送JSON格式請求併返迴JSON格式的信息。爲了説明這一點我們通過Github的issue査詢服務來演示類似的用法。首先我們要定義合適的類型和常量

gopl.io/ch4/github
// Package github provides a Go API for the GitHub issue tracker.
// See https://developer.github.com/v3/search/#search-issues.
package github

import "time"

const IssuesURL = "https://api.github.com/search/issues"

type IssuesSearchResult struct {
	TotalCount int `json:"total_count"`
	Items          []*Issue
}

type Issue struct {
	Number    int
	HTMLURL   string `json:"html_url"`
	Title     string
	State     string
	User      *User
	CreatedAt time.Time `json:"created_at"`
	Body      string    // in Markdown format
}

type User struct {
	Login   string
	HTMLURL string `json:"html_url"`
}

和前面一樣卽使對應的JSON對象名是小寫字母每個結構體的成員名也是聲明爲大小字母開頭的。因爲有些JSON成員名字和Go結構體成員名字併不相同因此需要Go語言結構體成員Tag來指定對應的JSON名字。同樣在解碼的時候也需要做同樣的處理GitHub服務返迴的信息比我們定義的要多很多。

SearchIssues函數發出一個HTTP請求然後解碼返迴的JSON格式的結果。因爲用戶提供的査詢條件可能包含類似?&之類的特殊字符爲了避免對URL造成衝突我們用url.QueryEscape來對査詢中的特殊字符進行轉義操作。

gopl.io/ch4/github
package github

import (
	"encoding/json"
	"fmt"
	"net/http"
	"net/url"
	"strings"
)

// SearchIssues queries the GitHub issue tracker.
func SearchIssues(terms []string) (*IssuesSearchResult, error) {
	q := url.QueryEscape(strings.Join(terms, " "))
	resp, err := http.Get(IssuesURL + "?q=" + q)
	if err != nil {
		return nil, err
	}

	// We must close resp.Body on all execution paths.
	// (Chapter 5 presents 'defer', which makes this simpler.)
	if resp.StatusCode != http.StatusOK {
		resp.Body.Close()
		return nil, fmt.Errorf("search query failed: %s", resp.Status)
	}

	var result IssuesSearchResult
	if err := json.NewDecoder(resp.Body).Decode(&result); err != nil {
		resp.Body.Close()
		return nil, err
	}
	resp.Body.Close()
	return &result, nil
}

在早些的例子中我們使用了json.Unmarshal函數來將JSON格式的字符串解碼爲字節slice。但是這個例子中我們使用了基於流式的解碼器json.Decoder它可以從一個輸入流解碼JSON數據盡管這不是必鬚的。如您所料還有一個針對輸出流的json.Encoder編碼對象。

我們調用Decode方法來填充變量。這里有多種方法可以格式化結構。下面是最簡單的一種以一個固定寬度打印每個issue但是在下一節我們將看到如果利用模闆來輸出複雜的格式。

gopl.io/ch4/issues

// Issues prints a table of GitHub issues matching the search terms.
package main

import (
	"fmt"
	"log"
	"os"

	"gopl.io/ch4/github"
)

func main() {
	result, err := github.SearchIssues(os.Args[1:])
	if err != nil {
		log.Fatal(err)
	}
	fmt.Printf("%d issues:\n", result.TotalCount)
	for _, item := range result.Items {
		fmt.Printf("#%-5d %9.9s %.55s\n",
			item.Number, item.User.Login, item.Title)
	}
}

通過命令行參數指定檢索條件。下面的命令是査詢Go語言項目中和JSON解碼相關的問題還有査詢返迴的結果

$ go build gopl.io/ch4/issues
$ ./issues repo:golang/go is:open json decoder
13 issues:
#5680    eaigner encoding/json: set key converter on en/decoder
#6050  gopherbot encoding/json: provide tokenizer
#8658  gopherbot encoding/json: use bufio
#8462  kortschak encoding/json: UnmarshalText confuses json.Unmarshal
#5901        rsc encoding/json: allow override type marshaling
#9812  klauspost encoding/json: string tag not symmetric
#7872  extempora encoding/json: Encoder internally buffers full output
#9650    cespare encoding/json: Decoding gives errPhase when unmarshalin
#6716  gopherbot encoding/json: include field name in unmarshal error me
#6901  lukescott encoding/json, encoding/xml: option to treat unknown fi
#6384    joeshaw encoding/json: encode precise floating point integers u
#6647    btracey x/tools/cmd/godoc: display type kind of each named type
#4237  gjemiller encoding/base64: URLEncoding padding is optional

GitHub的Web服務接口 https://developer.github.com/v3/ 包含了更多的特性。

練習 4.10 脩改issues程序根據問題的時間進行分類比如不到一個月的、不到一年的、超過一年。

練習 4.11 編寫一個工具允許用戶在命令行創建、讀取、更新和刪除GitHub上的issue當必要的時候自動打開用戶默認的編輯器用於輸入文本信息。

練習 4.12 流行的web漫畵服務xkcd也提供了JSON接口。例如一個 https://xkcd.com/571/info.0.json 請求將返迴一個很多人喜愛的571編號的詳細描述。下載每個鏈接隻下載一次然後創建一個離線索引。編寫一個xkcd工具使用這些離線索引打印和命令行輸入的檢索詞相匹配的漫畵的URL。

練習 4.13 使用開放電影數據庫的JSON服務接口允許你檢索和下載 https://omdbapi.com/ 上電影的名字和對應的海報圖像。編寫一個poster工具通過命令行輸入的電影名字下載對應的海報。