2016-02-15 03:06:34 +00:00
|
|
|
|
## 1.5. 获取URL
|
2015-12-09 07:45:11 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
对于很多现代应用来说,访问互联网上的信息和访问本地文件系统一样重要。Go语言在net这个强大package的帮助下提供了一系列的package来做这件事情,使用这些包可以更简单地用网络收发信息,还可以建立更底层的网络连接,编写服务器程序。在这些情景下,Go语言原生的并发特性(在第八章中会介绍)显得尤其好用。
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
为了最简单地展示基于HTTP获取信息的方式,下面给出一个示例程序fetch,这个程序将获取对应的url,并将其源文本打印出来;这个例子的灵感来源于curl工具(译注:unix下的一个用来发http请求的工具,具体可以man curl)。当然,curl提供的功能更为复杂丰富,这里只编写最简单的样例。这个样例之后还会多次被用到。
|
2015-12-09 07:45:11 +00:00
|
|
|
|
|
2016-01-20 13:08:13 +00:00
|
|
|
|
<u><i>gopl.io/ch1/fetch</i></u>
|
2015-12-09 07:45:11 +00:00
|
|
|
|
```go
|
|
|
|
|
// Fetch prints the content found at a URL.
|
|
|
|
|
package main
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2015-12-09 07:45:11 +00:00
|
|
|
|
import (
|
2015-12-23 04:55:24 +00:00
|
|
|
|
"fmt"
|
|
|
|
|
"io/ioutil"
|
|
|
|
|
"net/http"
|
|
|
|
|
"os"
|
2015-12-09 07:45:11 +00:00
|
|
|
|
)
|
|
|
|
|
|
|
|
|
|
func main() {
|
2015-12-23 04:55:24 +00:00
|
|
|
|
for _, url := range os.Args[1:] {
|
|
|
|
|
resp, err := http.Get(url)
|
|
|
|
|
if err != nil {
|
|
|
|
|
fmt.Fprintf(os.Stderr, "fetch: %v\n", err)
|
|
|
|
|
os.Exit(1)
|
|
|
|
|
}
|
2023-07-20 02:20:08 +00:00
|
|
|
|
b, err := io.ReadAll(resp.Body)
|
2015-12-23 04:55:24 +00:00
|
|
|
|
resp.Body.Close()
|
|
|
|
|
if err != nil {
|
|
|
|
|
fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)
|
|
|
|
|
os.Exit(1)
|
|
|
|
|
}
|
|
|
|
|
fmt.Printf("%s", b)
|
|
|
|
|
}
|
2015-12-09 07:45:11 +00:00
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
2023-07-20 02:20:08 +00:00
|
|
|
|
这个程序从两个package中导入了函数,net/http和io,http.Get函数是创建HTTP请求的函数,如果获取过程没有出错,那么会在resp这个结构体中得到访问的请求结果。resp的Body字段包括一个可读的服务器响应流。io.ReadAll函数从response中读取到全部内容;将其结果保存在变量b中。resp.Body.Close关闭resp的Body流,防止资源泄露,Printf函数会将结果b写出到标准输出流中。
|
2015-12-09 07:45:11 +00:00
|
|
|
|
|
2015-12-23 04:55:24 +00:00
|
|
|
|
```
|
2015-12-09 07:45:11 +00:00
|
|
|
|
$ go build gopl.io/ch1/fetch
|
|
|
|
|
$ ./fetch http://gopl.io
|
|
|
|
|
<html>
|
|
|
|
|
<head>
|
|
|
|
|
<title>The Go Programming Language</title>title>
|
|
|
|
|
...
|
|
|
|
|
```
|
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
HTTP请求如果失败了的话,会得到下面这样的结果:
|
2015-12-09 07:45:11 +00:00
|
|
|
|
|
2015-12-23 04:55:24 +00:00
|
|
|
|
```
|
2015-12-09 07:45:11 +00:00
|
|
|
|
$ ./fetch http://bad.gopl.io
|
|
|
|
|
fetch: Get http://bad.gopl.io: dial tcp: lookup bad.gopl.io: no such host
|
|
|
|
|
```
|
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
译注:在大天朝的网络环境下很容易重现这种错误,下面是Windows下运行得到的错误信息:
|
2015-12-09 07:45:11 +00:00
|
|
|
|
|
|
|
|
|
```
|
2015-12-23 04:55:24 +00:00
|
|
|
|
$ go run main.go http://gopl.io
|
|
|
|
|
fetch: Get http://gopl.io: dial tcp: lookup gopl.io: getaddrinfow: No such host is known.
|
2015-12-09 07:45:11 +00:00
|
|
|
|
```
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
无论哪种失败原因,我们的程序都用了os.Exit函数来终止进程,并且返回一个status错误码,其值为1。
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
**练习 1.7:** 函数调用io.Copy(dst, src)会从src中读取内容,并将读到的结果写入到dst中,使用这个函数替代掉例子中的ioutil.ReadAll来拷贝响应结构体到os.Stdout,避免申请一个缓冲区(例子中的b)来存储。记得处理io.Copy返回结果中的错误。
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
**练习 1.8:** 修改fetch这个范例,如果输入的url参数没有 `http://` 前缀的话,为这个url加上该前缀。你可能会用到strings.HasPrefix这个函数。
|
2015-12-23 04:55:24 +00:00
|
|
|
|
|
2016-02-15 03:06:34 +00:00
|
|
|
|
**练习 1.9:** 修改fetch打印出HTTP协议的状态码,可以从resp.Status变量得到该状态码。
|