mirror of
https://github.com/gopl-zh/gopl-zh.github.com.git
synced 2025-10-16 20:12:48 +00:00
回到简体
This commit is contained in:
@@ -1,22 +1,22 @@
|
||||
## 11.5. 剖析
|
||||
|
||||
測量基準對於衡量特定操作的性能是有幫助的,但是當我們視圖讓程序跑的更快的時候,我們通常併不知道從哪里開始優化。每個碼農都應該知道Donald Knuth在1974年的“Structured Programming with go to Statements”上所説的格言。雖然經常被解讀爲不重視性能的意思,但是從原文我們可以看到不同的含義:
|
||||
测量基准对于衡量特定操作的性能是有帮助的,但是当我们视图让程序跑的更快的时候,我们通常并不知道从哪里开始优化。每个码农都应该知道Donald Knuth在1974年的“Structured Programming with go to Statements”上所说的格言。虽然经常被解读为不重视性能的意思,但是从原文我们可以看到不同的含义:
|
||||
|
||||
> 毫無疑問,效率會導致各種濫用。程序員需要浪費大量的時間思考或者擔心,被部分程序的速度所榦擾,實際上這些嚐試提陞效率的行爲可能産生強烈的負面影響,特别是當調試和維護的時候。我們不應該過度糾結於細節的優化,應該説約97%的場景:過早的優化是萬惡之源。
|
||||
> 毫无疑问,效率会导致各种滥用。程序员需要浪费大量的时间思考或者担心,被部分程序的速度所干扰,实际上这些尝试提升效率的行为可能产生强烈的负面影响,特别是当调试和维护的时候。我们不应该过度纠结于细节的优化,应该说约97%的场景:过早的优化是万恶之源。
|
||||
>
|
||||
> 我們當然不應該放棄那關鍵的3%的機會。一個好的程序員不會因爲這個理由而滿足,他們會明智地觀察和識别哪些是關鍵的代碼;但是隻有在關鍵代碼已經被確認的前提下才會進行優化。對於判斷哪些部分是關鍵代碼是經常容易犯經驗性錯誤的地方,因此程序員普通使用的測量工具,使得他們的直覺很不靠譜。
|
||||
> 我们当然不应该放弃那关键的3%的机会。一个好的程序员不会因为这个理由而满足,他们会明智地观察和识别哪些是关键的代码;但是只有在关键代码已经被确认的前提下才会进行优化。对于判断哪些部分是关键代码是经常容易犯经验性错误的地方,因此程序员普通使用的测量工具,使得他们的直觉很不靠谱。
|
||||
|
||||
當我們想仔細觀察我們程序的運行速度的時候,最好的技術是如何識别關鍵代碼。自動化的剖析技術是基於程序執行期間一些抽樣數據,然後推斷後面的執行狀態;最終産生一個運行時間的統計數據文件。
|
||||
当我们想仔细观察我们程序的运行速度的时候,最好的技术是如何识别关键代码。自动化的剖析技术是基于程序执行期间一些抽样数据,然后推断后面的执行状态;最终产生一个运行时间的统计数据文件。
|
||||
|
||||
Go語言支持多種類型的剖析性能分析,每一種關註不同的方面,但它們都涉及到每個采樣記録的感興趣的一繫列事件消息,每個事件都包含函數調用時函數調用堆棧的信息。內建的`go test`工具對幾種分析方式都提供了支持。
|
||||
Go语言支持多种类型的剖析性能分析,每一种关注不同的方面,但它们都涉及到每个采样记录的感兴趣的一系列事件消息,每个事件都包含函数调用时函数调用堆栈的信息。内建的`go test`工具对几种分析方式都提供了支持。
|
||||
|
||||
CPU分析文件標識了函數執行時所需要的CPU時間。當前運行的繫統線程在每隔幾毫秒都會遇到操作繫統的中斷事件,每次中斷時都會記録一個分析文件然後恢複正常的運行。
|
||||
CPU分析文件标识了函数执行时所需要的CPU时间。当前运行的系统线程在每隔几毫秒都会遇到操作系统的中断事件,每次中断时都会记录一个分析文件然后恢复正常的运行。
|
||||
|
||||
堆分析則記録了程序的內存使用情況。每個內存分配操作都會觸發內部平均內存分配例程,每個512KB的內存申請都會觸發一個事件。
|
||||
堆分析则记录了程序的内存使用情况。每个内存分配操作都会触发内部平均内存分配例程,每个512KB的内存申请都会触发一个事件。
|
||||
|
||||
阻塞分析則記録了goroutine最大的阻塞操作,例如繫統調用、管道發送和接收,還有獲取鎖等。分析庫會記録每個goroutine被阻塞時的相關操作。
|
||||
阻塞分析则记录了goroutine最大的阻塞操作,例如系统调用、管道发送和接收,还有获取锁等。分析库会记录每个goroutine被阻塞时的相关操作。
|
||||
|
||||
在測試環境下隻需要一個標誌參數就可以生成各種分析文件。當一次使用多個標誌參數時需要當心,因爲分析操作本身也可能會影像程序的運行。
|
||||
在测试环境下只需要一个标志参数就可以生成各种分析文件。当一次使用多个标志参数时需要当心,因为分析操作本身也可能会影像程序的运行。
|
||||
|
||||
```
|
||||
$ go test -cpuprofile=cpu.out
|
||||
@@ -24,13 +24,13 @@ $ go test -blockprofile=block.out
|
||||
$ go test -memprofile=mem.out
|
||||
```
|
||||
|
||||
對於一些非測試程序也很容易支持分析的特性,具體的實現方式和程序是短時間運行的小工具還是長時間運行的服務會有很大不同,因此Go的runtime運行時包提供了程序運行時控製分析特性的接口。
|
||||
对于一些非测试程序也很容易支持分析的特性,具体的实现方式和程序是短时间运行的小工具还是长时间运行的服务会有很大不同,因此Go的runtime运行时包提供了程序运行时控制分析特性的接口。
|
||||
|
||||
一旦我們已經收集到了用於分析的采樣數據,我們就可以使用pprof來分析這些數據。這是Go工具箱自帶的一個工具,但併不是一個日常工具,它對應`go tool pprof`命令。該命令有許多特性和選項,但是最重要的有兩個,就是生成這個概要文件的可執行程序和對於的分析日誌文件。
|
||||
一旦我们已经收集到了用于分析的采样数据,我们就可以使用pprof来分析这些数据。这是Go工具箱自带的一个工具,但并不是一个日常工具,它对应`go tool pprof`命令。该命令有许多特性和选项,但是最重要的有两个,就是生成这个概要文件的可执行程序和对于的分析日志文件。
|
||||
|
||||
爲了提高分析效率和減少空間,分析日誌本身併不包含函數的名字;它隻包含函數對應的地址。也就是説pprof需要和分析日誌對於的可執行程序。雖然`go test`命令通常會丟棄臨時用的測試程序,但是在啟用分析的時候會將測試程序保存爲foo.test文件,其中foo部分對於測試包的名字。
|
||||
为了提高分析效率和减少空间,分析日志本身并不包含函数的名字;它只包含函数对应的地址。也就是说pprof需要和分析日志对于的可执行程序。虽然`go test`命令通常会丢弃临时用的测试程序,但是在启用分析的时候会将测试程序保存为foo.test文件,其中foo部分对于测试包的名字。
|
||||
|
||||
下面的命令演示了如何生成一個CPU分析文件。我們選擇`net/http`包的一個基準測試爲例。通常是基於一個已經確定了是關鍵代碼的部分進行基準測試。基準測試會默認包含單元測試,這里我們用-run=NONE參數禁止單元測試。
|
||||
下面的命令演示了如何生成一个CPU分析文件。我们选择`net/http`包的一个基准测试为例。通常是基于一个已经确定了是关键代码的部分进行基准测试。基准测试会默认包含单元测试,这里我们用-run=NONE参数禁止单元测试。
|
||||
|
||||
```
|
||||
$ go test -run=NONE -bench=ClientServerParallelTLS64 \
|
||||
@@ -57,10 +57,10 @@ Showing top 10 nodes out of 166 (cum >= 60ms)
|
||||
50ms 1.39% 71.59% 60ms 1.67% crypto/elliptic.p256Sum
|
||||
```
|
||||
|
||||
參數`-text`用於指定輸出格式,在這里每行是一個函數,根據使用CPU的時間長短來排序。其中`-nodecount=10`標誌參數限製了隻輸出前10行的結果。對於嚴重的性能問題,這個文本格式基本可以幫助査明原因了。
|
||||
参数`-text`用于指定输出格式,在这里每行是一个函数,根据使用CPU的时间长短来排序。其中`-nodecount=10`标志参数限制了只输出前10行的结果。对于严重的性能问题,这个文本格式基本可以帮助查明原因了。
|
||||
|
||||
這個概要文件告訴我們,HTTPS基準測試中`crypto/elliptic.p256ReduceDegree`函數占用了將近一半的CPU資源。相比之下,如果一個概要文件中主要是runtime包的內存分配的函數,那麽減少內存消耗可能是一個值得嚐試的優化策略。
|
||||
这个概要文件告诉我们,HTTPS基准测试中`crypto/elliptic.p256ReduceDegree`函数占用了将近一半的CPU资源。相比之下,如果一个概要文件中主要是runtime包的内存分配的函数,那么减少内存消耗可能是一个值得尝试的优化策略。
|
||||
|
||||
對於一些更微妙的問題,你可能需要使用pprof的圖形顯示功能。這個需要安裝GraphViz工具,可以從 http://www.graphviz.org 下載。參數`-web`用於生成一個有向圖文件,包含了CPU的使用和最熱點的函數等信息。
|
||||
对于一些更微妙的问题,你可能需要使用pprof的图形显示功能。这个需要安装GraphViz工具,可以从 http://www.graphviz.org 下载。参数`-web`用于生成一个有向图文件,包含了CPU的使用和最热点的函数等信息。
|
||||
|
||||
這一節我們隻是簡單看了下Go語言的分析據工具。如果想了解更多,可以閲讀Go官方博客的“Profiling Go Programs”一文。
|
||||
这一节我们只是简单看了下Go语言的分析据工具。如果想了解更多,可以阅读Go官方博客的“Profiling Go Programs”一文。
|
||||
|
Reference in New Issue
Block a user