當(dāng)前位置 主頁(yè) > 技術(shù)大全 >
`perf`(Performance analysis tools for Linux)是Linux官方的性能分析器,它存在于內(nèi)核源碼目錄的tools/perf中,原名為L(zhǎng)inux性能計(jì)數(shù)器(Performance Counters for Linux,PCL),現(xiàn)名為L(zhǎng)inux性能事件(Linux Performance Events,LPE)
作為L(zhǎng)inux內(nèi)核自帶的系統(tǒng)性能優(yōu)化工具,`perf`憑借其強(qiáng)大的功能和與內(nèi)核的緊密結(jié)合,成為了開(kāi)發(fā)者們不可或缺的利器
一、perf的安裝與基礎(chǔ)使用 在大多數(shù)Linux發(fā)行版中,`perf`是內(nèi)核的一部分,但需要通過(guò)軟件包管理器進(jìn)行安裝
安裝命令因發(fā)行版的不同而有所差異: Debian/Ubuntu: bash sudo apt update sudo apt install linux-tools-common linux-tools-$(uname -r) Fedora/RHEL/CentOS: bash sudo dnf install perf Arch Linux: bash sudo pacman -S perf 安裝完成后,可以通過(guò)運(yùn)行`perf --version`來(lái)確認(rèn)`perf`是否安裝成功
`perf`提供了許多子命令,每個(gè)子命令都專(zhuān)注于特定的性能分析任務(wù)
以下是一些常見(jiàn)的用法: 1.分析CPU使用情況(perf stat): `perf stat`用于統(tǒng)計(jì)一個(gè)命令的執(zhí)行過(guò)程中,硬件和軟件事件發(fā)生的次數(shù)
例如,可以用它來(lái)查看程序執(zhí)行期間的CPU周期、指令、緩存訪問(wèn)等硬件計(jì)數(shù)
bash perf stat ls 輸出將包括程序執(zhí)行期間的事件統(tǒng)計(jì)信息,如CPU周期、指令數(shù)、緩存未命中次數(shù)和分支未命中次數(shù)等
2.查看程序的熱點(diǎn)函數(shù)(perf record和`perf report`): `perf record`用于記錄程序的性能數(shù)據(jù),特別是CPU性能數(shù)據(jù)(如函數(shù)的執(zhí)行頻率)
`perf report`則用于分析這些數(shù)據(jù),查看程序的熱點(diǎn)函數(shù)
bash perf record ./my_program perf report 這將記錄`my_program`的執(zhí)行數(shù)據(jù),并生成一個(gè)`perf.data`文件
然后,`perfreport`會(huì)打開(kāi)一個(gè)文本用戶(hù)界面(TUI),顯示執(zhí)行數(shù)據(jù)的分析報(bào)告,包括各個(gè)函數(shù)的執(zhí)行頻率(如CPU周期占比),幫助識(shí)別程序的熱點(diǎn)函數(shù)
3.分析系統(tǒng)上的所有進(jìn)程(perf top): `perf top`類(lèi)似于`top`,但它分析的是系統(tǒng)上所有進(jìn)程的實(shí)時(shí)性能數(shù)據(jù),顯示當(dāng)前占用CPU最多的函數(shù)或事件
這有助于了解哪些程序或函數(shù)正在消耗最多的系統(tǒng)資源
4.跟蹤系統(tǒng)調(diào)用(perf trace): `perf trace`是一個(gè)類(lèi)似于`strace`的工具,它可以跟蹤進(jìn)程的系統(tǒng)調(diào)用并統(tǒng)計(jì)其頻率和開(kāi)銷(xiāo)
例如,跟蹤`ls`命令的系統(tǒng)調(diào)用: bash perf trace ls 輸出將顯示`ls`過(guò)程中發(fā)生的所有系統(tǒng)調(diào)用及其耗時(shí)
5.分析內(nèi)核事件(perf sched): `perf sched`可以用來(lái)分析內(nèi)核中的調(diào)度事件,了解進(jìn)程的調(diào)度行為,分析系統(tǒng)中是否存在調(diào)度延遲等問(wèn)題
二、perf的高級(jí)用法與性能調(diào)優(yōu) 除了基本用法外,`perf`還支持許多高級(jí)功能,這些功能在性能調(diào)優(yōu)中尤為重要
1.采樣指定硬件事件: `perf`可以專(zhuān)門(mén)采樣某些硬件事件(例如緩存未命中、分支預(yù)測(cè)失敗等),從而針對(duì)性地分析程序的性能問(wèn)題
例如,記錄程序的緩存未命中情況: bash perf record -e cache-misses ./my_program 這將記錄程序執(zhí)行期間的緩存未命中次數(shù),有助于分析緩存性能問(wèn)題
2.對(duì)指定PID進(jìn)行性能分析: 如果想對(duì)正在運(yùn)行的某個(gè)進(jìn)程進(jìn)行性能分析,可以使用`-p`選項(xiàng)指定進(jìn)程ID
這對(duì)分析后臺(tái)運(yùn)行的進(jìn)程非常有用
bash
perf record -p 例如:
bash
perf sched record
perf sched latency
通過(guò)分析調(diào)度延遲,可以找出導(dǎo)致系統(tǒng)調(diào)度不均衡的原因
4.程序性能瓶頸分析:
在發(fā)現(xiàn)一個(gè)程序的執(zhí)行時(shí)間比預(yù)期長(zhǎng)時(shí),可以使用`perfrecord`和`perf report`來(lái)分析程序的性能瓶頸 通過(guò)分析函數(shù)的CPU使用情況,找出最耗時(shí)的部分,進(jìn)而進(jìn)行優(yōu)化
5.CPU資源爭(zhēng)用分析:
當(dāng)系統(tǒng)負(fù)載較高時(shí),可以使用`perftop`查看哪些進(jìn)程或者函數(shù)占用了最多的CPU資源 這有助于定位系統(tǒng)性能瓶頸,分析高CPU占用的原因
三、perf的優(yōu)勢(shì)與局限性
`perf`作為L(zhǎng)inux內(nèi)核自帶的性能分析工具,具有顯著的優(yōu)勢(shì):
- 性能消耗小:perf在采樣和分析過(guò)程中,對(duì)系統(tǒng)性能的影響較小,能夠確保分析的準(zhǔn)確性
- 生成文件小:perf生成的性能數(shù)據(jù)文件相對(duì)較小,便于存儲(chǔ)和傳輸
- report速度快:perf的分析報(bào)告生成速度快,能夠迅速提供性能問(wèn)題的關(guān)鍵信息
- 與內(nèi)核緊密結(jié)合:perf能夠最先應(yīng)用到加入內(nèi)核的新特性,確保與內(nèi)核的兼容性
然而,`perf`也存在一些局限性:
- 不遵守X86 Calling Convention的函數(shù)無(wú)法獲取堆棧信息:對(duì)于某些特定的函數(shù),perf可能無(wú)法獲取完整的堆棧信息
- 內(nèi)聯(lián)函數(shù)無(wú)法獲取堆棧信息:對(duì)于內(nèi)聯(lián)函數(shù),`perf`同樣可能無(wú)法獲取堆棧信息,這會(huì)影響分析的準(zhǔn)確性
- 需要處理器支持:perf的某些功能需要處理器的支持,如果處理器不支持,則無(wú)法使用這些功能
此外,在使用`perf`時(shí),還需要注意一些常見(jiàn)問(wèn)題 例如,非root用戶(hù)運(yùn)行`perf`時(shí),可能會(huì)出現(xiàn)內(nèi)存映射頁(yè)面大小超過(guò)系統(tǒng)限制的問(wèn)題 此時(shí),可以通過(guò)調(diào)整`/proc/sys/kernel/perf_event_mlock_kb`的值來(lái)解決
四、總結(jié)
`perf`是Linux內(nèi)核中強(qiáng)大的性能分析工具,能夠?qū)PU事件、系統(tǒng)調(diào)用、線程調(diào)度、硬件計(jì)數(shù)器等多種系統(tǒng)層面進(jìn)行全面的性能分析 通過(guò)掌握`perf`的基本用法和高