網(wǎng)站制作NEWS
利用 PGO 提升 .NET 程序性能
.NET 6開始引入了PGO(Profile Guided Optimization),這是一種通過(guò)收集運(yùn)行時(shí)信息來(lái)指導(dǎo)JIT如何優(yōu)化代碼的技術(shù)。相比之前沒(méi)有PGO的情況,現(xiàn)在可以完成更多以前難以完成的優(yōu)化。
為了測(cè)試.NET 6中的PGO,我們使用了nightly build版本6.0.100-rc.1.21377.6。
.NET 6提供了靜態(tài)PGO和動(dòng)態(tài)PGO。靜態(tài)PGO通過(guò)工具收集profile數(shù)據(jù),然后應(yīng)用到下一次編譯中,指導(dǎo)編譯器進(jìn)行代碼優(yōu)化;動(dòng)態(tài)PGO則直接在運(yùn)行時(shí)收集profile數(shù)據(jù)并進(jìn)行優(yōu)化。此外,從.NET 5開始引入了OSR(On Stack Replacement),可以在運(yùn)行時(shí)替換正在運(yùn)行的函數(shù),允許將低優(yōu)化代碼遷移到高優(yōu)化代碼。
.NET從Core 3.1開始引入了分層編譯,程序啟動(dòng)時(shí)JIT首先快速生成低優(yōu)化的tier 0代碼,隨著程序運(yùn)行,對(duì)多次調(diào)用的方法進(jìn)行再次JIT產(chǎn)生高優(yōu)化的tier 1代碼。然而,這樣做對(duì)于程序的性能幾乎沒(méi)有提升,只是改善了延時(shí)。因此,在開發(fā)客戶端類程序時(shí)通常關(guān)閉分層編譯,而在開發(fā)服務(wù)器程序時(shí)開啟分層編譯。.NET 6引入PGO后,分層編譯的機(jī)制變得非常重要。
由于tier 0的代碼是低優(yōu)化代碼,因此更能夠收集到完整的運(yùn)行時(shí)profile數(shù)據(jù),指導(dǎo)JIT做更全面的優(yōu)化。例如,在tier 1代碼中,某方法B被某方法A內(nèi)聯(lián),運(yùn)行期間多次調(diào)用方法A后收集到的profile將只包含A的信息,而沒(méi)有B的信息;又例如在tier 1代碼中,某循環(huán)被JIT做了loop cloning,那此時(shí)收集到的profile則是不準(zhǔn)確的。
為了發(fā)揮PGO的最大效果,我們需要開啟分層編譯,并給循環(huán)啟用Quick Jit在一開始生成低優(yōu)化代碼。
下面通過(guò)一個(gè)測(cè)試代碼的例子來(lái)說(shuō)明如何使用.NET 6的PGO。
測(cè)試環(huán)境:不使用PGO,關(guān)閉分層編譯,使用動(dòng)態(tài)PGO,使用靜態(tài)PGO + AOT編譯。
測(cè)試結(jié)果顯示,啟用PGO后,性能得到了顯著提升,性能提升幅度達(dá)到了322%。
總結(jié):有了PGO之后,之前的很多性能經(jīng)驗(yàn)就不再有效。借助PGO,我們可以預(yù)見大幅度的執(zhí)行效率提升。在后續(xù)版本中,.NET將會(huì)帶來(lái)更多基于PGO的優(yōu)化。
多重隨機(jī)標(biāo)簽