如何快速理解python的垃圾回收機(jī)制
一、先來說說為什么要有垃圾回收
解釋器在執(zhí)行到定義變量得語法時,會申請內(nèi)存空間來存放變量得值,但是由于內(nèi)存空間是有限得,所以這就涉及到了內(nèi)存回收問題了,當(dāng)一個變量值沒有用了(簡稱垃圾),這種時候就應(yīng)該回收掉這個變量值得內(nèi)存空間。
二、那么什么是垃圾回收機(jī)制
垃圾回收機(jī)制(簡稱GC)是Python解釋器自帶一種機(jī),專門用來回收不可用的變量值所占用的內(nèi)存空間
三、為什么要用垃圾回收機(jī)制呢?
程序運(yùn)行過程中會申請大量的內(nèi)存空間,而對于一些無用的內(nèi)存空間如果不及時清理的話會導(dǎo)致內(nèi)存使用殆盡(內(nèi)存溢出),導(dǎo)致程序崩潰,因此管理內(nèi)存是一件重要且繁雜的事情,而python解釋器自帶的垃圾回收機(jī)制把程序員從繁雜的內(nèi)存管理中解放出來。
四、垃圾回收機(jī)制的理解
1、堆區(qū)和棧區(qū)
在定義變量時,變量名與變量值都是需要存儲的,分別對應(yīng)內(nèi)存中的兩塊區(qū)域:堆區(qū)與棧區(qū)。
# 1、變量名與值內(nèi)存地址的關(guān)聯(lián)關(guān)系存放于棧區(qū)# 2、變量值存放于堆區(qū),內(nèi)存管理回收的則是堆區(qū)的內(nèi)容
2、直接引用和間接引用
直接引用指的是從棧區(qū)出發(fā)直接引用到的內(nèi)存地址。間接引用指的是從棧區(qū)出發(fā)引用到堆區(qū)后,再通過進(jìn)一步引用才能到達(dá)的內(nèi)存地址。
x=10 # 10這個值被變量x直接引用list=[20,x] # 10這個值被列表list間接引用12
五、垃圾回收機(jī)制的原理分析
Python的GC模塊主要運(yùn)用了“引用計(jì)數(shù)”(reference counting)來跟蹤和回收垃圾。在引用計(jì)數(shù)的基礎(chǔ)上,還可以通過“標(biāo)記-清除”(mark and sweep)解決容器對象可能產(chǎn)生的循環(huán)引用的問題,并且通過“分代回收”(generation collection)以空間換取時間的方式來進(jìn)一步提高垃圾回收的效率。
1、引用計(jì)數(shù)
變量值被變量名關(guān)聯(lián)得次數(shù)(包括間接引用和直接引用 ),一旦變量得引用計(jì)數(shù)得值變成0,占用內(nèi)存就會被回收。
2、引用計(jì)數(shù)得問題以及解決方案
問題一:循環(huán)引用
引用計(jì)數(shù)機(jī)制存在著一個致命的弱點(diǎn),即循環(huán)引用(也稱交叉引用
list1=[111,]list2=[222,]list1.append(list2)list2.append(list1)print(list1,list2)[111, [222, [...]]] [222, [111, [...]]]# list1和list2之間相互引用# list1=[111的內(nèi)存地址,list2的內(nèi)存地址]# list2=[222的內(nèi)存地址,list1的內(nèi)存地址]x=10list=[2,3,x]print(list[2]) # 10x=123print(list[2]) # 10
這種時候一旦我們del list1,del list2,刪除列表的直接引用,只剩下list1和list2之間 的相互引用,這樣引用計(jì)數(shù)不是0,內(nèi)存空間無法回收,并且無法去到list1和list2的值(就是垃圾),這種時候python引入了“標(biāo)記-清除” 與“分代回收”來分別解決引用計(jì)數(shù)的循環(huán)引用與效率低的問題。
問題二:標(biāo)記清除
容器對象(比如:list,set,dict,class,instance)都可以包含對其他對象的引用,所以都可能產(chǎn)生循環(huán)引用。而“標(biāo)記-清除”計(jì)數(shù)就是為了解決循環(huán)引用的問題。標(biāo)記/清除算法的做法是當(dāng)應(yīng)用程序可用的內(nèi)存空間被耗盡的時,就會停止整個程序,然后進(jìn)行兩項(xiàng)工作,第一項(xiàng)則是標(biāo)記,第二項(xiàng)則是清除。
問題三:效率問題
基于引用計(jì)數(shù)的回收機(jī)制,每次回收內(nèi)存,都需要把所有對象的引用計(jì)數(shù)都遍歷一遍,這是非常消耗時間的,于是引入了分代回收來提高回收效率,分代回收采用的是用“空間換時間”的策略。
問題四:分代回收
分代回收的核心思想是:在歷經(jīng)多次掃描的情況下,都沒有被回收的變量,gc機(jī)制就會認(rèn)為,該變量是常用變量,gc對其掃描的頻率會降低分代指的是根據(jù)存活時間來為變量劃分不同等級(也就是不同的代)
新定義的變量,放到新生代這個等級中,假設(shè)每隔1分鐘掃描新生代一次,如果發(fā)現(xiàn)變量依然被引用,那么該對象的權(quán)重(權(quán)重本質(zhì)就是個整數(shù))加一,當(dāng)變量的權(quán)重大于某個設(shè)定得值(假設(shè)為3),會將它移動到更高一級的青春代,青春代的gc掃描的頻率低于新生代(掃描時間間隔更長),假設(shè)5分鐘掃描青春代一次,這樣每次gc需要掃描的變量的總個數(shù)就變少了,節(jié)省了掃描的總時間,接下來,青春代中的對象,也會以同樣的方式被移動到老年代中。也就是等級(代)越高,被垃圾回收機(jī)制掃描的頻率越低
回收依然使用引用計(jì)數(shù)作為回收的依據(jù)
問題五:分代回收的缺點(diǎn)
例如一個變量剛剛從新生代移入青春代,該變量的綁定關(guān)系就解除了,該變量應(yīng)該被回收,但青春代的掃描頻率低于新生代,這就到導(dǎo)致了應(yīng)該被回收的垃圾沒有得到及時地清理。
沒有十全十美的方案:
毫無疑問,如果沒有分代回收,即引用計(jì)數(shù)機(jī)制一直不停地對所有變量進(jìn)行全體掃描,可以更及時地清理掉垃圾占用的內(nèi)存,但這種一直不停地對所有變量進(jìn)行全體掃描的方式效率極低,所以我們只能將二者中和。
綜上:
垃圾回收機(jī)制是在清理垃圾&釋放內(nèi)存的大背景下,允許分代回收以極小部分垃圾不會被及時釋放為代價,以此換取引用計(jì)數(shù)整體掃描頻率的降低,從而提升其性能,這是一種以空間換時間的解決方案目錄。
以上就是如何快速理解python的垃圾回收機(jī)制的詳細(xì)內(nèi)容,更多關(guān)于你理解python的垃圾回收機(jī)制么的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
