• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 17  文章 - 48  trackbacks - 0
            <2013年11月>
            272829303112
            3456789
            10111213141516
            17181920212223
            24252627282930
            1234567

            常用鏈接

            留言簿(3)

            隨筆檔案

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

            GC的分類

            通常情況下GC分為兩種,分別是:掃描GC(Tracing GC)和引用計(jì)數(shù)GC(Reference counting GC)。其中掃描GC是比較常用的GC實(shí)現(xiàn)方法,其原理是:把正在使用的對象找出來,然后把未被使用的對象釋放。而引用計(jì)數(shù)GC則是對每個(gè)對象都添加一個(gè)計(jì)數(shù)器,引用增加一個(gè)計(jì)數(shù)器就加一,引用減少一個(gè)計(jì)數(shù)器就減一,當(dāng)計(jì)數(shù)器減至零時(shí),把對象回收釋放。引用計(jì)數(shù)GC跟C++中的shared_ptr類似,自然也會存在循環(huán)引用問題。

            掃描GC(Tracing GC)是廣泛使用的GC方法,最簡單的實(shí)現(xiàn)方式是mark-sweep,即掃描所有存活的對象并mark,然后遍歷整個(gè)GC對象列表,把所有標(biāo)記過的對象清除標(biāo)記,把未標(biāo)記過的對象釋放。如果GC使用的是mark-sweep方法,程序運(yùn)行一段時(shí)間后觸發(fā)了GC,每次GC的時(shí)候會把當(dāng)前程序中的所有對象都掃描一次,然后釋放未使用的對象。這對于分配GC對象少的程序來說沒有什么問題,當(dāng)程序中存在大量分配GC對象時(shí),每次啟動GC掃描所有對象的代價(jià)是很高的,又因?yàn)镚C的過程通常是stop-the-world,所以高代價(jià)的GC會導(dǎo)致整個(gè)程序卡頓一段時(shí)間。對于這個(gè)問題,解決方法有增量GC(Incremental GC)和分代GC(Generational GC)。

            增量GC(Incremental GC)會把整個(gè)GC過程分成很多步(phase),每步的執(zhí)行可以存在一定間隔運(yùn)行程序本身,這就盡量把stop-the-world的時(shí)間變短,使得程序不會因?yàn)镚C而導(dǎo)致延遲太大。Lua默認(rèn)采用的是這種實(shí)現(xiàn)方法,Lua 5.2中也引入了分代GC作為備選GC方法。

            分代GC(Generational GC)把對象分成幾代(Generation),通常把GC分為兩種:Minor GC和Major GC。剛剛分配出來的對象屬于最年輕的一代,在一次GC過后把年輕代中存活的對象上升到年老的一代中。把只掃描年輕一代的對象以減少掃描對象數(shù)量的GC過程稱為Minor GC,只有在特定情況下才會啟動完整的Major GC。分代GC是基于在大多數(shù)程序中新創(chuàng)建的對象同時(shí)也是最快變成無效的對象的經(jīng)驗(yàn)設(shè)計(jì)的,對年輕代對象GC時(shí),可以釋放大多數(shù)無效對象,存活下來的對象一般存活時(shí)間也會更長,因此把它們上升到下一代中以減少最這些對象的掃描。

            對于GC內(nèi)存的管理,有移動和非移動之分。移動的就是把一次GC過后存活的對象compact到一起,使GC管理的內(nèi)存保持連續(xù),這里增加了一個(gè)移動對象的開銷,不過它也同樣帶來不少好處:分配釋放對象快和更快的序列遍歷(在CPU cache中及在同一個(gè)Virtual memory page中)。正因?yàn)樗鼤褜ο骳ompact到一起,對象的地址就會發(fā)生變化,這也就導(dǎo)致一個(gè)明顯的缺點(diǎn),不能使用指針引用GC對象。

            其它高級GC方法,比如.NET的background GC,幾乎不需要stop-the-world就可以在GC線程中完成GC,這種高科技的GC對于我這種初級人士基本屬于不可想象。

            初級分代GC設(shè)計(jì)

            了解了基本的GC方法之后,我為luna第二版實(shí)現(xiàn)了一個(gè)初級的分代GC,把對象分成三代:GCGen0,GCGen1,GCGen2:

               GCGen0是最年輕的一代,默認(rèn)所有對象都是分配在這代中。
               GCGen1是年老的一代,在一次GC過后GCGen0代存活的對象會移動到這一代中。
               GCGen2是最老的一代,一般情況下用于存放編譯時(shí)分配的會長期存在的對象,比如函數(shù)及字符串常量。

            由于我在很多地方直接引用了GC對象的指針,為了簡單起見,我沒有在GC之后移動對象,而是對每個(gè)對象單獨(dú)分配釋放內(nèi)存。每個(gè)對象都有Generation標(biāo)記和GC標(biāo)記以及一個(gè)用于指向跟自己屬于同代的GC對象的指針。

            Minor GC對GCGen0代對象mark-sweep,并把存活的對象移動到GCGen1代中。既然需要mark,自然需要對所有GCGen0代存活的對象標(biāo)記,這通過對root對象的遍歷完成,root是指所有對象的引用入口,比如程序的棧和全局表。對于Minor GC的root對象遍歷最簡單的方法是跟Major GC的root遍歷完全一致,不過這樣的遍歷對于本來就是為了減少遍歷對象的Minor GC來說似乎不合,所以通常只對某一小塊root遍歷,比如只對棧上的對象遍歷,然后再把存活的對象保留不存活的對象釋放。

            Minor GC的root遍歷存在一個(gè)問題:假設(shè)只把棧上的對象作為root遍歷,會存在一些從GCGen0代分配出來的對象沒有被棧上的對象引用,而被全局表中的某個(gè)對象引用,或者其它某個(gè)非GCGen0對象引用了,這樣對GCGen0代sweep的時(shí)候可能會把這個(gè)存活的對象當(dāng)做無效對象而釋放掉,這種操作自然也就會導(dǎo)致整個(gè)程序crash。于是為了控制root遍歷的范圍,又要解決這個(gè)問題,對非GCGen0對象引用GCGen0對象的時(shí)候,需要把這個(gè)非GCGen0的對象也加入到root遍歷列表中去。這時(shí)引入了barrier,對于非GCGen0對象引用GCGen0對象時(shí),把這個(gè)非GCGen0的對象放到barrier列表中。

            Major GC是一個(gè)完整的GC,它遍歷所有的root并mark,并把所有的無效的對象都sweep釋放。

            GC啟動的時(shí)機(jī)

            GC什么時(shí)候啟動是一個(gè)需要仔細(xì)考慮的問題,由于我實(shí)現(xiàn)的GC并沒有自己管理內(nèi)存(Lua也沒有自己管理內(nèi)存,所有內(nèi)存分配都通過realloc),所以我把GCGen0代和GCGen1代的對象數(shù)量作為啟動時(shí)機(jī)的衡量指標(biāo),當(dāng)GCGen0和GCGen1的對象數(shù)量大于它們的閾值時(shí),分別啟動Minor GC和Major GC。我覺得對象的數(shù)量比起內(nèi)存占用大小(各種復(fù)雜的GC對象導(dǎo)致內(nèi)存占用很難精確的統(tǒng)計(jì),Lua的內(nèi)存統(tǒng)計(jì)也不夠精確)更能反映GC時(shí)間的長短,如果兩者結(jié)合也許會更好。

            通過判斷GC對象個(gè)數(shù)超過閾值時(shí)啟動GC,同時(shí)需要在GC之后自動調(diào)整閾值大小。比如某些程序很快的達(dá)到GCGen0的閾值并在Minor GC之后有超過一半的對象還是存活的,這時(shí)需要把閾值調(diào)大,以減少GC啟動的次數(shù),這個(gè)閾值也不能無限擴(kuò)大,這不僅會導(dǎo)致一段時(shí)間內(nèi)內(nèi)存占用一直上升,也會導(dǎo)致一旦觸發(fā)GC所需掃描的對象數(shù)量太多,GC耗時(shí)太長,程序運(yùn)行的延時(shí)增加。

            結(jié)語

            為了減少stop-the-world的時(shí)間,引入的各種方法都會讓GC實(shí)現(xiàn)難度加大。GC是一個(gè)復(fù)雜的東西,網(wǎng)上所能找到的資料文章似乎不太多,而有關(guān)GC的書,目前只發(fā)現(xiàn)《The Garbage Collection Handbook》(我還沒有看過),而這本書既沒有pdf也沒有kindle版,只能在美國Amazon上買紙質(zhì)書。另外一個(gè)參考資料就是各個(gè)語言的實(shí)現(xiàn)源碼了。
            posted on 2013-11-17 22:20 airtrack 閱讀(2646) 評論(1)  編輯 收藏 引用

            FeedBack:
            # re: 初級分代GC 2013-11-19 23:20 fyxtc
            寫得很好~  回復(fù)  更多評論
              

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久久这里有精品| 久久久久久国产精品美女| 久久国产精品久久| 久久国产精品久久精品国产| 久久久中文字幕| 久久人妻少妇嫩草AV蜜桃| 久久WWW免费人成一看片| 精品久久久久久中文字幕| 欧美日韩成人精品久久久免费看| 久久妇女高潮几次MBA| 国产成人AV综合久久| 久久精品国产亚洲AV影院| 久久综合综合久久97色| 久久久久se色偷偷亚洲精品av| 国内精品久久久久| 精品多毛少妇人妻AV免费久久| 91久久精品电影| 精品国际久久久久999波多野| 精品无码久久久久久国产| 国产精品99久久免费观看| 久久久久久久波多野结衣高潮 | 欧美日韩成人精品久久久免费看| 欧美噜噜久久久XXX| 亚洲人成无码久久电影网站| 亚洲国产精品久久66| 91精品国产91久久久久福利| 99久久无色码中文字幕人妻| 久久综合久久鬼色| 国产精品无码久久四虎| 777久久精品一区二区三区无码 | 久久久久久噜噜精品免费直播| 久久国产精品99国产精| 久久天天躁狠狠躁夜夜躁2O2O| 久久夜色精品国产亚洲| 国产精品久久久久久久久久影院| 久久免费观看视频| 久久只有这精品99| 亚洲精品乱码久久久久久久久久久久| 亚洲欧美一级久久精品| 亚洲熟妇无码另类久久久| 午夜精品久久久久久中宇|