內存池(MemPool)技術詳解
概述
內存池(MemPool)技術備受推崇。我用google搜索了下,沒有找到比較詳細的原理性的文章,故此補充一個。另外,補充了boost::pool組件與經典MemPool的差異。同時也描述了MemPool在sgi-stl/stlport中的運用。
經典的內存池技術
經典的內存池(MemPool)技術,是一種用于分配大量大小相同的小對象的技術。通過該技術可以極大加快內存分配/釋放過程。下面我們詳細解釋其中的奧妙。
經典的內存池只涉及兩個常量:MemBlockSize、ItemSize(小對象的大小,但不能小于指針的大小,在32位平臺也就是不能小于4字節),以及兩個指針變量MemBlockHeader、FreeNodeHeader。開始,這兩個指針均為空。
class MemPool { private: const int m_nMemBlockSize; const int m_nItemSize; struct _FreeNode { _FreeNode* pPrev; BYTE data[m_nItemSize - sizeof(_FreeNode*)]; }; struct _MemBlock { _MemBlock* pPrev; _FreeNode data[m_nMemBlockSize/m_nItemSize]; }; _MemBlock* m_pMemBlockHeader; _FreeNode* m_pFreeNodeHeader; public: MemPool(int nItemSize, int nMemBlockSize = 2048) : m_nItemSize(nItemSize), m_nMemBlockSize(nMemBlockSize), m_pMemBlockHeader(NULL), m_pFreeNodeHeader(NULL) { } };
其中指針變量MemBlockHeader是把所有申請的內存塊(MemBlock)串成一個鏈表,以便通過它可以釋放所有申請的內存。FreeNodeHeader變量則是把所有自由內存結點(FreeNode)串成一個鏈。
這段話涉及兩個關鍵概念:內存塊(MemBlock)和自由內存結點(FreeNode)。內存塊大小一般固定為MemBlockSize字節(除去用以建立鏈表的指針外)。內存塊在申請之初就被劃分為多個內存結點(Node)1,每個Node大小為ItemSize(小對象的大小),計MemBlockSize/ItemSize個。這MemBlockSize/ItemSize個內存結點剛開始全部是自由的,他們被串成鏈表。我們看看申請/釋放內存過程,就很容易明白這樣做的目的。
申請內存過程
代碼如下:
void* MemPool::malloc() // 沒有參數 { if (m_pFreeNodeHeader == NULL) { const int nCount = m_nMemBlockSize/m_nItemSize; _MemBlock* pNewBlock = new _MemBlock; pNewBlock->data[0].pPrev = NULL; for (int i = 1; i < nCount; ++i) pNewBlock->data[i].pPrev = &pNewBlock->data[i-1]; m_pFreeNodeHeader = &pNewBlock->data[nCount-1]; pNewBlock->pPrev = m_pMemBlock; m_pMemBlock = pNewBlock; } void* pFreeNode = m_pFreeNodeHeader; m_pFreeNodeHeader = m_pFreeNodeHeader->pPrev; return pFreeNode; }
內存申請過程分為兩種情況:
- 在自由內存結點鏈表(FreeNodeList)非空。在此情況下,Alloc過程只是從鏈表中摘下一個結點的過程。
- 否則,意味著需要一個新的內存塊(MemBlock)。這個過程需要將新申請的MemBlock切割成多個Node,并把它們串起來,MemPool技術的開銷主要在這。
釋放內存過程
代碼如下:
void MemPool::free(void* p) { _FreeNode* pNode = (_FreeNode*)p; pNode->pPrev = m_pFreeNodeHeader; m_pFreeNodeHeader = pNode; }
釋放過程極其簡單,只是把要釋放的結點掛到自由內存鏈表(FreeNodeList)的開頭即可。
性能分析
MemPool技術申請內存/釋放內存均極其快(比AutoFreeAlloc慢)。其內存分配過程多數情況下復雜度為O(1),主要開銷在FreeNodeList為空需要生成新的MemBlock時。內存釋放過程復雜度為O(1)。
boost::pool
boost::pool是內存池技術的變種。主要的變化如下:
- MemBlock改為非固定長度(MemBlockSize),而是:第1次申請時m_nItemSize*32,第2次申請時 m_nItemSize*64,第3次申請時m_nItemSize*128,以此類推。不采用固定的MemBlockSize,而采用這種做法預測模型2,是一個細節上的改良。
- 增加了ordered_free(void* p) 函數。ordered_free區別于free的是,free把要釋放的結點掛到自由內存鏈表(FreeNodeList)的開頭, ordered_free則假設FreeNodeList是有序的,因此會遍歷FreeNodeList把要釋放的結點插入到合適的位置。我們已經看到,free的復雜度是O(1),非常快。但請注意ordered_free是比較費的操作,其復雜度是O(N)。這里N是FreeNodeList的大小。對于一個頻繁釋放/申請的系統,這個N很可能是個大數。這個boost描述得很清楚:http://www.boost.org/libs/pool/doc/interfaces/pool.html
注意:不要認為boost提供ordered_free是多此一舉。后文我們會在討論boost::object_pool時解釋這一點。
基于內存池技術的通用內存分配組件
SGI STL把內存池(MemPool)技術進行發揚光大,用它來實現其最根本的allocator。
其大體的思想是,建立16個MemPool,<=8字節的內存申請由0號MemPool分配,<=16字節的內存申請由1號 MemPool分配,<=24字節的內存有2號MemPool分配,以此類推。最后,>128字節的內存申請由普通的malloc分配。
內存池技術的缺陷
遺憾的是,MemPool技術可能導致內存占用只增不減。還沒有非常有效的辦法去避免這種情況的發生。不過我后來在ScopeAlloc的實現中發現BlockPool(是一個簡化版的內存池)反倒避免了這一缺陷。
注意
以上代碼屬于偽代碼(struct _FreeNode、_MemBlock編譯通不過),并且去除了出錯處理。
Footnotes
1. boost:pool/object_pool 中稱之為塊(Chunk)。
2. 是的,這是一種用戶內存需求的預測模型,其實std::vector的內存增長亦采用了該模型。
posted on 2008-04-24 15:33 肥仔 閱讀(3257) 評論(1) 編輯 收藏 引用 所屬分類: C++ 基礎