無(wú)鎖有序鏈表可以保證元素的唯一性,使其可用于哈希表的桶,甚至直接作為一個(gè)效率不那么高的map。普通鏈表的無(wú)鎖實(shí)現(xiàn)相對(duì)簡(jiǎn)單點(diǎn),因?yàn)椴迦朐乜梢栽诒眍^插,而有序鏈表的插入則是任意位置。
本文主要基于論文High Performance Dynamic Lock-Free Hash Tables實(shí)現(xiàn)。
主要問(wèn)題
鏈表的主要操作包含insert和remove,先簡(jiǎn)單實(shí)現(xiàn)一個(gè)版本,就會(huì)看到問(wèn)題所在,以下代碼只用作示例:
struct node_t {
key_t key;
value_t val;
node_t *next;
};
int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {
node_t *pred = head;
node_t *item = head->next;
while (item) {
int d = KEY_CMP(item->key, key);
if (d >= 0) {
*pred_ptr = pred;
*item_ptr = item;
return d == 0 ? TRUE : FALSE;
}
pred = item;
item = item->next;
}
*pred_ptr = pred;
*item_ptr = NULL;
return FALSE;
}
int l_insert(node_t *head, key_t key, value_t val) {
node_t *pred, *item, *new_item;
while (TRUE) {
if (l_find(&pred, &item, head, key)) {
return FALSE;
}
new_item = (node_t*) malloc(sizeof(node_t));
new_item->key = key;
new_item->val = val;
new_item->next = item;
// A. 如果pred本身被移除了
if (CAS(&pred->next, item, new_item)) {
return TRUE;
}
free(new_item);
}
}
int l_remove(node_t *head, key_t key) {
node_t *pred, *item;
while (TRUE) {
if (!l_find(&pred, &item, head, key)) {
return TRUE;
}
// B. 如果pred被移除;如果item也被移除
if (CAS(&pred->next, item, item->next)) {
haz_free(item);
return TRUE;
}
}
}
l_find函數(shù)返回查找到的前序元素和元素本身,代碼A和B雖然拿到了pred和item,但在CAS的時(shí)候,其可能被其他線程移除。甚至,在l_find過(guò)程中,其每一個(gè)元素都可能被移除。問(wèn)題在于,任何時(shí)候拿到一個(gè)元素時(shí),都不確定其是否還有效。元素的有效性包括其是否還在鏈表中,其指向的內(nèi)存是否還有效。
解決方案
通過(guò)為元素指針增加一個(gè)有效性標(biāo)志位,配合CAS操作的互斥性,就可以解決元素有效性判定問(wèn)題。
因?yàn)?code>node_t放在內(nèi)存中是會(huì)對(duì)齊的,所以指向node_t的指針值低幾位是不會(huì)用到的,從而可以在低幾位里設(shè)置標(biāo)志,這樣在做CAS的時(shí)候,就實(shí)現(xiàn)了DCAS的效果,相當(dāng)于將兩個(gè)邏輯上的操作變成了一個(gè)原子操作。想象下引用計(jì)數(shù)對(duì)象的線程安全性,其內(nèi)包裝的指針是線程安全的,但對(duì)象本身不是。
CAS的互斥性,在若干個(gè)線程CAS相同的對(duì)象時(shí),只有一個(gè)線程會(huì)成功,失敗的線程就可以以此判定目標(biāo)對(duì)象發(fā)生了變更。改進(jìn)后的代碼(代碼僅做示例用,不保證正確):
typedef size_t markable_t;
// 最低位置1,表示元素被刪除
#define HAS_MARK(p) ((markable_t)p & 0x01)
#define MARK(p) ((markable_t)p | 0x01)
#define STRIP_MARK(p) ((markable_t)p & ~0x01)
int l_insert(node_t *head, key_t key, value_t val) {
node_t *pred, *item, *new_item;
while (TRUE) {
if (l_find(&pred, &item, head, key)) {
return FALSE;
}
new_item = (node_t*) malloc(sizeof(node_t));
new_item->key = key;
new_item->val = val;
new_item->next = item;
// A. 雖然find拿到了合法的pred,但是在以下代碼之前pred可能被刪除,此時(shí)pred->next被標(biāo)記
// pred->next != item,該CAS會(huì)失敗,失敗后重試
if (CAS(&pred->next, item, new_item)) {
return TRUE;
}
free(new_item);
}
return FALSE;
}
int l_remove(node_t *head, key_t key) {
node_t *pred, *item;
while (TRUE) {
if (!l_find(&pred, &item, head, key)) {
return FALSE;
}
node_t *inext = item->next;
// B. 刪除item前先標(biāo)記item->next,如果CAS失敗,那么情況同insert一樣,有其他線程在find之后
// 刪除了item,失敗后重試
if (!CAS(&item->next, inext, MARK(inext))) {
continue;
}
// C. 對(duì)同一個(gè)元素item刪除時(shí),只會(huì)有一個(gè)線程成功走到這里
if (CAS(&pred->next, item, STRIP_MARK(item->next))) {
haz_defer_free(item);
return TRUE;
}
}
return FALSE;
}
int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {
node_t *pred = head;
node_t *item = head->next;
hazard_t *hp1 = haz_get(0);
hazard_t *hp2 = haz_get(1);
while (item) {
haz_set_ptr(hp1, pred);
haz_set_ptr(hp2, item);
/*
如果已被標(biāo)記,那么緊接著item可能被移除鏈表甚至釋放,所以需要重頭查找
*/
if (HAS_MARK(item->next)) {
return l_find(pred_ptr, item_ptr, head, key);
}
int d = KEY_CMP(item->key, key);
if (d >= 0) {
*pred_ptr = pred;
*item_ptr = item;
return d == 0 ? TRUE : FALSE;
}
pred = item;
item = item->next;
}
*pred_ptr = pred;
*item_ptr = NULL;
return FALSE;
}
haz_get、haz_set_ptr之類(lèi)的函數(shù)是一個(gè)hazard pointer實(shí)現(xiàn),用于支持多線程下內(nèi)存的GC。上面的代碼中,要?jiǎng)h除一個(gè)元素item時(shí),會(huì)標(biāo)記item->next,從而使得insert時(shí)中那個(gè)CAS不需要做任何調(diào)整。總結(jié)下這里的線程競(jìng)爭(zhēng)情況:
-
insert中find到正常的pred及item,pred->next == item,然后在CAS前有線程刪除了pred,此時(shí)pred->next == MARK(item),CAS失敗,重試;刪除分為2種情況:a) 從鏈表移除,得到標(biāo)記,pred可繼續(xù)訪問(wèn);b) pred可能被釋放內(nèi)存,此時(shí)再使用pred會(huì)錯(cuò)誤。為了處理情況b,所以引入了類(lèi)似hazard pointer的機(jī)制,可以有效保障任意一個(gè)指針p只要還有線程在使用它,它的內(nèi)存就不會(huì)被真正釋放
-
insert中有多個(gè)線程在pred后插入元素,此時(shí)同樣由insert中的CAS保證,這個(gè)不多說(shuō)
-
remove中情況同insert,find拿到了有效的pred和next,但在CAS的時(shí)候pred被其他線程刪除,此時(shí)情況同insert,CAS失敗,重試
- 任何時(shí)候改變鏈表結(jié)構(gòu)時(shí),無(wú)論是
remove還是insert,都需要重試該操作
-
find中遍歷時(shí),可能會(huì)遇到被標(biāo)記刪除的item,此時(shí)item根據(jù)remove的實(shí)現(xiàn)很可能被刪除,所以需要重頭開(kāi)始遍歷
ABA問(wèn)題
ABA問(wèn)題還是存在的,insert中:
if (CAS(&pred->next, item, new_item)) {
return TRUE;
}
如果CAS之前,pred后的item被移除,又以相同的地址值加進(jìn)來(lái),但其value變了,此時(shí)CAS會(huì)成功,但鏈表可能就不是有序的了。pred->val < new_item->val > item->val
為了解決這個(gè)問(wèn)題,可以利用指針值地址對(duì)齊的其他位來(lái)存儲(chǔ)一個(gè)計(jì)數(shù),用于表示pred->next的改變次數(shù)。當(dāng)insert拿到pred時(shí),pred->next中存儲(chǔ)的計(jì)數(shù)假設(shè)是0,CAS之前其他線程移除了pred->next又新增回了item,此時(shí)pred->next中的計(jì)數(shù)增加,從而導(dǎo)致insert中CAS失敗。
// 最低位留作刪除標(biāo)志
#define MASK ((sizeof(node_t) - 1) & ~0x01)
#define GET_TAG(p) ((markable_t)p & MASK)
#define TAG(p, tag) ((markable_t)p | (tag))
#define MARK(p) ((markable_t)p | 0x01)
#define HAS_MARK(p) ((markable_t)p & 0x01)
#define STRIP_MARK(p) ((node_t*)((markable_t)p & ~(MASK | 0x01)))
remove的實(shí)現(xiàn):
/* 先標(biāo)記再刪除 */
if (!CAS(&sitem->next, inext, MARK(inext))) {
continue;
}
int tag = GET_TAG(pred->next) + 1;
if (CAS(&pred->next, item, TAG(STRIP_MARK(sitem->next), tag))) {
haz_defer_free(sitem);
return TRUE;
}
insert中也可以更新pred->next的計(jì)數(shù)。
總結(jié)
無(wú)鎖的實(shí)現(xiàn),本質(zhì)上都會(huì)依賴于CAS的互斥性。從頭實(shí)現(xiàn)一個(gè)lock free的數(shù)據(jù)結(jié)構(gòu),可以深刻感受到lock free實(shí)現(xiàn)的tricky。最終代碼可以從這里github獲取。代碼中為了簡(jiǎn)單,實(shí)現(xiàn)了一個(gè)不是很強(qiáng)大的hazard pointer,可以參考之前的博文。