Skip List(跳躍表)原理詳解與實(shí)現(xiàn)
Posted on 2013-04-06 19:55 鑫龍 閱讀(13445) 評(píng)論(0) 編輯 收藏 引用 所屬分類: 數(shù)據(jù)結(jié)構(gòu)與算法本文內(nèi)容框架:
§1 Skip List 介紹
§2 Skip List 定義以及構(gòu)造步驟
§3 Skip List 完整實(shí)現(xiàn)
§4 Skip List 概率分析
§5 小結(jié)
§1 Skip List 介紹
Skip List是一種隨機(jī)化的數(shù)據(jù)結(jié)構(gòu),基于并聯(lián)的鏈表,其效率可比擬于二叉查找樹(shù)(對(duì)于大多數(shù)操作需要O(log n)平均時(shí)間)。基本上,跳躍列表是對(duì)有序的鏈表增加上附加的前進(jìn)鏈接,增加是以隨機(jī)化的方式進(jìn)行的,所以在列表中的查找可以快速的跳過(guò)部分列表(因此得名)。所有操作都以對(duì)數(shù)隨機(jī)化的時(shí)間進(jìn)行。Skip List可以很好解決有序鏈表查找特定值的困難。
§2 Skip List 定義以及構(gòu)造步驟
Skip List定義
像下面這樣(初中物理經(jīng)常這樣用,這里我也盜用下):
一個(gè)跳表,應(yīng)該具有以下特征:
- 一個(gè)跳表應(yīng)該有幾個(gè)層(level)組成;
- 跳表的第一層包含所有的元素;
- 每一層都是一個(gè)有序的鏈表;
- 如果元素x出現(xiàn)在第i層,則所有比i小的層都包含x;
- 第i層的元素通過(guò)一個(gè)down指針指向下一層擁有相同值的元素;
- 在每一層中,-1和1兩個(gè)元素都出現(xiàn)(分別表示INT_MIN和INT_MAX);
- Top指針指向最高層的第一個(gè)元素。
構(gòu)建有序鏈表
的一個(gè)跳躍表如下:
Skip List構(gòu)造步驟:
1、給定一個(gè)有序的鏈表。
2、選擇連表中最大和最小的元素,然后從其他元素中按照一定算法(隨機(jī))隨即選出一些元素,將這些元素組成有序鏈表。這個(gè)新的鏈表稱為一層,原鏈表稱為其下一層。
3、為剛選出的每個(gè)元素添加一個(gè)指針域,這個(gè)指針指向下一層中值同自己相等的元素。Top指針指向該層首元素
4、重復(fù)2、3步,直到不再能選擇出除最大最小元素以外的元素。
一、查找
目的:在跳躍表中查找一個(gè)元素x
在跳躍表中查找一個(gè)元素x,按照如下幾個(gè)步驟進(jìn)行:
1. 從最上層的鏈(Sh)的開(kāi)頭開(kāi)始
2. 假設(shè)當(dāng)前位置為p,它向右指向的節(jié)點(diǎn)為q(p與q不一定相鄰),且q的值為y。將y與x作比較
(1) x=y 輸出查詢成功及相關(guān)信息
(2) x>y 從p向右移動(dòng)到q的位置
(3) x<y 從p向下移動(dòng)一格
3. 如果當(dāng)前位置在最底層的鏈中(S0),且還要往下移動(dòng)的話,則輸出查詢失敗
二、插入
目的:向跳躍表中插入一個(gè)元素x
首先明確,向跳躍表中插入一個(gè)元素,相當(dāng)于在表中插入一列從S0中某一位置出發(fā)向上的連續(xù)一段元素。有兩個(gè)參數(shù)需要確定,即插入列的位置以及它的“高度”。
關(guān)于插入的位置,我們先利用跳躍表的查找功能,找到比x小的最大的數(shù)y。根據(jù)跳躍表中所有鏈均是遞增序列的原則,x必然就插在y的后面。
而插入列的“高度”較前者來(lái)說(shuō)顯得更加重要,也更加難以確定。由于它的不確定性,使得不同的決策可能會(huì)導(dǎo)致截然不同的算法效率。為了使插入數(shù)據(jù)之后,保持該數(shù)據(jù)結(jié)構(gòu)進(jìn)行各種操作均為O(logn)復(fù)雜度的性質(zhì),我們引入隨機(jī)化算法(Randomized Algorithms)。
我們定義一個(gè)隨機(jī)決策模塊,它的大致內(nèi)容如下:
產(chǎn)生一個(gè)0到1的隨機(jī)數(shù)r r ← random()
如果r小于一個(gè)常數(shù)p,則執(zhí)行方案A, if r<p then do A
否則,執(zhí)行方案B else do B
初始時(shí)列高為1。插入元素時(shí),不停地執(zhí)行隨機(jī)決策模塊。如果要求執(zhí)行的是A操作,則將列的高度加1,并且繼續(xù)反復(fù)執(zhí)行隨機(jī)決策模塊。直到第i次,模塊要求執(zhí)行的是B操作,我們結(jié)束決策,并向跳躍表中插入一個(gè)高度為i的列。
我們來(lái)看一個(gè)例子:
假設(shè)當(dāng)前我們要插入元素“40”,且在執(zhí)行了隨機(jī)決策模塊后得到高度為4
步驟一:找到表中比40小的最大的數(shù),確定插入位置

步驟二:插入高度為4的列,并維護(hù)跳躍表的結(jié)構(gòu)

三、刪除
目的:從跳躍表中刪除一個(gè)元素x
刪除操作分為以下三個(gè)步驟:
在跳躍表中查找到這個(gè)元素的位置,如果未找到,則退出
將該元素所在整列從表中刪除
將多余的“空鏈”刪除

§3 Skip List 完整實(shí)現(xiàn)
下面來(lái)定義跳表的數(shù)據(jù)結(jié)構(gòu)(基于C)
首先是每個(gè)節(jié)點(diǎn)的數(shù)據(jù)結(jié)構(gòu)
{
int key;
int value;
struct nodeStructure *forward[1];
}nodeStructure;
跳表的結(jié)構(gòu)如下
typedef struct skiplist
{
int level;
nodeStructure *header;
}skiplist;
下面是跳表的基本操作{
int level;
nodeStructure *header;
}skiplist;
首先是節(jié)點(diǎn)的創(chuàng)建
{
nodeStructure *ns=(nodeStructure *)malloc(sizeof(nodeStructure)+level*sizeof(nodeStructure*));
ns->key=key;
ns->value=value;
return ns;
}
列表的初始化
列表的初始化需要初始化頭部,并使頭部每層(根據(jù)事先定義的MAX_LEVEL)指向末尾(NULL)。
{
skiplist *sl=(skiplist *)malloc(sizeof(skiplist));
sl->level=0;
sl->header=createNode(MAX_LEVEL-1,0,0);
for(int i=0;i<MAX_LEVEL;i++)
{
sl->header->forward[i]=NULL;
}
return sl;
}
插入元素
插入元素的時(shí)候元素所占有的層數(shù)完全是隨機(jī)的,通過(guò)隨機(jī)算法產(chǎn)生
{
int k=1;
while (rand()%2)
k++;
k=(k<MAX_LEVEL)?k:MAX_LEVEL;
return k;
}
{
nodeStructure *update[MAX_LEVEL];
nodeStructure *p, *q = NULL;
p=sl->header;
int k=sl->level;
//從最高層往下查找需要插入的位置
//填充update
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<key))
{
p=q;
}
update[i]=p;
}
//不能插入相同的key
if(q&&q->key==key)
{
return false;
}
//產(chǎn)生一個(gè)隨機(jī)層數(shù)K
//新建一個(gè)待插入節(jié)點(diǎn)q
//一層一層插入
k=randomLevel();
//更新跳表的level
if(k>(sl->level))
{
for(int i=sl->level; i < k; i++){
update[i] = sl->header;
}
sl->level=k;
}
q=createNode(k,key,value);
//逐層更新節(jié)點(diǎn)的指針,和普通列表插入一樣
for(int i=0;i<k;i++)
{
q->forward[i]=update[i]->forward[i];
update[i]->forward[i]=q;
}
return true;
}
刪除節(jié)點(diǎn)
刪除節(jié)點(diǎn)操作和插入差不多,找到每層需要?jiǎng)h除的位置,刪除時(shí)和操作普通鏈表完全一樣。不過(guò)需要注意的是,如果該節(jié)點(diǎn)的level是最大的,則需要更新跳表的level。
{
nodeStructure *update[MAX_LEVEL];
nodeStructure *p,*q=NULL;
p=sl->header;
//從最高層開(kāi)始搜
int k=sl->level;
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<key))
{
p=q;
}
update[i]=p;
}
if(q&&q->key==key)
{
//逐層刪除,和普通列表刪除一樣
for(int i=0; i<sl->level; i++){
if(update[i]->forward[i]==q){
update[i]->forward[i]=q->forward[i];
}
}
free(q);
//如果刪除的是最大層的節(jié)點(diǎn),那么需要重新維護(hù)跳表的
for(int i=sl->level-1; i >= 0; i--){
if(sl->header->forward[i]==NULL){
sl->level--;
}
}
return true;
}
else
return false;
}
查找
跳表的優(yōu)點(diǎn)就是查找比普通鏈表快,當(dāng)然查找操作已經(jīng)包含在在插入和刪除過(guò)程,實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單。
{
nodeStructure *p,*q=NULL;
p=sl->header;
//從最高層開(kāi)始搜
int k=sl->level;
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<=key))
{
if(q->key==key)
{
return q->value;
}
p=q;
}
}
return NULL;
}
完整代碼如下:
#include<stdlib.h>
#define MAX_LEVEL 10 //最大層數(shù)
//節(jié)點(diǎn)
typedef struct nodeStructure
{
int key;
int value;
struct nodeStructure *forward[1];
}nodeStructure;
//跳表
typedef struct skiplist
{
int level;
nodeStructure *header;
}skiplist;
//創(chuàng)建節(jié)點(diǎn)
nodeStructure* createNode(int level,int key,int value)
{
nodeStructure *ns=(nodeStructure *)malloc(sizeof(nodeStructure)+level*sizeof(nodeStructure*));
ns->key=key;
ns->value=value;
return ns;
}
//初始化跳表
skiplist* createSkiplist()
{
skiplist *sl=(skiplist *)malloc(sizeof(skiplist));
sl->level=0;
sl->header=createNode(MAX_LEVEL-1,0,0);
for(int i=0;i<MAX_LEVEL;i++)
{
sl->header->forward[i]=NULL;
}
return sl;
}
//隨機(jī)產(chǎn)生層數(shù)
int randomLevel()
{
int k=1;
while (rand()%2)
k++;
k=(k<MAX_LEVEL)?k:MAX_LEVEL;
return k;
}
//插入節(jié)點(diǎn)
bool insert(skiplist *sl,int key,int value)
{
nodeStructure *update[MAX_LEVEL];
nodeStructure *p, *q = NULL;
p=sl->header;
int k=sl->level;
//從最高層往下查找需要插入的位置
//填充update
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<key))
{
p=q;
}
update[i]=p;
}
//不能插入相同的key
if(q&&q->key==key)
{
return false;
}
//產(chǎn)生一個(gè)隨機(jī)層數(shù)K
//新建一個(gè)待插入節(jié)點(diǎn)q
//一層一層插入
k=randomLevel();
//更新跳表的level
if(k>(sl->level))
{
for(int i=sl->level; i < k; i++){
update[i] = sl->header;
}
sl->level=k;
}
q=createNode(k,key,value);
//逐層更新節(jié)點(diǎn)的指針,和普通列表插入一樣
for(int i=0;i<k;i++)
{
q->forward[i]=update[i]->forward[i];
update[i]->forward[i]=q;
}
return true;
}
//搜索指定key的value
int search(skiplist *sl,int key)
{
nodeStructure *p,*q=NULL;
p=sl->header;
//從最高層開(kāi)始搜
int k=sl->level;
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<=key))
{
if(q->key == key)
{
return q->value;
}
p=q;
}
}
return NULL;
}
//刪除指定的key
bool deleteSL(skiplist *sl,int key)
{
nodeStructure *update[MAX_LEVEL];
nodeStructure *p,*q=NULL;
p=sl->header;
//從最高層開(kāi)始搜
int k=sl->level;
for(int i=k-1; i >= 0; i--){
while((q=p->forward[i])&&(q->key<key))
{
p=q;
}
update[i]=p;
}
if(q&&q->key==key)
{
//逐層刪除,和普通列表刪除一樣
for(int i=0; i<sl->level; i++){
if(update[i]->forward[i]==q){
update[i]->forward[i]=q->forward[i];
}
}
free(q);
//如果刪除的是最大層的節(jié)點(diǎn),那么需要重新維護(hù)跳表的
for(int i=sl->level - 1; i >= 0; i--){
if(sl->header->forward[i]==NULL){
sl->level--;
}
}
return true;
}
else
return false;
}
void printSL(skiplist *sl)
{
//從最高層開(kāi)始打印
nodeStructure *p,*q=NULL;
//從最高層開(kāi)始搜
int k=sl->level;
for(int i=k-1; i >= 0; i--)
{
p=sl->header;
while(q=p->forward[i])
{
printf("%d -> ",p->value);
p=q;
}
printf("\n");
}
printf("\n");
}
int main()
{
skiplist *sl=createSkiplist();
for(int i=1;i<=19;i++)
{
insert(sl,i,i*2);
}
printSL(sl);
//搜索
int i=search(sl,4);
printf("i=%d\n",i);
//刪除
bool b=deleteSL(sl,4);
if(b)
printf("刪除成功\n");
printSL(sl);
system("pause");
return 0;
}

§5 小結(jié)
本篇博文已經(jīng)詳細(xì)講解了Skip List數(shù)據(jù)結(jié)構(gòu)的所有內(nèi)容,應(yīng)該可以有一個(gè)深入的了解。如果你有任何建議或者批評(píng)和補(bǔ)充,請(qǐng)留言指出,不勝感激,更多參考請(qǐng)移步互聯(lián)網(wǎng)。
參考:
①Skip List: http://www.cs.auckland.ac.nz/software/AlgAnim/niemann/s_skl.htm
②Songeliu: http://www.spongeliu.com/63.html
③Shi Kai Lun : http://yilee.info/skip-list.html
④Michael T. Goodrich Roberto Tamassia Algorithm Design Foundations, Analysis, and Internet Examples
⑤http://epaperpress.com/sortsearch/skl.html
轉(zhuǎn)自:http://dsqiu.iteye.com/blog/1705530