• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            若我的小家

            -編程,讀書,感悟,旅游,設(shè)計
            posts - 21, comments - 0, trackbacks - 0, articles - 0
            (一)深入淺出理解索引結(jié)構(gòu)

            實(shí)際上,您可以把索引理解為一種特殊的目錄。微軟的SQL SERVER提供了兩種索引:聚集索引(clustered index,也稱聚類索引、簇集索引)和非聚集索引(nonclustered index,也稱非聚類索引、非簇集索引)。下面,我們舉例來說明一下聚集索引和非聚集索引的區(qū)別:

            其實(shí),我們的漢語字典的正文本身就是一個聚集索引。比如,我們要查“安”字,就會很自然地翻開字典的前幾頁,因為“安”的拼音是“an”,而按照拼音排序漢字的字典是以英文字母“a”開頭并以“z”結(jié)尾的,那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”開頭的部分仍然找不到這個字,那么就說明您的字典中沒有這個字;同樣的,如果查“張”字,那您也會將您的字典翻到最后部分,因為“張”的拼音是“zhang”。也就是說,字典的正文部分本身就是一個目錄,您不需要再去查其他目錄來找到您需要找的內(nèi)容。

            我們把這種正文內(nèi)容本身就是一種按照一定規(guī)則排列的目錄稱為“聚集索引”。

            如果您認(rèn)識某個字,您可以快速地從自動中查到這個字。但您也可能會遇到您不認(rèn)識的字,不知道它的發(fā)音,這時候,您就不能按照剛才的方法找到您要查的字,而需要去根據(jù)“偏旁部首”查到您要找的字,然后根據(jù)這個字后的頁碼直接翻到某頁來找到您要找的字。但您結(jié)合“部首目錄”和“檢字表”而查到的字的排序并不是真正的正文的排序方法,比如您查“張”字,我們可以看到在查部首之后的檢字表中“張”的頁碼是672頁,檢字表中“張”的上面是“馳”字,但頁碼卻是63頁,“張”的下面是“弩”字,頁面是390頁。很顯然,這些字并不是真正的分別位于“張”字的上下方,現(xiàn)在您看到的連續(xù)的“馳、張、弩”三字實(shí)際上就是他們在非聚集索引中的排序,是字典正文中的字在非聚集索引中的映射。我們可以通過這種方式來找到您所需要的字,但它需要兩個過程,先找到目錄中的結(jié)果,然后再翻到您所需要的頁碼。

            我們把這種目錄純粹是目錄,正文純粹是正文的排序方式稱為“非聚集索引”。

            通過以上例子,我們可以理解到什么是“聚集索引”和“非聚集索引”。

            進(jìn)一步引申一下,我們可以很容易的理解:每個表只能有一個聚集索引,因為目錄只能按照一種方法進(jìn)行排序。

            (二)何時使用聚集索引或非聚集索引

            下面的表總結(jié)了何時使用聚集索引或非聚集索引(很重要)。

            動作描述
            使用聚集索引
            使用非聚集索引

            列經(jīng)常被分組排序
            應(yīng)
            應(yīng)

            返回某范圍內(nèi)的數(shù)據(jù)
            應(yīng)
            不應(yīng)

            一個或極少不同值
            不應(yīng)
            不應(yīng)

            小數(shù)目的不同值
            應(yīng)
            不應(yīng)

            大數(shù)目的不同值
            不應(yīng)
            應(yīng)

            頻繁更新的列
            不應(yīng)
            應(yīng)

            外鍵列
            應(yīng)
            應(yīng)

            主鍵列
            應(yīng)
            應(yīng)

            頻繁修改索引列
            不應(yīng)
            應(yīng)


            事實(shí)上,我們可以通過前面聚集索引和非聚集索引的定義的例子來理解上表。如:返回某范圍內(nèi)的數(shù)據(jù)一項。比如您的某個表有一個時間列,恰好您把聚合索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部數(shù)據(jù)時,這個速度就將是很快的,因為您的這本字典正文是按日期進(jìn)行排序的,聚類索引只需要找到要檢索的所有數(shù)據(jù)中的開頭和結(jié)尾數(shù)據(jù)即可;而不像非聚集索引,必須先查到目錄中查到每一項數(shù)據(jù)對應(yīng)的頁碼,然后再根據(jù)頁碼查到具體內(nèi)容。

            (三)結(jié)合實(shí)際,談索引使用的誤區(qū)

            理論的目的是應(yīng)用。雖然我們剛才列出了何時應(yīng)使用聚集索引或非聚集索引,但在實(shí)踐中以上規(guī)則卻很容易被忽視或不能根據(jù)實(shí)際情況進(jìn)行綜合分析。下面我們將根據(jù)在實(shí)踐中遇到的實(shí)際問題來談一下索引使用的誤區(qū),以便于大家掌握索引建立的方法。

            1、主鍵就是聚集索引

            這種想法筆者認(rèn)為是極端錯誤的,是對聚集索引的一種浪費(fèi)。雖然SQL SERVER默認(rèn)是在主鍵上建立聚集索引的。

            通常,我們會在每個表中都建立一個ID列,以區(qū)分每條數(shù)據(jù),并且這個ID列是自動增大的,步長一般為1。我們的這個辦公自動化的實(shí)例中的列Gid就是如此。此時,如果我們將這個列設(shè)為主鍵,SQL SERVER會將此列默認(rèn)為聚集索引。這樣做有好處,就是可以讓您的數(shù)據(jù)在數(shù)據(jù)庫中按照ID進(jìn)行物理排序,但筆者認(rèn)為這樣做意義不大。

            顯而易見,聚集索引的優(yōu)勢是很明顯的,而每個表中只能有一個聚集索引的規(guī)則,這使得聚集索引變得更加珍貴。

            從我們前面談到的聚集索引的定義我們可以看出,使用聚集索引的最大好處就是能夠根據(jù)查詢要求,迅速縮小查詢范圍,避免全表掃描。在實(shí)際應(yīng)用中,因為ID號是自動生成的,我們并不知道每條記錄的ID號,所以我們很難在實(shí)踐中用ID號來進(jìn)行查詢。這就使讓ID號這個主鍵作為聚集索引成為一種資源浪費(fèi)。其次,讓每個ID號都不同的字段作為聚集索引也不符合“大數(shù)目的不同值情況下不應(yīng)建立聚合索引”規(guī)則;當(dāng)然,這種情況只是針對用戶經(jīng)常修改記錄內(nèi)容,特別是索引項的時候會負(fù)作用,但對于查詢速度并沒有影響。

            在辦公自動化系統(tǒng)中,無論是系統(tǒng)首頁顯示的需要用戶簽收的文件、會議還是用戶進(jìn)行文件查詢等任何情況下進(jìn)行數(shù)據(jù)查詢都離不開字段的是“日期”還有用戶本身的“用戶名”。

            通常,辦公自動化的首頁會顯示每個用戶尚未簽收的文件或會議。雖然我們的where語句可以僅僅限制當(dāng)前用戶尚未簽收的情況,但如果您的系統(tǒng)已建立了很長時間,并且數(shù)據(jù)量很大,那么,每次每個用戶打開首頁的時候都進(jìn)行一次全表掃描,這樣做意義是不大的,絕大多數(shù)的用戶1個月前的文件都已經(jīng)瀏覽過了,這樣做只能徒增數(shù)據(jù)庫的開銷而已。事實(shí)上,我們完全可以讓用戶打開系統(tǒng)首頁時,數(shù)據(jù)庫僅僅查詢這個用戶近3個月來未閱覽的文件,通過“日期”這個字段來限制表掃描,提高查詢速度。如果您的辦公自動化系統(tǒng)已經(jīng)建立的2年,那么您的首頁顯示速度理論上將是原來速度8倍,甚至更快。

            在這里之所以提到“理論上”三字,是因為如果您的聚集索引還是盲目地建在ID這個主鍵上時,您的查詢速度是沒有這么高的,即使您在“日期”這個字段上建立的索引(非聚合索引)。下面我們就來看一下在1000萬條數(shù)據(jù)量的情況下各種查詢的速度表現(xiàn)(3個月內(nèi)的數(shù)據(jù)為25萬條):

            (1)僅在主鍵上建立聚集索引,并且不劃分時間段:

            Select gid,fariqi,neibuyonghu,title from tgongwen

            用時:128470毫秒(即:128秒)

            (2)在主鍵上建立聚集索引,在fariq上建立非聚集索引:

            select gid,fariqi,neibuyonghu,title from Tgongwen

            where fariqi> dateadd(day,-90,getdate())

            用時:53763毫秒(54秒)

            (3)將聚合索引建立在日期列(fariqi)上:

            select gid,fariqi,neibuyonghu,title from Tgongwen

            where fariqi> dateadd(day,-90,getdate())

            用時:2423毫秒(2秒)

            雖然每條語句提取出來的都是25萬條數(shù)據(jù),各種情況的差異卻是巨大的,特別是將聚集索引建立在日期列時的差異。事實(shí)上,如果您的數(shù)據(jù)庫真的有1000萬容量的話,把主鍵建立在ID列上,就像以上的第1、2種情況,在網(wǎng)頁上的表現(xiàn)就是超時,根本就無法顯示。這也是我摒棄ID列作為聚集索引的一個最重要的因素。

            得出以上速度的方法是:在各個select語句前加:declare @d datetime

            set @d=getdate()

            并在select語句后加:

            select [語句執(zhí)行花費(fèi)時間(毫秒)]=datediff(ms,@d,getdate())

            2、只要建立索引就能顯著提高查詢速度

            事實(shí)上,我們可以發(fā)現(xiàn)上面的例子中,第2、3條語句完全相同,且建立索引的字段也相同;不同的僅是前者在fariqi字段上建立的是非聚合索引,后者在此字段上建立的是聚合索引,但查詢速度卻有著天壤之別。所以,并非是在任何字段上簡單地建立索引就能提高查詢速度。

            從建表的語句中,我們可以看到這個有著1000萬數(shù)據(jù)的表中fariqi字段有5003個不同記錄。在此字段上建立聚合索引是再合適不過了。在現(xiàn)實(shí)中,我們每天都會發(fā)幾個文件,這幾個文件的發(fā)文日期就相同,這完全符合建立聚集索引要求的:“既不能絕大多數(shù)都相同,又不能只有極少數(shù)相同”的規(guī)則。由此看來,我們建立“適當(dāng)”的聚合索引對于我們提高查詢速度是非常重要的。

            3、把所有需要提高查詢速度的字段都加進(jìn)聚集索引,以提高查詢速度

            上面已經(jīng)談到:在進(jìn)行數(shù)據(jù)查詢時都離不開字段的是“日期”還有用戶本身的“用戶名”。既然這兩個字段都是如此的重要,我們可以把他們合并起來,建立一個復(fù)合索引(compound index)。

            很多人認(rèn)為只要把任何字段加進(jìn)聚集索引,就能提高查詢速度,也有人感到迷惑:如果把復(fù)合的聚集索引字段分開查詢,那么查詢速度會減慢嗎?帶著這個問題,我們來看一下以下的查詢速度(結(jié)果集都是25萬條數(shù)據(jù)):(日期列fariqi首先排在復(fù)合聚集索引的起始列,用戶名neibuyonghu排在后列)

            (1)select gid,fariqi,neibuyonghu,title from Tgongwen where fariqi>'2004-5-5'

            查詢速度:2513毫秒

            (2)select gid,fariqi,neibuyonghu,title from Tgongwen where fariqi>'2004-5-5' and neibuyonghu='辦公室'

            查詢速度:2516毫秒

            (3)select gid,fariqi,neibuyonghu,title from Tgongwen where neibuyonghu='辦公室'

            查詢速度:60280毫秒

            從以上試驗中,我們可以看到如果僅用聚集索引的起始列作為查詢條件和同時用到復(fù)合聚集索引的全部列的查詢速度是幾乎一樣的,甚至比用


            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            国产午夜精品久久久久免费视| 国产精品免费福利久久| 久久国产高清一区二区三区| 9999国产精品欧美久久久久久| 韩国三级中文字幕hd久久精品| 欧美久久一区二区三区| 狠狠色丁香久久婷婷综合五月| 91久久精品视频| 亚洲精品乱码久久久久久久久久久久| 久久丫精品国产亚洲av不卡| 久久99久久成人免费播放| 国产美女亚洲精品久久久综合| 国产午夜久久影院| 久久久久亚洲精品日久生情| 激情综合色综合久久综合| 无码伊人66久久大杳蕉网站谷歌| 狠狠精品久久久无码中文字幕 | 精品久久一区二区三区| 久久伊人精品青青草原日本| 久久精品欧美日韩精品| 亚洲精品国精品久久99热| 久久精品视频网| 嫩草伊人久久精品少妇AV| 亚洲人成无码www久久久| 一本大道加勒比久久综合| 国产精品9999久久久久| 亚洲AV乱码久久精品蜜桃| 亚洲日本久久久午夜精品| 久久久久久久综合日本| 国产精品久久久久一区二区三区| 浪潮AV色综合久久天堂| 久久综合综合久久综合| 亚洲AV日韩AV永久无码久久| 伊人久久大香线蕉av不卡| 久久精品国产清自在天天线| 亚洲综合久久久| 亚洲中文字幕无码久久2020| 婷婷五月深深久久精品| 国产午夜免费高清久久影院| 久久亚洲精品国产精品| 久久ww精品w免费人成|