• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            時(shí)雨の記-RainCode
            遠(yuǎn)野嘉一(Lams Lupin)的專欄
            posts - 2,  comments - 8,  trackbacks - 0
            前言
                  散列表(HashTable)又稱為哈希表,是一種快速的數(shù)據(jù)查找結(jié)構(gòu),它通常是為一個(gè)(組)要記錄的數(shù)據(jù)設(shè)計(jì)一個(gè)哈希函數(shù)H(x),依據(jù)這個(gè)函數(shù)進(jìn)行給數(shù)據(jù)定位,如果是閉散列,那就是直接存到數(shù)組的H(x)下標(biāo)處,如果是開散列,就是存到指針數(shù)組H(x)下標(biāo)的鏈表處。在OI中某些Pascaler為了避開鏈表而采用的閉散列鄙人認(rèn)為相當(dāng)糟糕,至于原因會(huì)在后面解釋。所以本文只談開散列。

            哈希表的組織方式:
                  我們首先要確定一個(gè)哈希函數(shù)H(x),x是要記錄的對(duì)象,我們以H(x)來確定對(duì)象的記錄的鏈的位置。
                  還需要一個(gè)指針數(shù)組來存放每個(gè)鏈的頭指針。由于要使用鏈表,所以還要有一個(gè)class/struct作為鏈表的基本單位。
            哈希表的一般實(shí)現(xiàn):
            首先是鏈表的基本元素:
            template<class T>
            struct t_node
            {
                
            public:
                    T key;
                    
            //other info
                    t_node* next;
            }
            ;

            然后是HashTable類的骨架(我在這里把它封裝成類了):

            template<class T>
            class hashtable
            {
                
            public:
                    hashtable();
                    
            int hash(const T &sr);
                    
            void insert();
                    t_node 
            *find(const T &sr);
                    
            //add more functions
                private:
                    t_node 
            *ht[t_size];//you should define t_size as sth before
                    
            //add more things
            }
            ;

            接下來是構(gòu)造函數(shù):

            hashtable<T>::hahstable()
            {
                memset(ht,
            0,sizeof(ht));
            }

            先略去哈希函數(shù),介紹插入函數(shù):

            void hashtable<T>::insert(const T &sr)
            {
                
            int loc = hash(sr);
                
            if (ht[loc] == 0)
                
            {
                    
            //此處為空,插入一個(gè)新鏈表
                    ht[loc] = new t_node();
                    ht[loc]
            -> key = T;
                }

                
            else
                
            {
                    t_node 
            *now = ht[loc];
                    
            while (true)
                    
            {
                        
            if (now->key == sr)
                        
            {
                            
            //元素已經(jīng)存在。 
                            return;
                        }

                        
            else if (now->next == 0)
                        
            {
                            
            //鏈里面沒有該元素,就地插入
                            now->next = new t_node();
                            now
            ->next->key = T; 
                            
            return;
                        }

                        
            else now = now->next;
                    }

                }

            }

            然后是查找:

            t_node *hashtable<T>::find(const T &st)
            {
                
            int loc = hash(sr);
                
            if (ht[loc] == 0)
                
            {
                    
            //此處為空,木有~ 返回空指針 
                    return 0;
                }

                
            else
                
            {
                    t_node 
            *now = ht[loc];
                    
            while (true)
                    
            {
                        
            if (now->key == sr)
                        
            {
                            
            //找到了 
                            return now;
                        }

                        
            else if (now->next == 0)
                        
            {
                            
            //遍歷完了整個(gè)鏈還是木有。。 
                            return 0;
                        }

                        
            else now = now->next;//看這個(gè)鏈的下一個(gè)元素 
                    }

                }

            }

            當(dāng)然可以根據(jù)具體情況做各種改動(dòng),如果要極限追求效率可以在t_node里面把key改為指針,然后使用自己編寫的內(nèi)存分配函數(shù)代替new。


            最簡(jiǎn)單的哈希函數(shù):
            其實(shí)最簡(jiǎn)單的哈希表1就是H(x)=x,意思是若記錄對(duì)象是整數(shù),就直接采用這個(gè)整數(shù)為下標(biāo)(char類型也可視為整數(shù)),這個(gè)就是數(shù)組,但它也可以看作哈希表。
            最簡(jiǎn)單的哈希表2就是H(x)=1,意思是不管是什么元素都放到同一個(gè)下標(biāo),這個(gè)就是鏈表,也可視為一種哈希表。

            大整數(shù)的哈希函數(shù):
            當(dāng)記錄對(duì)象是大整數(shù)的時(shí)候,若再用H(x)=x,數(shù)組的范圍將會(huì)承受不起,所以這時(shí)候要考慮哈希函數(shù)的設(shè)計(jì)問題,又有很多種設(shè)計(jì)方法,最廣泛的一種就是H(x)=x%k,k通常是一個(gè)質(zhì)數(shù)。

            一般的哈希函數(shù):
            我們也許會(huì)記錄一些class或者struct之類的東西,這時(shí)候我們可以選取里面的某些關(guān)鍵變量進(jìn)行一種運(yùn)算來確定下標(biāo)。

            沖突的處理:
            再好的哈希函數(shù)也很難避免沖突,所謂沖突就是說H(a)=H(b)的情況,而開散列的處理方法是在數(shù)組后面掛的是鏈表,這樣沖突的元素可以直接掛在鏈表的末端,而閉散列沒有鏈表,一般是重復(fù)Hn(x)或者往H(x)+a(a=1,2,3..)尋找,這會(huì)使哈希表變得一塌糊涂,而且沖突還可能引發(fā)別的沖突,而且也不便于估計(jì)哈希數(shù)組的范圍,所以鄙人不提倡使用閉散列的組織方式。
            順便說一句:好的哈希函數(shù)是盡量減少和平衡沖突,盡量使得每個(gè)鏈的長(zhǎng)度分布得平均,好的哈希函數(shù)的設(shè)計(jì)要靠長(zhǎng)久的經(jīng)驗(yàn)積累,絕非一日之功。

            哈希表的本質(zhì)思想:
            散列表本質(zhì)思想就是把數(shù)組與鏈表的優(yōu)勢(shì)結(jié)合起來,數(shù)組的訪問復(fù)雜度是O(1),鏈表的插入復(fù)雜度是O(1),然而數(shù)組的插入復(fù)雜度和鏈表的訪問復(fù)雜度都比較高,所以就產(chǎn)生了散列表。我們可以把這個(gè)思想運(yùn)用到許多地方,這本是我想說的重點(diǎn),但鄙人才疏學(xué)淺,不知如何表達(dá),日后整理一下代碼說明吧。

            posted on 2011-09-10 12:07 遠(yuǎn)野嘉一 閱讀(2810) 評(píng)論(8)  編輯 收藏 引用

            FeedBack:
            # re: 淺談哈希思想的應(yīng)用
            2011-09-10 15:23 | 李立強(qiáng)
            在CSDN的群里看到了,過來看看。
            我覺得你在類中使用typedef會(huì)比較好,這樣子不僅可以跟STL達(dá)到一種同步,同時(shí)可以方便的閱讀和使用,例如可以把
            typedef T size_type;
            typedef size_type* iterator;
            typedef const iterator const_iterator;
            typedef size_type& reference;
            typedef const reference const_reference;
            之類的。這只是舉例子,并不是一定適合你這個(gè)類,你可以自己寫適合的typedef。還有一點(diǎn),我在看primer時(shí),他們將t_node設(shè)為class,然后再設(shè)置一個(gè)友元,這樣子可以防止t_node的訪問,達(dá)到封裝的效果。  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用
            2011-09-10 15:39 | 博洋家紡
            止t_node的訪問,達(dá)到封裝的效果  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用[未登錄]
            2011-09-10 16:50 | Chipset
            1、耗費(fèi)內(nèi)存太多。
            2、速度可能不會(huì)太快。

            作為對(duì)比,SGI STL和Boost的哈西表速度太慢,耗費(fèi)內(nèi)存也太多,估計(jì)你的這個(gè)還趕不上Boost和SGI STL的哈希表。如果感興趣,到我的主頁上看看哈西表怎么設(shè)計(jì)的。  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用
            2011-09-10 19:49 | 遠(yuǎn)野嘉一
            @Chipset
            謝謝批評(píng),你的哈希表我剛剛看了,確實(shí)不錯(cuò)。事實(shí)上我在編寫哈希表的時(shí)候都是指針處理數(shù)據(jù)的,所以理論上在有N個(gè)元素時(shí)內(nèi)存占用只有sizeof(ht)+N*sizeof(void*)以及N*sizeof(T)的數(shù)據(jù)原本占用的內(nèi)存,sizeof(ht)=t_size*sizeof(void*),鄙人以為應(yīng)該不會(huì)很高,此外我也通常自己編寫內(nèi)存管理器,和你的博文比較以后,發(fā)現(xiàn)我通常寫的和你寫的“拉鏈哈希”應(yīng)當(dāng)是時(shí)間、空間差不多的,還沒發(fā)現(xiàn)新的東西。
            至于哈希函數(shù)的設(shè)計(jì)和內(nèi)存管理器我將會(huì)專門發(fā)文,所以在這里就沒有贅述,愿今后繼續(xù)關(guān)注、指教,謝謝!  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用
            2011-09-10 19:52 | 遠(yuǎn)野嘉一
            @李立強(qiáng)
            謝謝建議,這個(gè)typedef加上應(yīng)該是很好的,至于封裝問題我以為是具體操作的事情了,應(yīng)該不用贅述所以就沒講。。。以后會(huì)注意。  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用[未登錄]
            2011-09-10 21:26 | Chipset
            @遠(yuǎn)野嘉一
            不是批評(píng),而是交流心得或者說互相學(xué)習(xí)。我說話不會(huì)拐彎抹角客氣,請(qǐng)不要見怪。

            你給出的信息比較少,我個(gè)人覺得t_size不應(yīng)定義成常數(shù),對(duì)于靜態(tài)表初始化時(shí)指定容量就行了,如果是動(dòng)態(tài)表應(yīng)該能自動(dòng)調(diào)整大小。

            映射到一個(gè)數(shù)組時(shí)(對(duì)應(yīng)下標(biāo)),最好不要用取模,因?yàn)槿∧:馁M(fèi)太多CPU指令。
              回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用[未登錄]
            2011-09-11 00:01 | Jcily
            我倒是覺得博主說的言簡(jiǎn)意賅,非常節(jié)約讀者時(shí)間又把信息傳達(dá)到了。
            頂一個(gè)。  回復(fù)  更多評(píng)論
              
            # re: 淺談哈希思想的應(yīng)用[未登錄]
            2011-10-04 23:19 | Hero
            文章言簡(jiǎn)意賅,建議代碼用Coure New 字體,看起來舒服些。  回復(fù)  更多評(píng)論
              

            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理



            <2025年6月>
            25262728293031
            1234567
            891011121314
            15161718192021
            22232425262728
            293012345

            常用鏈接

            留言簿

            隨筆檔案

            文章檔案

            搜索

            •  

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            91精品无码久久久久久五月天| 97精品国产91久久久久久| 国内精品九九久久久精品| 久久久久国产精品嫩草影院| 久久精品人妻一区二区三区| 99久久国产综合精品网成人影院| 久久国产欧美日韩精品| 久久人人爽人人爽人人AV东京热| 久久精品无码一区二区WWW| 久久午夜免费视频| 久久亚洲精品国产亚洲老地址| 亚洲欧洲中文日韩久久AV乱码| 久久免费99精品国产自在现线| 国产精品成人99久久久久91gav| 国产精品久久自在自线观看| 久久青草国产精品一区| 青青青青久久精品国产h| 91精品无码久久久久久五月天| 久久99热这里只有精品国产| 久久久久国产成人精品亚洲午夜| 久久AⅤ人妻少妇嫩草影院| 亚洲欧美一区二区三区久久| 久久久久久久久久久精品尤物| 久久精品天天中文字幕人妻| 狠狠色丁香婷婷综合久久来 | 久久综合久久自在自线精品自 | AV无码久久久久不卡蜜桃| 97久久香蕉国产线看观看| 国产午夜福利精品久久| 性做久久久久久免费观看| 无码人妻少妇久久中文字幕蜜桃| 久久噜噜电影你懂的| 欧美激情精品久久久久久| 久久亚洲私人国产精品vA| 久久精品?ⅴ无码中文字幕| 久久精品亚洲AV久久久无码| 久久这里只有精品首页| 国内高清久久久久久| 91精品国产综合久久香蕉 | 久久无码国产| 亚洲中文字幕无码一久久区|