• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            小四的海市蜃樓
            Never surrender to complexity
            posts - 21,comments - 59,trackbacks - 0

            寫了一個(gè)哈希表模板類,用于統(tǒng)計(jì)一篇文章中不同單詞出現(xiàn)的次數(shù)。哈希表使用char*作為key,使用桶式鏈表指針數(shù)組(指向結(jié)點(diǎn)鏈表的指針數(shù)組)來索引,字符串哈希函數(shù)是在網(wǎng)上搜來的。模板參數(shù)一個(gè)是值類型,另一個(gè)NBARREL是指針數(shù)組的大小,通常是越大哈希值沖突就越少,結(jié)點(diǎn)鏈表長(zhǎng)度也就越短,當(dāng)然查找就越快。

            為了方便統(tǒng)計(jì),為哈希表增加了一個(gè)IncValue函數(shù),提高效率。統(tǒng)計(jì)的時(shí)候使用了快速排序,為了提高效率,
            把上次的快排模板稍微修改了一下,直接對(duì)指針數(shù)組進(jìn)行排序,就不用進(jìn)行值的交換了。

             

            /********************************************************************
                created:    2007/12/30
                filename:   hashtable.h
                author:     dj
                purpose:    哈希表模板類
            *********************************************************************/


               #ifndef __HASHTABLE_H__
            #define __HASHTABLE_H__

            #define SAFE_DELETE(p) {if(p) { delete [] (p); (p) = NULL;}}

            template
            <typename T>
            void quicksort(T* v, int n)
            {
                
            if (n<=1)
                    
            return;
                
            int last = 0;
                
            int pivot = rand()%n;
                swap(v, 
            0, pivot);
                
            for (int i = 1; i < n; i++)
                
            {
                    
            if ((*v[i])>(*v[0]))
                        swap(v, 
            ++last, i);
                }

                swap(v, last, 
            0);
                quicksort(
            &v[0], last);
                quicksort(
            &v[last+1], n-last-1);
            }


            template
            <typename T>
            void swap(T* v, int i, int j)
            {
                T tmp 
            = v[i];
                v[i] 
            = v[j];
                v[j] 
            = tmp;    
            }



            template
            <typename T, int NBARREL = 100>
            class HashTable
            {
            public:
                HashTable():m_nCount(
            0)
                
            {
                    memset(m_pNodes, NULL, 
            sizeof(void*)*NBARREL);
                }

                
            ~HashTable()
                
            {
                    FreeTable();
                }

                
            bool Exists(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return true;
                        p 
            = p->next;
                    }

                    
            return false;
                }

                
            bool AddNode(const char* sName, const T& tValue)
                
            {
                    
            if (Exists(sName))
                        
            return false;
                    
            int h = Hash(sName);
                    HashNode
            * node = new HashNode(sName, tValue);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                    
            return true;
                }

                T GetValue(
            const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return p->value;
                        p 
            = p->next;
                    }

                    
            return NULL;
                }

                
            bool SetValue(const char* sName, const T& tValue)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value = tValue;
                            
            return true;
                        }

                        p 
            = p->next;
                    }

                }

                
            void IncValue(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value++;
                            
            return;
                        }

                        p 
            = p->next;
                    }
                    
                    HashNode
            * node = new HashNode(sName, 1);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                }

                
            void Dump(const char* sFile)
                
            {
                    ofstream file(sFile);
                    assert(file
            !=NULL);
                    HashNode
            ** pNodes = new HashNode*[m_nCount];
                    
            int i, counter = 0;
                    
            for(i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            pNodes[counter
            ++= p;
                            p 
            = p->next;
                        }

                    }

                    quicksort(pNodes, m_nCount);
                    
            for (i = 0; i < m_nCount; i++)
                    
            {
                        file
            <<pNodes[i]->value<<"  "<<pNodes[i]->name<<endl;
                    }


                    SAFE_DELETE(pNodes);
                    file.close();
                }

            private:
                
            int Hash(const char* c)
                
            {
                    
            int ret=0
                    
            int n, v, r; 
                    
            if ((c == NULL) || (*== '\0')) 
                    
            return(ret); 
                    n
            =0x100
                    
            while (*c) 
                    

                        v
            =n|(*c); 
                        n
            +=0x100
                        r
            = (int)((v>>2)^v)&0x0f
                        ret
            =(ret!=(32-r)); 
                        ret
            &=0xFFFFFFFFL
                        ret
            ^=v*v; 
                        c
            ++
                    }
             
                    
            return(((ret>>16)^ret)%NBARREL);         
                }

                
            void FreeTable()
                
            {
                    
            for(int i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            HashNode
            * pnext = p->next;
                            delete p;
                            p 
            = pnext;
                        }

                    }

                }

            private:
                
            struct HashNode
                
            {
                    HashNode(
            const char* c, const T& v)
                    
            {
                        name 
            = new char[strlen(c)+1];
                        strcpy(name, c);
                        value 
            = v;
                    }

                    
            ~HashNode()
                    
            {
                        SAFE_DELETE(name);
                    }

                    
            bool operator > (const HashNode& node) const
                    
            {
                        
            return (this->value > node.value);
                    }

                    
            bool operator < (const HashNode& node) const
                    
            {
                        
            return (this->value < node.value);
                    }

                    
            bool operator == (const HashNode& node) const
                    
            {
                        
            return (this->value == node.value);
                    }

                    
            char* name;
                    T value;
                    HashNode
            * next;
                }
            ;
                HashNode
            * m_pNodes[NBARREL];
                
            int m_nCount;
            }
            ;


            #endif //__HASHTABLE_H__


            測(cè)試程序如下

            int main(int argc, char* argv[])
            {
                HashTable
            <int500> h;
                ifstream f(
            "c:\\test.txt");
                
            string s;
                
            while(f>>s)
                
            {
            //        if (h.Exists(s.c_str()))
            //        {
            //            h.SetValue(s.c_str(), h.GetValue(s.c_str())+1);
            //        }
            //        else
            //        {
            //            h.AddNode(s.c_str(), 1);
            //        }
                    h.IncValue(s.c_str());
                }

                h.Dump(
            "c:\\stat.txt");    
                
            return 0;
            }

            隨便在google上找了幾個(gè)英文網(wǎng)頁(yè)來統(tǒng)計(jì),
            發(fā)現(xiàn)排第一位的單詞是"2007",第二位的居然是"die"

            程序設(shè)計(jì)實(shí)踐上說,用素?cái)?shù)作為數(shù)組的大小是明智的,因?yàn)檫@樣能保證在數(shù)組大小、散列的乘數(shù)和可能的數(shù)據(jù)值之間不存在公因子,我覺得他特指java的散列函數(shù)
            enum{MULTIPLIER = 37}
            unsigned 
            int hash(char* str)

               unsigned 
            int h = 0;
               unsigned 
            char* p;
               
            for(p=str;*p!=0;p++)
                  h 
            = MULTIPLIER*h+*p;
               
            return h%NHASH;
            }


            最后附幾個(gè)經(jīng)典字符串哈希函數(shù)來自
            http://www.oioj.net/blog/user3/28679/archives/2005/166870.shtml

            posted on 2007-12-30 15:13 小四 閱讀(551) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 算法與數(shù)據(jù)結(jié)構(gòu)
            美女久久久久久| 好久久免费视频高清| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 久久93精品国产91久久综合| 久久久精品日本一区二区三区 | 久久99国产一区二区三区| 久久天天躁狠狠躁夜夜av浪潮 | 精品久久久久久无码人妻蜜桃| 日韩亚洲国产综合久久久| 久久夜色精品国产欧美乱| 色综合久久中文综合网| 欧美一级久久久久久久大| 99久久国产综合精品麻豆| 国产精品久久久久久五月尺| 国产V亚洲V天堂无码久久久| 久久久久久青草大香综合精品| 亚洲AV日韩精品久久久久久| 久久久久无码精品国产app| 国产成人久久AV免费| 一本久久a久久精品综合香蕉| 久久美女人爽女人爽| AV无码久久久久不卡蜜桃| 久久亚洲AV无码精品色午夜麻豆| 国产无套内射久久久国产| 久久99国产亚洲高清观看首页 | 99久久免费国产特黄| 精品国产乱码久久久久久呢| 国产精品久久久久乳精品爆 | 国产免费福利体检区久久| 国内精品久久久久| 久久丫精品国产亚洲av| 亚洲AV日韩精品久久久久| 久久人人爽人人爽人人片AV东京热| 精品水蜜桃久久久久久久| 99久久婷婷国产一区二区| 99久久免费国产精品| 久久婷婷五月综合成人D啪| 狠狠久久综合伊人不卡| 久久激情五月丁香伊人| 久久久久久极精品久久久| 久久99精品免费一区二区|