• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            小四的海市蜃樓
            Never surrender to complexity
            posts - 21,comments - 59,trackbacks - 0

            寫了一個哈希表模板類,用于統計一篇文章中不同單詞出現的次數。哈希表使用char*作為key,使用桶式鏈表指針數組(指向結點鏈表的指針數組)來索引,字符串哈希函數是在網上搜來的。模板參數一個是值類型,另一個NBARREL是指針數組的大小,通常是越大哈希值沖突就越少,結點鏈表長度也就越短,當然查找就越快。

            為了方便統計,為哈希表增加了一個IncValue函數,提高效率。統計的時候使用了快速排序,為了提高效率,
            把上次的快排模板稍微修改了一下,直接對指針數組進行排序,就不用進行值的交換了。

             

            /********************************************************************
                created:    2007/12/30
                filename:   hashtable.h
                author:     dj
                purpose:    哈希表模板類
            *********************************************************************/


               #ifndef __HASHTABLE_H__
            #define __HASHTABLE_H__

            #define SAFE_DELETE(p) {if(p) { delete [] (p); (p) = NULL;}}

            template
            <typename T>
            void quicksort(T* v, int n)
            {
                
            if (n<=1)
                    
            return;
                
            int last = 0;
                
            int pivot = rand()%n;
                swap(v, 
            0, pivot);
                
            for (int i = 1; i < n; i++)
                
            {
                    
            if ((*v[i])>(*v[0]))
                        swap(v, 
            ++last, i);
                }

                swap(v, last, 
            0);
                quicksort(
            &v[0], last);
                quicksort(
            &v[last+1], n-last-1);
            }


            template
            <typename T>
            void swap(T* v, int i, int j)
            {
                T tmp 
            = v[i];
                v[i] 
            = v[j];
                v[j] 
            = tmp;    
            }



            template
            <typename T, int NBARREL = 100>
            class HashTable
            {
            public:
                HashTable():m_nCount(
            0)
                
            {
                    memset(m_pNodes, NULL, 
            sizeof(void*)*NBARREL);
                }

                
            ~HashTable()
                
            {
                    FreeTable();
                }

                
            bool Exists(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return true;
                        p 
            = p->next;
                    }

                    
            return false;
                }

                
            bool AddNode(const char* sName, const T& tValue)
                
            {
                    
            if (Exists(sName))
                        
            return false;
                    
            int h = Hash(sName);
                    HashNode
            * node = new HashNode(sName, tValue);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                    
            return true;
                }

                T GetValue(
            const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return p->value;
                        p 
            = p->next;
                    }

                    
            return NULL;
                }

                
            bool SetValue(const char* sName, const T& tValue)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value = tValue;
                            
            return true;
                        }

                        p 
            = p->next;
                    }

                }

                
            void IncValue(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value++;
                            
            return;
                        }

                        p 
            = p->next;
                    }
                    
                    HashNode
            * node = new HashNode(sName, 1);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                }

                
            void Dump(const char* sFile)
                
            {
                    ofstream file(sFile);
                    assert(file
            !=NULL);
                    HashNode
            ** pNodes = new HashNode*[m_nCount];
                    
            int i, counter = 0;
                    
            for(i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            pNodes[counter
            ++= p;
                            p 
            = p->next;
                        }

                    }

                    quicksort(pNodes, m_nCount);
                    
            for (i = 0; i < m_nCount; i++)
                    
            {
                        file
            <<pNodes[i]->value<<"  "<<pNodes[i]->name<<endl;
                    }


                    SAFE_DELETE(pNodes);
                    file.close();
                }

            private:
                
            int Hash(const char* c)
                
            {
                    
            int ret=0
                    
            int n, v, r; 
                    
            if ((c == NULL) || (*== '\0')) 
                    
            return(ret); 
                    n
            =0x100
                    
            while (*c) 
                    

                        v
            =n|(*c); 
                        n
            +=0x100
                        r
            = (int)((v>>2)^v)&0x0f
                        ret
            =(ret!=(32-r)); 
                        ret
            &=0xFFFFFFFFL
                        ret
            ^=v*v; 
                        c
            ++
                    }
             
                    
            return(((ret>>16)^ret)%NBARREL);         
                }

                
            void FreeTable()
                
            {
                    
            for(int i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            HashNode
            * pnext = p->next;
                            delete p;
                            p 
            = pnext;
                        }

                    }

                }

            private:
                
            struct HashNode
                
            {
                    HashNode(
            const char* c, const T& v)
                    
            {
                        name 
            = new char[strlen(c)+1];
                        strcpy(name, c);
                        value 
            = v;
                    }

                    
            ~HashNode()
                    
            {
                        SAFE_DELETE(name);
                    }

                    
            bool operator > (const HashNode& node) const
                    
            {
                        
            return (this->value > node.value);
                    }

                    
            bool operator < (const HashNode& node) const
                    
            {
                        
            return (this->value < node.value);
                    }

                    
            bool operator == (const HashNode& node) const
                    
            {
                        
            return (this->value == node.value);
                    }

                    
            char* name;
                    T value;
                    HashNode
            * next;
                }
            ;
                HashNode
            * m_pNodes[NBARREL];
                
            int m_nCount;
            }
            ;


            #endif //__HASHTABLE_H__


            測試程序如下

            int main(int argc, char* argv[])
            {
                HashTable
            <int500> h;
                ifstream f(
            "c:\\test.txt");
                
            string s;
                
            while(f>>s)
                
            {
            //        if (h.Exists(s.c_str()))
            //        {
            //            h.SetValue(s.c_str(), h.GetValue(s.c_str())+1);
            //        }
            //        else
            //        {
            //            h.AddNode(s.c_str(), 1);
            //        }
                    h.IncValue(s.c_str());
                }

                h.Dump(
            "c:\\stat.txt");    
                
            return 0;
            }

            隨便在google上找了幾個英文網頁來統計,
            發現排第一位的單詞是"2007",第二位的居然是"die"

            程序設計實踐上說,用素數作為數組的大小是明智的,因為這樣能保證在數組大小、散列的乘數和可能的數據值之間不存在公因子,我覺得他特指java的散列函數
            enum{MULTIPLIER = 37}
            unsigned 
            int hash(char* str)

               unsigned 
            int h = 0;
               unsigned 
            char* p;
               
            for(p=str;*p!=0;p++)
                  h 
            = MULTIPLIER*h+*p;
               
            return h%NHASH;
            }


            最后附幾個經典字符串哈希函數來自
            http://www.oioj.net/blog/user3/28679/archives/2005/166870.shtml

            posted on 2007-12-30 15:13 小四 閱讀(550) 評論(0)  編輯 收藏 引用 所屬分類: 算法與數據結構
            久久亚洲2019中文字幕| 2021国产成人精品久久| 亚洲精品乱码久久久久久蜜桃| 97久久精品无码一区二区| 国产精品对白刺激久久久| 7国产欧美日韩综合天堂中文久久久久 | 亚洲欧洲久久av| 色婷婷综合久久久久中文 | 欧美精品国产综合久久| 国产精品久久久久jk制服| 亚洲国产一成久久精品国产成人综合 | 久久精品一区二区影院| 性高湖久久久久久久久| 久久黄视频| 久久99精品国产麻豆宅宅| 国产精品久久久久a影院| 久久99热精品| 日韩乱码人妻无码中文字幕久久 | 久久精品国产免费观看三人同眠| 狠狠色丁香久久婷婷综| AV无码久久久久不卡蜜桃| 青青国产成人久久91网| 精品久久久久久无码专区| 无码人妻久久一区二区三区蜜桃 | 成人妇女免费播放久久久| 久久乐国产综合亚洲精品| 国产精品女同一区二区久久| 久久综合狠狠综合久久综合88| 日本国产精品久久| 青青青国产精品国产精品久久久久| 精品久久久无码21p发布| 久久综合成人网| 日日狠狠久久偷偷色综合0| 国产日韩久久免费影院 | 伊人久久大香线蕉综合5g| 国产亚洲精午夜久久久久久| 狠狠色噜噜狠狠狠狠狠色综合久久 | 精品久久久无码人妻中文字幕| 亚洲中文字幕久久精品无码APP| 久久91精品国产91| 久久天天躁夜夜躁狠狠躁2022|