青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 5, comments - 40, trackbacks - 0, articles - 0
Hash Table(哈希表)就是根據(jù)對象的特征進(jìn)行定位的一種數(shù)據(jù)結(jié)構(gòu)。一個簡單的實(shí)現(xiàn)方法是將對象通過某種運(yùn)算得到一個整數(shù),再讓這個整數(shù)除以哈希表的大小,取其余數(shù),以此作為對象的存儲位置。
很多的書上認(rèn)為,哈希表的大小最好是選擇一個大的質(zhì)數(shù),并且最好不要和2的整數(shù)冪接近。《算法導(dǎo)論》上還認(rèn)為,最不好的選擇是哈希表的大小恰好是2的整數(shù)冪,對此的解釋是(只記得大意):因?yàn)橛嬎銠C(jī)是用二進(jìn)制存儲的,當(dāng)一個二進(jìn)制數(shù)除以一個2的整數(shù)冪的時候,結(jié)果就是這個二進(jìn)制數(shù)的后幾位,前面的位都丟失了,也就意味著丟失了一部分信息,進(jìn)而導(dǎo)致哈希表中的元素分布不均勻。
這個解釋看似合理,但我不認(rèn)同。不光是我,Java開發(fā)小組的人也不認(rèn)同。Java里的HashSet類偏偏就把哈希表的大小設(shè)置成2的整數(shù)冪。可以設(shè)想一下,對于自然數(shù)集合中的任意一個數(shù)x,對于一個正整數(shù)M,難道x mod M為某些值的概率會大些嗎?顯然不是,因?yàn)閤是在自然數(shù)集合里任選的,當(dāng)選取的次數(shù)非常多時,x mod M的結(jié)果應(yīng)該是平均分布在[0,M-1]中。我認(rèn)為《算法導(dǎo)論》的錯誤在于先引入了二進(jìn)制,其實(shí)二進(jìn)制和哈希表的“碰撞”根本沒有什么關(guān)系;然后說對除以2^n的余數(shù)會丟失位,丟失信息,這顯然也不對,因?yàn)橹灰獂>=M,x mod M的結(jié)果總是要“丟失一些信息的”。照《算法導(dǎo)論》的說法,如果計算機(jī)采用十進(jìn)制,那哈希表的容量是10^n的話豈不是很糟?這種解釋顯然站不住腳。
我認(rèn)為對于x mod M這樣的哈希函數(shù)來說,好壞應(yīng)該取決于x的生成方式和M的值。比如一個字符串“ABC”,如果我讓x("ABC")=65*128^2+66*128+67,即把字符串當(dāng)成一個128進(jìn)制的整數(shù),那么若M=128,那就很糟糕了。因?yàn)檫@樣無論是什么字符串,最終結(jié)果只取決于最后一個字符,這才會造成分布不均勻。

以上只是我個人的見解,有不妥之處歡迎指出。

Feedback

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-04 23:15 by turingbook
吹毛求疵一下:hash應(yīng)該譯為散列。
哈希這個譯法顯然是當(dāng)年初譯者誤以為人名了。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-05 00:27 by helixapp
樓主理解很正確,假如10進(jìn)制的話, 10^n 次方就不好,任意非素數(shù)都可以表示為 m1^n1 * m2^n2 * m3^n3 .... 所以說素數(shù)比其他的數(shù)字更加適合啊。

不過對于計算機(jī),2^n 次方的確是很糟的hash size, 想想你對ip地址,對內(nèi)存地址求hash吧...

不過MOD的hash方法的確有缺陷,linux kernel里面用的乘以一個大素數(shù)然后取高位的方法比這個好多了

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-05 00:29 by helixapp
BTW 我敢肯定java里面HashSet類沒有使用單純求余的方法來算hash

# re: 關(guān)于哈希表——一個常見的謬誤[未登錄]  回復(fù)  更多評論   

2008-03-05 08:46 by cppexplore
java里的hash是乘以31的:hash=hash<<5-hash+ch。
據(jù)說就英文而言,乘以33的是最優(yōu)的:hash=hash<<5+hash+ch,這個也是apache stl等一大堆著名項(xiàng)目或庫的hash方式。
特定應(yīng)用而言,還是要根據(jù)特定的數(shù)據(jù),設(shè)計最優(yōu)的hash函數(shù)。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-05 08:56 by cppexplore
上面的語句外面都是foreach(ch in str){}。
hash表的數(shù)量 應(yīng)該不是影響hash的因素吧 想不出來原因。貌似一般都把hash表的桶數(shù)量設(shè)置的很大,是實(shí)際使用到的3倍多。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-05 11:25 by abettor
同意樓主的見解。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-03-05 17:11 by #Ant
說的有一些道理,感覺hash表的大小還是要根據(jù)實(shí)際情況來選取。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-04-18 15:12 by 萬鐵
有理, 對于mod的方法,確實(shí)與素數(shù)無關(guān)。
大于mod值的所謂信息只能“丟失”,只保留小于mod值的那些“位”。

要降低這個影響,在散列函數(shù)的計算過程中,這些低位所代表的信息也要能體現(xiàn)輸入。比如對于字符串的散列函數(shù), 最好能夠把高位的字符串折回到低位去,這樣即使取余,也會保證均勻性,只不過,有一個元素對于桶的密度會增大。

能力有限, 太形式化的描述,不會。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-08-18 19:46 by roofjava@163.com
關(guān)于這個,我也認(rèn)為和2的冪數(shù)無關(guān)。但是這可能跟哈希函數(shù)的設(shè)計有關(guān),怎么說呢,很多哈希函數(shù)的設(shè)計本身是根據(jù)二進(jìn)制進(jìn)行的,所以《算法導(dǎo)論》才會得出丟失信息的結(jié)論。

不過最好還是用大數(shù)據(jù)測試比較下。

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2008-10-19 18:23 by Phoenix
哎,樓主的思維還不夠嚴(yán)謹(jǐn)……

“如果計算機(jī)采用十進(jìn)制,那哈希表的容量是10^n的話豈不是很糟?”
給1234,容量是10,求余得4,僅由最后一位得出,前面的數(shù)直接被無視了,而對9求余就不是這樣了。

“不光是我,Java開發(fā)小組的人也不認(rèn)同。”
你知道他們用的散列函數(shù)僅僅是求余?他們二者的思想沒有矛盾,是你糾結(jié)的這個矛盾。

樓主的質(zhì)疑態(tài)度還是很好的。

歡迎批評我:phoenix.0220@gmail.com

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2009-03-25 16:33 by ofan
正好看到《算法導(dǎo)論》中的hash table部分
我想《算法導(dǎo)論》中說表的大小不應(yīng)為2的整數(shù)次方,應(yīng)該是有針對性的,不是普遍的規(guī)律。

# re: 關(guān)于哈希表——一個常見的謬誤[未登錄]  回復(fù)  更多評論   

2010-08-05 14:12 by steven
一個理想的HASH函數(shù),輸出的值的每一位都“散列”的,無所謂丟失哪一部分來適應(yīng)“桶”的大小

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2012-03-12 02:32 by Wallace
豁然開朗啊

# re: 關(guān)于哈希表——一個常見的謬誤[未登錄]  回復(fù)  更多評論   

2013-01-25 16:08 by richard
使用質(zhì)數(shù)是有意義的, 雖然準(zhǔn)確的證明我不會(我也沒看到哪里有證明),
但是可以簡單說明一下.

用最簡單的hash函數(shù) h(k) = k mod m來說明.
對于任意的k1, k2,
假設(shè)事件A為k1 mod m == k2 mod m, 即k1, k2產(chǎn)生沖突的概率為p(A).
事件B_i為k1 mod m取得某個余數(shù)i, p(B_i) = 1/m,
事件C_j為k2 mod m取得某個余數(shù)j, p(C_j) = 1/m,

1. 如果m為質(zhì)數(shù):
由于k1, k2是任意選取的, 所以事件B_i和C_j是相互獨(dú)立的,
p(A) = p(B_x) * p(C_x) = 1/(m^2)

2. 如果m不為質(zhì)數(shù):
這時m可以寫成m = a * b, (a, b不等于1或m)
假設(shè)事件D為k1和k2具有公因數(shù)a(或b), 概率為p(D),
(用~D表示D不發(fā)生, 即k1,k2互質(zhì))
* 這里p(D)我不會求, 不好意思, 不過概率論里面有, 結(jié)果是6/(pi^2) *
1) 那么, 如果在D不發(fā)生的情況下, 概率和1是一樣的,
即p(A|~D) = 1/(m^2)
2) 如果D發(fā)生, 假設(shè)k1 = c1 * a, k2 = c2 * a,
事件A可轉(zhuǎn)化為c1 mod b == c2 mod b,
即p(A|D) = 1/(b^2)
于是, 我們得到了p(A) = p(A|~D) + p(A|D)
= (1-p(D)) * 1/(m^2) + p(D) * 1/(b^2)
= 1/(m^2) + p(D) * (1/(b^2) - 1/(m^2))
顯然p(D) >= 0, 1/(b^2) - 1/(m^2) > 0,
于是, p(A) = 1/(m^2) + p(D) * (1/(b^2) - 1/(m^2)) > 1/(m^2)

綜上所述, 當(dāng)m為質(zhì)數(shù)時, 事件A即產(chǎn)生碰撞的概率比m不為質(zhì)數(shù)時要小.
推廣到任意選取多個數(shù)的情況下也是成立的.

有些人可能會覺得對于任意的m, k mod m都能取到[0, m-1]的數(shù)的概率是
一樣的, 這確實(shí)沒錯. 但我們關(guān)注的問題是如何減少碰撞.

# re: 關(guān)于哈希表——一個常見的謬誤[未登錄]  回復(fù)  更多評論   

2013-01-25 16:54 by richard
不好意思, 上面關(guān)于p(D)的說明不太正確,改為

假設(shè)事件D為k1, k2, m具有公因數(shù)(a或b, 假設(shè)為a), 概率為p(D), (用~D表示D不發(fā)生)
* 這里p(D)我不會求, 不好意思, 不過兩個數(shù)互質(zhì)的概率是6/(pi^2) *

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2013-03-02 01:13 by Aule
上面的證明我覺得有問題,

2) 如果D發(fā)生, 假設(shè)k1 = c1 * a, k2 = c2 * a,
事件A可轉(zhuǎn)化為c1 mod b == c2 mod b,

這一步隱含的內(nèi)容是:
(c1*a) mod (a*b) = c1 mod b
但是同余并不具有可除性 這個等式是不成立的 因此這一步我認(rèn)為是錯了

例如k1=2*7=14,k2=5*7=35
即 c1=2,c2=5,b=u7
c1,c2在模b環(huán)境下并不同余

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2014-02-23 23:11 by rookieaca
沒看過算法導(dǎo)論,不過我的理解是否均勻,要看 x 的特征,以及選取的算法。
對于,實(shí)際應(yīng)用中, 基于內(nèi)存地址來做HASH的話,可以標(biāo)志內(nèi)存的某一塊數(shù)據(jù)(OOP可以是堆中分配的對象的地址)。在這種情況下由于很多實(shí)際的機(jī)器實(shí)現(xiàn)的地址的對齊方式,分配的內(nèi)存地址都是2的倍數(shù)。在這種情況下hash(address) = (address)MOD M,
你想想如果M=2*x的話, 分布情況會是怎么樣?

# re: 關(guān)于哈希表——一個常見的謬誤  回復(fù)  更多評論   

2014-03-25 16:13 by jaub
算法導(dǎo)論說的是正確的!
樓主說“,因?yàn)閤是在自然數(shù)集合里任選的,當(dāng)選取的次數(shù)非常多時,x mod M的結(jié)果應(yīng)該是平均分布在[0,M-1]中”。那么如果存在這樣一個集合,它的元素的低位嚴(yán)重偏斜到某幾個值,x對M=2^n取余后,剩下的低位值決定元素在哈希表中的位置,而低位會聚集在某些值上,導(dǎo)致哈希表嚴(yán)重沖突。

只有注冊用戶登錄后才能發(fā)表評論。
網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲一区二区黄色| 欧美日韩一区二区三区在线视频 | 国产精品地址| 久久手机免费观看| 国产精品久久久久久久久免费樱桃| 红桃视频国产一区| 久久久水蜜桃| 国产欧美三级| 亚洲一区尤物| 欧美伊人精品成人久久综合97| 欧美三区在线观看| 欧美专区在线| 欧美mv日韩mv国产网站| 黑人巨大精品欧美黑白配亚洲 | 性欧美激情精品| 欧美视频一区二区三区四区| 亚洲一区二区在线| 国产精品久久久久久久久久三级| 亚洲欧美日韩人成在线播放| 国产精品午夜视频| 欧美在线首页| 亚洲经典视频在线观看| 一区二区欧美日韩视频| 午夜精品久久久久久久久久久久久 | 亚洲国产婷婷香蕉久久久久久99| 亚洲国产欧美一区二区三区久久 | 亚洲精品国产品国语在线app | 一本色道久久加勒比88综合| 国产综合亚洲精品一区二| 最近看过的日韩成人| 国产一区二区精品丝袜| 欧美~级网站不卡| 夜夜嗨一区二区| 99成人在线| 激情久久一区| 先锋影音久久| 久久亚洲综合| 在线观看视频一区二区| 欧美中文日韩| 亚洲欧美日韩一区二区| 亚洲激情在线观看| 最新国产成人av网站网址麻豆| 欧美系列一区| 欧美日韩中文在线| 欧美日韩国产综合视频在线| 免费亚洲电影在线| 裸体一区二区三区| 亚洲精品麻豆| 亚洲在线中文字幕| 亚洲在线成人| 国产亚洲成人一区| 在线一区二区三区四区| 日韩午夜免费视频| 亚洲作爱视频| 欧美在线在线| 亚洲狼人综合| 欧美在线不卡| 欧美大片在线看免费观看| 亚洲精品在线观看视频| 亚洲精品日韩欧美| 亚洲午夜精品一区二区三区他趣| 99热在这里有精品免费| 亚洲人成高清| 久久精品国产第一区二区三区| 欧美一区二区三区在线观看| 激情综合网激情| 国产精品天天摸av网| 国产色婷婷国产综合在线理论片a| 国产精品欧美一区喷水| 欧美成人一区在线| 欧美午夜一区二区| 欧美日本簧片| 久久久国产视频91| 亚洲已满18点击进入久久| 欧美一区二区三区啪啪| 在线亚洲一区| 欧美日韩美女| 亚洲精品免费观看| 一区二区三区自拍| 国产麻豆视频精品| 亚洲最快最全在线视频| 夜夜嗨av色综合久久久综合网| 亚洲福利视频网站| 亚洲国产一区二区三区在线播 | 一本色道久久88综合日韩精品| 久久成人免费网| 艳妇臀荡乳欲伦亚洲一区| 精久久久久久| 快播亚洲色图| 久久这里有精品视频| 欧美激情亚洲| 亚洲欧美精品伊人久久| 亚洲一卡久久| 久热这里只精品99re8久| 亚洲电影视频在线| 欧美激情四色| 午夜精品视频一区| 欧美国产日韩在线| 国产一区二区中文字幕免费看| 一区二区在线视频观看| 一本色道精品久久一区二区三区| 日韩视频在线一区二区| 欧美视频一区二区三区四区| 久久成人国产| 久久久久久自在自线| 国产精品老女人精品视频| 久久久久久精| 国产精品女主播| 一区二区三区四区五区在线| 亚洲精品久久久久久久久久久| 欧美日韩国产精品一区| 久久人人爽国产| 国产精品夜夜夜一区二区三区尤| 亚洲欧洲日产国码二区| 欧美国产精品| 女人天堂亚洲aⅴ在线观看| 欧美伊人久久大香线蕉综合69| 亚洲另类黄色| 亚洲区一区二| 久久综合狠狠| 亚洲精品一区久久久久久| 欧美日韩国产精品一区二区亚洲| 久久精品91| 国产精品国产三级国产aⅴ9色 | 亚洲欧美一区二区精品久久久| 91久久久国产精品| 欧美日韩xxxxx| 久久久精品999| 国自产拍偷拍福利精品免费一| 制服丝袜亚洲播放| 亚洲免费在线精品一区| 欧美一区二区精品久久911| 亚洲一区二区三区在线播放| 欧美日韩国产精品专区| 亚洲欧洲在线视频| 亚洲一区二区三区涩| 久久久91精品国产一区二区精品| 欧美一区二区三区免费看| 国产精品亚洲美女av网站| 久久精品国产v日韩v亚洲| 亚洲日本久久| 国产欧美亚洲一区| 亚洲精品日韩激情在线电影| 激情久久综艺| 欧美在线电影| 一本色道久久综合一区| 欧美成人在线免费观看| 国产女优一区| 欧美区国产区| 亚洲人成在线播放网站岛国| 久久久国产亚洲精品| 中文在线一区| 国产精品午夜久久| 欧美日韩高清在线| 欧美激情综合色| 美女图片一区二区| 影音先锋久久| 国产香蕉97碰碰久久人人| 日韩一级视频免费观看在线| 亚洲欧美激情一区二区| 在线看国产日韩| 欧美日韩三级一区二区| 欧美在线视频免费| 日韩亚洲一区二区| 亚洲区第一页| 欧美日韩国产成人在线91| 欧美一级午夜免费电影| 亚洲精品少妇| 亚洲激情婷婷| 91久久精品国产91久久性色| 久久在线免费观看视频| 欧美一二三视频| 亚洲免费在线观看视频| 欧美一级二级三级蜜桃| 一区二区三区日韩欧美精品| 欧美日韩国产三级| 欧美午夜免费影院| 国产精品一区毛片| 久久精品视频免费| 欧美成年视频| 亚洲欧美激情在线视频| 亚洲欧美日韩另类| 麻豆av一区二区三区久久| 久久高清免费观看| 欧美国产日韩一区二区在线观看| 亚洲三级性片| 一区二区三区在线观看视频| 亚洲激情视频在线播放| 国产一区二区欧美日韩| 国产精品久久国产三级国电话系列| 国产精品成人免费视频| 美玉足脚交一区二区三区图片| 一个人看的www久久| 亚洲美女淫视频| 亚洲全部视频| 国产色综合网| 亚洲激情欧美| 欧美激情网友自拍| 久久久777| 欧美紧缚bdsm在线视频|