青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆 - 42  文章 - 3  trackbacks - 0
<2011年3月>
272812345
6789101112
13141516171819
20212223242526
272829303112
3456789

常用鏈接

留言簿(2)

隨筆檔案

文章檔案

網頁收藏

搜索

  •  

最新評論

閱讀排行榜

評論排行榜

問題實例:給你A,B兩個文件,各存放50億條URL,每條URL占用64字節,內存限制是4G,讓你找出A,B文件共同的URL。如果是三個乃至n個文件呢?

根據這個問題我們來計算下內存的占用,4G=2^32大概是40億*8大概是340億,n=50億,如果按出錯率0.01算需要的大概是650億個bit。現在可用的是340億,相差并不多,這樣可能會使出錯率上升些。另外如果這些urlip是一一對應的,就可以轉換成ip,則大大簡單了。

問題實例:
1).海量日志數據,提取出某日訪問百度次數最多的那個IP。

IP的數目還是有限的,最多2^32個,所以可以考慮使用hash將ip直接存入內存,然后進行統計。

問題實例:

1)已知某個文件內包含一些電話號碼,每個號碼為8位數字,統計不同號碼的個數。

8位最多99 999 999,大概需要99m個bit,大概10幾m字節的內存即可。

2)2.5億個整數中找出不重復的整數的個數,內存空間不足以容納這2.5億個整數。

將bit-map擴展一下,用2bit表示一個數即可,0表示未出現,1表示出現一次,2表示出現2次及以上。或者我們不用2bit來進行表示,我們用兩個bit-map即可模擬實現這個2bit-map。

問題實例:
1)100w個數中找最大的前100個數。

用一個100個元素大小的最小堆即可。

問題實例:
1).2.5億個整數中找出不重復的整數的個數,內存空間不足以容納這2.5億個整數。

有點像鴿巢原理,整數個數為2^32,也就是,我們可以將這2^32個數,劃分為2^8個區域(比如用單個文件代表一個區域),然后將數據分離到不同的區域,然后不同的區域在利用bitmap就可以直接解決了。也就是說只要有足夠的磁盤空間,就可以很方便的解決。

2).5億個int找它們的中位數。

這個例子比上面那個更明顯。首先我們將int劃分為2^16個區域,然后讀取數據統計落到各個區域里的數的個數,之后我們根據統計結果就可以判斷中位數落到那個區域,同時知道這個區域中的第幾大數剛好是中位數。然后第二次掃描我們只統計落在這個區域中的那些數就可以了。

實際上,如果不是int是int64,我們可以經過3次這樣的劃分即可降低到可以接受的程度。即可以先將int64分成2^24個區域,然后確定區域的第幾大數,在將該區域分成2^20個子區域,然后確定是子區域的第幾大數,然后子區域里的數的個數只有2^20,就可以直接利用direct addr table進行統計了。

問題實例:
1).有一個1G大小的一個文件,里面每一行是一個詞,詞的大小不超過16個字節,內存限制大小是1M。返回頻數最高的100個詞。

這個數據具有很明顯的特點,詞的大小為16個字節,但是內存只有1m做hash有些不夠,所以可以用來排序。內存可以當輸入緩沖區使用。

問題實例:
1).有10個文件,每個文件1G, 每個文件的每一行都存放的是用戶的query,每個文件的query都可能重復。要你按照query的頻度排序 。

2).1000萬字符串,其中有些是相同的(重復),需要把重復的全部去掉,保留沒有重復的字符串。請問怎么設計和實現?

3).尋找熱門查詢:查詢串的重復度比較高,雖然總數是1千萬,但如果除去重復后,不超過3百萬個,每個不超過255字節。

1. 給你A,B兩個文件,各存放50億條URL,每條URL占用64字節,內存限制是4G,讓你找出:A,B文件共同的URL。 
解法一:Hash成內存大小的小塊文件,然后分塊內存內查交集。
解法二:Bloom Filter(廣泛應用于URL過濾、查重。參考http://en.wikipedia.org/wiki/Bloom_filterhttp://blog.csdn.net/jiaomeng/archive/2007/01/28/1496329.aspx

2. 有10個文件,每個文件1G, 每個文件的每一行都存放的是用戶的query,每個文件的query都可能重復。要你按照query的頻度排序。
解法一:根據數據稀疏程度算法會有不同,通用方法是用Hash把文件重排,讓相同query一定會在同一個文件,同時進行計數,然后歸并,用最小堆來統計頻度最大的。
解法二:類似1,但是用的是與簡單Bloom Filter稍有不同的CBF(Counting Bloom Filter)或者更進一步的SBF(Spectral Bloom Filter,參考http://blog.csdn.net/jiaomeng/archive/2007/03/19/1534238.aspx
解法三:MapReduce,幾分鐘可以在hadoop集群上搞定。參考http://en.wikipedia.org/wiki/MapReduce

3. 有一個1G大小的一個文件,里面每一行是一個詞,詞的大小不超過16個字節,內存限制大小是1M。返回頻數最高的100個詞。
解法一:跟2類似,只是不需要排序,各個文件分別統計前100,然后一起找前100。

posted on 2011-03-14 14:25 鷹擊長空 閱讀(1247) 評論(0)  編輯 收藏 引用

只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲成人自拍视频| 欧美精品18+| 亚洲日本激情| 欧美成人精精品一区二区频| 久久成人精品电影| 久久久视频精品| 久久精品国产精品 | 欧美不卡在线视频| 欧美成人a视频| 亚洲国产va精品久久久不卡综合| 亚洲精品一区中文| 亚洲一区国产| 久久久www成人免费毛片麻豆| 久久亚洲欧美国产精品乐播| 欧美精品在线一区| 国产免费亚洲高清| 亚洲人成网站777色婷婷| 亚洲一区二区三区成人在线视频精品 | 欧美成人高清视频| 久久久xxx| 欧美精品久久久久久久免费观看| 欧美四级在线观看| 国产一区二区激情| 日韩一本二本av| 久久久99免费视频| 99国产精品久久久久老师| 性欧美xxxx视频在线观看| 欧美激情第4页| 黑人巨大精品欧美黑白配亚洲| 99国产精品久久久| 亚洲伦理在线免费看| 欧美在线免费视屏| 亚洲黄色影片| 欧美中文字幕在线播放| 欧美伦理视频网站| 伊人天天综合| 欧美亚洲色图校园春色| 亚洲电影免费| 久久精品国产视频| 国产精品视频网| 亚洲网站视频| 亚洲激情中文1区| 可以免费看不卡的av网站| 国产欧美日韩另类视频免费观看| 国产精品99久久99久久久二8| 久久综合一区二区三区| 午夜精品视频| 国产伦精品一区二区| 亚洲影院在线| 亚洲精品国精品久久99热一| 久久视频精品在线| 国产亚洲精品bt天堂精选| 亚洲一级高清| 亚洲电影自拍| 米奇777在线欧美播放| 影音先锋在线一区| 久久亚洲风情| 久久久噜噜噜久久狠狠50岁| 国产一区二区精品在线观看| 欧美中文字幕视频| 亚洲欧美日韩直播| 国产麻豆视频精品| 久久成人精品| 久久免费视频网| 亚洲国产欧美一区二区三区同亚洲 | 欧美日韩视频| 夜久久久久久| 一本久久综合| 国产精品美女久久久久av超清| 亚洲欧美日韩一区| 午夜精品久久99蜜桃的功能介绍| 国产欧美日韩亚洲| 欧美国产精品专区| 欧美另类变人与禽xxxxx| 亚洲精品美女在线观看播放| 亚洲福利在线看| 欧美日韩日日骚| 欧美一区二区精品| 久久蜜桃香蕉精品一区二区三区| 亚洲国产免费| 国产精品99久久久久久久vr| 国产欧美一区二区三区视频| 老司机午夜精品| 欧美了一区在线观看| 午夜影院日韩| 久久亚洲高清| 亚洲一区在线直播| 久久精品女人| 亚洲视频在线二区| 久久大香伊蕉在人线观看热2| 亚洲黄色一区| 亚洲午夜久久久久久久久电影院 | 国产免费观看久久黄| 看片网站欧美日韩| 欧美日本三区| 久久午夜国产精品| 欧美日韩国产成人| 久久久视频精品| 欧美三级中文字幕在线观看| 久久免费国产精品| 欧美日韩一区二区三区高清| 久久亚洲一区二区| 欧美日韩国产va另类| 久久综合色婷婷| 国产精品高潮呻吟久久av黑人| 久久伊人一区二区| 欧美精品日韩www.p站| 久久久午夜电影| 欧美手机在线| 亚洲精品123区| 在线观看日韩国产| 亚洲欧美日本日韩| 一区二区三区高清在线| 久久久久青草大香线综合精品| 亚洲综合清纯丝袜自拍| 蜜臀va亚洲va欧美va天堂| 欧美一区二区三区啪啪| 欧美精品福利| 欧美电影免费观看| 狠狠入ady亚洲精品| 午夜精品久久久久99热蜜桃导演| 亚洲视频一区在线观看| 欧美精品乱人伦久久久久久| 欧美国产视频一区二区| 亚洲第一黄色网| 久久精品亚洲精品国产欧美kt∨| 亚洲伊人伊色伊影伊综合网| 欧美美女bbbb| 亚洲国产综合视频在线观看| 亚洲国产精品久久久| 久久精品2019中文字幕| 久久精品久久综合| 国产毛片一区二区| 午夜一区二区三区不卡视频| 欧美一区2区三区4区公司二百| 欧美视频在线免费| 亚洲国产精品日韩| 老色鬼久久亚洲一区二区 | 欧美成人一区二区三区片免费| 久久久国产成人精品| 国产日韩在线看片| 亚洲综合成人在线| 欧美在线观看网址综合| 国产午夜精品麻豆| 久久精品国产96久久久香蕉| 久久蜜桃香蕉精品一区二区三区| 国产无一区二区| 久久九九国产| 欧美电影资源| 99视频+国产日韩欧美| 欧美日韩精品| 亚洲午夜久久久久久久久电影院| 午夜亚洲一区| 国产在线视频不卡二| 性欧美18~19sex高清播放| 久久夜色精品国产亚洲aⅴ| 国产一区二区三区日韩| 久久久久免费视频| 亚洲经典在线| 亚洲欧美中文字幕| 国产一区二区三区视频在线观看 | 国产精品久久久久免费a∨| 亚洲欧美99| 老色鬼精品视频在线观看播放| 亚洲精品中文字幕女同| 国产精品久久久久久久久借妻| 性欧美18~19sex高清播放| 亚洲成色www8888| 亚洲视频国产视频| 国产亚洲精品一区二555| 久热精品在线| 亚洲一级片在线看| 久热精品视频在线| 亚洲毛片在线| 国际精品欧美精品| 欧美日本在线观看| 欧美一级黄色录像| 亚洲国产精品va在线看黑人动漫 | 亚洲国产高清一区| 欧美视频二区| 久久久久亚洲综合| 一区二区三区成人精品| 免费高清在线视频一区·| 亚洲一区二三| 亚洲人成久久| 国产精品中文在线| 欧美日韩国产首页在线观看| 欧美伊久线香蕉线新在线| 亚洲精品视频在线观看网站 | 亚洲欧美日韩国产一区| 91久久国产综合久久| 久久综合精品国产一区二区三区| 亚洲一区中文字幕在线观看| 亚洲黄一区二区| 黄色一区二区三区四区| 国产精品青草久久| 欧美日韩国产综合在线| 麻豆国产va免费精品高清在线| 午夜国产欧美理论在线播放| 一区二区高清在线观看|