青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

foxriver
Keep It Simple and Stupid.
posts - 12,  comments - 39,  trackbacks - 0

當QQ群聊天記錄日積月累,達到一定數量級的時候,要查找某些單一文字,往往會花費10幾秒甚至幾分鐘才有反應。除去磁盤讀取的時間,是否對聊天記錄做一個全局索引也是個重要的優化,這篇文章就是為了優化文本查找速度,介紹一個最簡單的方法。

試著把QQ每條聊天記錄看成SQL里單一記錄,對單條記錄做全文索引。這里用的方法是bit位快速匹配。假設一條聊天記錄是"test", 轉換成16進制,就是"74 65 73 74", 對單條記錄,定義196位bit空間(占用24字節),定義為數組A, 然后按bit層(注意不是字節)做or操作:  (A = A or N, 把A的第N個bit設置為1)

初始狀態:
A = 0;        // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

使用時,給需要查找的字符串建立相同大小的bit索引B,對查找數據"es"做相同處理:

B = 0;
B = B or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
B = B or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x08,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

然后把A和B做and操作,如果結果為空(完全沒有交集),則可以快速跳過這條記錄,而不用去判斷實際內容中是否包含了查找文本。

if (B & A)
{
  // 兩者索引存在交集,有一定的可能性,處理進一步文字查找操作。
}
else
{
  // 兩者不可能有包含關系,直接跳過本條記錄內容,判斷數據庫下一條記錄。
}

原理很簡單,就是求兩者的交集,但往往簡單的索引,能帶來意想不到的速度提升。實際測試中,只要輸入的查找文本比較短小,大約30%~60%上下浮動的數據都能直接略過,大大節省了查找總耗時。

本人實現中,中文的查找方法相當于兩個單字節的英文,為了最大效率利用空間,用算法把中文每個BYTE都壓縮在196bit之內。

posted on 2011-01-14 01:22 foxriver 閱讀(2237) 評論(6)  編輯 收藏 引用

FeedBack:
# re: C++ 【原創算法】實現一個最簡單bit位全文查找索引。
2011-01-14 09:30 | atyuwen
你這個不就是bloom filter的山寨版么,而且hash時并沒有考慮到pattern中的字母順序,結果退化成了一個普通的字符集求交。  回復  更多評論
  
# re: C++ 實現一個最簡單bit位全文查找索引。
2011-01-14 09:42 | foxriver
@atyuwen

啥,已經有人實現過了?有點杯具,去找來bloom filter研究研究。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 12:03 | waiting4you
和布隆算法還是不太一樣的,有創意~~
只是有個地方沒看懂,A = A or 0x74怎么運算呢?怎么得到...0x16...的?謝謝  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 14:28 | foxriver
@waiting4you

杯具,測試數據寫錯了,是十進制的結果,被我寫成了16進制,已經修正。感謝。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 21:50 | qiuxiafei
額 確實是bloomfilter....
不過還是很贊 異曲同工  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-02-12 17:57 | 隨便寫寫~~
@waiting4you
嘗試做了下,還不錯~~

public void or(byte[] input, byte index) {
int move = index % 8;
int fix = index / 8;
input[fix] |= (byte)(1 << move);
}

public bool and(byte[] input1, byte[] input2) {
for (int i = 0; i < input1.Length; i++) {
int x = input1[i] & input2[i];
if (x > 0)
return true;
}
return false;
}  回復  更多評論
  

<2025年9月>
31123456
78910111213
14151617181920
21222324252627
2829301234
567891011

常用鏈接

留言簿(3)

隨筆檔案

文章檔案

相冊

1

搜索

  •  

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            国产欧美 在线欧美| 亚洲精品综合精品自拍| 亚洲国产成人午夜在线一区| 国产酒店精品激情| 国产欧美一区在线| 国产日韩欧美在线播放| 影音先锋日韩精品| 在线播放不卡| 亚洲国产精彩中文乱码av在线播放| 狠狠噜噜久久| 在线观看日韩国产| 亚洲精品一区二区三区四区高清 | 久久福利精品| 久久久成人网| 欧美高清视频在线观看| 亚洲免费电影在线| 先锋影音久久| 欧美暴力喷水在线| 国产精品视频福利| 亚洲国产三级网| 亚洲午夜视频在线观看| 久久xxxx精品视频| 亚洲国产婷婷香蕉久久久久久99| 欧美日韩aaaaa| 欧美日韩中文字幕| 国产一区二三区| 日韩午夜免费| 久久精品国产精品| 亚洲日本一区二区| 性xx色xx综合久久久xx| 欧美多人爱爱视频网站| 国产欧美日韩综合一区在线观看| 国内成人精品一区| 亚洲天堂av电影| 美女露胸一区二区三区| 一本一本久久a久久精品综合麻豆| 欧美在线视频一区二区| 欧美日韩性生活视频| 一区精品在线播放| 香蕉久久夜色精品国产| 亚洲黄色av一区| 久久久久久久激情视频| 国产精品久久久久久模特 | 亚洲午夜在线| 欧美福利视频网站| 国产视频一区在线观看| 亚洲在线黄色| 亚洲精品视频啊美女在线直播| 欧美一级黄色录像| 国产精品美女主播在线观看纯欲| 日韩视频一区二区在线观看| 久久精品一区二区三区不卡| 亚洲视频综合在线| 欧美日韩精品欧美日韩精品| 亚洲黄一区二区| 麻豆9191精品国产| 久久久久国产精品一区二区| 国产亚洲欧美日韩一区二区| 性欧美在线看片a免费观看| 亚洲伦理自拍| 欧美日韩综合久久| 中日韩美女免费视频网站在线观看| 亚洲国产精品视频| 女仆av观看一区| 亚洲国产乱码最新视频| 看欧美日韩国产| 久久国产精品第一页| 国产亚洲欧美一区| 久久视频一区| 久久久精品国产免费观看同学| 国产午夜精品全部视频在线播放 | 欧美在线视频一区二区| 亚洲精选视频在线| 欧美日韩情趣电影| 亚洲天堂网站在线观看视频| 日韩视频免费在线观看| 中日韩美女免费视频网站在线观看| 欧美精品videossex性护士| 亚洲精品一区二区三区樱花| 亚洲第一成人在线| 欧美日韩国产精品一区二区亚洲| 一区二区三区四区精品| 一区二区三区欧美在线观看| 国产精品国产三级国产专区53| 亚洲欧美日韩国产另类专区| 亚洲欧美成人网| 伊人久久av导航| 欧美国产日韩精品免费观看| 欧美日韩一区在线观看视频| 午夜久久电影网| 久久久久久夜精品精品免费| 亚洲精品资源美女情侣酒店| 一区二区免费在线视频| 国产日韩欧美制服另类| 欧美 日韩 国产 一区| 欧美国产一区视频在线观看| 亚洲综合色视频| 久久综合色播五月| 亚洲一区二区av电影| 久久爱另类一区二区小说| 永久免费精品影视网站| 亚洲精品综合精品自拍| 国产日韩精品入口| 亚洲激情图片小说视频| 国产精品乱看| 亚洲国产成人av好男人在线观看| 国产精品久久久久久五月尺| 免费久久久一本精品久久区| 国产精品va| 亚洲福利视频专区| 国产欧亚日韩视频| 亚洲欧洲精品一区二区精品久久久 | 亚洲麻豆av| 午夜亚洲福利| av成人天堂| 美日韩免费视频| 久久欧美肥婆一二区| 国产精品成人久久久久| 亚洲国产精品成人| 永久555www成人免费| 欧美一区网站| 亚洲少妇中出一区| 牛牛精品成人免费视频| 久久午夜电影| 国产视频在线观看一区二区| 亚洲一区二区三区在线| 亚洲深夜福利视频| 欧美久久视频| 亚洲欧洲三级电影| 亚洲区在线播放| 久久综合影音| 欧美高清不卡| 在线播放亚洲| 噜噜噜噜噜久久久久久91 | 久久精品一本久久99精品| 欧美系列精品| 亚洲精品小视频在线观看| 最新亚洲电影| 亚洲乱码国产乱码精品精天堂| 亚洲国产日韩一级| 免费看av成人| 亚洲国产日韩欧美综合久久| 91久久精品久久国产性色也91| 久久性天堂网| 欧美激情在线| 99国产麻豆精品| 欧美日韩高清免费| 亚洲性夜色噜噜噜7777| 欧美在线日韩精品| 国产一区二区中文| 久久色在线观看| 亚洲国产精品一区二区尤物区| 亚洲人成网站777色婷婷| 欧美成人一区二区三区在线观看| 亚洲激情在线观看| 亚洲男人影院| 国产中文一区二区| 欧美/亚洲一区| 日韩一级在线| 欧美一区午夜视频在线观看| 狠狠狠色丁香婷婷综合激情| 麻豆国产精品va在线观看不卡| 欧美激情第10页| 亚洲综合三区| 伊人久久亚洲美女图片| 欧美精品一区在线播放| 亚洲欧美日本在线| 欧美国产综合视频| 性8sex亚洲区入口| 亚洲福利视频三区| 欧美日韩视频在线一区二区观看视频 | 老司机一区二区| 亚洲激情成人网| 国产精品久久77777| 久久精品人人做人人爽电影蜜月| 亚洲国产精品传媒在线观看| 午夜欧美大片免费观看| 亚洲电影天堂av| 欧美色综合天天久久综合精品| 欧美在线亚洲| 一区二区三区.www| 噜噜噜噜噜久久久久久91 | 国产亚洲欧美中文| 欧美金8天国| 久久成人这里只有精品| 亚洲精品欧美极品| 久久久久久夜| 亚洲欧美日韩一区在线| 国产精品久久77777| 久久久精品五月天| 亚洲欧美日韩视频二区| 91久久久久久国产精品| 久久天天躁狠狠躁夜夜av| 一区二区三区四区五区精品视频| 国产在线视频欧美| 欧美性理论片在线观看片免费| 久久九九热免费视频| 午夜日韩av| 亚洲调教视频在线观看| 91久久午夜|