青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

勤能補拙,Expter

成都游戲Coder,記錄游戲開發過程的筆記和心得!

一個關鍵字過濾算法

      經常某些論壇,或者軟件中對某些字符串進行了關鍵字過濾, 一般代替為*號,一般的算法是利用strstr算法,即使是string的find子串算法復雜度也是(N*log(n)),并非kmp算法,也非bm查找子串算法。
     對于一組關鍵字過濾,特別是對于一組字符串多,且長度不規律的字符串過濾算法完全是有必要的。
   
    網上對于關鍵字過濾算法較多,且實現方法較多,本文主要介紹基于一種把關鍵字轉換為Unicode,然后對關鍵字的字符或者單個關鍵字hash求值。算法復雜度為O(n).
   對于漢字的hash值的求法,因為是Unicode編碼是16位,哈希求值:

  /// 求漢字的哈希值
long HashFun(wchar_t  word)
{
 BYTE l 
= LOBYTE(word);
 
int  h = HIBYTE(word);

 
long num = h << 8 ;
 num 
+=l;
 
return num;
}



    基本算法思想;
   1.建立2個過濾關鍵字數組:數組1:為單個字符  數組2:為2個或者多個字符
   2.求出數組1,2的hash值,數組2的hash值只求出前2個字符的hash值即可。
   3.掃描待檢測的文本,然后每次取2個字符,查找數組2是否有匹配,如果沒有則查找數組1。。。。  查找為O(1)

  主要代碼如下:


/*
   File :  WordFilter.cpp 
   brief:  關鍵字過濾程序,復雜度為O(n),線性
   Author: Expter
   Data  : 2009/06/30

   對漢字或者字符進行哈希算法,先轉換為unicode編碼,然后求其hash值。

   主要算法為:
   1.建立2個過濾關鍵字數組:數組1:為單個字符  數組2:為2個或者多個字符
   2.求出數組1,2的hash值,數組2的hash值只求出前2個字符的hash值即可。
   3.掃描待檢測的文本,然后每次取2個字符,查找數組2是否有匹配,如果沒有則查找數組1。。。。  查找為O(1)


   不足:
   不能很好的分詞。過濾不是很準確,每次只能1,2個詞的過濾。
*/

#include 
<stdlib.h>
#include 
<iostream>
#include 
<map>
#include 
<vector>
#include 
<string>
#include 
<windows.h>
#include 
<wchar.h>  
#include 
<iosfwd>
using namespace std;

wchar_t des1 [
5][2= { L"",L"",L"",L"",L""};
wchar_t des2 [
3][5= { L"用漢", L"的啥" ,L"測試啊"};
wchar_t src[]  
= { L"這個原來是打算的啥子東西用漢字只是一個是不是測試"};


/// 求漢字的哈希值
long HashFun(wchar_t  word)
{
    BYTE l 
= LOBYTE(word);
    
int  h = HIBYTE(word);

    
long num = h << 8 ;
    num 
+=l;
    
return num;
}


long HashFun(wchar_t * word)
{
    
return HashFun(word[0])*10 + HashFun(word[1]);
}



void  ParamVer(map<long,int> hashmp , wchar_t *src , int i)
{
    
long val = HashFun(src[i+1]);
    
if(hashmp[val] == 1)
    
{
        src[i
+1= L'*';
    }

}

void  VmAlorgthm(map<long,int> hashmp,wchar_t *src)
{
    
long val = 0;
    
int  m = wcslen(src) ;
    
// O(n);
    for(int i = 0 ; i < m-1  ; i ++)
    
{
        
if( HashFun(src[i]) != L'*')
        
{
            val 
= HashFun(src[i]) + HashFun(src[i+1]);
            
if( hashmp[val] == 1)
            
{
                src[i] 
= L'*';
                src[i
+1=L'*';
            }

            
else
            
{
                val 
= HashFun(src[i]);
                
if(hashmp[val] == 1)
                
{
                    src[i] 
= L'*';
                }

                
else
                
{
                    ParamVer(hashmp,src,i);
                }

            }

        }

        
else
        
{
            ParamVer(hashmp,src,i
+1);
        }

    }

    ParamVer(hashmp,src,m
-1);
}



int _tmain(int argc, _TCHAR* argv[])
{
    wcout.imbue(locale(
"chs"));     
    typedef map
<long,int> HASHMAP;

    cout 
<<" 需要過濾文本: ";
    wcout
<< src <<endl;
    cout 
<<" 過濾關鍵字 : " ;
    
for(int i = 0 ;i < 5; i++)
        wcout 
<< des1[i][0<<" ";
    wcout 
<<endl;
    cout 
<<" 過濾關鍵詞 : " ;
    
for(int i = 0 ;i < 3; i++)
        wcout 
<< des2[i] <<" ";
    wcout 
<<endl;

    
long  val = 0;

    HASHMAP hash_map;
    
/// 字 hash
    for(int i = 0 ; i < 5 ; i++)
    
{
        val 
= HashFun(des1[i][0]);
        hash_map[val] 
= 1;
    }

    
/// 詞 hash
    for(int i =0 ; i < 3 ; i++)
    
{
        val 
= HashFun(des2[i]);
        hash_map[val] 
= 1;
    }

    
    VmAlorgthm(hash_map,src);
    
    cout 
<<"\n-------------------------------------------------------------\n"
        
<<" 過濾后的文本: ";
    wcout
<< src <<endl;

    
return 0;
}

posted on 2009-07-12 22:07 expter 閱讀(4156) 評論(4)  編輯 收藏 引用 所屬分類: 其他學習筆記算法與數據結構

評論

# re: 一個關鍵字過濾算法[未登錄] 2009-07-13 11:33 megax

用hash,對于詞組來說本身就有不確定性  回復  更多評論   

# re: 一個關鍵字過濾算法 2009-07-14 00:42 XXOO

我一般是先把詞組排序,然后對每個字進行二分法這樣。或者也可以HASH
  回復  更多評論   

# re: 一個關鍵字過濾算法 2009-07-14 12:37 戴爾電腦

看了有點幫助!!  回復  更多評論   

# re: 一個關鍵字過濾算法[未登錄] 2009-07-20 09:10 cc

你這個hashfun有干活嗎?傳進去的值沒有變化啊  回復  更多評論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            国产精品久久久久av| 国产伦精品一区二区三区视频孕妇| 欧美在线免费观看| 欧美另类在线播放| 亚洲激情一区二区三区| 欧美在线地址| 亚洲一区免费网站| 欧美日韩三级电影在线| 亚洲欧洲一区二区三区久久| 久热精品在线视频| 午夜精品久久久久久久99水蜜桃| 欧美日韩国产区一| 亚洲日本中文字幕免费在线不卡| 免费精品99久久国产综合精品| 亚洲欧美日韩一区二区在线| 国产精品v欧美精品v日本精品动漫| 最新亚洲视频| 亚洲春色另类小说| 久久琪琪电影院| 精品9999| 免费在线国产精品| 久久先锋影音| 亚洲国产欧美一区| 亚洲国产精品高清久久久| 欧美+亚洲+精品+三区| 91久久久国产精品| 91久久精品视频| 欧美精品在线视频| 一区二区三区视频在线看| 亚洲激情影院| 欧美日韩在线观看一区二区| 亚洲视频电影图片偷拍一区| 99在线视频精品| 国产嫩草一区二区三区在线观看 | 欧美h视频在线| 亚洲乱码国产乱码精品精天堂 | 久久女同精品一区二区| 久久av在线| 在线看片成人| 亚洲日韩视频| 国产精品亚洲综合久久| 久久久91精品| 美国十次了思思久久精品导航| 欧美自拍偷拍| 亚洲精品视频一区二区三区| 免费日韩成人| 欧美高清一区| 亚洲私人影院在线观看| 亚洲一卡久久| 黄色成人免费观看| 亚洲国产精品小视频| 欧美福利一区二区| 午夜激情久久久| 久久精品国产99国产精品澳门| 在线日韩成人| 一区二区三区四区精品| 国内精品美女av在线播放| 亚洲啪啪91| 国产综合在线看| 亚洲国产美女| 国产日韩一区欧美| 亚洲国产欧美国产综合一区| 国产女主播视频一区二区| 欧美激情一区二区| 国产啪精品视频| 亚洲精品一区二区三区樱花| 狠狠爱综合网| 亚洲综合色自拍一区| 亚洲国产一区二区三区高清 | 国产一区二区三区高清| 欧美国产日韩精品| 国产精品日本一区二区| 91久久精品国产91久久| 国产一区久久久| 一区二区三区四区五区视频 | 国产一区二区三区免费观看 | 欧美色中文字幕| 欧美黄色片免费观看| 国产一区久久久| 午夜国产精品视频| 性18欧美另类| 欧美日韩三级电影在线| 亚洲福利在线看| 一区二区在线看| 欧美在线国产精品| 亚洲专区欧美专区| 欧美日韩国产在线一区| 亚洲国产精品一区二区第一页 | 国模一区二区三区| 亚洲在线一区二区| 亚洲一区二区在线看| 欧美精品成人一区二区在线观看| 免费高清在线一区| 一区在线观看| 久久久久久九九九九| 久久久久久欧美| 小黄鸭精品aⅴ导航网站入口| 一区二区三区四区五区视频| 欧美高清视频| 亚洲精品在线免费观看视频| 亚洲久久一区| 欧美日韩国产综合网 | 国产精品美女久久久| 一区二区欧美日韩| 亚洲在线观看视频| 国产精品免费观看在线| 午夜精品久久| 久久婷婷久久一区二区三区| 国模精品一区二区三区色天香| 久久精品成人欧美大片古装| 麻豆精品精华液| 亚洲欧洲一二三| 欧美日韩一区二区三| 亚洲一区二区视频在线| 欧美自拍丝袜亚洲| 亚洲国产精品成人一区二区| 欧美国产精品专区| 亚洲神马久久| 久久在线视频在线| 日韩西西人体444www| 国产精品免费看久久久香蕉| 久久精品人人爽| 亚洲精品国产拍免费91在线| 亚洲欧美日韩人成在线播放| 国语自产偷拍精品视频偷| 麻豆精品视频| 亚洲视频一区在线观看| 久久一综合视频| 亚洲精品国久久99热| 国产精品九九| 久久精品毛片| 亚洲看片网站| 久久米奇亚洲| 在线一区观看| 狠狠色综合色综合网络| 欧美激情欧美狂野欧美精品| 中国成人黄色视屏| 免费欧美网站| 欧美一区=区| 亚洲成人在线网| 国产精品毛片在线看| 久久日韩精品| 亚洲欧美成人| 99亚洲伊人久久精品影院红桃| 美女脱光内衣内裤视频久久网站| 在线亚洲一区| 亚洲国产视频a| 国产日韩专区在线| 欧美日韩一区高清| 久久久久久久综合狠狠综合| 99在线视频精品| 欧美激情久久久久| 久久久久久久一区二区| 国产精品99久久久久久久女警| 在线观看欧美一区| 国产欧美日韩一区二区三区| 欧美日韩综合精品| 欧美激情一区二区三区成人| 久久久久久亚洲精品杨幂换脸| 在线亚洲电影| 亚洲精品欧美| 久热综合在线亚洲精品| 午夜精品久久久久久久99水蜜桃| 99视频超级精品| 亚洲精品欧美激情| 激情成人综合| 国产一级久久| 国产欧美日韩三区| 国产精品拍天天在线| 欧美日韩国产美| 亚洲欧洲精品成人久久奇米网| 久久夜色精品国产| 久久精品久久综合| 小黄鸭视频精品导航| 亚洲午夜日本在线观看| 日韩午夜在线播放| 欧美伦理91| 欧美激情一区二区三区在线视频观看| 久久精品免费| 久久综合九色综合欧美就去吻| 欧美在线三区| 久久精品毛片| 久久夜色精品国产欧美乱| 久久久99久久精品女同性 | 最新国产拍偷乱拍精品 | 99re热精品| 99re国产精品| 亚洲天堂免费观看| 午夜精品久久久久| 久久久噜噜噜久久人人看| 久久久噜噜噜久久狠狠50岁| 欧美www视频在线观看| 欧美人在线观看| 国产精品久久网站| 狠狠色丁香婷婷综合| 亚洲精品国产日韩| 亚洲欧美日韩视频二区| 久久亚洲一区| 艳妇臀荡乳欲伦亚洲一区| 欧美亚洲一区二区在线观看|