青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

勤能補拙,Expter

成都游戲Coder,記錄游戲開發過程的筆記和心得!

一個關鍵字過濾算法

      經常某些論壇,或者軟件中對某些字符串進行了關鍵字過濾, 一般代替為*號,一般的算法是利用strstr算法,即使是string的find子串算法復雜度也是(N*log(n)),并非kmp算法,也非bm查找子串算法。
     對于一組關鍵字過濾,特別是對于一組字符串多,且長度不規律的字符串過濾算法完全是有必要的。
   
    網上對于關鍵字過濾算法較多,且實現方法較多,本文主要介紹基于一種把關鍵字轉換為Unicode,然后對關鍵字的字符或者單個關鍵字hash求值。算法復雜度為O(n).
   對于漢字的hash值的求法,因為是Unicode編碼是16位,哈希求值:

  /// 求漢字的哈希值
long HashFun(wchar_t  word)
{
 BYTE l 
= LOBYTE(word);
 
int  h = HIBYTE(word);

 
long num = h << 8 ;
 num 
+=l;
 
return num;
}



    基本算法思想;
   1.建立2個過濾關鍵字數組:數組1:為單個字符  數組2:為2個或者多個字符
   2.求出數組1,2的hash值,數組2的hash值只求出前2個字符的hash值即可。
   3.掃描待檢測的文本,然后每次取2個字符,查找數組2是否有匹配,如果沒有則查找數組1。。。。  查找為O(1)

  主要代碼如下:


/*
   File :  WordFilter.cpp 
   brief:  關鍵字過濾程序,復雜度為O(n),線性
   Author: Expter
   Data  : 2009/06/30

   對漢字或者字符進行哈希算法,先轉換為unicode編碼,然后求其hash值。

   主要算法為:
   1.建立2個過濾關鍵字數組:數組1:為單個字符  數組2:為2個或者多個字符
   2.求出數組1,2的hash值,數組2的hash值只求出前2個字符的hash值即可。
   3.掃描待檢測的文本,然后每次取2個字符,查找數組2是否有匹配,如果沒有則查找數組1。。。。  查找為O(1)


   不足:
   不能很好的分詞。過濾不是很準確,每次只能1,2個詞的過濾。
*/

#include 
<stdlib.h>
#include 
<iostream>
#include 
<map>
#include 
<vector>
#include 
<string>
#include 
<windows.h>
#include 
<wchar.h>  
#include 
<iosfwd>
using namespace std;

wchar_t des1 [
5][2= { L"",L"",L"",L"",L""};
wchar_t des2 [
3][5= { L"用漢", L"的啥" ,L"測試啊"};
wchar_t src[]  
= { L"這個原來是打算的啥子東西用漢字只是一個是不是測試"};


/// 求漢字的哈希值
long HashFun(wchar_t  word)
{
    BYTE l 
= LOBYTE(word);
    
int  h = HIBYTE(word);

    
long num = h << 8 ;
    num 
+=l;
    
return num;
}


long HashFun(wchar_t * word)
{
    
return HashFun(word[0])*10 + HashFun(word[1]);
}



void  ParamVer(map<long,int> hashmp , wchar_t *src , int i)
{
    
long val = HashFun(src[i+1]);
    
if(hashmp[val] == 1)
    
{
        src[i
+1= L'*';
    }

}

void  VmAlorgthm(map<long,int> hashmp,wchar_t *src)
{
    
long val = 0;
    
int  m = wcslen(src) ;
    
// O(n);
    for(int i = 0 ; i < m-1  ; i ++)
    
{
        
if( HashFun(src[i]) != L'*')
        
{
            val 
= HashFun(src[i]) + HashFun(src[i+1]);
            
if( hashmp[val] == 1)
            
{
                src[i] 
= L'*';
                src[i
+1=L'*';
            }

            
else
            
{
                val 
= HashFun(src[i]);
                
if(hashmp[val] == 1)
                
{
                    src[i] 
= L'*';
                }

                
else
                
{
                    ParamVer(hashmp,src,i);
                }

            }

        }

        
else
        
{
            ParamVer(hashmp,src,i
+1);
        }

    }

    ParamVer(hashmp,src,m
-1);
}



int _tmain(int argc, _TCHAR* argv[])
{
    wcout.imbue(locale(
"chs"));     
    typedef map
<long,int> HASHMAP;

    cout 
<<" 需要過濾文本: ";
    wcout
<< src <<endl;
    cout 
<<" 過濾關鍵字 : " ;
    
for(int i = 0 ;i < 5; i++)
        wcout 
<< des1[i][0<<" ";
    wcout 
<<endl;
    cout 
<<" 過濾關鍵詞 : " ;
    
for(int i = 0 ;i < 3; i++)
        wcout 
<< des2[i] <<" ";
    wcout 
<<endl;

    
long  val = 0;

    HASHMAP hash_map;
    
/// 字 hash
    for(int i = 0 ; i < 5 ; i++)
    
{
        val 
= HashFun(des1[i][0]);
        hash_map[val] 
= 1;
    }

    
/// 詞 hash
    for(int i =0 ; i < 3 ; i++)
    
{
        val 
= HashFun(des2[i]);
        hash_map[val] 
= 1;
    }

    
    VmAlorgthm(hash_map,src);
    
    cout 
<<"\n-------------------------------------------------------------\n"
        
<<" 過濾后的文本: ";
    wcout
<< src <<endl;

    
return 0;
}

posted on 2009-07-12 22:07 expter 閱讀(4156) 評論(4)  編輯 收藏 引用 所屬分類: 其他學習筆記算法與數據結構

評論

# re: 一個關鍵字過濾算法[未登錄] 2009-07-13 11:33 megax

用hash,對于詞組來說本身就有不確定性  回復  更多評論   

# re: 一個關鍵字過濾算法 2009-07-14 00:42 XXOO

我一般是先把詞組排序,然后對每個字進行二分法這樣。或者也可以HASH
  回復  更多評論   

# re: 一個關鍵字過濾算法 2009-07-14 12:37 戴爾電腦

看了有點幫助!!  回復  更多評論   

# re: 一個關鍵字過濾算法[未登錄] 2009-07-20 09:10 cc

你這個hashfun有干活嗎?傳進去的值沒有變化啊  回復  更多評論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美一区91| 欧美刺激性大交免费视频 | 久久综合九色综合久99| 欧美一区二区在线播放| 久久久精品一区| 久久精品人人做人人爽| 久久深夜福利| 麻豆久久久9性大片| 欧美日韩精品免费| 国产精品看片你懂得| 国产精品一区二区在线| 国产一区二区三区无遮挡| 亚洲国产免费| 欧美一区1区三区3区公司| 久久青青草综合| 国产精品有限公司| 亚洲欧美国产毛片在线| 亚洲一区欧美二区| 亚洲欧美另类在线| 欧美理论大片| 亚洲精品乱码久久久久久黑人| 亚洲性视频h| 亚洲欧洲精品一区二区| 99国产欧美久久久精品| 久热精品视频在线免费观看 | 亚洲丁香婷深爱综合| 小辣椒精品导航| 国产欧美在线观看一区| 9久re热视频在线精品| 久久综合色8888| 久久xxxx精品视频| 国产欧美日韩综合一区在线观看 | 国内久久婷婷综合| 久久久久欧美| 久久综合色播五月| 最近中文字幕日韩精品| 欧美成人首页| 欧美国产精品人人做人人爱| 亚洲精品社区| 亚洲午夜精品久久久久久浪潮| 国产精品国产馆在线真实露脸| 中国亚洲黄色| 亚洲欧美国产精品桃花| 欧美成人精品1314www| 你懂的国产精品永久在线| 欧美黑人国产人伦爽爽爽| 久热精品在线| 欧美国产一区二区三区激情无套| 日韩一级二级三级| 亚洲看片免费| 国产主播精品在线| 亚洲国产一区在线观看| 国产精品黄页免费高清在线观看| 久久久精品国产免费观看同学| 鲁大师影院一区二区三区| 一区二区冒白浆视频| 午夜在线精品偷拍| 中文av一区二区| 美女福利精品视频| 久久在精品线影院精品国产| 欧美视频在线看| 亚洲高清久久久| 在线观看成人av| 亚洲性视频h| 亚洲一本视频| 欧美天天影院| 99视频精品免费观看| 亚洲国产高清自拍| 久久国产手机看片| 久久久久久亚洲综合影院红桃 | 99热在这里有精品免费| 日韩视频一区二区| 一区二区三区四区五区视频| 欧美1区2区3区| 亚洲精品免费电影| 日韩视频在线观看国产| 免费91麻豆精品国产自产在线观看| 久久久久.com| 韩国免费一区| 美女网站久久| 日韩一级裸体免费视频| 欧美精品久久久久久久久老牛影院 | 亚洲一级在线| 国产日韩精品一区二区三区在线 | 亚洲激情婷婷| 欧美日韩国产电影| 亚洲欧美另类综合偷拍| 久久夜色精品亚洲噜噜国产mv| **网站欧美大片在线观看| 欧美日韩高清一区| 亚洲桃色在线一区| 亚洲第一页中文字幕| 欧美一级电影久久| 亚洲精品色婷婷福利天堂| 国产日韩免费| 欧美网站大全在线观看| 久久久噜噜噜久久中文字幕色伊伊 | 狂野欧美激情性xxxx| 99视频热这里只有精品免费| 久久久久久久国产| 亚洲伊人伊色伊影伊综合网| 亚洲国产片色| 在线免费日韩片| 国语对白精品一区二区| 国产精品一区二区三区久久| 国产精品久久7| 欧美日韩1区2区3区| 国产精品网站在线观看| 欧美成年人视频网站欧美| 麻豆国产精品一区二区三区 | 亚洲综合色视频| 亚洲视频一区在线观看| 日韩午夜三级在线| 国产精品99久久久久久有的能看| 亚洲精品视频一区二区三区| 99国产精品国产精品久久| 亚洲精品午夜| 亚洲婷婷综合色高清在线| 正在播放欧美视频| 亚洲欧美一区二区三区久久 | 欧美电影专区| 亚洲国产成人tv| 亚洲人成毛片在线播放| 一区二区三区精品在线 | 蜜桃久久精品一区二区| 免费观看日韩| 亚洲精品免费在线| 香蕉视频成人在线观看| 欧美夫妇交换俱乐部在线观看| 国产精品大片| 亚洲福利电影| 亚洲一区欧美二区| 欧美激情一二区| 国产一区二区三区久久久久久久久 | 亚洲国产精品久久人人爱蜜臀 | 黄色综合网站| 亚洲私人影吧| 亚洲免费观看在线视频| 可以免费看不卡的av网站| 男女激情视频一区| 亚洲一二三区视频在线观看| 欧美高清视频在线播放| 激情久久五月| 久久久久久电影| 亚洲欧美视频一区二区三区| 欧美日韩天天操| 一区二区三区.www| 亚洲国产另类 国产精品国产免费| 精品成人在线观看| 欧美成人免费小视频| 久久久国产精彩视频美女艺术照福利| 欧美亚男人的天堂| 亚洲一区二区在| 亚洲欧美美女| 欧美国产亚洲精品久久久8v| 老牛影视一区二区三区| 亚洲国产三级在线| 999亚洲国产精| 国产午夜精品全部视频播放| 久久婷婷影院| 欧美精品日韩| 久久青草福利网站| 欧美日韩国产成人在线| 欧美一级电影久久| 久久综合国产精品| 亚洲欧美日韩一区二区| 久久久久久一区| 亚洲一区影院| 久久综合九色综合网站| 亚洲欧美日韩精品久久亚洲区| 乱中年女人伦av一区二区| 亚洲午夜免费福利视频| 久久久亚洲国产天美传媒修理工| 亚洲图片在线观看| 欧美成人中文字幕| 免费在线日韩av| 国产一区二区三区在线观看精品| 亚洲国产高清一区二区三区| 国产午夜精品一区二区三区欧美 | 国产在线精品一区二区中文| 在线看无码的免费网站| 在线视频亚洲欧美| 伊人夜夜躁av伊人久久| 亚洲永久精品大片| 欧美一区日本一区韩国一区| 国产精品久久国产三级国电话系列 | 国产在线精品二区| 午夜欧美不卡精品aaaaa| 一区二区三区视频在线播放| 欧美激情成人在线视频| 亚洲国产天堂网精品网站| 激情综合中文娱乐网| 久久久久久午夜| 亚洲国产一区二区视频| 艳妇臀荡乳欲伦亚洲一区| 欧美成人免费在线观看| 亚洲青色在线| 欧美综合国产精品久久丁香| 国产亚洲欧洲997久久综合| 美日韩精品免费观看视频|