亚洲一区二区高清,狠狠色狠狠色综合日日tαg,欧美精品偷拍http://m.shnenglu.com/yefeng/category/12093.html夜風'blogzh-cnMon, 07 Dec 2009 12:45:06 GMTMon, 07 Dec 2009 12:45:06 GMT60Aho-Corasick算法實踐http://m.shnenglu.com/yefeng/archive/2009/12/06/102671.html夜風夜風Sun, 06 Dec 2009 14:51:00 GMThttp://m.shnenglu.com/yefeng/archive/2009/12/06/102671.htmlhttp://m.shnenglu.com/yefeng/comments/102671.htmlhttp://m.shnenglu.com/yefeng/archive/2009/12/06/102671.html#Feedback0http://m.shnenglu.com/yefeng/comments/commentRss/102671.htmlhttp://m.shnenglu.com/yefeng/services/trackbacks/102671.html

Aho-Corasick算法實踐

摘要:

    Aho-Corasick算法可以在文本串中識別一組關鍵字,所需時間和文本長度以及所有關鍵字的總長度成正比。該算法使用了一種稱為“trie”的特殊形式的狀態裝換圖。Trie是一個樹形結構的狀態裝換圖,從一個結點到它的各個子結點的邊上有不同的標號。Trie的葉子結點表示識別到的關鍵字。

    在這里,將著重討論算法的實現。算法包含兩個部分,一是經典的KMP算法,二是KMP的擴展算法Aho-Corasick算法。前者實現單關鍵字的模式匹配,后者實現多關鍵字的匹配。(參考龍書詞法分析部分內容)

   【源代碼:http://m.shnenglu.com/Files/yefeng/ACKMP.rar(vc9.0下測試通過) 】

一、經典KMP算法

    當初,初學KMP算法時,總是通過反復的舉例去理解,沒有一種好的表達方式,而龍書描述這個算法使用了trie樹,也就是一個單鏈的狀態轉換圖。如模式b0b1...bn-1,trie樹如下:

    

    對模式串定義失效函數f:x->y,x,y in S,描述狀態轉移,f(s)表示在狀態s處,當下一個字符不是bs時轉向狀態f(s)繼續匹配。因此設置f(s)成為關鍵問題。

    f(s)的存在其實主要是為了消除回溯。細節就不再多說了,這里只從原理上簡單說明。

    設模式串為W,用文法描述,U、V表示W的一部分,w表示一個字符:

    W -> UwV,

    當U識別完成后,進入狀態s,識別w時,發現到來的字符不等于w,則需要轉向狀態f(s),f(s)到哪里去找呢?

    那就要看U是什么樣子了。不管什么情況,只要U非空串,總可以表示成:

       U -> uXu,或 U -> u,或U-> uXx,(x != u)

    可以發現,前綴u是,如果后綴也是u,意味著主串中u已經被識別,如果還從模式串頭匹配u無疑是多余的,所以f(s)應該是識別前綴u后進入的狀態。然后再匹配下一個字符。而滿足條件的u可能會有多個,所以總是選擇最長的那個。偽代碼如下:

   

    到此為止,應該算是可以結束KMP了,但實際情況下還可以對f函數進行優化。很多書本上描述的next數組就可以從f函數推導過來。

    其實也顯然,設狀態s接收字符w,當與輸入字符c不等于c時,轉向狀態t,倘若t狀態也只接收字符w,顯然再次比較w與c是多余的,之后必然再次轉向狀態f(t)。在運行的時候,這些狀態轉換時沒有意義的,可以在構造f之后,直接將f(s)設置為f(t)提高運行效率(不過此時f函數的意義已經不同了)。f優化如下:

   

二、多關鍵字匹配與Aho-Corasick算法

    Aho和Corasick對KMP算法進行了推廣,使它可以在一個文本串識別一個關鍵字集合中的任何關鍵字。在這種情況下,trie是一棵真正的樹,從其根結點開始就會出現分支。如果一個字符串是某個關鍵字的前綴,那么在trie中就又一個和該字符串對應的狀態。如關鍵字集合{he,she,his,hers},trie樹如下:

   

   

    類似的,仍然構造類似KMP算法中那樣的實效函數。對于上面的例子,失效函數如下:

s

0

1

2

3

4

5

6

7

8

9

f(s)

-1

0

0

0

1

2

0

3

0

3


  1.構造失效函數

    類似KMP算法,同樣采用實效實效函數推進的方法,假設當前狀態為s,s的一個孩子結點的根結點根節點t狀態,如果當前的失效函數已知為f(s),則顯然地,f(t)必定是f(s)的孩子結點狀態,所要做的就是在狀態f(s)處尋找接受字符同s->t下一個狀態,如果能找到,那就是f(t),否則說明到s處匹配串的前綴長度太長,需縮減,所以需要找到更短的后綴,于是就到f(s)處繼續,如果仍然找不到,則轉到f(f(s))處,形成狀態的遞歸轉移。構造中需要遍歷之前結點的所有孩子,所以需采用廣度優先遍歷,偽代碼如下:

   

    具體的構造如下:

   

  2.構造Trie樹

    具體實現當然需要用到樹形結構了,顯然采用靜態鏈表應該是最適合的,因為樹構造完就不需要改變,而且當模式串比較多的時候可以減少內存碎片。

    每一個結點有5個域:接受字符,下一個兄弟結點,第一個孩子結點,失效函數值,結點狀態。

但是有一種特殊情況,如上面的第二個圖,在進行匹配時,hers是永遠不會被匹配,因為he總是先于hers被匹配。這里就不考慮在內點狀態結束,這個問題暫時無法解決。于是可以做個特殊處理,只使用4個域,因為此時匹配成功后狀態就到了葉子結點,葉子結點不存在孩子域,這個域被浪費了,這里就可以借用一下,比如此域值為x,當x<0時,使用x xor 0x80000000表示識別到的模式串編號。

    另一個棘手的問題是結點個數問題,這個數組到底多大?如何確定?

    可以使用分值算法計算,先把模式串按字典順序排好序,設想n個排好序的模式串第i位排在一起,相同字符的組成一組,如AiBi…Xi,再把每組下一個字符,也就是第i+1位排在一起,相同字符的組成一組,如A’iB’I…X’i,以此遞歸運算。偽代碼如下:

    

  3.缺點

    水平有限,程序缺點很多,很多問題都沒有解決。

    1.如果存在兩個模式串,一個是另一個的子串,那么后者將無法被匹配。

    2.無法處理動態決定大小寫敏感性

    3.不夠完整,只能向后匹配



夜風 2009-12-06 22:51 發表評論
]]>
虛擬鍵盤(軟鍵盤)設計要點http://m.shnenglu.com/yefeng/archive/2009/10/18/98905.html夜風夜風Sun, 18 Oct 2009 15:19:00 GMThttp://m.shnenglu.com/yefeng/archive/2009/10/18/98905.htmlhttp://m.shnenglu.com/yefeng/comments/98905.htmlhttp://m.shnenglu.com/yefeng/archive/2009/10/18/98905.html#Feedback6http://m.shnenglu.com/yefeng/comments/commentRss/98905.htmlhttp://m.shnenglu.com/yefeng/services/trackbacks/98905.html    前些天花了很多時間寫這樣一個軟鍵盤,效果是顯示一個與鍵盤外觀相似的視圖,通過鼠標單擊像活動窗口發送虛擬的鍵盤消息。目標是實現像windows自帶的軟鍵盤osk相似。
    看似很簡單的工作,設計中卻遇到了很多困難。
    困難一:鍵盤按鍵分類
        鍵盤按鍵有很多種分類方法。
        第一種:按顯示分類。按住shift鍵,字母鍵、符號鍵顯示上面的字符;按下caps lock鍵,字母鍵切換為大寫字母。
        第二種:按功能分類。大體有可顯示字符類、控制類。控制類包括shift,ctrl等。
        為了解決可變的顯示問題,采用了一個自我感覺非常好的解決方案:字符集、鍵集相互獨立。如此一來,只要總體按照功能分類,通過特定功能的按鍵控制有效字符集即可,也就是說,對普通按鍵來說,它只負責到指定的字符集中去取對應序號的字符即可。
//LabelSet.h
#pragma once

//字母標簽集合
class LabelSet
{
public:
    LabelSet(LPCSTR
* _pTable,int _n);
    LPCSTR getLabel(
int _id) const;

    
~LabelSet();

protected:
    LabelSet(){}

private:
    LPCSTR
* pTable;
    
int n;
};

//相當于單刀雙擲開關組
class LabelSetEx
{
protected:
    
struct Switch
    {
        LabelSet
* s[2];
        
int at;
    };

public:
    LabelSetEx(
int _n);
    
bool addSets(int id,LPCSTR* s1,LPCSTR* s2,int n,int at = 0);
    LPCSTR getLable(
int id,int off) const;
    
void turn(int id);

    
~LabelSetEx();

private:
    
int n;    //開關組總個數
    Switch* pGroup;    //開關組
};

//
//LabelSet.cpp
#include "StdAfx.h"
#include 
"LabelSet.h"
#include 
<algorithm>
#include 
<cassert>

using namespace std;

LabelSet::LabelSet( LPCSTR
* _pTable,int _n )
{
    n 
= _n;
    pTable 
= new LPCSTR[n];
    copy(_pTable,_pTable 
+ _n,pTable);
}

LPCSTR LabelSet::getLabel( 
int _id ) const
{
    
return pTable[_id];
}

LabelSet::
~LabelSet()
{
    delete [] pTable;
}

LabelSetEx::LabelSetEx( 
int _n )
{
    n 
= _n;
    pGroup 
= new Switch[n];
    memset(pGroup,
0,n * sizeof(pGroup[0]));
}

LabelSetEx::
~LabelSetEx()
{
    
while(n--)
    {
        
if(pGroup[n].s[0== pGroup[n].s[1])
            delete pGroup[n].s[
0];
        
else
        {
            delete pGroup[n].s[
0];
            delete pGroup[n].s[
1];
        }
    }
    delete [] pGroup;
}

bool LabelSetEx::addSets( int id,LPCSTR* s1,LPCSTR* s2,int n,int at /*= 0*/ )
{
    assert((at 
& ~1== 0);
    
if(pGroup[id].s[0!= NULL)
        
return false;
    LabelSet
* p = new LabelSet(s1,n);
    pGroup[id].s[
0= p;
    
if(s1 == s2)
        pGroup[id].s[
1= p;
    
else
        pGroup[id].s[
1= new LabelSet(s2,n);
    pGroup[id].at 
= at;
    
return true;
}

LPCSTR LabelSetEx::getLable( 
int id,int off ) const
{
    Switch
* p = pGroup + id;
    
return p->s[p->at]->getLabel(off);
}

void LabelSetEx::turn( int id )
{
    assert((pGroup
->at & ~1== 0);
    pGroup[id].at 
^= 1;
}
        以上取開關的索引id是指字符集的分類id,在config.h文件下定義了這樣的id
#pragma once

//分類id的定義
#define LABEL_SET_ALPHA  0
#define LABEL_SET_SYMBOL 1
#define LABEL_SET_NUMPAD 2
#define LABEL_SET_MAIN   3
#define LABEL_SET_HELP   4

//字母串表
extern LPCSTR AlphaTable1[];    //小寫
extern LPCSTR AlphaTable2[];    //大寫
extern const int AlphaTableSize;

//符號串表
extern LPCSTR SymbolTable1[];    //
extern LPCSTR SymbolTable2[];    //
extern const int SymbolTableSize;

//小鍵盤數字表
extern LPCSTR NumPadTable1[];    //數字
extern LPCSTR NumPadTable2[];    //光標控制
extern const int NumPadTableSize;

//主鍵盤單顯
extern LPCSTR MainTable[];
extern const int MainTableSize;

//輔助鍵盤單顯
extern LPCSTR HelpTable[];
extern const int HelpTableSize;

struct KeyConfig
{
    
short id;        //分類id
    short offset;    //類內偏移
    RECT rt;    //位置
    BYTE vk;    //虛擬碼
};

extern KeyConfig kcs[];
extern const int kcSize;
extern const SIZE kbSize;
        第一次這樣寫代碼,寫完發現這樣極大地提高了靈活性,只要在配置文件config.cpp中修改,就可以產生很多種不同的界面(雖然仍然是代碼級別的,畢竟邁出了第一步,今后還會嘗試改成xml配置)。
        言歸正傳,這樣的設計分離了按鍵與顯示,可配置能力大大加強。但仍然存在第二個大問題。
    問題二:輸入焦點的確定
        方案一:現在只要在網上搜索“虛擬鍵盤”,能夠搜到一大溜的源代碼,但只可惜全是同一份拷貝,而且存在一點小錯誤。他的解決方案是:利用 PreTranslateMessage,在底層調用它之前,前臺窗口仍然沒有改變,此時是獲得前一個前臺窗口的好時機,獲得后保存,并將使用 AttachThreadInput將當前線程綁定活動窗口的消息隊列,然后在單擊虛擬鍵盤時使用SetFocus將保存的窗口設為焦點(源代碼中同時使用了SetForgroundWindow和SetFocus,這是失效的原因),然后發送虛擬按鍵。

        方案二:其實有更簡便的方法。設置主窗口屬性為WM_ES_NOACTIVATE,這樣窗口就不會成為前臺窗口,不管如何發送鍵盤消息,擁有焦點的窗口總會收到。但此時仍然存在問題。當移動窗口時,效果不大順暢,而且沒辦法響應菜單命令,那是因為該窗口始終不是前臺窗口造成的。解決方法就是在單擊標題欄時,成為前臺窗口,釋放是歸還前臺。

void CMainFrame::OnNcLButtonDown(UINT nHitTest, CPoint point)
{
    
if(m_hForground == NULL)
    {
        m_hForground 
= ::GetForegroundWindow();
        ModifyStyleEx(WS_EX_NOACTIVATE,
0);
        SetForegroundWindow();
    }
    CFrameWnd::OnNcLButtonDown(nHitTest, point);
}
                但是,如果想當然歸還前臺使用WM_NCLBUTTONUP消息的話,就要讓你失望了,windows似乎有意跟我們開玩笑,必須單擊兩次才能響應這個消息。沒辦法,于是嘗試WM_NCMOUSELEAVE,但效果也不好,最終嘗試WM_NCMOUSEMOVE,很好,這次終于成功了。
void CMainFrame::OnNcMouseMove(UINT nHitTest, CPoint point)
{
    
if(m_hForground != NULL)
    {
        ::SetForegroundWindow(m_hForground);
        ModifyStyleEx(
0,WS_EX_NOACTIVATE);
        m_hForground 
= NULL;
    }
    CFrameWnd::OnNcMouseMove(nHitTest, point);
}
        問題到此為止,現在說說一點小小的發現。
        原本以為一般的按鍵就兩種狀態,通過down、up改變,如果用方波描述,down就是下降沿觸發,up是上升沿觸發。也曾了解,像shift這樣的按鍵會很復雜,存在多個狀態。后來測試發現,shift并非一個特例,所有的按鍵都有4個狀態,通過down、up改變狀態。只是不同按鍵對狀態的關注點不同。
        可以做這樣一個測試,用GetKeyboardState得到各個虛擬碼對應的按鍵狀態。最高位為1時表示鍵被按下,最高位為1時,如果是lock鍵則表示被鎖住,對于其他鍵,各有各的作用。
        比如一個鍵,用2位的二進制數表示這些狀態,設初始狀態為10,經過down后,變為01,經過up后,變為11,再經過down后,變為00,再經過up后,變為10,如此四個狀態經過down、up實現了周期性的狀態裝換。大體符合這樣的規律:
            10-(down xor 11)->01->(up xor 10)->11-(down xor 11)->00(up xor 10)->10。
        這樣,如果虛擬得比較徹底,在虛擬鍵盤內部可以輕易地實現狀態的記憶,并且可以獲得足夠的信息。對于顯示、控制都非常方便。

    這只是第一個版本,還有很多問題需要解決。
    待解決問題一:xml配置動態配置鍵盤,及動態更換顯示效果。
    待解決問題二:同步物理鍵盤。
    待解決問題三:更深層次,防止鍵盤消息被hook,初步認識,似乎可以使用剪貼板。
   【源代碼1.2版本:http://m.shnenglu.com/Files/yefeng/VirtualKeyboard1.2.rar


夜風 2009-10-18 23:19 發表評論
]]>
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美激情在线观看| 欧美aaaaaaaa牛牛影院| 亚洲高清激情| 亚洲精品免费看| 国产精品成人一区二区网站软件 | 日韩午夜三级在线| 在线观看欧美日韩国产| 国产精品第一页第二页第三页| 欧美电影免费观看大全| 亚洲婷婷在线| 久久精品国产精品亚洲| 欧美一区二区三区在线免费观看| 亚洲欧美中日韩| 噜噜爱69成人精品| 欧美午夜精品电影| 国产在线拍偷自揄拍精品| 尤妮丝一区二区裸体视频| 欧美日本韩国一区| 欧美女同在线视频| 国产精品免费视频观看| 在线播放日韩欧美| 亚洲女女做受ⅹxx高潮| 麻豆精品传媒视频| 亚洲一区在线直播| 欧美α欧美αv大片| 国产精品99免费看 | 久久麻豆一区二区| 蜜臀av性久久久久蜜臀aⅴ| 国产偷久久久精品专区| 亚洲图片激情小说| 最近中文字幕日韩精品| 久久久久久9| 在线观看日韩www视频免费| 亚洲精品无人区| 欧美高清在线精品一区| 久久精品人人做人人爽| 国模叶桐国产精品一区| 久久夜色精品国产欧美乱极品| 99精品免费网| 欧美性片在线观看| 日韩亚洲欧美一区| 亚洲人被黑人高潮完整版| 亚洲欧美一区二区精品久久久| 欧美精品入口| 一本色道久久综合亚洲精品高清| 欧美va亚洲va国产综合| 久久av在线看| 亚洲精品久久久一区二区三区| 亚洲高清免费在线| 欧美丰满高潮xxxx喷水动漫| 亚洲狠狠婷婷| 亚洲日本久久| 欧美另类亚洲| 亚洲午夜久久久久久尤物 | 欧美福利电影在线观看| 99在线精品观看| 国产综合在线看| 亚洲第一区色| 伊人久久婷婷| 午夜电影亚洲| 亚洲欧美日韩国产成人| 免费欧美日韩| 亚洲欧美日韩国产中文在线| 麻豆精品一区二区综合av| 亚洲欧美不卡| 欧美成人黄色小视频| 久久人人超碰| 国内精品一区二区三区| 欧美亚洲一区在线| 久久精品国产清高在天天线 | 美女脱光内衣内裤视频久久网站| 在线亚洲一区观看| 欧美日韩高清在线| 欧美国产激情| 亚洲精品色图| 欧美日韩二区三区| 这里只有精品视频| 欧美一区二视频| 国产欧美视频一区二区三区| 午夜视频在线观看一区二区| 欧美中日韩免费视频| 极品少妇一区二区| 欧美国产免费| 亚洲免费中文字幕| 老司机aⅴ在线精品导航| 亚洲国产裸拍裸体视频在线观看乱了| 老司机免费视频一区二区三区| 免费永久网站黄欧美| 91久久精品一区二区别| 欧美欧美天天天天操| 亚洲一区二区三区视频播放| 久久五月婷婷丁香社区| 久久久精品2019中文字幕神马| 久久久福利视频| 99视频精品在线| 国内精品久久久久久久影视麻豆 | 欧美一区二区免费| 一区免费视频| 国产九色精品成人porny| 欧美高清在线视频观看不卡| 欧美亚洲三区| 亚洲一级黄色av| 99精品欧美| 亚洲国产视频一区| 蜜臀av国产精品久久久久| 亚洲女人天堂av| 中文成人激情娱乐网| 亚洲国产日韩综合一区| 亚洲电影免费观看高清完整版在线观看 | 亚洲网站在线播放| 亚洲精品久久久蜜桃| 亚洲国产精品视频| 国内精品视频在线观看| 激情久久五月天| 精品99一区二区| 狠狠综合久久av一区二区小说| 国产日韩精品一区| 欧美色123| 欧美性jizz18性欧美| 欧美大色视频| 欧美午夜不卡| 亚洲在线视频| 久久这里有精品15一区二区三区 | 亚洲人妖在线| 国产精品久久77777| 久久久久国产精品www| 亚洲激情在线观看视频免费| 韩日视频一区| 激情综合视频| 日韩一级在线观看| 亚洲欧美一区二区视频| 久久久久国产精品一区二区| 欧美成人a视频| 亚洲综合好骚| 欧美国产一区二区在线观看| 国产精品久久久久久久久久尿| 一区二区三区在线免费播放| 99精品热视频只有精品10| 午夜久久黄色| 欧美激情一区二区三区蜜桃视频| 欧美激情在线观看| 欧美影视一区| 国产日韩欧美二区| 一本色道88久久加勒比精品 | 国产精自产拍久久久久久| 亚洲国产另类久久久精品极度| 亚洲欧美日韩中文在线制服| 欧美激情在线狂野欧美精品| 久久漫画官网| 亚洲国产高清高潮精品美女| 久久久久久久综合狠狠综合| 亚洲永久免费精品| 国产精品成人av性教育| 一区二区三区成人| 一区二区三区精密机械公司| 欧美日韩国产综合视频在线| 99国产精品一区| 日韩视频―中文字幕| 欧美色图五月天| 欧美影院在线| 久久精品国产一区二区三区免费看 | 久久综合给合| 亚洲精品国产视频| 在线观看日韩| 亚洲欧洲精品成人久久奇米网 | 国产人成一区二区三区影院| 亚洲激情在线视频| 欧美电影免费观看高清完整版| 欧美激情在线免费观看| 日韩视频一区二区三区| 亚洲第一页在线| 欧美精品日韩| 正在播放欧美视频| 久久www成人_看片免费不卡| 欧美网站在线| 久久黄色网页| 欧美精品一区二区三区在线播放| 亚洲图片自拍偷拍| 欧美11—12娇小xxxx| 亚洲免费伊人电影在线观看av| 久久精品亚洲一区| 亚洲欧美日韩精品久久久久| 久久久久久亚洲精品不卡4k岛国| 亚洲一区二区三区精品视频| 免费的成人av| 欧美风情在线观看| 黄网站免费久久| 中日韩美女免费视频网址在线观看 | 欧美 亚欧 日韩视频在线| 国产精品国内视频| 亚洲成人在线免费| 亚洲国产精品999| 国产精品欧美日韩| 在线观看视频欧美| 久久一区视频| 亚洲黄色免费| 一本大道av伊人久久综合| 欧美精品日韩综合在线| 宅男在线国产精品| 久久蜜臀精品av|