青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

a tutorial on computer science

  C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
  21 隨筆 :: 0 文章 :: 17 評論 :: 0 Trackbacks
   hash算法一直被我認為成一種處理大數據量的高效算法(時間復雜度)。
   從一道百度面試題開始。
    搜索引擎會通過日志文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串的長度為1-255字節。
    假設目前有一千萬個記錄(這些查詢串的重復度比較高,雖然總數是1千萬,但如果除去重復后,不超過3百萬個。一個查詢串的重復度越高,說明查詢它的用戶越多,也就是越熱門。),請你統計最熱門的10個查詢串,要求使用的內存不能超過1G。

   好。首先想暴力解決下,看看內存夠不夠。大約255X10^8B內存,2.4G的樣子。。超內存了。。汗。。300萬,那就是0.8G,剛剛好。很自然的,我們可以想到,如果每次向內存讀一個字符串,然后把那個字符串出現的次數和字符串存起來,這樣,就可以在不超過1G的情況下搞定。編程珠璣上面有這道題目的int版本,大概就是問10億個整數(從1到10億,缺一個),不超過多少內存,要求最快找出缺少的數。那個題目也是利用hash的思想,不過它的hash函數就是它自己就是了。開一個10億比特的內存,然后把flag[num]設置一下,最后再統計一下。好吧,這個題目是不是可以利用類似的思想呢?好吧,hash吧。
   hash算法的基本步驟是:把數據存放到key(data[i])里面。如此簡單。就是建立data[i]和i的映射關系,然后利用數組可以隨機訪問的特點,使得在O(1)的時間復雜度再次找到數據(理想情況,可能沖突)!hash最直接的利用就是lookup table,查找表。建立一個hash表,然后可以進行快速查找。(如果出現訪問沖突怎么辦呢?大致分為兩種辦法:開散列和閉散列。開散列就是找到了這個位置被別人占了,好,找個規則換地方。閉散列就是這個地方被別人站著,我跟在他后面(鏈表)。高深的玩意研究不懂,MARK之,以后慢慢看)。
   hash解決此題:網上找一個字符串hash函數看看先(看不懂,直接用。哪位大神可以告訴我為什么或者詳細資料??)。建立一個空的hash表,每次讀一個字符串。找到這個字符串的key(就是用hash函數對它XXX),返回一個位置??纯茨莻€位置是不是被別人占了。如果被別人占了,我就往后走,直到找到一個空位子。坐下。當然這個過程也許會找到和自己一樣的,那樣就把它的訪問次數+1。好了,hash表建好了,里面有300萬個字符串,每一個字符串的搜索次數也統計出來了。
   問題完成了第一步。
  第二部是,統計TOP K字符串。這個。。可以排個序,qsort,O(N*logN),太挫了。果斷用個小頂堆,把復雜度降到O(N*log(K)),K 很小,這個很劃算啊。
  關于堆的問題就不詳細闡述了,實現簡單(siftdown(int),siftup(int)),目的明確(取最值,增加刪除元素)。下面是測試的代碼。當然我沒有那么大的數據量,寫的代碼也僅供測試之用。
 
#include <stdio.h>
#include 
<string.h>
#define MAXN 47
#define NUM 10

typedef 
struct
{
  
char str[256];
  
int time;
}
node;

node data[MAXN];

node heap[NUM];
//小頂堆
int hcount = 0;

void swap(node& a,node& b)
{
     node tmp;
     tmp 
= a;
     a 
= b;
     b 
= tmp;
}



void siftdown(int i)
{
   
int minst = i;
   
if(2*i<=hcount&&heap[i].time>heap[2*i].time)
     minst 
= 2*i;
    
if(2*i+1<=hcount&&heap[minst].time>heap[2*i+1].time)
     minst 
= 2*i+1;
    swap(heap[i],heap[minst]);          
    
if(i!=minst)
    
{
      siftdown(minst);        
    }
   
}


void siftup(int i)
{
   
while(heap[i].time<heap[i/2].time)
   
{
     swap(heap[i],heap[i
/2]);
     siftup(i);     
   }

}


void pop()
{
   
if(hcount<=0)
     
return;
   swap(heap[
1],heap[hcount]);
   hcount
--;
   siftdown(
1);      
}


void add(node n)
{
  
if(hcount<NUM)
   
{
     data[hcount
++= n;
     siftup(hcount);
     
return;
   }

  
if(heap[0].time<n.time)
   
{
     pop();
     data[hcount
++= n;
     siftup(hcount);
     
return;
   }

}


int strhash(char* str)
{
   
//BKDRHash
   int seed = 131;
   
int hash = 0;
   
   
while(*str)
   
{
      hash 
= hash *seed + (*str++);
   }

   
return (hash & 0x7FFFFFFF);
}


void init()
{
  
int i;
  
for(i=0;i<MAXN;i++)
     data[i].time
=-1;
}


void solve()
{
   
int i;
   
for(i=0;i<MAXN;i++)
   
{
     
if(data[i].time>=0)
     
{
    add(data[i]);    
     }
 
   }

  
//輸出heap   
  for(i=0;i<NUM;i++)
  
{
    printf(
"%s %d\n",data[i].str,data[i].time);
  }

}


int main()
{
   init();
   
int index;
   
char str[256];
   freopen(
"in.txt","r",stdin);
   freopen(
"out.txt","w",stdout);
   
while(scanf("%s",str)!=EOF)
   
{
      index 
= strhash(str);
      index 
= index%MAXN;
      
//找一個沒放的或者和它相同的
      while(data[index].time != -1 && strcmp(data[index].str,str) != 0
      
{
         index
++;
         index
%=MAXN;
      }

      
if(data[index].time == -1)
      
{
         strcpy(data[index].str,str);
         data[index].time 
= 1;
      }

      
else
      
{
         data[index].time
++;
      }

   }

 
#include <stdio.h>
#include 
<string.h>
#include 
<stdlib.h>
#define DEBUG
#define MAXN 7997997


typedef 
struct _node
{
  
int num;
  
int time;
  
struct _node* next;
}
node;

node zhash[MAXN],fhash[MAXN];

int A[5000],B[5000],C[5000],D[5000];

void init(int n)
{
int i;
  
for(i=0;i<n;i++
  
{
   zhash[i].time 
= -1;
   fhash[i].time 
= -1;
   zhash[i].next 
= NULL;
   fhash[i].next 
= NULL;
  }

}


void insert(int num)
{
   node
* h;
   
if(num >= 0)
     h 
= zhash;
   
else
     h 
= fhash;
 
   
int index = abs(num)%MAXN;
   
if(h[index].time==-1)
   
{
      h[index].time 
= 1;
      h[index].num 
= num;
   }

  
else
   
{
      node
* p = &h[index];
      
while(p!=NULL && p->num!=num)
        p 
= p->next;
      
if(p != NULL)
      
{
        p
->time++
      }

      
else
      
{
        p 
= (node*)malloc(sizeof(node));
        p
->num = num;
        p
->time = 1;
        p
->next =NULL;
      }

   }

}


int getres(int num)
{
   node
* h;
   
if(num <= 0)
     h 
= zhash;
   
else
     h 
= fhash;
   
   
int index = abs(num)%MAXN;
   
   node
* p = &h[index];
   
while(p!=NULL && p->num!=(num*(-1)))
   
{
     p 
= p->next;
   }

   
if(p == NULL)
     
return 0;
   
else
     
return p->time;
}


int main()
{
   
int i,j,count,res=0,tmp;
   scanf(
"%d",&count);
   init(MAXN);
   
for(i=0;i<count;i++)
   
{
     scanf(
"%d%d%d%d",&A[i],&B[i],&C[i],&D[i]);     
   }

   
for(i=0;i<count;i++)
    
for(j=0;j<count;j++)
     
{
        tmp 
= A[i]+B[j];
        insert(tmp);
     }


   
for(i=0;i<count;i++)
     
for(j=0;j<count;j++)
     
{
        tmp 
= C[i]+D[j];
        res 
+= getres(tmp);
     }

     printf(
"%d\n",res);
   #ifdef DEBUG
     scanf(
"%d",&i);
   
#endif
   
return 0;
}

 solve();
  
return 0;
}

繼續hash算法。
其實本來是想搞ACM的hash的,苦于各種找不到資料。
POJ2785。http://poj.org/problem?id=2785
下面代碼沒AC。
題目自己看吧,思路是正數一個hash表,負數一個hash表,然后把O(N^4)復雜度搞成O(N^2)。上面玩的是開散列。下面是閉散列。無代碼規范代碼。

posted on 2011-11-15 19:57 bigrabbit 閱讀(6011) 評論(4)  編輯 收藏 引用

評論

# re: hash初步[未登錄] 2011-11-17 11:51 遠行
頂  回復  更多評論
  

# re: hash初步 2011-11-18 16:42 jc_ontheroad
先頂一下。  回復  更多評論
  

# re: hash初步 2011-11-20 14:00 春秋十二月
對于關鍵字為字符串類型的散列函數,其本質和整數模散列差不多,對7位acsii碼的字符串,先把它轉到對應的整數,比如"abcd",對應的整數為97*128^3+98*128^2+99*128^1+100(128為基數),考慮到字符串長度,上面的公式計算的結果可能會溢出,因此根據mod函數的性質及霍納算法,可以改進為:((((((97%M)*128+98)%M)*128+99)%M)*128+100)%M,你的strhash實現是累加求和,131為因子,最終結果再取31位而得散列值,而131、31都是素數,素數有處于減少沖突。  回復  更多評論
  

# re: hash初步 2011-11-20 18:34 bigrabbit
@春秋十二月
原來ELFhash做的是這個事情。。。請問有沒有什么關于hash深入一些全面一些的資料?  回復  更多評論
  


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            国产视频在线观看一区 | 欧美伊人久久久久久午夜久久久久 | 国产精品高潮在线| 在线观看日韩www视频免费| 亚洲欧美成aⅴ人在线观看| 免费观看成人鲁鲁鲁鲁鲁视频| 亚洲永久在线| 国产精品sm| 亚洲一区二区三区免费在线观看| 欧美大尺度在线观看| 久久久久一区二区三区四区| 狠狠色噜噜狠狠狠狠色吗综合| 久久精品国产亚洲a| 香港久久久电影| 国产亚洲欧美一区在线观看| 久久精品国产一区二区三区免费看| 亚洲在线观看免费视频| 国产欧美日韩不卡| 久久精品99国产精品日本| 午夜免费在线观看精品视频| 国产精品在线看| 久久精品国产欧美激情| 久久国产高清| 在线观看日韩专区| 亚洲第一在线| 狂野欧美激情性xxxx| 亚洲国产欧美日韩精品| 亚洲人在线视频| 亚洲国产日韩在线| 欧美国产在线观看| 中文精品视频一区二区在线观看| 99这里只有久久精品视频| 国产精品福利久久久| 欧美一区二区三区在线看| 久久精品综合一区| 日韩视频一区二区三区| 99视频有精品| 国产在线视频欧美| 欧美激情第五页| 国产精品成人免费| 久久综合久久综合这里只有精品| 久久一区免费| 亚洲一区二区欧美| 欧美一区二区观看视频| 亚洲三级观看| 亚洲欧美另类综合偷拍| 亚洲国产欧美一区二区三区久久 | 亚洲欧美激情四射在线日| 午夜精品免费在线| 亚洲韩日在线| 亚洲欧美福利一区二区| 亚洲国产精品视频| 亚洲一区二区三区视频| 狠狠色狠狠色综合日日91app| 亚洲国产欧美一区二区三区丁香婷| 欧美日韩免费看| 久久婷婷麻豆| 国产精品久久午夜夜伦鲁鲁| 欧美成人国产| 国产欧美日韩麻豆91| 亚洲经典在线| 黄色成人免费网站| 亚洲一区国产一区| 亚洲美女少妇无套啪啪呻吟| 欧美一级视频| 亚洲一卡久久| 欧美国产在线电影| 美女91精品| 国产麻豆午夜三级精品| 亚洲精品九九| 亚洲激情一区| 久久久国产精品亚洲一区| 午夜精品一区二区在线观看 | 国产伦精品一区二区三区在线观看 | 欧美一区二区三区四区在线观看地址| 久久久欧美精品sm网站| 欧美一区二区成人| 欧美性片在线观看| 国产精品免费电影| 欧美一区久久| 国产精品久久久久久久久果冻传媒| 欧美国产日韩在线| 精品不卡一区| 久久成人精品无人区| 亚洲欧美日韩网| 欧美色综合网| 妖精视频成人观看www| 亚洲另类自拍| 欧美国产第一页| 亚洲国产日韩欧美| 亚洲精品国产精品乱码不99按摩| 久久精品日产第一区二区| 久久国内精品视频| 国产日产欧美一区| 性久久久久久久久久久久| 欧美一区二区三区免费视| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ入口 | 亚洲欧洲一区二区在线播放| 亚洲国内自拍| 欧美交受高潮1| 亚洲乱码日产精品bd| 一区二区日韩伦理片| 欧美三区免费完整视频在线观看| 亚洲娇小video精品| 99pao成人国产永久免费视频| 欧美激情一区二区三区蜜桃视频| 亚洲国产另类久久精品| 99热免费精品| 国产精品久久久久久久电影| 午夜精品福利在线观看| 久久天堂av综合合色| 亚洲国产裸拍裸体视频在线观看乱了| 免费欧美日韩国产三级电影| 91久久国产自产拍夜夜嗨| 一区二区三区四区五区精品视频| 欧美午夜片在线免费观看| 亚洲欧美国产高清va在线播| 久久精品人人做人人爽电影蜜月| 韩日在线一区| 欧美激情va永久在线播放| 一区二区欧美亚洲| 久久免费高清视频| 日韩午夜在线电影| 国产精品尤物| 农村妇女精品| 亚洲在线观看免费| 欧美国产日韩精品免费观看| 亚洲视频在线观看一区| 国产亚洲午夜高清国产拍精品| 久久婷婷国产综合精品青草| 亚洲精品国产欧美| 久久久99久久精品女同性| 亚洲精品一区二区三区蜜桃久 | 国产在线拍偷自揄拍精品| 欧美1区2区视频| 国产精品99久久久久久宅男| 久久综合伊人77777蜜臀| 中文亚洲视频在线| 在线国产精品播放| 国产精品黄色| 欧美精品一区二区精品网| 亚洲国产成人av| 欧美午夜精品久久久| 久久精品视频va| 一本一本久久| 亚洲国产激情| 久久久久国产免费免费| 亚洲视频中文字幕| 亚洲激情女人| 狠狠色综合网| 国产精品日韩精品欧美在线| 欧美黑人一区二区三区| 久久成人18免费观看| 国产精品99久久久久久www| 亚洲第一主播视频| 久久久亚洲精品一区二区三区 | 日韩一区二区精品| 黄色精品一区二区| 国产精品一区二区久久精品| 欧美激情久久久久| 久久久综合精品| 午夜精品一区二区三区四区| 日韩天天综合| 亚洲人成在线播放网站岛国| 免费成人av| 老司机67194精品线观看| 欧美一区三区二区在线观看| 亚洲一区二区三区免费在线观看| 亚洲毛片在线看| 亚洲黄页一区| 亚洲国产人成综合网站| 精品成人一区| 影音先锋国产精品| 在线电影国产精品| 精品成人免费| 91久久久一线二线三线品牌| 亚洲国产成人午夜在线一区| 在线播放国产一区中文字幕剧情欧美| 国产区精品视频| 国产视频一区在线| 国内伊人久久久久久网站视频| 国产日韩欧美一区二区三区四区| 国产精品日韩电影| 国产日本欧美一区二区三区在线| 国产精品视频导航| 国产精品一区毛片| 国产一区二区精品久久91| 韩国一区电影| 亚洲高清在线观看| 亚洲精品视频免费| 亚洲天堂第二页| 性做久久久久久久久| 久久国产精品久久久久久电车| 久久精品亚洲一区| 麻豆精品精华液| 亚洲国产精品va| 99国产精品一区| 午夜在线观看免费一区| 久久久久久久久综合| 欧美成人资源网|