摘要:
閱讀全文
posted @
2008-04-22 23:33 merlinfang 閱讀(668) |
評論 (1) |
編輯 收藏
當我們看網頁的時候,常??匆姶罅亢臀覀兯P心內容無關的導航條、廣告信息、版權信息以及調查問卷等。有時候,我們可能從中得到一些意外的驚喜;但大多數時候都是非常討厭。
飛行廣告可以說是其中的佼佼者,但已經有插件可以讓它不顯示了。但更多更多的無關廣告,特別是那種點進去還中毒的廣告,是不是也該開發個插件讓它們不要出現在我們面前了。
最近看搜索引擎,搜索引擎分析網頁的時候也需要這樣處理,稱之為網頁凈化。
不過不知道加了這種插件之后,那網站還能不能接到廣告哈。。。
posted @
2008-03-09 22:52 merlinfang 閱讀(1272) |
評論 (0) |
編輯 收藏
摘要:
閱讀全文
posted @
2008-03-05 23:10 merlinfang 閱讀(763) |
評論 (0) |
編輯 收藏
最新研究搜索引擎了,做點筆記。
搜索引擎一般分為三個模塊: 網頁搜集、預處理和查詢服務。
網頁搜集是事先搜集的,在查詢的時候再去搜集明顯不可能了。而事先搜集又分為定期搜集和增量搜集。定期搜集是個全量的搜集過程,往往更新一次需要很長的時間,基本也不時新了,但是實現無疑要簡單點;增量搜集除第一次是全量的外,后續做的就是更新了(包括新增網頁,刪除過期的,以及更新),實現上要復雜的多?,F實上這兩種也是相輔相成的,如新聞的搜索要及時更新,但某些學術網站就很少更新了。
網頁搜集要解決的問題:
(1)各種類型的網頁(html、asp、javascript),各種語種(ascii, utf-8)
(2)網絡資源的多樣化(文件,圖片,文檔,音頻,視頻 etc.)
(3)搜索策略(深度優先,廣度優先)
(4)并發搜集(避免對同一站點同一時刻的大量訪問,不然就變成Dos攻擊了)
(5)避免重復搜集
記錄未訪問、已訪問URL和網頁內容摘要信息
域名與IP的對應問題
(6)判斷網頁的重要程度
1) 網頁的入度大,表明被其他網頁引用的次數多;
2) 某網頁的父網頁入度大;
3) 網頁的鏡像度高,說明網頁內容比較熱門,從而顯得重要;
4) 網頁的目錄深度小,易于用戶瀏覽到。
posted @
2008-03-04 21:52 merlinfang 閱讀(622) |
評論 (2) |
編輯 收藏
好可憐啊,我差一點,就是沒過. 上午倒是50多分,下午考差2分,論文才考了40分.
總結一下,下午按道理肯定能過的,也不知道是打字打多了,寫字手都在發抖,
很多字想不出來怎么寫,瀑布汗~~~~~,全還給小學語文老師了.
不過論文沒過也很正常,完全跟不上時代,還好是4選1,只能選迭代開發吹吹牛,
心里本來就沒覺得迭代開發有多么好,硬著寫了那3千字,一年的字還學那次寫的
多.
要被GF恥笑了,5555,沒事吹牛必過干嗎........
posted @
2008-01-30 20:27 merlinfang 閱讀(305) |
評論 (0) |
編輯 收藏
記得hibernate剛有點火的時候,04年吧,公司也希望能做C++版,愿望是美好,可惜最終是失敗的,作為最后一個接手的人,心中是不盡的失落啊。
現在在另外一個項目組,看到的是4,500張表結構,基本上每張表都寫了個管理類,來封裝一些方法吧??粗杏X是很幼稚啊,感覺象在填充代碼而已,光這些都能折騰幾W行。才覺得當年的持久層如果還在的話是一件多么美好的事情。
總結最終失敗的原因不外乎兩點:
(1)性能太差,既然用了C++肯定就喜歡獲得好的性能;
(2)面向對象不深入人心,就試點項目而言,別人能畫ER圖,但卻不能畫類圖去設計,說是說OQL的方式符合人的思考習慣,但SQL多少年了習慣的人更多。
面向對象的數據庫已經提出好些年,但理論還是不如關系數據庫成熟啊。禮拜天晚上發發牢騷,偶爾想起,緬懷一下我那失敗可憐的項目。
posted @
2008-01-27 21:49 merlinfang 閱讀(1893) |
評論 (4) |
編輯 收藏
摘要:
閱讀全文
posted @
2007-11-17 20:51 merlinfang 閱讀(355) |
評論 (0) |
編輯 收藏
最近上班真的是一點事情也沒有,下班回到家也一樣,發現人太閑了也很難受,于是就有了寫個加密軟件的沖動,主要想做成winrar的樣子,但突出加密和可編輯,沒有壓縮功能。準備剩下的三個月完成第一個版本的開發,好興奮,一定要完成。。。
今天完成了0.01版,真是粗糙啊,有興趣的同僚們破解下看看。。
/Files/merlinfang/encrypt_0.01.rar
加密后成為了"*.era"文件,但原文件目前沒有刪除,怕破壞了大家的文件。
=================================================
一個新的版本,使用AES加密的了.
/Files/merlinfang/encrypt_0.02.rar
不過離真正完成還差很遠.
界面上的差距:
修改密碼功能
完成進度條
界面根據實際情況灰化
規劃程序目錄
posted @
2007-08-13 22:35 merlinfang 閱讀(1734) |
評論 (6) |
編輯 收藏
摘要:
閱讀全文
posted @
2007-07-20 21:28 merlinfang 閱讀(4037) |
評論 (2) |
編輯 收藏
摘要:
閱讀全文
posted @
2007-07-16 20:46 merlinfang 閱讀(2363) |
評論 (0) |
編輯 收藏