最近也不知道在干什么,每天沒精打采的,寫點代碼,有時候是垃圾代碼,有時候精妙的代碼,呵呵可是不是我的原創從
HACKER'S DELIGHT上copy來的東西,至于想干什么,我自己現在都有點不知道。究竟該去讀書,還是繼續上班也沒個定數,反正心里很亂。要盡快下個決定,時間不等人!
最近在做數據挖掘中的web usage mining,關于apache
log的東西,準備這次用C寫了,惡心的java,感這種事情就是瘋子的想法,我上次的一個相關性分析和聚類的模型使用Java寫的,讓我惱火至極,可能
我比較懶學不好Java的思想,還是寫C,寫匯編比較好玩,呵呵,我還是比較擅長和機器打交道,不適合和人說話,呵呵因為OO太像人類說話的思維了,沒有
機器的那種優美的感覺,要是匯編高手的話,就會有和“尤尼5號”談話的感覺,很早的一部機器人電影了,感覺非常的好,呵呵,可能Java然我感覺不到我在
控制計算機,感覺不到控制一堆破銅爛鐵硅,所以我學不好Java吧,不過,存在就是合理的,Java的確很優秀,以后也要好好學習一下。
做Web log
mining的時候現在最大的問題就是運算效率,現在數據量小,要是以后的log數據每天上了幾百GB,呵呵,幾百GB的文本的有多少行,呵呵至少是分文
件的,不過就算是10GB的文本操作起來,統計起來,挖掘起來也是個要命的事情,而且極其要命,這個和在學校做實驗不一樣,在學校做實驗可能50行的數據
就算不錯了,根本不會去考慮那么大的數據,現在不同了,在公司要做東西,唉,上班是很無聊的事情,還是那句話真想去讀Ph.D,而且是數學Ph.D、計算
機Ph.D一起讀,朕相信自己能力!
web log
mining的paper看了不少,但是做的很牛的公司卻不知道都在干什么,比如google一定也在做,不過分析什么東西就不知道了,手段更是不得而
知,天曉得他們怎么想的,看了一堆paper,照著paper寫代碼呵呵這可真是一種挑戰。從國外到國內大家分析的都是那一點東西,key
page,權威頁面,訪問統計,URL聚類,URL關聯,etc……不過這些東西寫起來還真的是更像實驗品而不能夠做成產品,呵呵,究竟什么是產品,老子
也不知道,反正每天聽一幫傻逼談論的頭頭是道,那天聽見他們說:
產品@#¥……%&……#%@&,
操作系統¥%#……!@&*(#……,
算法&……#%*!@&*(¥!,
挖掘&*……#@)(*,
web OS&
*(……#&*#@,靠,都是瘋子,什么叫做狗屁不懂,什么叫半吊子,老子見識了。我雖然學的不好,但我不出來到處亂講啊,就是認真學就是了。可
是他們,明明沒學過也能瞎他媽的胡編亂造的叭叭,真讓我哭笑不得。那天聽見一個驚天之語:“算法就是做小學應用題的東西”。哇哈哈哈,笑的我真不想在說什
么了,這也太搞了吧,操,一群不學無術的家伙!!