青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆 - 224  文章 - 41  trackbacks - 0
<2010年4月>
28293031123
45678910
11121314151617
18192021222324
2526272829301
2345678

享受編程

常用鏈接

留言簿(11)

隨筆分類(lèi)(159)

隨筆檔案(224)

文章分類(lèi)(2)

文章檔案(4)

經(jīng)典c++博客

搜索

  •  

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

皮爾遜公式

前言

在很多推薦算法的地方,涉及到了很多關(guān)于數(shù)學(xué)的公式,如果簡(jiǎn)單的應(yīng)用這些公式,那當(dāng)然較為的簡(jiǎn)單,當(dāng)如果有真正的理解這些公式里面隱含著的道理那就要下一定的苦功夫。

我們這里不從皮爾遜的公式講起,我們從物物的推薦開(kāi)始。

問(wèn)題

這里以音樂(lè)的推薦為例子,對(duì)于音樂(lè)的推薦很多人都在做,比較好解釋清楚。給你一首歌曲讓你推薦10首相識(shí)的歌曲。推薦的數(shù)據(jù)來(lái)源是這樣子的。每個(gè)人都會(huì)通過(guò)搜索歌曲來(lái)聽(tīng)他們自己喜歡的歌曲。這樣歌曲就能有一些相關(guān)的特性了,關(guān)于數(shù)據(jù)的問(wèn)題我們等下再進(jìn)一步的說(shuō)明。

如果我們不按數(shù)學(xué)的方法來(lái)思考這個(gè)問(wèn)題的話(huà),平常的人我們會(huì)怎樣來(lái)解決這個(gè)問(wèn)題呢?我們是這樣想的,某一首音樂(lè),他會(huì)存在不同的用戶(hù)中,如果這些用戶(hù)也存在著某些歌曲,我們就可以計(jì)算這首歌曲中在不同的用戶(hù)中還存在了多少歌曲,這些歌曲的個(gè)數(shù)是多少,就可以有一個(gè)排序,這就是我們要的相識(shí)歌曲。

我們簡(jiǎn)單的用數(shù)學(xué)來(lái)描述一下:

假設(shè)有兩個(gè)人甲,乙,三首歌曲A B C,如果甲有這首歌就標(biāo)記為1,沒(méi)有的話(huà)就標(biāo)記為零

   A B C

甲 1 1 1

乙 0 1 0 

按照我們的算法

在甲用戶(hù)中

Dict[A][B]=1,Dict[A][C]=1

乙用戶(hù)沒(méi)有A

這樣歌曲A和B、C都相識(shí),而且相識(shí)度都一樣為1。眨眼看上去這種算法,很完美,非常的完美,因?yàn)槠綍r(shí)我們聊起推薦系統(tǒng)的時(shí)候,時(shí)不時(shí)的一開(kāi)口就讓你這樣做了。真的無(wú)懈可擊了當(dāng)然不是這樣,讓我們?cè)倏匆淮螖?shù)據(jù),你會(huì)發(fā)現(xiàn),其實(shí)A,C    的數(shù)據(jù)是一樣一樣的,理論上我們會(huì)覺(jué)得A,跟C的相識(shí)度是最高的,但是他的相識(shí)度卻和B一樣,這開(kāi)起來(lái)是不合理的,但這是為什么呢。

 


改進(jìn)

回想一下如果進(jìn)一步的假設(shè),用1來(lái)標(biāo)記喜歡,用0來(lái)標(biāo)記不喜歡的話(huà),我們這一種算法其實(shí)是沒(méi)有考慮不喜歡這個(gè)因素的。很多人都認(rèn)為不能這樣假設(shè),我告訴你,其實(shí)這是數(shù)據(jù)的問(wèn)題,如果我們把使用的數(shù)據(jù)能夠滿(mǎn)足這里的假設(shè),完全是可以采用的。

這里我想說(shuō)的是,我并不認(rèn)為我們使用的第一個(gè)算法,有多大的問(wèn)題,只是想說(shuō)的是,這種算法還不完美,還可以有改進(jìn)的空間,這不就是我們一直所擁有的理念,把事情改變的更好。

進(jìn)一步的再說(shuō):如果我們的數(shù)據(jù)不僅是1和0呢,用戶(hù)對(duì)歌曲有打分了,怎么辦呢?

  A B C

甲 3 4 3

乙 0 2 0

當(dāng)然很多人會(huì)說(shuō),算法也可以哦,字典里的數(shù)據(jù)跟著變Dict[A][B]=3,Dict[A][C]=3,但是有個(gè)問(wèn)題不知道有沒(méi)有注意到,每個(gè)人對(duì)打分的理解是不一樣的,有的人覺(jué)得3分就是很好聽(tīng)的歌曲,而有的人要覺(jué)得4分才是很好聽(tīng)的歌曲,也就是說(shuō),每個(gè)人打分的標(biāo)準(zhǔn)不一樣,導(dǎo)致了打出的分?jǐn)?shù)和比人比較的時(shí)候是不一樣的,但自己的標(biāo)準(zhǔn)大部分的時(shí)間是不會(huì)變的。

皮爾遜公式

這里我們需要一種算法。能夠概括這些情況的。這就是皮爾遜公式。

假設(shè)有兩個(gè)變量X、Y,那么兩變量間的皮爾遜相關(guān)系數(shù)可通過(guò)以下公式計(jì)算:

公式一:

 

皮爾遜相關(guān)系數(shù)計(jì)算公式

公式二:

 

皮爾遜相關(guān)系數(shù)計(jì)算公式

公式三:

 

皮爾遜相關(guān)系數(shù)計(jì)算公式

公式四:

 

皮爾遜相關(guān)系數(shù)計(jì)算公式

 

以上列出的四個(gè)公式等價(jià),其中E是數(shù)學(xué)期望,cov表示協(xié)方差,N表示變量取值的個(gè)數(shù)。

皮爾遜算法過(guò)于復(fù)雜,如果要有點(diǎn)理解的話(huà),可以使用把維數(shù)降到二維,這樣就跟余弦定理有點(diǎn)相識(shí)了,相識(shí)度就是兩條直線(xiàn)的夾角,角度為0的時(shí)候,皮爾遜的值為1,就是最相識(shí)的,如果角度為180度,代表兩個(gè)牛馬不相干,皮爾遜的值為-1。


總結(jié)

很多時(shí)候,以前牛逼的數(shù)學(xué)家已經(jīng)給了我們很多很好用的數(shù)學(xué)公式,只是如果沒(méi)有真正去用過(guò)的話(huà),我們并不知道他所涉及的原理。好好的研究數(shù)學(xué)公式,他會(huì)給給我們的算法帶來(lái)一定的優(yōu)化作用。關(guān)于公式的優(yōu)化比較難了,以前的數(shù)學(xué)家給了我們很多的想法,而能夠優(yōu)化的就是我們的數(shù)據(jù),如何取數(shù)據(jù),這里主要的是,那個(gè)數(shù)據(jù)離用戶(hù)的行為越近,離你使用的數(shù)學(xué)模型越近,那個(gè)數(shù)據(jù)就越好用。

參考:

http://lobert.iteye.com/blog/2024999

http://zh.wikipedia.org/wiki/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%A7%AF%E7%9F%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0

posted on 2014-07-23 16:08 漂漂 閱讀(4261) 評(píng)論(1)  編輯 收藏 引用

FeedBack:
# re: 你應(yīng)該知道的推薦算法--皮爾遜公式介紹和意義 2016-08-12 14:21 是是是
鄂爾泰沒(méi)看夠  回復(fù)  更多評(píng)論
  

只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。
網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
      <noscript id="pjuwb"></noscript>
            <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
              <dd id="pjuwb"></dd>
              <abbr id="pjuwb"></abbr>
              亚洲综合国产精品| 欧美成人精品影院| 伊人久久大香线| 亚洲精选视频免费看| 久久成人18免费网站| 久久国产加勒比精品无码| 欧美亚洲一级片| 久久精品免费看| 欧美国产精品久久| 欧美久久久久| 国产欧美一区二区三区在线看蜜臀| 国产偷久久久精品专区| 在线日韩中文字幕| 亚洲午夜精品久久| 久久亚洲精品一区| 亚洲精品国产拍免费91在线| 亚洲精品一线二线三线无人区| 亚洲亚洲精品在线观看| 久久人人九九| 国产精品视频久久久| 在线观看免费视频综合| 亚洲在线网站| 欧美福利在线| 亚洲欧美日本国产有色| 蜜乳av另类精品一区二区| 欧美性淫爽ww久久久久无| **欧美日韩vr在线| 翔田千里一区二区| 亚洲黄色成人网| 久久精品国产视频| 国产精品久久久91| 亚洲精品裸体| 久久字幕精品一区| 亚洲一区二区三区视频播放| 欧美成人精品福利| 韩国三级电影一区二区| 亚洲永久精品大片| 亚洲国产精品va在看黑人| 久久国产精品久久久久久久久久 | 午夜精品区一区二区三| 免费的成人av| 午夜日韩福利| 国产精品入口日韩视频大尺度| 亚洲人永久免费| 久久躁狠狠躁夜夜爽| 午夜精品美女久久久久av福利| 欧美日本免费| 99热精品在线观看| 亚洲黄色在线视频| 久久久噜噜噜| 国产综合久久久久久| 性娇小13――14欧美| 亚洲无线视频| 国产精品自在在线| 欧美亚洲一区三区| 亚洲专区在线视频| 亚洲精品一区二区三区福利| 久久午夜色播影院免费高清| 亚洲一区二区三区四区中文 | 欧美在线视频二区| 亚洲欧美国内爽妇网| 国产欧美一区二区精品仙草咪| 亚洲一二三四久久| 一区二区三区日韩精品视频| 欧美色区777第一页| 亚洲免费在线看| 亚洲欧美日韩综合一区| 国产午夜精品全部视频播放 | 亚洲性感激情| 亚洲在线播放| 国外成人免费视频| 六月婷婷久久| 欧美大片国产精品| 一本久久青青| 亚洲视频在线观看免费| 国产亚洲精品美女| 欧美成人免费视频| 欧美日韩国产页| 久久激情五月婷婷| 欧美成人精品三级在线观看 | 亚洲激情影视| 亚洲精品欧美日韩专区| 国产精品第2页| 久久激情一区| 欧美大片在线看| 午夜久久久久| 美女在线一区二区| 性色av香蕉一区二区| 狂野欧美激情性xxxx欧美| 在线视频你懂得一区二区三区| 亚洲一区二区三区在线视频| 极品尤物久久久av免费看| 亚洲人成精品久久久久| 国产伦精品一区二区三区| 欧美高清在线| 国产一二三精品| 亚洲美女在线国产| 伊人成人开心激情综合网| 日韩亚洲欧美高清| 一区二区在线视频播放| 这里只有精品在线播放| 亚洲国产网站| 久久精品国产77777蜜臀| 一区二区精品| 欧美成黄导航| 久久亚洲捆绑美女| 国产精品国产一区二区| 亚洲国产精品电影| 国产在线精品成人一区二区三区 | 亚洲一区二区三区免费在线观看| 欧美日韩亚洲系列| 麻豆成人综合网| 欧美性猛交视频| 欧美高清视频一区二区三区在线观看| 国产精品婷婷午夜在线观看| 亚洲日本欧美| 亚洲高清三级视频| 欧美一区三区二区在线观看| 校园春色国产精品| 国产精品99免费看| 日韩网站在线看片你懂的| 91久久中文字幕| 久久综合五月| 欧美日韩激情网| 99国产精品视频免费观看| 国产精品一区二区在线观看不卡| 欧美成va人片在线观看| 国产亚洲成av人在线观看导航 | 欧美视频在线播放| 亚洲国产99| 亚洲日本中文字幕区| 久久久噜噜噜久久中文字幕色伊伊 | 欧美精品日韩一区| 久久免费国产| 欧美日韩一区二区三区高清| 亚洲第一页中文字幕| 亚洲第一二三四五区| 久久久精品免费视频| 久久夜色精品国产噜噜av| 国内精品视频666| 久久精品国产精品| 久久伊人免费视频| 亚洲成色999久久网站| 久久婷婷av| 亚洲国产经典视频| 一区二区电影免费观看| 国产精品多人| 久久本道综合色狠狠五月| 久久综合综合久久综合| 亚洲人成人一区二区三区| 欧美日韩一区在线| 午夜精品久久久久久99热软件| 久久久欧美精品sm网站| 亚洲激情视频在线播放| 欧美午夜精品久久久久久人妖| 亚洲小说区图片区| 欧美亚洲自偷自偷| 黄色国产精品| 欧美精品福利视频| 亚洲永久在线观看| 美日韩精品免费观看视频| 亚洲精品国偷自产在线99热| 欧美午夜不卡在线观看免费 | 亚洲精品乱码久久久久久久久| 欧美激情一区二区三区在线| 亚洲视频你懂的| 亚洲视频一区二区免费在线观看| 在线视频中文亚洲| 91久久精品久久国产性色也91| 欧美日本高清视频| 午夜视频一区二区| 亚洲动漫精品| 欧美一区二区在线看| 亚洲高清一区二区三区| 欧美日韩中文在线| 久久久精彩视频| 日韩午夜电影av| 久久久久久久久岛国免费| 亚洲黄色大片| 国产美女精品免费电影| 欧美成人网在线| 午夜视频久久久| 亚洲精品自在久久| 猛干欧美女孩| 西西裸体人体做爰大胆久久久 | 99精品国产一区二区青青牛奶| 国产精品日韩在线| 欧美成年人网站| 久久国产成人| 亚洲女人av| 亚洲精品国产精品乱码不99按摩| 久久精品视频网| 亚洲一区制服诱惑| 亚洲免费成人av| 亚洲国产欧美日韩精品| 国产一区二区三区网站| 国产精品久久久久aaaa樱花| 欧美激情第1页| 老司机午夜精品| 久久久精品国产免大香伊|