青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 15, comments - 10, trackbacks - 0, articles - 0

跨機房的hadoop集群

Posted on 2013-10-27 23:28 whspecial 閱讀(5292) 評論(0)  編輯 收藏 引用 所屬分類: hadoop

這是來自于阿里技術嘉年華的一個分享,因為在百度也考慮過類似的事情,所以聽得比較有感悟,這里把相關內(nèi)容整理一下。

首先尊重版權,還是把原鏈接和作者貼上:

http://adc.alibabatech.org/carnival/history/schedule/2013/detail/main/286?video=0

來自于阿里吳威工程師的分享

 

首先需要說明一點,跨機房hadoop可能應用場景并不是很多,國內(nèi)像BAT這種巨頭也許需要,但是大部分的中小公司也許并不需要這個,也許這是個屠龍之技,呵呵。

把這個問題分三段來講,第一段是問題出現(xiàn)的背景,第二段是解決該問題的難點,第三段是最終的解決方案。

(一) 背景:

先要看下為什么需要做一個跨機房的大集群?

大集群的優(yōu)點在于數(shù)據(jù)管理和授權容易(這個問題在一個多部門的大公司還是很重要的);跨部門的使用數(shù)據(jù)容易,無需重復拉取數(shù)據(jù)。

在集群達到一定規(guī)模時,單機房(機房內(nèi)的容量是有限的)已經(jīng)無法滿足集群的需求了,要想一勞永逸的解決問題,需要建設一個跨機房的hadoop集群。

(二)技術挑戰(zhàn):

2.1 NameNode的性能問題:

         在管理一個巨大的hadoop集群時,由于原始的Namenode是單節(jié)點,因此會成為一個性能瓶頸,遇到的性能問題主要包括兩方面:存儲容量問題(存儲元數(shù)據(jù))和計算壓力(處理rpc請求,修改內(nèi)存樹時候需要全局鎖)問題。

         其中存儲容量問題可以依賴內(nèi)存的垂直擴展來解決,但是計算壓力卻很難通過提升硬件來解決(因為目前廠商的主要發(fā)展方向是多核,而非提高主頻)

2.2機房之間的網(wǎng)絡限制:

         機房之間的網(wǎng)絡永遠是個硬件條件的限制,跨機房的網(wǎng)絡傳輸帶來了數(shù)據(jù)延時和帶寬限制:

1, 延時一般是在10ms之內(nèi),而hadoop上大部分運行的是離線作業(yè),基本可接受

2, 帶寬限制的問題比較大,因為單機房內(nèi)的點對點帶寬一般是在1Gbps,而機房之間的帶寬確在20Mbps左右,非常有限。

2.3資源組之間的管理

         每個部門可以看做一個資源組,它們可能會互相使用對方的數(shù)據(jù),因此如何規(guī)劃計算和存儲的位置就很重要,否則會在多個機房之間出現(xiàn)大量的數(shù)據(jù)拷貝。

(三)解決方案:

先看下整個跨集群hadoop的架構圖:


 

重點介紹里面三點,也就是和上面三個問題相對應的:

1, 可以看到這里畫出了兩個NNnamenode),它們實際上還是屬于一個hadoop集群,這是業(yè)界里的一個解決方案:HDFS Fedaration,它為了解決元數(shù)據(jù)節(jié)點性能問題;

2, 可以看到這里有一個cross node節(jié)點,它是用來在兩個機房之間同步數(shù)據(jù)的,它的設計考慮到了機房間的網(wǎng)絡限制;

3, 最后是groupAgroupB,這是為了解決數(shù)據(jù)產(chǎn)出方和使用方關系來用的。

3.1 Federation

Federation相關資料見:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Federation.html#HDFS_Federation


為了水平擴展Namenodefederation使用了多個互相獨立的namenode。它們之間互相不需要通信,每個datenode需要向全部namenode注冊并發(fā)送信息。

BlockPool是屬于一個namenodeblock集合,每個blockpool之間也是互相獨立的。

         federation里,有一個需要關注的問題,就是多個namenode的地址如何對用戶進行透明?它采用的解決方案是目錄樹掛載的方案(社區(qū)有個viewFS,應該就是為了解決這個問題):熟悉linux或者nfs的朋友應該都知道mount這個概念,目錄樹掛載就是這個意思。

不過使用目錄樹掛載也存在著一個問題,就是各個子目錄下的存儲資源需要人為的介入管理,不能出現(xiàn)嚴重的不均。

3.2 crossNode

         機房間的網(wǎng)絡限制要求不能出現(xiàn)大規(guī)模、長時間的數(shù)據(jù)拷貝,需要一個專門管理機房間數(shù)據(jù)拷貝的進程,叫做crossNode。它是獨立部署的一個節(jié)點,和元數(shù)據(jù)節(jié)點是分離的。

         它能提供的功能概括來說主要包括以下三點:

a) 根據(jù)預置的跨機房文件,進行數(shù)據(jù)拷貝

b) 處理實時的數(shù)據(jù)拷貝請求

c) 進行跨機房的數(shù)據(jù)流量控制

如何得知跨機房文件列表?

         由于離線任務基本都是定時觸發(fā)的,可以根據(jù)對歷史作業(yè)的分析來形成一個跨機房文件列表

3.3   資源組之間的管理

各個資源組之間存在數(shù)據(jù)的依賴,我們希望通過資源組管理,能實現(xiàn)大部分任務在本機房內(nèi)產(chǎn)出數(shù)據(jù),只有少量跨機房產(chǎn)出數(shù)據(jù);大部分任務讀取本機房的數(shù)據(jù)副本,只有少量跨機房讀取數(shù)據(jù)。

為了標識資源組之間的數(shù)據(jù)依賴性,定義一個資源組之間的距離概念:一個資源組訪問另一個資源組的數(shù)據(jù)量越多,則兩者的距離越近,應該將距離接近的資源組放在同一個機房內(nèi)。

為了讓計算和產(chǎn)出盡可能地靠近,使用一個MRProxy,對于不同類型的任務做不同處理:

a)            離線計算:跨機房列表中的數(shù)據(jù)正在傳輸中(DC1->DC2),DC2上的 Job 被暫停調(diào)度,等待傳輸完畢

b)            Ad-hoc查詢:DC2上的 Job 需要讀DC1上的數(shù)據(jù),Job暫停調(diào)度,通知 CrossNode,數(shù)據(jù)傳輸完畢后繼續(xù)調(diào)度

c)             特殊情況:跨機房數(shù)據(jù) JoinDC1大表,DC2小表,Job 調(diào)度到DC1上,跨機房直接讀取DC2數(shù)據(jù),無需等待

 

由于是根據(jù)視頻和ppt整理,并沒有代碼或者文檔,所以可能有些地方的理解有偏差,歡迎來提意見~

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲国产精品一区二区三区| 亚洲精品一区二区三区av| 国产精品乱人伦一区二区| 女生裸体视频一区二区三区| 久久国产欧美| 久久成人久久爱| 久久久九九九九| 久久综合伊人| 欧美精选在线| 国产精品视频一二三| 国产欧美一区二区精品仙草咪| 国产日韩久久| 亚洲国产另类 国产精品国产免费| 在线电影欧美日韩一区二区私密| 亚洲欧洲综合| 一区二区三区日韩精品| 亚洲欧美日韩国产成人| 久久久久成人精品| 亚洲福利在线观看| 亚洲精品久久嫩草网站秘色| 亚洲一区二区三区四区在线观看| 久久精品亚洲精品| 欧美日韩成人激情| 国产有码在线一区二区视频| 99av国产精品欲麻豆| 欧美影院午夜播放| 亚洲大片免费看| 亚洲欧美日韩国产中文| 欧美国产一区二区在线观看| 国产美女精品在线| 9l国产精品久久久久麻豆| 久久久久99精品国产片| 日韩亚洲视频在线| 久久久久国内| 国产色综合久久| 亚洲手机成人高清视频| 欧美成人三级在线| 亚洲一区三区电影在线观看| 欧美韩日高清| **网站欧美大片在线观看| 欧美亚洲综合网| 日韩亚洲欧美成人一区| 欧美大片va欧美在线播放| 国产日韩专区| 欧美伊久线香蕉线新在线| 99伊人成综合| 欧美精品久久久久a| 在线观看精品| 久久人人精品| 亚洲综合欧美| 欧美网站在线观看| 99re6这里只有精品| 欧美激情综合色| 久热精品视频| 久久国产精品久久久| 亚洲一区综合| 欧美成人亚洲成人| 亚洲高清av在线| 久久综合伊人| 久久久噜噜噜久久久| 国精产品99永久一区一区| 欧美主播一区二区三区| 亚洲欧美欧美一区二区三区| 国产精品国产自产拍高清av| 一本色道久久88综合亚洲精品ⅰ| 亚洲国产欧美在线| 欧美mv日韩mv国产网站app| 在线精品国产成人综合| 噜噜噜噜噜久久久久久91| 久久电影一区| 黄色在线成人| 欧美高清在线观看| 欧美国产亚洲精品久久久8v| 99精品国产福利在线观看免费| 亚洲电影有码| 欧美日韩成人一区| 亚洲欧美bt| 午夜欧美精品| 亚洲第一精品福利| 亚洲欧洲一区| 国产精品福利在线观看| 久久成人久久爱| 久久亚洲一区二区| 99riav国产精品| 亚洲一级特黄| 亚洲大片一区二区三区| 亚洲第一黄色网| 欧美午夜免费电影| 久久久久久婷| 欧美精品在线视频| 欧美一区二区网站| 久久久久.com| 宅男噜噜噜66国产日韩在线观看| 亚洲视频精选在线| 在线观看日韩专区| 日韩一区二区精品| 国内精品久久国产| 最新成人av网站| 国产日韩综合一区二区性色av| 欧美va天堂| 国产精品久久久久免费a∨大胸 | 亚洲国产精品久久久久久女王| 欧美搞黄网站| 国产精品久在线观看| 欧美激情女人20p| 国产美女精品视频| 亚洲伦伦在线| 亚洲高清网站| 欧美一二三区精品| 亚洲一区二区在线看| 久久久久久穴| 欧美中文字幕第一页| 欧美四级剧情无删版影片| 欧美高清一区二区| 国产欧美日韩精品专区| 亚洲日本成人网| 免费黄网站欧美| 欧美激情一二区| 久久日韩粉嫩一区二区三区| 99精品热6080yy久久| 精品999在线播放| 狠狠色综合日日| 在线观看日韩| 亚洲精品在线观看免费| 日韩一级裸体免费视频| 亚洲视频图片小说| 欧美一区二区在线免费播放| 久久精品盗摄| 欧美韩日精品| 亚洲免费一在线| 久久这里有精品视频| 欧美激情女人20p| 国产精品美女一区二区| 影音先锋亚洲电影| 日韩一级欧洲| 美女精品在线| 亚洲一区二区免费| 欧美国产在线视频| 黑人巨大精品欧美一区二区| 亚洲免费观看高清在线观看 | 一区二区三区国产在线| 欧美专区在线播放| 国产精品久久久久国产精品日日| 一区视频在线| 久久久精彩视频| 在线一区二区三区做爰视频网站 | 欧美一区二区视频观看视频| 欧美日韩久久不卡| 一区在线免费观看| 久久久久久久久久久久久久一区 | 蜜桃av一区二区| 亚洲久久视频| 欧美理论电影在线观看| 亚洲欧洲在线视频| 亚洲福利视频二区| 欧美a一区二区| 亚洲精品久久久久久久久久久久久| 久久久激情视频| 久久精品人人做人人综合| 国产真实久久| 美女视频黄 久久| 久久综合九色九九| 日韩写真视频在线观看| 99视频在线精品国自产拍免费观看| 免费在线看成人av| 一区二区毛片| 亚洲欧美激情视频在线观看一区二区三区 | 欧美一级夜夜爽| 欧美一区二区视频在线观看2020| 国产精品男人爽免费视频1| 午夜精品久久| 久久久精品2019中文字幕神马| 在线观看久久av| 这里只有精品视频| 亚洲国产精品电影| 亚洲欧美日韩国产精品 | 欧美激情一区二区三区蜜桃视频| 亚洲精品综合在线| 欧美在线免费观看| 亚洲欧美日韩中文播放| 久久久蜜臀国产一区二区| 亚洲一区二区三区在线| 久久一区激情| 美女国产一区| 国产精品有限公司| 99国产精品视频免费观看| 亚洲天堂av电影| 亚洲乱码国产乱码精品精| 欧美在线亚洲一区| 香蕉免费一区二区三区在线观看| 蜜臀va亚洲va欧美va天堂| 久久久久www| 黄色影院成人| 久色婷婷小香蕉久久| 农村妇女精品| 亚洲人成网站999久久久综合| 久久精品欧美日韩精品| 久久免费视频网站| 亚洲国产精品电影在线观看| 久久人人97超碰人人澡爱香蕉|