青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 15, comments - 10, trackbacks - 0, articles - 0

跨機房的hadoop集群

Posted on 2013-10-27 23:28 whspecial 閱讀(5289) 評論(0)  編輯 收藏 引用 所屬分類: hadoop

這是來自于阿里技術嘉年華的一個分享,因為在百度也考慮過類似的事情,所以聽得比較有感悟,這里把相關內容整理一下。

首先尊重版權,還是把原鏈接和作者貼上:

http://adc.alibabatech.org/carnival/history/schedule/2013/detail/main/286?video=0

來自于阿里吳威工程師的分享

 

首先需要說明一點,跨機房hadoop可能應用場景并不是很多,國內像BAT這種巨頭也許需要,但是大部分的中小公司也許并不需要這個,也許這是個屠龍之技,呵呵。

把這個問題分三段來講,第一段是問題出現的背景,第二段是解決該問題的難點,第三段是最終的解決方案。

(一) 背景:

先要看下為什么需要做一個跨機房的大集群?

大集群的優點在于數據管理和授權容易(這個問題在一個多部門的大公司還是很重要的);跨部門的使用數據容易,無需重復拉取數據。

在集群達到一定規模時,單機房(機房內的容量是有限的)已經無法滿足集群的需求了,要想一勞永逸的解決問題,需要建設一個跨機房的hadoop集群。

(二)技術挑戰:

2.1 NameNode的性能問題:

         在管理一個巨大的hadoop集群時,由于原始的Namenode是單節點,因此會成為一個性能瓶頸,遇到的性能問題主要包括兩方面:存儲容量問題(存儲元數據)和計算壓力(處理rpc請求,修改內存樹時候需要全局鎖)問題。

         其中存儲容量問題可以依賴內存的垂直擴展來解決,但是計算壓力卻很難通過提升硬件來解決(因為目前廠商的主要發展方向是多核,而非提高主頻)

2.2機房之間的網絡限制:

         機房之間的網絡永遠是個硬件條件的限制,跨機房的網絡傳輸帶來了數據延時和帶寬限制:

1, 延時一般是在10ms之內,而hadoop上大部分運行的是離線作業,基本可接受

2, 帶寬限制的問題比較大,因為單機房內的點對點帶寬一般是在1Gbps,而機房之間的帶寬確在20Mbps左右,非常有限。

2.3資源組之間的管理

         每個部門可以看做一個資源組,它們可能會互相使用對方的數據,因此如何規劃計算和存儲的位置就很重要,否則會在多個機房之間出現大量的數據拷貝。

(三)解決方案:

先看下整個跨集群hadoop的架構圖:


 

重點介紹里面三點,也就是和上面三個問題相對應的:

1, 可以看到這里畫出了兩個NNnamenode),它們實際上還是屬于一個hadoop集群,這是業界里的一個解決方案:HDFS Fedaration,它為了解決元數據節點性能問題;

2, 可以看到這里有一個cross node節點,它是用來在兩個機房之間同步數據的,它的設計考慮到了機房間的網絡限制;

3, 最后是groupAgroupB,這是為了解決數據產出方和使用方關系來用的。

3.1 Federation

Federation相關資料見:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Federation.html#HDFS_Federation


為了水平擴展Namenodefederation使用了多個互相獨立的namenode。它們之間互相不需要通信,每個datenode需要向全部namenode注冊并發送信息。

BlockPool是屬于一個namenodeblock集合,每個blockpool之間也是互相獨立的。

         federation里,有一個需要關注的問題,就是多個namenode的地址如何對用戶進行透明?它采用的解決方案是目錄樹掛載的方案(社區有個viewFS,應該就是為了解決這個問題):熟悉linux或者nfs的朋友應該都知道mount這個概念,目錄樹掛載就是這個意思。

不過使用目錄樹掛載也存在著一個問題,就是各個子目錄下的存儲資源需要人為的介入管理,不能出現嚴重的不均。

3.2 crossNode

         機房間的網絡限制要求不能出現大規模、長時間的數據拷貝,需要一個專門管理機房間數據拷貝的進程,叫做crossNode。它是獨立部署的一個節點,和元數據節點是分離的。

         它能提供的功能概括來說主要包括以下三點:

a) 根據預置的跨機房文件,進行數據拷貝

b) 處理實時的數據拷貝請求

c) 進行跨機房的數據流量控制

如何得知跨機房文件列表?

         由于離線任務基本都是定時觸發的,可以根據對歷史作業的分析來形成一個跨機房文件列表

3.3   資源組之間的管理

各個資源組之間存在數據的依賴,我們希望通過資源組管理,能實現大部分任務在本機房內產出數據,只有少量跨機房產出數據;大部分任務讀取本機房的數據副本,只有少量跨機房讀取數據。

為了標識資源組之間的數據依賴性,定義一個資源組之間的距離概念:一個資源組訪問另一個資源組的數據量越多,則兩者的距離越近,應該將距離接近的資源組放在同一個機房內。

為了讓計算和產出盡可能地靠近,使用一個MRProxy,對于不同類型的任務做不同處理:

a)            離線計算:跨機房列表中的數據正在傳輸中(DC1->DC2),DC2上的 Job 被暫停調度,等待傳輸完畢

b)            Ad-hoc查詢:DC2上的 Job 需要讀DC1上的數據,Job暫停調度,通知 CrossNode,數據傳輸完畢后繼續調度

c)             特殊情況:跨機房數據 JoinDC1大表,DC2小表,Job 調度到DC1上,跨機房直接讀取DC2數據,無需等待

 

由于是根據視頻和ppt整理,并沒有代碼或者文檔,所以可能有些地方的理解有偏差,歡迎來提意見~

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美激情精品久久久久久黑人 | 久久久夜夜夜| 亚洲精品之草原avav久久| 黄色成人av| 国产主播一区| 在线视频成人| 亚洲国产精品久久久久| 亚洲日韩欧美视频| 99成人免费视频| 亚洲一区一卡| 午夜视频在线观看一区二区三区| 午夜欧美精品| 久久这里只有| 亚洲剧情一区二区| 亚洲国产天堂网精品网站| 麻豆成人av| 亚洲日本激情| 亚洲在线免费| 榴莲视频成人在线观看| 欧美黑人多人双交| 国产精品区免费视频| 国语自产精品视频在线看8查询8| 亚洲第一黄网| 亚洲欧美日韩国产综合| 久久综合狠狠| 99精品久久久| 久久精品青青大伊人av| 欧美日韩国产欧美日美国产精品| 国产精品资源| 亚洲免费福利视频| 久久久一二三| 亚洲一区自拍| 欧美久久视频| 伊人天天综合| 午夜精品免费视频| 亚洲国内精品在线| 久久久久久久999| 国产精品免费看| 亚洲精品久久久久久一区二区 | 老司机精品导航| 国产精品第一页第二页第三页| 国内伊人久久久久久网站视频| 一本色道久久88亚洲综合88| 久久最新视频| 亚洲欧美日韩专区| 国产精品初高中精品久久| 亚洲国产精品一区二区www| 欧美诱惑福利视频| 亚洲精品日韩欧美| 欧美国产三区| 亚洲高清在线观看| 亚洲欧洲综合另类| 久久婷婷国产综合尤物精品| 日韩一级黄色大片| 另类天堂视频在线观看| 国产亚洲人成a一在线v站| 亚洲网站啪啪| 亚洲国产日韩在线一区模特| 美女主播一区| 永久免费精品影视网站| 国户精品久久久久久久久久久不卡| 宅男66日本亚洲欧美视频| 欧美激情免费在线| 蜜臀99久久精品久久久久久软件| 国产一区二区三区高清| 久久精品1区| 亚洲美女av网站| 欧美日韩一二区| 这里只有精品视频在线| 亚洲精品国产视频| 欧美精品免费播放| 一区二区三区精品国产| 99re66热这里只有精品3直播| 欧美激情一区二区| 亚洲一区二区视频在线观看| 亚洲欧洲日本专区| 欧美丝袜一区二区| 欧美一区二区三区成人| 欧美在线啊v一区| 在线看不卡av| 亚洲激情视频| 国产精品久久久久久模特| 欧美一区2区三区4区公司二百| 午夜精品久久久99热福利| 国产一区自拍视频| 欧美成人嫩草网站| 欧美精品在线视频| 欧美一二三区精品| 久久精品一区二区三区四区| 亚洲国产第一页| 亚洲美女精品久久| 国产乱人伦精品一区二区| 久久免费高清| 欧美成人自拍视频| 午夜激情综合网| 久久久久久久久久久一区| 亚洲精品日产精品乱码不卡| 美女视频一区免费观看| 欧美激情成人在线| 欧美一区=区| 欧美理论在线播放| 午夜国产欧美理论在线播放| 久久亚洲精品一区二区| 一区二区三区四区五区在线| 欧美一级夜夜爽| 9色精品在线| 久久久国产午夜精品| 亚洲一区二区欧美| 免费视频一区| 欧美综合国产| 欧美精品系列| 久久综合色天天久久综合图片| 欧美日本韩国一区二区三区| 欧美高清在线播放| 国产精品久久久久久超碰| 在线亚洲欧美| 久久久午夜视频| 午夜久久久久久久久久一区二区| 免费成人av| 久久综合久久综合久久综合| 欧美视频在线观看 亚洲欧| 久久夜色精品亚洲噜噜国产mv | 国产日韩在线一区| 一本大道av伊人久久综合| 亚洲国产福利在线| 欧美专区一区二区三区| 亚洲欧美不卡| 欧美日韩国产成人在线| 欧美成人国产| 精品不卡在线| 性做久久久久久免费观看欧美| 亚洲一区二区黄| 欧美日韩精品三区| 91久久精品国产91性色| 亚洲电影免费观看高清完整版在线| 亚洲欧美成人一区二区在线电影| 国产精品一区二区黑丝| 一区二区三区国产盗摄| 亚洲精选久久| 欧美黄免费看| 亚洲日本中文字幕区| 亚洲久久视频| 欧美韩日一区二区三区| 亚洲国产婷婷综合在线精品| 亚洲国产天堂久久国产91| 久久久夜色精品亚洲| 美女主播一区| 91久久精品一区二区别| 噜噜噜91成人网| 亚洲精品国产系列| 99精品视频一区二区三区| 欧美精品一区三区在线观看| 亚洲看片免费| 性久久久久久久久久久久| 国产视频一区在线| 久久激情网站| 亚洲国产精品精华液2区45| 日韩视频中文| 国产精品乱子乱xxxx| 午夜精品三级视频福利| 麻豆精品视频在线观看| 亚洲美女黄网| 国产情人综合久久777777| 久久久亚洲综合| 亚洲伦理在线观看| 欧美一级视频免费在线观看| 在线免费观看成人网| 欧美日韩福利在线观看| 亚洲制服av| 欧美岛国激情| 亚洲天堂视频在线观看| 国产一区深夜福利| 欧美福利一区二区三区| 在线一区二区日韩| 免费在线观看精品| 亚洲尤物精选| 在线播放一区| 欧美色图五月天| 久久综合狠狠综合久久激情| 日韩亚洲欧美在线观看| 免费欧美日韩| 午夜久久一区| 久久精品72免费观看| 欧美日韩免费在线观看| 性欧美长视频| 亚洲精品无人区| 久久久久久久一区二区| 在线一区视频| 亚洲国产精品一区二区久| 欧美日韩在线大尺度| 久久久91精品国产一区二区精品| 亚洲精品一区二区三区av| 亚洲欧美精品在线| 亚洲理论在线观看| 国产精品一区二区三区久久久| 欧美成人在线免费观看| 亚洲欧美日韩国产中文| 欧美国产亚洲另类动漫| 久久男人资源视频| 国产精品99久久久久久久vr|