• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            使用Python通過Hive的Streaming來寫UDF的一些記錄

                  最近使用Hive來統計數據,用了pyhs2來實現查詢,但是有些復雜的處理比如,自定義對域名的處理等,不能通過hql來實現,發現能夠使用udf。

                  Java來實現Hive的寫法 

            package jsl.hive.udf;

            import org.apache.hadoop.hive.ql.exec.UDF;
            import org.apache.hadoop.io.Text;

            public final class DomainRoot extends UDF {
                public Text evaluate(Text s) {
                    if (s == null) {return null;}
                    String tmp = s.toString();
                    tmp = this.getDomainRoot(tmp);
                    return new Text(tmp);
                }   

                private String getDomainRoot(String domain) {
                    throw NoneImplementException("xxxx");
                }   
            }

            如果Java的UDF需要當成常用的,不用每次add可以注冊到Hive中,
            ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java中加入
            registerUDF("domain_root", UDFParseUrl.class, false);并重新編譯hive即可


               下面來說說重點,通過Streaming用Python來寫處理。
               關于Streaming的基礎內容:

               約束:首先必須add file到hive中(當python中引用了其他如自己寫的模塊時,也需要一并add進去)
                        其次非常不幸,在單獨的一個查詢中,不能夠使用UDAF的函數如sum()
                        再次不得為中間結果數據使用cluster by或distribute by

            注意:對于優化查詢,使用cluster by或distribute by 和sort by一起非常重要

            posted on 2014-09-12 11:41 Hallelujah 閱讀(2116) 評論(0)  編輯 收藏 引用

            <2025年7月>
            293012345
            6789101112
            13141516171819
            20212223242526
            272829303112
            3456789

            導航

            統計

            常用鏈接

            留言簿(1)

            隨筆分類(15)

            隨筆檔案(14)

            最新隨筆

            搜索

            最新隨筆

            最新評論

            閱讀排行榜

            評論排行榜

            国产巨作麻豆欧美亚洲综合久久 | 久久国产精品一区| 亚洲午夜精品久久久久久app| 中文字幕一区二区三区久久网站| AV无码久久久久不卡蜜桃| 热re99久久精品国产99热| 亚洲一区精品伊人久久伊人| 日韩精品久久无码中文字幕| 国产日韩久久久精品影院首页| 久久99热这里只频精品6| 99久久婷婷国产综合亚洲| 久久久久亚洲AV综合波多野结衣 | 久久99精品国产麻豆宅宅| 午夜视频久久久久一区| 久久精品国产亚洲欧美| 国产激情久久久久久熟女老人| 国产精品99久久精品爆乳| 精品国产乱码久久久久久郑州公司| 伊人久久大香线蕉综合网站| 久久精品国产秦先生| 99久久精品国内| 久久A级毛片免费观看| 色青青草原桃花久久综合| 久久久久女教师免费一区| 91精品国产91久久久久久青草| 99久久久精品| 久久久久久午夜精品| 国产99久久九九精品无码| 久久夜色精品国产噜噜噜亚洲AV| 一级做a爰片久久毛片毛片| 久久精品国产亚洲AV不卡| 国产精品久久久天天影视香蕉 | 久久无码av三级| 天天综合久久久网| 国产成人99久久亚洲综合精品| 色综合色天天久久婷婷基地| 亚洲天堂久久精品| 久久丝袜精品中文字幕| 久久综合偷偷噜噜噜色| 国产aⅴ激情无码久久| 久久综合噜噜激激的五月天|