• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            馭風萬里無垠

            Unix文本處理之利器-awk/gawk

            日常在shell中使用awk基本是家常便飯了,但是詳細的寫一些小程序還是第一次,總體是下來,還是深深得被這門年齡比自己都要大的工具語言的魅力所折服(since 1977)。作者中最引人注目的當屬鼎鼎大名的Brian W. Kernighan (即K的簡稱來源)。目前所用的版本大多是gawk或者nawk.

            作為一門微型且完整的編程語言,awk可以用數行代碼就完成其他語言需要數倍的LOC才能完成的工作。其設計哲學也是比較特殊的,核心是data-driven的,并且采用了和C類似的語法來組織。它最核心的思想應該是如下兩點:
            • pattern-action 結構 借由強大的正則表達式來匹配pattern,然后執行pattern對應的操作
            • Record/Field 處理模型  所有的輸入數據都根據制定的record separator 分割成 record, 然后沒一個record再根據field separator 分割為fields. POSIX 定義的 field separator可以為正則表達式,而gawk可以允許record separator同時為正則表達式
            引發我花點時間來仔細研究awk的起因是這樣的,我們的程序在做profiling的時候,發現原來用shell寫的腳本分析一次話費的時間太長。初看了下那個腳本,大概的邏輯是要掃名所有的log文件,按照時間戳將關注的時間所耗費的時間提取出來,計算平均值,波動等最終畫出曲線圖。

            整體的腳本有幾個部分(python+bash),處理一次40MB的log文件需要耗費40分鐘~1個小時,這顯然超出了預期;中間一個處理很長的部分是grep某個時間段的信息然后按照報表格式寫入到中間文件中。在想能否優化這一節的時候,忽然就想起了模式匹配來(學習Haskell的最深印象),于是大致翻了一下awk,發現很容易通過模式匹配使得按行處理,同時記錄中間的信息,而一個時間段恰好和awk的record概念吻合。

            花了2個小時研讀了下awk的函數語法,自定義自己的時間截取函數(gawk的strftime很有用,尤其我們發現記錄有跳躍要自動補全中間的數據記錄時),通過三個pattern截取需要的信息,30分鐘寫出來awk的代碼來。

            所幸的是,其它的shell腳本都不需要任何改動,重新跑一次,3s就處理完了原來40MB的文件,看來這點時間投入還是相當值得的。

            有興趣的可參考:
                 http://www.gnu.org/manual/gawk/gawk.html

            PS:awk的另一作者Winberger 供職于google。
             

            posted on 2011-01-02 20:32 skyscribe 閱讀(909) 評論(0)  編輯 收藏 引用 所屬分類: LinuxMisc

            <2025年6月>
            25262728293031
            1234567
            891011121314
            15161718192021
            22232425262728
            293012345

            導航

            統計

            常用鏈接

            留言簿(3)

            隨筆分類

            隨筆檔案

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            久久精品无码一区二区WWW| 久久99久久99小草精品免视看| 99久久免费只有精品国产| 99久久人妻无码精品系列| 久久亚洲国产中v天仙www| 亚洲国产精品综合久久一线| 久久香综合精品久久伊人| 久久99精品综合国产首页| 久久久精品视频免费观看| 无遮挡粉嫩小泬久久久久久久 | 久久久久久极精品久久久| 久久亚洲国产精品成人AV秋霞 | 99久久精品国产麻豆| 青青热久久国产久精品| 久久久久久久尹人综合网亚洲| 亚洲精品国产自在久久| 岛国搬运www久久| 99久久精品影院老鸭窝| 久久精品国产亚洲AV久| 狠狠精品干练久久久无码中文字幕| 亚洲AV无码久久精品成人| 日韩va亚洲va欧美va久久| 青青青国产精品国产精品久久久久| 伊人久久久AV老熟妇色| 久久综合视频网站| 日韩欧美亚洲国产精品字幕久久久 | 国内精品久久久久久久亚洲| 成人久久精品一区二区三区| 亚洲国产精品一区二区久久hs| 久久综合亚洲色HEZYO社区| 久久精品一区二区影院| 国产日韩久久免费影院| 国产高潮国产高潮久久久91| 久久这里只精品国产99热| 热久久这里只有精品| 久久免费精品一区二区| 亚洲国产精品婷婷久久| 91精品国产综合久久四虎久久无码一级 | 久久久久一级精品亚洲国产成人综合AV区 | 人妻无码αv中文字幕久久琪琪布 人妻无码精品久久亚瑟影视 | 99久久精品国产麻豆|