• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            huyutian

            他強由他強,清風拂山崗;他橫由他橫,明月照大江。他自狠來他自惡,我自一口真氣足

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              20 隨筆 :: 47 文章 :: 22 評論 :: 0 Trackbacks
            HDF5格式非常適合保存層次化的結構數據集合。python下有pytable和h5py兩種接口方式支持存儲HDF5文件,pandas就支持直接讀寫pytable。保存數據量不太大(一般控制在2GB以內)的日線分鐘線數據用h5格式還是很方便的。pandas在讀取h5文件時,可以像數據庫一樣進行條件檢索。詳細資料可參考pandas.HDFStore的where參數。要使column可以在where語句中查詢,保存數據文件時需要增加index或者明確指定data_columns。但是指定過多的column為data_columns將會使得性能下降
            網上搜索后找到了關于pandas存儲HDF5文件性能優化的一些建議,原文在這里

            1.不使用index,創建出來的HDF文件尺寸會小一些,速度也快一些。
            2.通過store.create_table_index() 創建索引,對data_columns進行篩選時的速度沒有什么影響。
            3.保存HDF時使用壓縮選項對數據的讀取速度影響很小,但是壓縮后,文件尺寸會顯著的變小。
            使用pandas讀寫hdf5文件示例如下
            #write
            store=pd.HDFStore("./data/Minutes.h5","a", complevel=9, complib='zlib')
            store.put("Year2015", dfMinutes, format="table", append=True, data_columns=['dt','code'])
            # read
            store=pd.HDFStore("./data/Minutes.h5","r")
            store.select("Year2015", where=['dt<Timestamp("2015-01-07")','code=="000570"'])
            posted on 2015-12-08 16:38 胡雨田 閱讀(11937) 評論(0)  編輯 收藏 引用
            久久夜色精品国产网站| 久久99精品国产麻豆宅宅| 香蕉久久夜色精品国产尤物| 人妻无码αv中文字幕久久琪琪布| 久久久久久国产精品无码下载| 久久精品水蜜桃av综合天堂| 成人精品一区二区久久久| 亚洲色欲久久久综合网| 国内精品久久久久久久久| 亚洲欧美日韩中文久久| 国产免费久久精品丫丫| 精品九九久久国内精品| 久久婷婷五月综合97色直播| 精品国产青草久久久久福利| 久久水蜜桃亚洲av无码精品麻豆| 久久精品国产福利国产琪琪| 伊人久久大香线蕉亚洲五月天 | 日韩AV毛片精品久久久| 免费国产99久久久香蕉| 久久久国产精品亚洲一区| 久久综合九色综合久99| 青青青青久久精品国产h| 亚洲va中文字幕无码久久不卡| 亚洲国产精品嫩草影院久久| 99久久国产主播综合精品| 国产成人精品久久二区二区| 人妻无码中文久久久久专区| 久久无码AV一区二区三区| 久久久久国产精品麻豆AR影院| 97精品国产97久久久久久免费| 国产精品久久成人影院| 精品久久一区二区| 国产精品99久久久久久www| 久久精品国产亚洲麻豆| 日本一区精品久久久久影院| 久久国产高清字幕中文| 国产精品九九久久精品女同亚洲欧美日韩综合区 | 久久久一本精品99久久精品88| 久久精品一本到99热免费| 欧美久久亚洲精品| 欧美成人免费观看久久|