• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Codejie's C++ Space

            Using C++

            LingosHook:結果抓取失敗的一種原因


                LingosHook在抓取結果數據時,HTML的解析最主要的一個環節,就是說,如果對HTML字串分析上有任何的錯誤都會導致無法正確提取所需數據。
                還好LingosHook的HTML解析代碼是自己的,怎么說呢,“代碼在手,天下我有”,像是對付“破碎”HTML數據,稍微改改就OK了,嘿嘿。。。
                當然了,也有不好的時候,由于HTML解析代碼是自己寫的,對很多特殊的情況的支持不好,導致解析失敗,比如最早發現<IMG>標簽沒有</IMG>這個問題找了很久,昨晚有發現了Lingoes還在用另一個特殊的標簽<PARAM>,這個也沒有</PARAM>;雖然Vicon詞典并沒有用到這個,但由于其它詞典使用到了,而導致整個HTML解析失敗。
                雖然加一個這樣特殊標簽處理很簡單,只是在CheckSepicalTag()函數里面添加一行就OK,但問題是,誰知道還會有多少個這樣的標簽呢?我是不可能一個一個詞典檢測的啊。。。因此,如果使用中碰到類似無法抓取結果的時候,可以在'Setting'界面中,開啟'Open Trace'選項,然后當數據到達時,將'Trace'界面中的HTML數據Copy出來,然后貼上來,我來定位原因。。。

            posted on 2010-03-29 23:59 codejie 閱讀(239) 評論(0)  編輯 收藏 引用 所屬分類: 隨筆而已

            公告

            Using C++

            導航

            統計

            留言簿(73)

            隨筆分類(513)

            積分與排名

            最新評論

            閱讀排行榜

            評論排行榜

            国产欧美一区二区久久| 久久天天躁狠狠躁夜夜2020一| 精品久久久久久久久午夜福利| 国产成人综合久久综合| 久久国产精品免费一区二区三区 | 亚洲午夜无码AV毛片久久| 久久婷婷五月综合成人D啪| 国产69精品久久久久777| 久久亚洲2019中文字幕| 久久超乳爆乳中文字幕| 人人狠狠综合88综合久久| 99久久久国产精品免费无卡顿 | 国产成人香蕉久久久久| 97久久国产综合精品女不卡| 欧美久久综合性欧美| 亚洲中文久久精品无码| 久久精品国产亚洲7777| 国产精品视频久久久| 影音先锋女人AV鲁色资源网久久 | 国产精品无码久久久久| 久久综合精品国产二区无码| 中文字幕亚洲综合久久菠萝蜜| 9久久9久久精品| 亚洲国产另类久久久精品黑人| 国产精品gz久久久| 人人狠狠综合久久亚洲88| 亚洲AV无码久久精品成人 | 色偷偷偷久久伊人大杳蕉| 久久久久亚洲av综合波多野结衣 | 久久中文字幕无码专区| 国产精品美女久久久网AV| 国产精品久久免费| 精品免费tv久久久久久久| 漂亮人妻被中出中文字幕久久| 久久国产视屏| 久久99精品九九九久久婷婷| 亚洲国产成人久久综合碰碰动漫3d| 久久国产精品无码一区二区三区 | AAA级久久久精品无码区| 99精品久久精品| 久久香蕉国产线看观看99|