• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            Cpper
            C/C++高級工程師 Android高級軟件工程師 IT集成工程師 音頻工程師 熟悉c,c++,java,c#,py,js,asp等多種語言 程序猿
            不得不承認(rèn),有時(shí)候使用python比c++方便很多,
            就拿解析html來說,使用 Beautiful Soup 就比使用libtidy方便很多 - 當(dāng)然也有可能是
            Beautiful Soup封裝的很厲害吧

            使用Beautiful Soup的一個(gè)例子如下:
            from bs4 import BeautifulSoup

            soup 
            = BeautifulSoup(open('List.htm'))
            for a in soup.find_all('a',class_ = 'link'):
                
            print (a.get('href'))
            目的是找出html中class屬性為link的a節(jié)點(diǎn)對應(yīng)的href屬性字符串
            如果是使用c++ libtidy的話
            對應(yīng)的代碼如下:
            Bool TIDY_CALL tidyFilterCb(TidyDoc tdoc,TidyReportLevel lvl,uint line,uint col,ctmbstr mssg)
            {  
                
            return no;
            }

            void extractContent(TidyNode node,TidyDoc doc);

            void parseContent(TidyNode node,TidyDoc doc)
            {   
                TidyNode child;
                
            for(child = tidyGetChild(node);child;child = tidyGetNext(child))
                {   
                    
            if(tidyNodeIsA(child))                    
                        extractContent(child,doc);
                    
            else
                        parseContent(child,doc);     
                }
            }

            void extractContent(TidyNode node,TidyDoc doc)
            {   
                
            if(yes == tidyNodeIsA(node))
                {   
                    TidyAttr cls 
            = tidyAttrGetCLASS(node);
                    
            if(cls != NULL)
                    {   
                        
            char* value = (char*)tidyAttrValue(cls);
                        
            if(!strcmp(value,"link"))
                        {   
                            TidyAttr href 
            = tidyAttrGetHREF(node);   
                            
            if(href != NULL)
                            {
                                
            char* link = (char*)tidyAttrValue(href);
                                printf(
            "link:%s\n",link);
                                
            return;
                            }
                        }
                    } 
                }   
                parseContent(node,doc);
            }

            void tidyParseHtml(char* file)
            {
                TidyDoc doc 
            = tidyCreate();
                tidySetReportFilter(doc,tidyFilterCb);
                tidyParseFile(doc,file);
                TidyNode body 
            = tidyGetBody(doc);
                TidyNode child;
                
            for(child = tidyGetChild(body);child;child = tidyGetNext(child))
                {   
                    parseContent(child,doc);
                }    
                tidyRelease(doc); 
            }
            還是很啰嗦的

            當(dāng)然下面的python代碼也能完成任務(wù):
            from bs4 import BeautifulSoup

            soup 
            = BeautifulSoup(open('List.htm'))
            list 
            = soup.select('a[class="link"]')
            for a in list:
                
            if a.has_attr('href'):
                    print (a.
            get('href'))
            如果想分析網(wǎng)頁我覺得BeatifulSoup絕對是一個(gè)利器
            鏈接:
            http://www.crummy.com/software/BeautifulSoup/bs4/doc/
            posted on 2013-12-07 11:17 ccsdu2009 閱讀(1848) 評論(0)  編輯 收藏 引用 所屬分類: Python腳本 、網(wǎng)頁搜素
             
            青青热久久国产久精品 | 久久国产成人亚洲精品影院| 久久―日本道色综合久久| 久久久久久久99精品免费观看| 久久精品国产91久久综合麻豆自制 | 国产产无码乱码精品久久鸭| 国产成人精品久久亚洲高清不卡| 一本久久综合亚洲鲁鲁五月天| 久久久久久久人妻无码中文字幕爆 | 亚洲国产精品久久久久婷婷软件 | 久久亚洲色一区二区三区| 日韩人妻无码一区二区三区久久| 久久综合九色综合97_久久久| 久久久久亚洲AV无码专区首JN | 国产99久久精品一区二区| 久久人人超碰精品CAOPOREN| 国产精品9999久久久久| 久久AV无码精品人妻糸列| 久久精品夜色噜噜亚洲A∨| 国产美女久久久| 久久精品国产99久久无毒不卡| 无码任你躁久久久久久老妇| 99久久精品免费国产大片| 人人狠狠综合久久88成人| 亚洲精品99久久久久中文字幕 | 久久激情五月丁香伊人| 久久精品国产91久久麻豆自制| 亚洲中文字幕无码一久久区| 久久亚洲精品无码播放| 久久久精品人妻无码专区不卡| 香港aa三级久久三级| 久久成人精品视频| 国产一区二区三区久久精品| 久久99精品久久久久久hb无码| 久久一日本道色综合久久| 国内精品久久久久影院薰衣草| 久久综合成人网| 噜噜噜色噜噜噜久久| 人妻无码精品久久亚瑟影视 | 国内精品久久久久久久97牛牛 | 久久无码AV中文出轨人妻|