青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Codejie's C++ Space

Using C++

LingosHook:自己造的輪子對路面要求太高了~


    為了搞定HTML,這幾天在學著用Tidylib,終于搞明白了,喜滋滋地合并到代碼中一測試,傻眼了--字符集問題。。。
    Tidylib的輸入流似乎只支持const char*, 因此不的不將std::wstring從‘寬字節’轉換為‘多字節。轉換了幾次,時好時壞,搞到半夜才發現自己所用的幾個測試HTML頁面都各種包含著不同的字符集,于是字符集問題就出來了,也搞死我了~最后一咬牙,一跺腳,老子我不轉了,都用‘RAW’數據好了,‘寬’到‘多’直接用UTF8了。。。于是就有了下面的代碼。

int CHtmlTidyObject::Tidy(const std::wstring &input, std::wstring &output)
{
    
int codepage = CP_UTF8;//54936;//CP_UTF8;

    
int ret = -1;

    TidyDoc tdoc 
= tidyCreate();
    
if(tidyOptSetBool(tdoc, TidyMark, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyDoctypeMode, TidyDoctypeOmit) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHideComments, yes) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyWrapLen, 0!= yes)
        
return -1;
    
//if(tidyOptSetBool(tdoc, TidyMakeClean, yes) != yes)//css
    
//    return -1;
  
    
if(tidyOptSetBool(tdoc, TidyUpperCaseTags, yes) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHtmlOut, yes) != yes)
        
return -1;
    
if(tidySetCharEncoding(tdoc, "raw"!= 0)
        
return -1;
    
    
if(tidyOptSetBool(tdoc, TidyShowWarnings, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyShowErrors, 0!= yes)
        
return -1;

    
if(tidyOptSetBool(tdoc, TidyForceOutput, yes) != yes)
        
return -1;

    
int sz = WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), NULL, 0, NULL, NULL);
    
if(sz == -1)
        
return -1;
    
char* buf = new char[sz + 1];
    sz 
= WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), buf, sz, NULL, NULL);
    
    
if(tidyParseString(tdoc, buf) >= 0)
    
{
        
//TidyBuffer errbuf = {0};
        
//tidySetErrorBuffer( tdoc, &errbuf );
        if(tidyCleanAndRepair(tdoc) >= 0)
        
{
            
//tidyRunDiagnostics( tdoc ); 

            TidyBuffer outbuf 
= 0 };
            
if(tidySaveBuffer(tdoc, &outbuf) >= 0)
            
{
                
//std::cout << "OUTPUT->\n" << outbuf.bp << std::endl;
                int wsz = MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, NULL, 0);
                wchar_t
* wbuf = new wchar_t[wsz + 1];
                wsz 
= MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, wbuf, wsz);
                output 
= wbuf;
                delete [] wbuf;
                ret 
= 0;
            }

            tidyBufFree(
&outbuf);
        }

        
//std::cout << "ERROR->\n" << errbuf.bp << std::endl;
        
//tidyBufFree(&errbuf);
    }


    delete [] buf;

    tidyRelease(tdoc);

    
return ret;
}


    感覺還有問題,但經過Tidy處理,TinyHtmlParser確實能解析原來解不開的HTML數據了,就先放著吧,測試看看先~唉,HTML從頭到尾都是最影響LingosHook的部分,早知道應該多好好找找穩定的Parser,自己造的輪子對路面要求太高了。。。

posted on 2010-05-12 18:06 codejie 閱讀(558) 評論(2)  編輯 收藏 引用 所屬分類: C++LingosHook

評論

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 11:42 陳梓瀚(vczh)

HTML這種一個字符串可以由多個字符集構成的東西,根本就是結構化的二進制文件,而不是文本文件……  回復  更多評論   

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 12:12 codejie

@陳梓瀚(vczh)
這個‘結構化’放到XML文件上比較合適,HTML就不合適了。。不然哪有‘瀏覽器容錯能力‘之說呢。。所以,還是當文本處理比較方便點。  回復  更多評論   

公告

Using C++

導航

統計

留言簿(73)

隨筆分類(513)

積分與排名

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲卡通欧美制服中文| 亚洲影院免费| 亚洲一品av免费观看| 亚洲免费久久| 亚洲麻豆av| 中文无字幕一区二区三区| 在线亚洲欧美视频| 欧美中文字幕精品| 久久嫩草精品久久久精品一| 欧美国产高潮xxxx1819| 亚洲国产精品欧美一二99| 麻豆精品精华液| 久久精品99久久香蕉国产色戒| 久久在线91| 欧美色欧美亚洲高清在线视频| 国产精品嫩草久久久久| 激情婷婷久久| 99国内精品久久| 欧美伊人精品成人久久综合97| 老妇喷水一区二区三区| 亚洲毛片在线观看| 久久精品91久久香蕉加勒比| 欧美成人一品| 国产欧美日韩免费| 亚洲麻豆国产自偷在线| 午夜日本精品| 亚洲第一页自拍| 亚洲一区二区精品在线| 美女精品国产| 国产欧美精品一区aⅴ影院| 亚洲福利国产精品| 亚欧成人精品| 91久久精品美女| 欧美在线看片a免费观看| 欧美精品 国产精品| 国产午夜精品理论片a级大结局 | 欧美午夜免费电影| 永久91嫩草亚洲精品人人| 亚洲一区一卡| 亚洲国产一二三| 久久狠狠亚洲综合| 国产精品丝袜久久久久久app| 亚洲精品久久久久| 久久亚洲精品视频| 久久福利毛片| 亚洲午夜高清视频| 欧美激情五月| 亚洲第一精品夜夜躁人人躁 | 亚洲国产一区二区三区在线播| 亚洲欧美清纯在线制服| 亚洲激情视频在线| 美玉足脚交一区二区三区图片| 国产精品永久免费在线| 亚洲一区二区三区免费观看| 91久久黄色| 模特精品裸拍一区| 亚洲国内自拍| 欧美国产亚洲精品久久久8v| 久久性色av| 在线国产精品一区| 欧美岛国激情| 蜜臀va亚洲va欧美va天堂| 136国产福利精品导航| 快she精品国产999| 另类激情亚洲| 亚洲精品视频一区二区三区| 亚洲国产精品成人精品| 欧美精品乱码久久久久久按摩| 亚洲欧洲在线视频| 亚洲欧洲中文日韩久久av乱码| 欧美大胆人体视频| 妖精成人www高清在线观看| 亚洲精品一区二区在线| 欧美日韩无遮挡| 亚洲欧美伊人| 久久国产精品黑丝| 亚洲国产成人porn| 亚洲精品你懂的| 欧美精品在线看| 午夜一区在线| 久久精品综合一区| 亚洲人精品午夜| 在线中文字幕一区| 国产亚洲一区精品| 欧美国产成人精品| 国产精品三级视频| 免费成人性网站| 欧美日本国产| 久久精彩免费视频| 欧美暴力喷水在线| 午夜精品影院| 欧美福利专区| 久久国内精品自在自线400部| 久久久成人精品| 国产精品99久久久久久久vr | 先锋影音久久| 亚洲黄色成人网| 亚洲一区在线播放| 亚洲黄色天堂| 性欧美18~19sex高清播放| 亚洲国产精品va在线看黑人| 国产精品99久久久久久白浆小说| 亚洲伦理精品| 在线日韩电影| 欧美国产日韩一区二区三区| 欧美三级黄美女| 噜噜噜久久亚洲精品国产品小说| 欧美日韩国产不卡在线看| 久久久精品999| 欧美日韩中文字幕综合视频| 久久裸体艺术| 国产精品一区亚洲| 亚洲人成网站999久久久综合| 国产精品一区二区三区免费观看 | 嫩草影视亚洲| 久久国产精品久久w女人spa| 欧美精品福利| 欧美成人午夜| 激情成人综合网| 亚洲视频一二| 亚洲视频精选在线| 欧美电影在线播放| 亚洲国产精品嫩草影院| **网站欧美大片在线观看| 午夜精品视频在线观看| 午夜精品成人在线视频| 欧美日韩性生活视频| 亚洲激情偷拍| 亚洲精品国产品国语在线app| 久久精品视频在线免费观看| 欧美在线免费视屏| 国产精品国产成人国产三级| 亚洲精品中文字幕有码专区| 日韩视频在线一区二区三区| 久久亚洲国产成人| 欧美凹凸一区二区三区视频| 伊人狠狠色丁香综合尤物| 久久av免费一区| 久久一区二区三区四区五区| 激情婷婷久久| 免费视频久久| 亚洲国产专区校园欧美| 日韩系列在线| 国产精品成人aaaaa网站| 亚洲一区二区三| 亚洲愉拍自拍另类高清精品| 国产精品久久久久久影视| 亚洲一区二区四区| 久久精品电影| 136国产福利精品导航| 女生裸体视频一区二区三区| 亚洲日本aⅴ片在线观看香蕉| 一区二区电影免费观看| 国产精品多人| 久久精品国产久精国产一老狼| 免费欧美电影| 一本色道久久综合精品竹菊| 欧美午夜免费| 久久久久九九视频| 亚洲欧洲精品成人久久奇米网| 亚洲视频免费| 国产自产2019最新不卡| 美国十次了思思久久精品导航| 亚洲精品美女免费| 欧美一区二区三区免费观看视频| 国内视频一区| 欧美国产激情二区三区| 亚洲免费在线视频一区 二区| 亚洲欧美精品一区| 久久精品亚洲热| 在线观看的日韩av| 欧美色区777第一页| 欧美一区二区成人6969| 亚洲激情午夜| 久久久精品tv| 国产精品99久久久久久久女警| 国产精品视频精品| 免费观看30秒视频久久| 亚洲午夜高清视频| 亚洲高清在线观看一区| 亚洲女女做受ⅹxx高潮| 亚洲国产一区视频| 国产伦精品一区二区三区免费 | 欧美国产在线电影| 亚洲欧美伊人| 99精品国产高清一区二区| 国产欧美日韩激情| 欧美日韩精品一区二区天天拍小说| 欧美一级成年大片在线观看| 亚洲精品系列| 欧美v国产在线一区二区三区| 午夜一区不卡| 亚洲深夜福利| 日韩视频在线一区二区| 在线播放豆国产99亚洲| 国产精品亚发布| 国产精品xxxav免费视频| 欧美大胆人体视频| 麻豆精品传媒视频| 久久久蜜臀国产一区二区|