青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Codejie's C++ Space

Using C++

LingosHook:自己造的輪子對路面要求太高了~


    為了搞定HTML,這幾天在學著用Tidylib,終于搞明白了,喜滋滋地合并到代碼中一測試,傻眼了--字符集問題。。。
    Tidylib的輸入流似乎只支持const char*, 因此不的不將std::wstring從‘寬字節’轉換為‘多字節。轉換了幾次,時好時壞,搞到半夜才發現自己所用的幾個測試HTML頁面都各種包含著不同的字符集,于是字符集問題就出來了,也搞死我了~最后一咬牙,一跺腳,老子我不轉了,都用‘RAW’數據好了,‘寬’到‘多’直接用UTF8了。。。于是就有了下面的代碼。

int CHtmlTidyObject::Tidy(const std::wstring &input, std::wstring &output)
{
    
int codepage = CP_UTF8;//54936;//CP_UTF8;

    
int ret = -1;

    TidyDoc tdoc 
= tidyCreate();
    
if(tidyOptSetBool(tdoc, TidyMark, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyDoctypeMode, TidyDoctypeOmit) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHideComments, yes) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyWrapLen, 0!= yes)
        
return -1;
    
//if(tidyOptSetBool(tdoc, TidyMakeClean, yes) != yes)//css
    
//    return -1;
  
    
if(tidyOptSetBool(tdoc, TidyUpperCaseTags, yes) != yes)
        
return -1;
    
if(tidyOptSetBool(tdoc, TidyHtmlOut, yes) != yes)
        
return -1;
    
if(tidySetCharEncoding(tdoc, "raw"!= 0)
        
return -1;
    
    
if(tidyOptSetBool(tdoc, TidyShowWarnings, no) != yes)
        
return -1;
    
if(tidyOptSetInt(tdoc, TidyShowErrors, 0!= yes)
        
return -1;

    
if(tidyOptSetBool(tdoc, TidyForceOutput, yes) != yes)
        
return -1;

    
int sz = WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), NULL, 0, NULL, NULL);
    
if(sz == -1)
        
return -1;
    
char* buf = new char[sz + 1];
    sz 
= WideCharToMultiByte(codepage, 0, input.c_str(), input.size(), buf, sz, NULL, NULL);
    
    
if(tidyParseString(tdoc, buf) >= 0)
    
{
        
//TidyBuffer errbuf = {0};
        
//tidySetErrorBuffer( tdoc, &errbuf );
        if(tidyCleanAndRepair(tdoc) >= 0)
        
{
            
//tidyRunDiagnostics( tdoc ); 

            TidyBuffer outbuf 
= 0 };
            
if(tidySaveBuffer(tdoc, &outbuf) >= 0)
            
{
                
//std::cout << "OUTPUT->\n" << outbuf.bp << std::endl;
                int wsz = MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, NULL, 0);
                wchar_t
* wbuf = new wchar_t[wsz + 1];
                wsz 
= MultiByteToWideChar(codepage, 0, (const char*)outbuf.bp, outbuf.size, wbuf, wsz);
                output 
= wbuf;
                delete [] wbuf;
                ret 
= 0;
            }

            tidyBufFree(
&outbuf);
        }

        
//std::cout << "ERROR->\n" << errbuf.bp << std::endl;
        
//tidyBufFree(&errbuf);
    }


    delete [] buf;

    tidyRelease(tdoc);

    
return ret;
}


    感覺還有問題,但經過Tidy處理,TinyHtmlParser確實能解析原來解不開的HTML數據了,就先放著吧,測試看看先~唉,HTML從頭到尾都是最影響LingosHook的部分,早知道應該多好好找找穩定的Parser,自己造的輪子對路面要求太高了。。。

posted on 2010-05-12 18:06 codejie 閱讀(558) 評論(2)  編輯 收藏 引用 所屬分類: C++LingosHook

評論

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 11:42 陳梓瀚(vczh)

HTML這種一個字符串可以由多個字符集構成的東西,根本就是結構化的二進制文件,而不是文本文件……  回復  更多評論   

# re: LingosHook:自己造的輪子對路面要求太高了~ 2010-05-13 12:12 codejie

@陳梓瀚(vczh)
這個‘結構化’放到XML文件上比較合適,HTML就不合適了。。不然哪有‘瀏覽器容錯能力‘之說呢。。所以,還是當文本處理比較方便點。  回復  更多評論   

公告

Using C++

導航

統計

留言簿(73)

隨筆分類(513)

積分與排名

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久成人免费| 娇妻被交换粗又大又硬视频欧美| 亚洲激情在线激情| 欧美日韩精品三区| 蜜臀av国产精品久久久久| 久久久人成影片一区二区三区观看 | 亚洲日本成人女熟在线观看| 麻豆久久婷婷| 亚洲第一精品福利| 亚洲精品在线免费| 亚洲永久免费av| 久久精品国产免费看久久精品| 久久久久国产精品午夜一区| 欧美电影在线免费观看网站| 欧美日韩一卡| 国内外成人免费视频 | 午夜精品视频在线观看| 久久黄色网页| 亚洲三级影院| 久久国产精品99精品国产| 欧美—级高清免费播放| 国产亚洲欧美一区在线观看| 亚洲另类自拍| 久久人人精品| 亚洲一二三区视频在线观看| 两个人的视频www国产精品| 欧美性天天影院| 亚洲丰满少妇videoshd| 欧美一级免费视频| 亚洲日本欧美| 久久亚洲国产精品一区二区| 国产精品地址| 亚洲精品一区二区三区婷婷月| 香蕉久久夜色精品国产使用方法| 欧美激情国产日韩| 久久riav二区三区| 国产精品日日摸夜夜摸av| 亚洲精品久久在线| 毛片av中文字幕一区二区| 亚洲天堂av电影| 欧美精品一区二区高清在线观看| 狠狠久久亚洲欧美专区| 欧美一区日本一区韩国一区| 亚洲国产另类久久久精品极度| 欧美a级片一区| 亚洲尤物视频在线| 欧美激情精品久久久| 国产日本欧美一区二区| 欧美日韩精品免费看| 久久视频一区二区| 一区电影在线观看| 午夜精品婷婷| 亚洲作爱视频| 欧美日韩亚洲一区二区三区四区 | 欧美电影免费观看网站| 欧美在线91| 国产亚洲一区二区三区在线播放| 亚洲欧美成人| 亚洲欧美www| 国产精品久久福利| 午夜精品亚洲| 性色av一区二区怡红| 国产日韩在线亚洲字幕中文| 欧美一区日韩一区| 欧美在线亚洲在线| 在线观看日产精品| 欧美激情在线| 欧美日韩精品一区二区三区四区| 日韩亚洲欧美精品| 一本色道久久88精品综合| 欧美视频1区| 欧美一级大片在线免费观看| 午夜视频久久久| 国产欧美二区| 免费亚洲一区二区| 欧美韩日亚洲| 午夜精品一区二区三区在线视 | 欧美四级在线观看| 欧美一级片在线播放| 久久国产乱子精品免费女 | 亚洲毛片视频| 一区二区电影免费观看| 国产精品免费在线| 久久久久免费视频| 欧美国产1区2区| 亚洲在线播放| 久久成人在线| 正在播放欧美视频| 欧美一区二区在线观看| 亚洲人成艺术| 亚洲伊人久久综合| 亚洲成人影音| 亚洲视频在线免费观看| 激情一区二区| 中文国产一区| 亚洲福利视频二区| 亚洲婷婷综合久久一本伊一区| 精品电影一区| 国产欧美日韩视频一区二区| 亚洲人成精品久久久久| 亚洲欧美在线看| 欧美在线视频在线播放完整版免费观看| 久久一区二区三区av| 欧美精品激情在线| 久久久久久久久久久久久女国产乱| 欧美/亚洲一区| 欧美一级播放| 国产精品亚洲综合久久| 国产亚洲欧洲一区高清在线观看 | 欧美午夜久久| 性欧美大战久久久久久久免费观看 | 欧美日韩国产首页| 亚洲午夜精品17c| 久久久久久久综合日本| 亚洲私拍自拍| 欧美激情第4页| 欧美阿v一级看视频| 国产伦一区二区三区色一情| 亚洲激情在线播放| 在线高清一区| 欧美一级成年大片在线观看| 国产精品99久久99久久久二8| 免费亚洲电影在线| 男女精品网站| 国内自拍视频一区二区三区| 亚洲欧美国产另类| 欧美一级成年大片在线观看| 国产精品盗摄一区二区三区| 99精品国产在热久久婷婷| 欧美成人精品h版在线观看| 在线观看三级视频欧美| 欧美亚洲一区三区| 欧美午夜在线一二页| 日韩亚洲国产精品| 一本色道精品久久一区二区三区| 久久夜色精品一区| 牛人盗摄一区二区三区视频| 狠狠久久婷婷| 狂野欧美激情性xxxx欧美| 欧美3dxxxxhd| 亚洲人体偷拍| 欧美精品一二三| 一本色道久久综合亚洲精品不| 亚洲性人人天天夜夜摸| 国产精品久久久久久户外露出| 这里是久久伊人| 久久九九全国免费精品观看| 狠狠色综合日日| 嫩模写真一区二区三区三州| 亚洲成人资源| 中文久久精品| 在线一区欧美| 欧美a级一区| 亚洲黄色在线观看| 欧美va亚洲va香蕉在线| 亚洲福利视频一区| 亚洲制服av| 国产夜色精品一区二区av| 久久aⅴ乱码一区二区三区| 老司机一区二区三区| 国产精品入口66mio| 久久夜色精品国产欧美乱极品| 韩国女主播一区| 99综合电影在线视频| 欧美视频二区| 亚洲国产精品久久91精品| 久久久久久综合网天天| 久久深夜福利| 91久久久久久国产精品| 久久精品在线观看| 亚洲国产成人porn| 欧美一级黄色录像| 国产伦精品一区二区三区在线观看 | 久久精品国产亚洲精品| 久久午夜电影网| 欧美一级视频精品观看| 亚洲国内高清视频| 亚洲自拍偷拍色片视频| 狠狠色狠狠色综合| 另类图片综合电影| 国产精品网站在线播放| 欧美顶级少妇做爰| 亚洲高清不卡| 午夜精品影院在线观看| 亚洲三级免费| 在线观看成人网| 国产欧美日韩免费| 欧美小视频在线观看| 欧美大片第1页| 另类国产ts人妖高潮视频| 欧美在线中文字幕| 欧美在线国产| 亚洲欧美日韩国产综合在线 | 欧美成人精品| 国内伊人久久久久久网站视频| 亚洲一区三区在线观看| 久久成人一区二区| 影音先锋日韩资源| 欧美人与性动交α欧美精品济南到| 亚洲精品美女在线观看播放|