山伏札記[1]
這段日子一直沒來,blog長了不少草,沒辦法,填幾塊山石吧。
山伏就是修行者,不少都是在野的浪人之輩,我目前就仍然是這個狀態(tài)。假期里放松不少,技術(shù)上面,csdn上賺分撿漏折騰了1周就沒能繼續(xù),經(jīng)驗(yàn)不足知識不夠,于是SDL學(xué)了一點(diǎn)入門基礎(chǔ),看書學(xué)了學(xué)lua的用法跟一些trick,數(shù)據(jù)結(jié)構(gòu)方面再看了點(diǎn)基礎(chǔ)的,被推薦了解了一下TinyXml這個輕巧的庫(文末就是一篇我的TinyXml入門總結(jié))。
換了電腦就嘗試了幾個新游戲,刺客信條,殺手47 血錢,重新回味一下Sims2,Portal,也是很有意思,為了玩游戲,我把預(yù)裝的vista換成了xp,個人覺的還是挺值得,這也反應(yīng)了vista在兼容性方面的失敗。
假期看了亂七八糟的一些閑書,看穿了50集新版射雕,郭靖的成才是靠很好的RP加上一個很好的老婆。因?yàn)閮烧呷币唬晕疫€是有待成才。大四開學(xué)就要奔忙各處找到自己向往的工作了。
網(wǎng)上一個做游戲服務(wù)端的朋友教導(dǎo)我了解一下TinyXml這個庫,并且讓我寫個tutorial總結(jié)一下,那么我就拿找工作的信息說事了。
----------------------TinyXml簡單應(yīng)用-------------------------
下面這些內(nèi)容,就是csdn的一個人才招聘發(fā)布的RSS聚合信息,http://job.csdn.net/Con001_ProjectManage/Job/jobListRss.aspx,它使用的是RSS2.0標(biāo)準(zhǔn),以xml的形式保存了網(wǎng)站和各個條目信息。(基于XML的RSS聚合可以方便的使用閱讀器接收與更新,這種方式可以快速獲取信息,避免了廣告。xml的格式在游戲開發(fā)中也作為游戲的配置文件存在,.net工程中的app.config等配置文件也是xml格式,可見它的用處廣泛,它比ini等其它格式有著更多優(yōu)勢,這里就不再多說。)
<?xml version="1.0" encoding="utf-8"?>
<rss xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" version="2.0">
<channel>
<title>CSDN → 人才頻道 → 最新職位列表</title>
<link>http://job.csdn.net/Con001_ProjectManage/Job/JobList.Aspx</link>
<description>CSDN → 人才頻道 → 最新職位列表</description>
<language>zh-CN</language>
<generator>WWW.CSDN.NET</generator>
<image>
<title>www.csdn.net</title>
<url>http://job.csdn.net/Images/logo_csdn_s.gif</url>
<link>http://job.csdn.net</link>
</image>
<copyright>Copyright 1998 - 2005 CSDN.NET Inc. All Rights Reserved</copyright>
<item>
<title>軟件工程師</title>
<link>http://job.csdn.net/Jobs/ViewJob/3bc489d929b34a49bbb811dc3251a55c.aspx</link>
<author>北京紫光北美科技開發(fā)有限公司</author>
<guid>http://job.csdn.net/Jobs/ViewJob/3bc489d929b34a49bbb811dc3251a55c.aspx</guid>
<pubDate>Wed, 06 Aug 2008 13:04:41 GMT</pubDate>
<slash:comments>0</slash:comments>
<source url="http://job.csdn.net/Jobs/ViewCompany/761f6c3a48574181991242d70a452446.aspx">北京紫光北美科技開發(fā)有限公司</source>
<description>軟件工程師</description>
</item>
<item>
<title>Java 研發(fā)工程師</title>
<link>http://job.csdn.net/Jobs/ViewJob/8fc4fa80080843098fbf882f16a89c84.aspx</link>
<author>北京互維聯(lián)創(chuàng)信息技術(shù)有限公司</author>
<guid>http://job.csdn.net/Jobs/ViewJob/8fc4fa80080843098fbf882f16a89c84.aspx</guid>
<pubDate>Wed, 06 Aug 2008 12:53:05 GMT</pubDate>
<slash:comments>0</slash:comments>
<source url="http://job.csdn.net/Jobs/ViewCompany/616fdfe34d7949c1b9679d37ea3f66d3.aspx">北京互維聯(lián)創(chuàng)信息技術(shù)有限公司</source>
<description>Java 研發(fā)工程師</description>
</item>
<item>
<title>C++ 高級軟件工程師</title>
<link>http://job.csdn.net/Jobs/ViewJob/132d5d81285e41a286baea9de6b4c408.aspx</link>
<author>北京互維聯(lián)創(chuàng)信息技術(shù)有限公司</author>
<guid>http://job.csdn.net/Jobs/ViewJob/132d5d81285e41a286baea9de6b4c408.aspx</guid>
<pubDate>Wed, 06 Aug 2008 12:53:05 GMT</pubDate>
<slash:comments>0</slash:comments>
<source url="http://job.csdn.net/Jobs/ViewCompany/616fdfe34d7949c1b9679d37ea3f66d3.aspx">北京互維聯(lián)創(chuàng)信息技術(shù)有限公司</source>
<description>C++ 高級軟件工程師</description>
</item>
</channel>
</rss>
xml結(jié)構(gòu)保存的信息可以當(dāng)作一棵樹,它有且僅有一個根,這個例子中根是rss,這個例子中的這棵樹如左圖所示(點(diǎn)擊可放大)。
可以看出這個xml結(jié)構(gòu)一共有四層,這里我們比較關(guān)注的信息在(紅色標(biāo)記的)item節(jié)點(diǎn)中。
現(xiàn)在我們假設(shè)本地已經(jīng)存在了"job.xml"這個文件,內(nèi)容結(jié)構(gòu)就是之前介紹的這般。
使用TinyXml來操作xml數(shù)據(jù)就有如在xml的樹形結(jié)構(gòu)中游走,首先創(chuàng)建TiXmlDocument對象打開xml文件,這時可以使用該對象的FirstChild方法獲得頭結(jié)點(diǎn)對象,從這個頭結(jié)點(diǎn)開始,你可以繼續(xù)得到它的所有子節(jié)點(diǎn),孫子節(jié)點(diǎn),從一個節(jié)點(diǎn)可以很方便的訪問它的同胞兄弟們,
任務(wù)1.使用TinyXml遍歷所有Item。
//#define TIXML_USE_STL 如果使用這個宏,tinyxml會支持一些c++的io流操作,還會使用std::string作為內(nèi)建的字符串類。
#include "tinyxml.h"
#include <iostream>
using namespace std;
int main()
{
//讀文件
TiXmlDocument *doc = new TiXmlDocument("job.xml");
doc->LoadFile();
if(doc->Error())
{
cout<<"Load file Error"<<endl;
return -1;
}
//開始游走,也可以通過doc->RootElement()方法返回一個TiXmlElement指針。
TiXmlNode* rss = doc->FirstChild("rss");
if(rss == NULL)
{
cout<<"Walking on <rss> Error"<<endl;
return -1;
}
TiXmlNode* channel = rss->FirstChild("channel");
if(rss == NULL)
{
cout<<"Walking on <channel> Error"<<endl;
return -1;
}
TiXmlElement* item = channel->FirstChildElement("item");
if(item == NULL)
{
cout<<"Walking on <item> Error"<<endl;
return -1;
}
//成功游走到首個item節(jié)點(diǎn)
int count = 0;
//遍歷所有item
for(TiXmlElement* elem = item;elem!= NULL;elem = elem->NextSiblingElement())
{
//elem就是每一個item節(jié)點(diǎn)
//print(elem);
count++;
}
cout<<count<<" item(s)"<<endl;
delete doc;
}
任務(wù)2.打印Item數(shù)據(jù)
這里實(shí)現(xiàn)了print函數(shù),接收一個Xml元素對象指針,可以理解為這個指針目前就走到了這個item上。
for循環(huán)中遍歷了item節(jié)點(diǎn)的所有子節(jié)點(diǎn)
TiXmlElement::Value()獲得當(dāng)前節(jié)點(diǎn)的節(jié)點(diǎn)鍵值,TiXmlElement::GetText()獲得當(dāng)前節(jié)點(diǎn)的文本描述(注意,這個函數(shù)在沒有文本描述時可能會返回NULL,這時執(zhí)行類似cout<<TiXmlElement::GetText()這樣的代碼就會發(fā)生運(yùn)行時錯誤),vc++里沒有內(nèi)置對UTF8編碼打印的支持,這里的UTF8toGB使用的是我修改自VCKBASE的一個UTF8和GB2312碼轉(zhuǎn)換的函數(shù),有興趣可以查看VCKBASE的鏈接,對于UTF8與默認(rèn)編碼轉(zhuǎn)換的內(nèi)容可以查看wikipedia相關(guān)鏈接。
const char * UTF8toGB(const char * utf)
{
static string temp;
GB2312Helper::UTF_8ToGB2312(temp,utf,strlen(utf));
return temp.c_str();
}
void print(TiXmlElement * item)
{
for(TiXmlElement* elem = item->FirstChildElement();elem!= NULL;elem = elem->NextSiblingElement())
{
cout<<elem->Value()<<":"<<UTF8toGB(elem->GetText())<<endl;
}
}
執(zhí)行結(jié)果如圖所示。
TiXmlElement::FirstChildElement();
FirstChild這類函數(shù)有一個參數(shù)為const char*的重載版本,可以方便的找到某個指定鍵值的節(jié)點(diǎn),NextSibling系列函數(shù)也是同樣道理,所以也是方便應(yīng)用的。請讀者自行實(shí)踐
任務(wù)3,獲取Item中source節(jié)點(diǎn)的url屬性。
可以看到,程序的在打印source節(jié)點(diǎn)信息的時候打印了它的鍵值和文本,但是url這個屬性沒有打印出來,使用如下方法可以將其打印出來。
只要把打印函數(shù)加上如下部分,就可以列舉所有的節(jié)點(diǎn)的屬性值。執(zhí)行結(jié)果在右邊。
void print(TiXmlElement * item)
{
for(TiXmlElement* elem = item->FirstChildElement();elem!= NULL;elem = elem->NextSiblingElement())
{
cout<<elem->Value()<<":"<<UTF8toGB(elem->GetText())<<endl;
for(TiXmlAttribute* attr = elem->FirstAttribute();attr!=NULL;attr=attr->Next())
{
cout<<elem->Value()<<" "<<attr->Name()<<":"<<attr->Value()<<endl;
}
}
}
這種方法判斷節(jié)點(diǎn)是否名為source,如果是source,打印屬性url,注意這個Attribute如果找不到屬性也會return NULL的。Attribute這類函數(shù)也有不少個,有興趣都可以看看。
void print(TiXmlElement * item)
{
for(TiXmlElement* elem = item->FirstChildElement();elem!= NULL;elem = elem->NextSiblingElement())
{
cout<<elem->Value()<<":"<<UTF8toGB(elem->GetText())<<endl;
if(0 == strcmp(elem->Value(),"source"))
{
cout<<elem->Value()<<" url:"<<elem->Attribute("url")<<endl;
}
}
}
到了這里我的TinyXml介紹結(jié)束了,這里只介紹了讀取信息的一些最基礎(chǔ)的方法,至于修改,創(chuàng)建,插入節(jié)點(diǎn)也都是同樣原理,實(shí)際上就是一步一步在這個樹上做著操作。了解了它的類的結(jié)構(gòu)關(guān)系,在進(jìn)一步實(shí)踐中,你將會得到更多的心得體會。我文字寫得拙劣,還請各位朋友多提意見,相互交流。
關(guān)于TinyXml有用的鏈接
- TinyXml中文文檔 http://www.hansencode.cn/2007/06/tinyxml-chinese-doc.html
- TinyXml中文指南 http://www.hansencode.cn/2007/06/tinyxml-chinese-tutorial.html
- TinyXml官方主頁 http://www.grinninglizard.com/tinyxml/
- TinyXml在線文檔 http://www.grinninglizard.com/tinyxmldocs/index.html
posted on 2008-08-07 02:30 Gohan 閱讀(1190) 評論(6) 編輯 收藏 引用 所屬分類: C++ 、Practise