取得屬性值類似于前面我們?nèi)〉靡粋€(gè)結(jié)點(diǎn)的文本內(nèi)容。在這個(gè)例子中,我們將取出我們?cè)谇耙徊糠痔砑拥?/span>URI的值。完整代碼:附錄G,取得屬性值例程代碼。
這個(gè)例子的初始步驟和前面是類似的:解析文檔,查找你感興趣的元素,然后進(jìn)入一個(gè)函數(shù)完成指定的請(qǐng)求任務(wù)。在這個(gè)例子中,我們調(diào)用getReference。
void
getReference (xmlDocPtr doc, xmlNodePtr cur) {
xmlChar *uri;
cur = cur->xmlChildrenNode;
while (cur != NULL) {
if ((!xmlStrcmp(cur->name, (const xmlChar *)"reference"))) {
① uri = xmlGetProp(cur, "uri");
printf("uri: %s\n", uri);
xmlFree(uri);
}
cur = cur->next;
}
return;
}
① 關(guān)鍵函數(shù)是xmlGetProp,它返回一個(gè)包含屬性值的xmlChar。在本例中,我們僅僅打印它。
注釋
如果你使用DTD定義屬性的固定值或缺省值,這個(gè)函數(shù)也將取得它。
編碼轉(zhuǎn)換
數(shù)據(jù)編碼兼容問題是程序員新建普通的XML或特定XML時(shí)最常見的困難。按照這里
稍后的討論來思考設(shè)計(jì)你的應(yīng)用程序?qū)椭惚苊膺@個(gè)困難。實(shí)際上,libxml能以UTF-8格式保存和操縱多種數(shù)據(jù)
你的程序使用其它的數(shù)據(jù)格式,比如常見的ISO-8859-1編碼,必須使用libxml函數(shù)轉(zhuǎn)換到UTF-8。如果你想你的程序以除UTF-8外的其它編碼方式輸出也必須做轉(zhuǎn)換。
如果能有效地轉(zhuǎn)換數(shù)據(jù)Libxml將使用轉(zhuǎn)換器。無轉(zhuǎn)換器時(shí),僅僅UTF-8、UTF-16和ISO-8859-1能夠被作為外部格式使用。有轉(zhuǎn)換器時(shí),它能將從其它格式與UTF-8互換的任何格式均可使用。當(dāng)前轉(zhuǎn)換器支持大約150種不同的編碼格式之間的相互轉(zhuǎn)換。實(shí)際支持的格式數(shù)量正在被實(shí)現(xiàn)。每一個(gè)實(shí)現(xiàn)在的轉(zhuǎn)換器盡可能的支持每一種格式。
警告
一個(gè)常見錯(cuò)誤是在內(nèi)部數(shù)據(jù)不同的部分使用不同的編碼格式。最常見的是情況是一個(gè)應(yīng)用以ISO-8859-1作為內(nèi)部數(shù)據(jù)格式,結(jié)合libxml部分使用UTF-8格式。結(jié)果是一個(gè)應(yīng)用程序要面對(duì)不同地內(nèi)部數(shù)據(jù)格式。一部分代碼執(zhí)行后,它或其它部分代碼將使用曲解的數(shù)據(jù)。
這個(gè)例子構(gòu)造一個(gè)簡(jiǎn)單的文檔,然后添加在命令行提供的內(nèi)容到根元素并使用適當(dāng)?shù)木幋a將結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備上。在這個(gè)例子中,我們使用ISO-8859 -1編碼。在命令輸入的內(nèi)容將被從ISO-8859-1轉(zhuǎn)換到UTF-8。完整代碼:附件H,編碼轉(zhuǎn)換例程代碼。
包含在例子中的轉(zhuǎn)換函數(shù)使用libxml的xmlFindCharEncodingHandler函數(shù)。
①xmlCharEncodingHandlerPtr handler;
②size = (int)strlen(in)+1;
out_size = size*2-1;
out = malloc((size_t)out_size);
…
③handler = xmlFindCharEncodingHandler(encoding);
…
④handler->input(out, &out_size, in, &temp);
…
⑤xmlSaveFormatFileEnc("-", doc, encoding, 1);
①定義一個(gè)xmlCharEncodingHandler函數(shù)指針。
②XmlCharEncodingHandler函數(shù)需要給出輸入和輸出字符串的大小,這里計(jì)算輸入輸出字符串。
③XmlFindCharEncodingHandler使用數(shù)據(jù)初始編碼作為參數(shù)搜索libxml已經(jīng)完成的轉(zhuǎn)換器句柄并將找到的函數(shù)指針返回,如果沒有找到則返回NULL。
④The conversion function identified by handler requires as its arguments pointers to the input and output strings, along with the length of each. The lengths must be determined separately by the application.
由句柄指定的轉(zhuǎn)換函數(shù)請(qǐng)求輸入、輸出字符中及它們的長(zhǎng)度作為參數(shù)。這個(gè)長(zhǎng)度必須由應(yīng)用程序分別指定。
⑤用指定編碼而不是UTF-8輸出,我們使用xmlSaveFormatFileEnc指不定期編碼方式。
A. 編譯
Libxml包含一個(gè)腳本xml2-config,它一般用于編譯和鏈接程序到庫(kù)時(shí)產(chǎn)生標(biāo)志。
為了取得預(yù)處理和編譯標(biāo)志,使用xml2-config –cflags,為了取得鏈接標(biāo)志,使用xml2-config –libs。其它有效的參數(shù)請(qǐng)使用xml2-config –help查閱。
B. 示例文檔
<?xml version="1.0"?>
<story>
<storyinfo>
<author>John Fleck</author>
<datewritten>June 2, 2002</datewritten>
<keyword>example keyword</keyword>
</storyinfo>
<body>
<headline>This is the headline</headline>
<para>This is the body text.</para>
</body>
</story>
C. Keyword例程代碼
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <libxml/xmlmemory.h>
#include <libxml/parser.h>
void
parseStory (xmlDocPtr doc, xmlNodePtr cur) {
xmlChar *key;
cur = cur->xmlChildrenNode;
while (cur != NULL) {
if ((!xmlStrcmp(cur->name, (const xmlChar *)"keyword"))) {
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("keyword: %s\n", key);
xmlFree(key);
}
cur = cur->next;
}
return;
}
static void
parseDoc(char *docname) {
xmlDocPtr doc;
xmlNodePtr cur;
doc = xmlParseFile(docname);
if (doc == NULL ) {
fprintf(stderr,"Document not parsed successfully. \n");
return;
}
cur = xmlDocGetRootElement(doc);
if (cur == NULL) {
fprintf(stderr,"empty document\n");
xmlFreeDoc(doc);
return;
}
if (xmlStrcmp(cur->name, (const xmlChar *) "story")) {
fprintf(stderr,"document of the wrong type, root node != story");
xmlFreeDoc(doc);
return;
}
cur = cur->xmlChildrenNode;
while (cur != NULL) {
if ((!xmlStrcmp(cur->name, (const xmlChar *)"storyinfo"))){
parseStory (doc, cur);
}
cur = cur->next;
}
xmlFreeDoc(doc);
return;
}
int
main(int argc, char **argv) {
char *docname;
if (argc <= 1) {
printf("Usage: %s docname\n", argv[0]);
return(0);
}
docname = argv[1];
parseDoc (docname);
return (1);
}