• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            loop_in_codes

            低調(diào)做技術(shù)__歡迎移步我的獨(dú)立博客 codemaro.com 微博 kevinlynx

            小寫了個(gè)XML解析器

                開始用FLEX做詞法分析,然后在此基礎(chǔ)上稍微做些符號(hào)匹配(實(shí)在稱不上語(yǔ)法分析),即完成了XML
            文件的簡(jiǎn)單解析。
                我把XML文件拆分成:<, >, />, </, =, ID, STRING 等token。這樣一整理,用FLEX直接生成詞法
            分析程序。每一次getToken就返回這些token。上層的語(yǔ)法匹配就變得比較簡(jiǎn)單。例如當(dāng)?shù)玫?/>"token
            時(shí),我就可以判斷這是一個(gè)節(jié)點(diǎn)的結(jié)束;當(dāng)?shù)玫絀D token時(shí),就可以推測(cè)下一個(gè)token為"=",再下一個(gè)
            是個(gè)STRING。不過(guò)對(duì)于部分token,也需要做一兩個(gè)token的回溯,例如當(dāng)遇到"<"時(shí),并不一定表示一個(gè)
            新節(jié)點(diǎn)的開始,它可能是新節(jié)點(diǎn)的開始,同樣也可能是上一個(gè)節(jié)點(diǎn)的結(jié)束("</")。
                以我薄弱的編譯原理知識(shí)來(lái)看,解析XML變得非常容易。除此之外,還需要寫一些上層代碼來(lái)保存
            XML結(jié)構(gòu),以方面更上層代碼獲取XML文件的配置信息。因?yàn)槲掖蛩阌眉僀來(lái)寫這個(gè)東西,所以數(shù)據(jù)結(jié)構(gòu)方
            面只有自己處理。這里我以一種變相的樹結(jié)構(gòu)來(lái)保存:每一個(gè)節(jié)點(diǎn)有兩個(gè)域:first child, sibling。
            其實(shí)這樣做是一個(gè)很明顯的通用做法,因?yàn)閄ML種每一個(gè)節(jié)點(diǎn)都可能擁有不定數(shù)量的children節(jié)點(diǎn),如果
            讓parent直接去保存,顯然很笨。例如:
                <Resource>
                    <bmp file="1.bmp"/>
                    <bmp file="2.bmp"/>
                </Resource>
                可以使用這樣的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ):
                struct xmlNode
                {
                    ...
                    struct xmlNode *child;
                    struct xmlNode *sibling;
                };
                對(duì)于Resource這個(gè)node而言,其child域指向第一個(gè)bmp節(jié)點(diǎn)(file屬性為1.bmp那個(gè)節(jié)點(diǎn));對(duì)于第一
            個(gè)bmp節(jié)點(diǎn)而言,其sibling域則指向了第二個(gè)bmp節(jié)點(diǎn)。
                這個(gè)簡(jiǎn)單的xml解析器是在公司外網(wǎng)機(jī)器上寫的,沒(méi)有VC,沒(méi)有任何IDE。代碼我是用VIM敲的,敲好
            后寫makefile,用mingw里的gcc、make來(lái)生成程序,用gdb來(lái)調(diào)試程序。這算是第一次離開VC寫的一個(gè)非
            練習(xí)程序(起碼用makefile來(lái)組織工程)。- -| makefile寫的比較爛,gdb用得很不熟,不過(guò)好歹調(diào)試出來(lái)
            了。越來(lái)越想換個(gè)平臺(tái),只可惜工作還是得在windows vc下,很掃興。
                后來(lái)發(fā)覺(jué)詞法分析也很簡(jiǎn)單,用FLEX的時(shí)候正則表達(dá)式都寫出來(lái)了。前段時(shí)間一直在看編譯原理,雖然不
            用功。但是就這里而言,基本可以直接根據(jù)正則表達(dá)式畫出DFA。終于不用接觸那惡心的從NFA轉(zhuǎn)DFA的
            過(guò)程,因?yàn)槲抑两癫粫?huì),更不會(huì)寫代碼轉(zhuǎn)。- - 總而言之,自己手寫了詞法分析。邊寫邊參考編譯原理
            與實(shí)踐中附帶的tiny-c編譯器的詞法分析部分,最終發(fā)現(xiàn)我抄了一遍。MD,一點(diǎn)技術(shù)含量都沒(méi)有。

            附上全部源代碼(對(duì)于代碼我還是比較滿意的:D),下載

            posted on 2008-12-10 16:22 Kevin Lynx 閱讀(4600) 評(píng)論(9)  編輯 收藏 引用 所屬分類: 通用編程編譯原理

            評(píng)論

            # re: 小寫了個(gè)XML解析器 2008-12-10 18:20 肥仔

            struct xmlNode
            {
            ...
            struct xmlNode *child;
            struct xmlNode *sibling;
            };
            ==================
            這種結(jié)構(gòu)處理起來(lái),好累的。我的xml解析器采用下面這種結(jié)構(gòu)
            struct xmlNode
            {
            ...
            vector<xmlNode*> childs;
            struct xmlNode* parent;
            };  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器[未登錄](méi) 2008-12-10 19:40 908971

            up  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2008-12-11 08:50 Kevin Lynx

            @肥仔
            - -!
            我恰好說(shuō)了,如果parent直接保存children,好占空間的,例如你這個(gè)vector,雖然我的處理方式累了點(diǎn)。- -!   回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2008-12-11 11:06 momor

            @Kevin Lynx
            @肥仔
            - -!
            我恰好說(shuō)了,如果parent直接保存children,好占空間的,例如你這個(gè)vector,雖然我的處理方式累了點(diǎn)。- -!
            ===============================================
            沒(méi)錯(cuò),而且使用vector雖然方便了,但是除了增加內(nèi)存消耗以外,還有性能損耗,附加的庫(kù)會(huì)加劇你的移植問(wèn)題,雖然說(shuō)是標(biāo)準(zhǔn)模板庫(kù),但是在底層的工具類實(shí)現(xiàn)里,最好還是符合KISS原則夠用就好^^比如TinyXML就提供了支持和不支持使用STL的選項(xiàng)用以折衷
              回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2008-12-13 18:03 dell筆記本

            不錯(cuò),謝謝,省得我自己寫了  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2009-01-04 02:06 胖dudu

            c 的東西,還加了個(gè)vector就不太好了吧,我推薦自己封一個(gè)c版本的vector或者list  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2009-01-08 09:07 Kevin Lynx

            @胖dudu
            不用自己做了。BSD(相關(guān)組織)早使用宏寫了一套數(shù)據(jù)結(jié)構(gòu),鏈表,樹,等等。  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器 2009-04-29 11:41 gua

            直接使用TinyXML就可以了!  回復(fù)  更多評(píng)論   

            # re: 小寫了個(gè)XML解析器[未登錄](méi) 2011-08-12 17:07 dophi

            @gua
            hacker為啥要自己寫工具來(lái)用而不是用現(xiàn)成的工具?  回復(fù)  更多評(píng)論   

            久久久久久久99精品免费观看| 国产成人精品久久一区二区三区 | 欧美久久久久久午夜精品| 国产精品一区二区久久精品| 精品久久一区二区| 亚洲精品tv久久久久| 7777精品伊人久久久大香线蕉| 久久国产视屏| 国内精品久久久久影院薰衣草| 久久亚洲AV无码精品色午夜| 2021久久国自产拍精品| 久久久久无码国产精品不卡| 国产精品一区二区久久不卡| 青青草原综合久久大伊人| 99久久精品国产一区二区蜜芽| 久久亚洲精品国产精品| 亚洲国产成人久久精品99 | 99久久精品这里只有精品| 亚洲欧美国产日韩综合久久| 国产成人精品久久二区二区| 久久精品国产亚洲av麻豆蜜芽| 精品久久国产一区二区三区香蕉 | 亚洲欧洲久久久精品| 青青青国产精品国产精品久久久久 | 模特私拍国产精品久久| 久久精品a亚洲国产v高清不卡 | 亚洲女久久久噜噜噜熟女| 久久99精品国产麻豆不卡| 99久久精品日本一区二区免费| 久久中文字幕精品| 精品久久久久久无码不卡| 欧洲性大片xxxxx久久久| 日韩精品无码久久一区二区三| 国产精自产拍久久久久久蜜| 国产高潮久久免费观看| 久久WWW免费人成—看片| 亚洲一本综合久久| 亚洲欧美日韩精品久久| 久久久久久毛片免费看| 欧美国产成人久久精品| 久久久久精品国产亚洲AV无码|