青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0

手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理)

 

陳梓瀚

華南理工大學軟件本科05

vczh@163.com

http://m.shnenglu.com/vczh/

 

這一篇文章開始講述如何實現一個高級語言的腳本引擎了。由于工程量較為龐大,因此將分開幾篇文章講。學習做腳本還是要從簡單的東西做起的。上一篇文章介紹的命令腳本為實現高級語言的原理做了鋪墊。首先,高級語言和低級語言腳本的架構是一致的。其次,為了具有較大的優化的空間,我們將把高級語言轉換成低級語言,并配合一個低級語言的腳本引擎來實現高級語言的腳本引擎。當然,習慣上,在這種情況下我們把低級語言叫『指令』。

 

在這個階段,我們實現的這門語言是非惰性計算的、弱類型的、僅支持基本類型、數組和函數指針的語言。作為擴展,隱式類型轉換和函數重載也將包含在這幾篇文章的主題中。好了,開始介紹語法吧。

 

為了免去分析C語言函數指針聲明的一堆麻煩問題,在這里我借用了pascal的語法。我們將構造出一門非常類似pascal的語言出來。

 

文件結構:

我們將實現的高級語言腳本是支持多文件的。腳本引擎總是需要外部函數的。為了方便的讓宿主程序提供外部函數的聲明,因此我們做成了多文件的腳本引擎。也就可以有類似C語言#include那樣子的東西了。pascal有一個奇怪的注釋規則:使用大括號注釋。

 

結構如下:

unit 單元名;

 

uses 單元名1,單元名2,……;

 

type

  新類型名稱=類型聲明;

  ……

 

var

  變量名組:類型;

  ……

 

interface

  公開的函數聲明;

 

implementation

  公開和非公開的函數實現(非公開函數不需要聲明)

end.

 

對于語言本身來說,typeuses最好應該屬于interfaceimplementation的。不過我們為了方便,姑且就這么做吧。不然的話,既不能揭示更多的原理,又給自己添麻煩。

 

類型聲明:

類型聲明有普通類型、數組類型和函數指針。

普通類型有booleanintegerrealcharstring

數組類型的聲明方法是array of 類型

函數指針的聲明方法跟函數聲明一致,唯一的區別是函數指針不可出現函數名。譬如我們需要一個輸入兩個整數輸出一個整數的函數指針,我們寫:

type MyPointer=function(a,b:integer):integer;

 

函數聲明:

pascal的函數根據有沒有返回值的區別使用不同的語法。基本語法如下:

procedure 函數名(參數表)function 函數名(參數表):返回類型

參數表的語法:[var]參數名組1:類型; [var]參數名組2:類型;……[var]參數名組n:類型。其中參數名組可以為多個用逗號隔開的參數名,也可以僅為一個參數名。其中var代表引用參數。

 

函數實現:

函數實現的語法由函數聲明、分號、可選的變量聲明、語句、分號構成。其中變量聲明由var開頭,后面街上多個“變量名組:類型;”構成。

 

語句:

一般語句:表達式new 類型[長度]

賦值語句:變量名:=表達式

分支語句:if 布爾表達式 then 語句 [else 語句]

循環語句:

  for 變量:= to|downto do 語句

  while 布爾表達式 do 語句

  repeat 語句塊 while 布爾表達式

復合語句:begin 語句塊 end

命令語句:continuebreakexit

語句塊為多個“語句;”連接而成。

 

表達式:

表達式由變量、操作符、常數以及函數調用構成。支持的操作符有+-*divmod/andorxornot。其中/的返回值一定是realdiv用于兩個整數的整除,mod用于求余數。在這里我們修改一下pascal的語法,我們默認字符串的下標從0開始,而不是1

數組和字符串可以用“表達式[下標]”來獲得指向元素的引用。數組賦值的時候使用引用復制,字符串也使用引用復制。不過字符串修改的時候保證不影響到其他的副本,這個工作由虛擬機完成。

 

既然有了這個簡單的語法規定,我們可以試著來寫一個程序。跟上一篇文章相同,我們寫一個判斷一個數字是否質數的函數:

unit PrimeTest;

 

uses IO;{writelnread}

 

interface

  function IsPrime(Num:integer):boolean;

 

implementation

 

function IsPrime(Num:integer):boolean;

var i:integer;

begin

  result:=true; {這是delphi設置返回值的方法,此處借用。exit用于退出函數,result變量僅僅用于設置返回值}

  if Num<2 then

    result:=false;

  else if Num>2 then

    for i:=2 to Num-1 do

      if Num mod i=0 then

        result:=false;

end;

 

end.

 

語法的介紹就到此結束了。在這里發一下牢騷。雖然我們知道C++很強大,但是其語法卻是很不利于分析的。舉個例子:

A*B;知道是什么嗎?乘法?指針聲明?

a<b,c>d;知道是什么嗎?逗號表達式?一個類型為某模板類的變量?

因此,各位有志于分析C++語法的大大們注意了,傳統的先語法分析后語義分析的方法在C++面前基本上是一點用都沒有。如果你不知道上述代碼中兩個A代表著什么(類型還是對象),你就無法正確得到你想要的語法樹,那么你就慘了。所以,要分析C++,想個辦法吧語法分析和語義分析揉在一起吧。在這里我很想知道早期的gcc為什么能用yacc來搞,用yacc寫出來的C/C++編譯器的代碼肯定很難看的,雖然寫得出來。

 

回到我們的主題中。這個語言擁有可以遞歸調用的函數以及全局變量,我們需要準備一個堆棧和一個堆才可以支撐所有的內存操作。堆棧有很多種實現的方法,可以放在堆里也可以不放在堆里。這個決策將對接下去的指令集將會有一點小影響。

 

現在讓我們考慮一下各種類型的結構。首先,booleanintegercharreal都是實體類型,只需要那么一段數據就行了。在32位的機器上分別是1418個字節。其次是函數指針。我們可以使用一個全局的ID指向一個函數,就跟我們拿函數去編號一樣,一個函數一個編號。那么,函數指針跟integer就一致了,區別在于函數指針不能計算也不能轉換類型。

 

接下來是字符串和數組,字符串和數組的結構都是一致的,我們可以使用引用計數來達到垃圾收集的功能。根據類型理論我們可以知道我們剛剛設計的語言是不可能存在內存泄漏的(如果所有的數據都只讓腳本修改)。于是,我們可以讓數組和字符串的結構如下:

[引用計數:int][數據]

當創建一個數組變量的時候,我們讓數組的值為nil,讓其為空,需要使用new創建一個數組。new創建的數組的引用計數是1。如果這個數組被復制的話,那么引用計數也會隨之增大。當引用計數為0,也就是所有的變量都不指向這個數組的時候,數組就該釋放了。而且剛剛設計的這門語言是保險的,也就是說,只要我們無法訪問到這個數組,那么這個數組就一定會被釋放。至于原因就留給大家思考了。

 

字符串的結構跟array of char是一致的,但是字符串有一個特殊的地方。我們將一個字符串賦值給另一個字符串的時候,兩個字符串變量其實指向相同的空間。但是我們對其中一個字符串進行修改的時候,是不影響到另一個字符串的。我們可以在修改之前將被修改的字符串進行復制。舉個例子:

a="vczh";

b=a;

這個時候字符串的引用計數是2。當我們修改b(而不是對b賦值),譬如說b[0]= 'V'的時候,我們對b進行復制。這個時候內存中就有兩個引用計數為1而且內容都是vczh,但是指向的空間不同的字符串了。這個時候我們對b指向的空間進行修改的時候,a指向的空間是不變的。這種方法是經常被使用的。

 

接下來我們考慮堆棧的構造。堆棧是用來存放不支持閉包的語言的函數中的參數和變量的。對于我們剛剛說的這門語言來說,堆棧是相當合適的數據結構。堆棧是分段的,一個段記錄的內容有參數、變量、臨時信息、函數參數起始位置以及函數的執行位置。函數的執行位置用于記錄當前函數在調用新函數之前所執行的指令。有了這個信息之后,我們就可以在函數返回的時候找到合適的指令繼續執行了。

 

如果堆棧中存放字符串或者數組的話,在堆棧的一個段被銷毀的同時,我們需要減少相應的字符串或數組的引用計數,并在適當的時候釋放他們。那么,我們如何知道堆棧的什么地方記錄著什么類型的變量呢?因為表達式也會頻繁地使用堆棧的臨時空間進行計算,因此類型信息有必要放在堆棧里面。如果不這樣做的話,我們就要在指令集里面加入各種不同的pop指令,并在函數的很多地方使用。這兩種做法各有利弊,在實現的時候需要衡量一下。

 

函數調用的時候需要大量更改堆棧的內容。在這里我舉一個例子。已知如下代碼:

function A(x:integer):integer;

begin

  result:=B(x+1,x-1);

end;

 

function B(x,y:integer):integer;

begin

  result:=x*y;

end;

 

我們可以假想出一個編譯后的指令:

FUNCTION_A:

00  push x;

01  push 1;

02  add;

03  push x;

04  push 1;

05  sub;

06  call FUNCTION_B;

07  pushref result;

08  assign;

09  ret 1;

FUNCTION_B:

10  push x;

11  push y;

12  mul;

13  pushref result;

14  assign;

15  ret 2;

 

當我們執行A(5)的時候,堆棧如下:

 

地址  內容

<以前的內容>

100   5{x}

104   0{result變量}

108   100{FUNCTION_A參數起始地址}

112   ×××{FUNCTION_A返回的時候的地址}

 

好了,我們一直執行指令,直到05sub;)。這個時候堆棧上有了x+1x-1兩個數:

 

地址  內容

<以前的內容>

100   5{x}

104   0{result變量}

108   100{FUNCTION_A參數起始地址}

112   ×××{FUNCTION_A返回的時候的地址}

116   6

120   4

 

現在執行06call FUNCTION_B;),堆棧變成這樣:

 

地址  內容

<以前的內容>

100   5{x}

104   0{result變量}

108   100{FUNCTION_A參數起始地址}

112   ×××{FUNCTION_A返回的時候的地址}

116   6

120   4

124   0{新的result 變量}

128   116{FUNCTION_B參數起始地址}

132   07{FUNCTION_B返回的時候的地址,指向pushref result;指令}

 

然后一直執行,終于FUNCTION_B執行完了,到了15ret 2)。

 

地址  內容

<以前的內容>

100   5{x}

104   0{result變量}

108   100{FUNCTION_A參數起始地址}

112   ×××{FUNCTION_A返回的時候的地址}

116   6

120   4

124   24{新的result 變量,被更改}

128   116{FUNCTION_B參數起始地址}

132   07{FUNCTION_B返回的時候的地址,指向pushref result;指令}

 

于是執行15ret 2)。ret 2的意思是屬于FUNCTION_B的參數和變量一共有2個。虛擬機尋找有沒有字符串和數組,發現沒有。這時,虛擬機將132處的返回地址07拿出來,并將124處的函數返回值24保存好,最后將堆棧頂部重新指向116,并push函數返回值。這個時候堆棧如下:

 

地址  內容

<以前的內容>

100   5{x}

104   0{result變量}

108   100{FUNCTION_A參數起始地址}

112   ×××{FUNCTION_A返回的時候的地址}

116   24{函數執行結果}

 

這就是一次函數調用和函數返回之后堆棧中數據的變動了。當然,我們可以加入新的指令以調整result變量、函數參數、起始地址以及返回地址的位置,讓callret指令輕松一些,效率也提高一些。不過這是后話了。事實上上述指令中ret指令的參數是需要一個函數的參數表和變量表才能正確工作的。不同的解決方案中的ret有不同的意義。

 

這篇文章就到此為止了。剛剛開始實習,雜七雜八的事情比較多,因此寫文章的速度會慢一些。下一批文章將講述如何對我們構造的一門腳本語言進行語法分析以及語義分析。語法分析和語義分析主要還是用來分析代碼并檢查語法錯誤的,并附帶給出一個描述語言的數據結構,用于接下來的代碼生成等問題。

posted on 2008-07-18 20:31 陳梓瀚(vczh) 閱讀(6667) 評論(8)  編輯 收藏 引用 所屬分類: 腳本技術

評論:
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2008-07-18 21:27 | sunwj
很好,很期待  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2008-07-19 00:04 | 不戒大師
期待下一章  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理)[未登錄] 2008-07-19 01:57 | ngaut
不錯,加油  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理)[未登錄] 2008-07-19 06:40 | foxtail
恩 適合當高級講師   回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2008-07-20 16:48 | Strive
牛!!  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2008-07-21 03:30 | rhode
只想看你的下一篇
寫長點哦.....哈哈  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2009-03-06 10:12 | Acumon
你的文章不錯,不過有些地方沒有說到點子上。
比如說C++的確很難分析,難是難在它不能解釋為一些簡單的、有成熟解析方法的文法--比如說LALR。更過份的是,C++甚至不是LR(K)可解析的,無論K取多大的值。作為對比,JAVA和C是很容易解析的,因為它們都是LALR可解析的。

因此,像A*B;這類的表達式,其實并不難處理--當然了,如果使用后綴表達式就更爽了:入棧,出棧,解決 :)

  回復  更多評論
  
# re: 手把手教你寫腳本引擎(三)——簡單的高級語言(1,基本原理) 2009-03-06 20:02 | 陳梓瀚(vczh)
@Acumon
顯然寫這種文章就是為了人們不必去搞什么LALR……所以就通通略過去了。于是在另一篇文章使用一點點文法知識構造了文法分析器。  回復  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲日韩中文字幕在线播放| 国产偷国产偷亚洲高清97cao| 国产日韩欧美一区在线 | 亚洲图片欧洲图片av| 亚洲人久久久| 在线一区二区三区四区五区| 亚洲永久网站| 久久天天狠狠| 亚洲国产一区在线观看| 99v久久综合狠狠综合久久| 99视频日韩| 亚洲欧美日本国产有色| 久久精品视频亚洲| 欧美搞黄网站| 国产一区视频在线看| 亚洲电影免费在线| 亚洲一区二区网站| 久久综合给合| 一区二区三区欧美| 美女成人午夜| 国产精品美女久久久久aⅴ国产馆| 狠狠久久五月精品中文字幕| av不卡在线观看| 久久嫩草精品久久久精品| 亚洲日本理论电影| 久久国产乱子精品免费女| 欧美日韩激情小视频| 在线观看亚洲a| 午夜综合激情| 亚洲精品免费看| 久久综合久久综合九色| 国产精品美女久久久久久久| 亚洲啪啪91| 久久资源av| 香蕉成人啪国产精品视频综合网| 欧美日韩第一页| 亚洲第一伊人| 久久精品免费看| 在线视频精品一区| 欧美波霸影院| 亚洲第一成人在线| 久久米奇亚洲| 午夜精品久久久久久久久 | 午夜精品影院在线观看| 欧美日韩久久不卡| 亚洲人成在线观看| 欧美肥婆在线| 久久艳片www.17c.com| 国际精品欧美精品| 久久免费视频网| 久久成人免费网| 国产亚洲成av人片在线观看桃| 亚洲午夜国产一区99re久久| 最新成人av网站| 美女久久网站| 亚洲国产精品一区在线观看不卡| 久久亚洲精品一区二区| 日韩视频在线你懂得| 亚洲综合色丁香婷婷六月图片| 欧美日韩国产三级| 99精品视频免费全部在线| 麻豆av福利av久久av| 久久在线精品| 亚洲区一区二| 亚洲激情一区| 欧美日韩国内自拍| 亚洲欧美日韩精品久久久| 在线亚洲精品| 国产乱码精品一区二区三区忘忧草| 亚洲一级免费视频| 亚洲综合另类| 国模精品娜娜一二三区| 免费视频一区二区三区在线观看| 久久久精品国产99久久精品芒果| 韩国成人福利片在线播放| 久久婷婷国产综合尤物精品| 久久久久国产成人精品亚洲午夜| 亚洲电影免费| 日韩视频欧美视频| 国产精品亚洲精品| 欧美成人官网二区| 欧美日韩一区高清| 久久精品男女| 欧美激情第9页| 午夜日本精品| 免费日韩一区二区| 亚洲欧美国产高清| 久久久欧美一区二区| 妖精成人www高清在线观看| 亚洲与欧洲av电影| 亚洲日本免费电影| 亚洲制服少妇| 亚洲美女黄色| 久久er99精品| 一区二区不卡在线视频 午夜欧美不卡在| 一区二区日韩精品| 在线观看亚洲视频啊啊啊啊| 一本色道久久综合亚洲91| 国产亚洲第一区| 91久久久久久久久久久久久| 国产精品一二三| 亚洲电影毛片| 国产精品中文字幕欧美| 欧美大片18| 国产伦精品一区二区三区照片91| 在线看片第一页欧美| 在线性视频日韩欧美| 亚洲国产欧美在线人成| 亚洲一区二区四区| 亚洲精品国产精品久久清纯直播| 亚洲字幕在线观看| 一区二区三区日韩欧美精品| 久久久视频精品| 欧美一区影院| 国产精品hd| 亚洲精品久久视频| 亚洲福利视频免费观看| 午夜国产精品视频| 午夜宅男久久久| 欧美日韩中字| 91久久视频| 欧美—级高清免费播放| 久久免费国产| 久久er99精品| 欧美在线一级视频| 欧美色图首页| 99ri日韩精品视频| 亚洲深夜福利在线| 欧美巨乳在线观看| 亚洲精品1区2区| 亚洲精品日韩在线| 欧美高清视频免费观看| 欧美国产大片| 亚洲人成网站777色婷婷| 麻豆精品一区二区综合av | 久久久亚洲国产天美传媒修理工| 欧美午夜理伦三级在线观看| 日韩视频一区二区三区在线播放| 亚洲免费av片| 欧美日韩精品在线观看| 99精品视频免费| 亚洲桃花岛网站| 国产精品高潮在线| 亚洲一区二区三区高清| 欧美一区二区在线视频| 国产一区二区三区av电影 | 久久精品午夜| 看欧美日韩国产| 亚洲成人在线免费| 久热爱精品视频线路一| 亚洲风情亚aⅴ在线发布| 亚洲国产午夜| 欧美日韩久久久久久| 亚洲综合精品四区| 老司机67194精品线观看| 亚洲日韩欧美一区二区在线| 欧美日韩国产欧| 午夜精品理论片| 麻豆国产精品va在线观看不卡| 在线精品高清中文字幕| 欧美经典一区二区三区| 亚洲视频一区| 久久久久久午夜| 亚洲精品欧美日韩| 国产精品视频网址| 久色婷婷小香蕉久久| 亚洲区第一页| 狠狠色综合网站久久久久久久| 美女视频黄a大片欧美| 日韩一级成人av| 久久在线免费观看| 一区二区三区日韩精品| 国产一区二区在线观看免费播放 | 久久久最新网址| 亚洲精品网站在线播放gif| 国产精品成人在线观看| 久久久www| 一级日韩一区在线观看| 蜜桃久久精品一区二区| 亚洲一区二区三区国产| 国色天香一区二区| 欧美日韩综合在线| 久久免费一区| 亚洲免费在线观看| 91久久精品美女| 久久综合网hezyo| 亚洲一区二区三区四区中文| 麻豆久久婷婷| 亚洲欧美中日韩| 亚洲人成啪啪网站| 久久久久久噜噜噜久久久精品 | 久久一本综合频道| 国产视频欧美视频| 国产精品扒开腿做爽爽爽视频| 久久综合伊人77777麻豆| 午夜亚洲福利| 亚洲少妇最新在线视频| 最新日韩精品| 亚洲电影免费观看高清| 午夜在线a亚洲v天堂网2018|