• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-341  評論-2670  文章-0  trackbacks-0

            手把手教你寫腳本引擎(一)——挑選語言的特性

             

            陳梓瀚

            華南理工大學軟件本科05

            vczh@163.com

            http://m.shnenglu.com/vczh/

             

            腳本引擎的作用在于增強程序的可配置性。從游戲到管理系統(tǒng)都需要腳本,甚至連工業(yè)級產品的Office3DS Max以及AutoCAD等都添加了屬于自己的腳本語言。DHTML的出現(xiàn)讓我們可以在網頁代碼中嵌入腳本語言,PHPASP等技術的出現(xiàn)讓我們可以將一個應用程序的界面換成網頁,而邏輯使用腳本語言編寫。現(xiàn)在腳本語言的種類繁多,Python的發(fā)展讓BOOST庫擁有了對Python的支持,Rails框架的出現(xiàn)壯大了Ruby的實力,LUA更是被大量應用在游戲開發(fā)中。Windows甚至提供了wscript以便讓我們能夠調用javascriptvbscript的代碼。


            既然有了這么多可供選擇的腳本引擎,為什么我們仍然要開發(fā)自己的腳本引擎呢?首先,我們并不能保證現(xiàn)有的腳本引擎能夠滿足我們做出來的系統(tǒng)。因為我們所需要的腳本可能很簡單,用現(xiàn)有的腳本引擎比較浪費。或者我們的腳本復雜,但是功能比較“神奇”(譬如SQL)以至于沒有能夠滿足我們需要的腳本引擎。因為腳本并不一定是通用語言,腳本僅僅是為了滿足我們增強系統(tǒng)的可配置性而出現(xiàn)的。其次,腳本引擎足夠復雜,可以訓練我們的編程能力。在我們的業(yè)余時間里面開發(fā)出來的程序并不完全是為了滿足某個應用的需要而產生的,有可能是我們?yōu)榱俗陨淼奶岣叨M行的摸索。開發(fā)腳本引擎足以成為鍛煉的方法之一。

             

            計算機語言作為一個計算的定義,在我們開發(fā)腳本引擎之前需要先進行了解。對于目前流行的若干種語言,我們可以抽象出一組正交屬性來描述他們。

             

            一、命令式與描述式

             

            一門語言是命令式或者描述式取決于這門語言是用來告訴計算機怎樣做還是做什么的。舉個例子,SQLProlog是描述式語言,而C++C#等則是命令式語言。我們在使用SQL的時候告訴服務器的是我們需要滿足什么條件的數(shù)據(jù)項,而不是告訴服務器我們需要通過什么計算來獲得自己所需要的數(shù)據(jù)項。描述式的語言的優(yōu)點在于其可讀性好。C# 3.0為數(shù)據(jù)查詢加入了LINQ讓我們可以在C#中書寫類似SQL的代碼查詢數(shù)據(jù)。

             

            另一個比較模糊的例子則是HaskellHaskell很難區(qū)分是命令式語言還是描述式語言。因為從形式上來說我們告訴編譯器的是我們想做什么而不是我們想怎么做,但是Haskell給我們的工具的粒度太細以至于我們?yōu)榱烁嬖V編譯器做什么的同時仍然需要考慮一個問題是如何被解決的。

             

            二、按值計算與惰性計算

             

            惰性計算的語言很少出現(xiàn)以至于可能很多人都不知道“原來語言可以是這個樣子的”。惰性計算的精神是不去執(zhí)行沒用的代碼。什么是沒用的代碼呢?只要是這段代碼的值不對外界產生任何影響,譬如沒有往屏幕、硬盤或者是其他什么地方寫點什么數(shù)據(jù),就是沒有用的。當然,至于這段代碼中間做了些什么事情那是不管的。

             

            舉一個比較簡單的例子,假設現(xiàn)在有如下代碼:

            function PrintAndReturn(Message,Result)

            {

                Print(Message);

                return Result;

            }

            function DoSomething(BoolA,BoolB)

            {

                If(BoolA || BoolB) Print(“!”);

            }

            DoSomething(PrintAndReturn(“Hello”,true),PrintAndReturn(“World”,false));

            DoSomething函數(shù)傳入兩個參數(shù),都是布爾類型的。如果這兩個參數(shù)其中有一個是true的話那么就往屏幕上打出一個感嘆號。PrintAndReturn函數(shù)接受兩個參數(shù),往屏幕上打出第一個參數(shù),函數(shù)返回第二個參數(shù)。

             

            對于一門按值計算的語言,也就是我們平常見到的那種,執(zhí)行的結果是“HelloWorld!”。因為為了調用DoSomething我們需要首先獲得兩個布爾值。

             

            對于一門惰性計算的語言,執(zhí)行的結果是“Hello!”。因為DoSomething在對BoolA || BoolB進行求值的時候計算了BoolA,發(fā)現(xiàn)是true,于是BoolB這個參數(shù)就沒有用了,因此PrintAndReturn(“World”,false)也就不會執(zhí)行了,導致“World”不會顯示在屏幕上。

             

            當然,對于上面舉的這個例子來說,這種語言有著惰性計算的屬性并不合理。一門語言為了不具有二義性,在存在惰性計算的同時必須對自己的類型系統(tǒng)進行改造。關于這方面的資料可以查閱Haskell語言中Monad的原理。Haskell作為一門惰性計算的語言,在不關心求值順序的同時,仍然保證結果的一致性。上面這個例子,如果程序對||的求值是從右操作數(shù)開始的話,那么輸出的結果就變成“HelloWorld!”了。惰性計算的好處在于可以在邏輯上表達無窮大的對象,而在實際的計算過程中并不需要將這個無窮大的對象一次性計算出來,而是需要哪里算到哪里。舉個例子:

             

            function MakeArray(Index)

            {

                return [Index]++MakeArray(Index+1);

            }

            function Sum(Array,Count)

            {

                Result=0;

                for i=0 to Count-1

                    Result+=Array[i];

               return Result;

            }

            Print(Sum(MakeArray(1),10));

            在這個例子中,[Index]代表一個只有一個元素的數(shù)組,其內容是Index,而++操作符將兩個數(shù)組接起來。于是MakeArray(1)就產生了一個無窮長的數(shù)組,其內容是[1,2,3,4,…]Sum計算數(shù)組的前若干個數(shù)字的和。對于一門惰性計算的語言,這個例子將輸出55,因為我們需要的僅僅是前10個數(shù)字,因此MakeArray只需要遞歸10次就自動挺下來了。而對于一門按值計算的語言來說,將發(fā)生死循環(huán)而出現(xiàn)不可停機現(xiàn)象。

             

            三、強類型、弱類型與無類型

             

            一門語言是無類型當且僅當一個固定的符號的類型可以在運行時改變。譬如如下代碼:

            TheVariable=1;

            TheVariable=”I am a string!”;

            第一行創(chuàng)建了一個int類型的TheVariable變量,而第二行則將TheVariable修改成了字符串類型。一門無類型語言的對象類型可以是數(shù)值、字符串、數(shù)組、類、閉包、函數(shù)指針等等的東西。

             

            只要不是無類型的,那必然就是強類型或者弱類型的了。強類型與弱類型的分界線比較明顯。只要存在隱式類型轉換的語言則是弱類型的,譬如C語言能將int隱式轉換為double。不存在隱式轉換的語言也是存在的,譬如Haskell。在Haskell里面不能創(chuàng)建一個實數(shù)類型的名字但是綁定一個整數(shù)的值上去。因為整數(shù)跟實數(shù)的類型是不同的,而且不存在隱式轉換。

             

            四、函數(shù)與閉包

             

                凡是支持閉包的語言必然是支持函數(shù)的,但是并不是所有支持函數(shù)的語言都支持閉包,而且也并不是所有的語言都有函數(shù)。Windows的批處理文件所能理解的語言就是不支持函數(shù)的語言的一個例子。

             

                至于什么是閉包呢?閉包就是可以保持函數(shù)執(zhí)行的上下文的一種強大的函數(shù)指針。舉個例子:

                function Add(a)

                {

                    return function(b)

                    {

                        Return a+b;

                    }

                }

                Inc=Add(1);

                Inc10=Add(10);

                Print(Inc(5));

                Print(Inc10(5));

                這個例子將輸出615。執(zhí)行Inc=Add(1);的時候,Add函數(shù)返回了一個新的函數(shù),這個函數(shù)接受參數(shù)b并返回參數(shù)ab相加的結果。返回的這個函數(shù)將參數(shù)a記了下來。所以IncInc10在執(zhí)行的時候,雖然執(zhí)行的是同一個函數(shù),但是這個函數(shù)所看到的a確是不同的。a的值的不同代表著IncInc10執(zhí)行函數(shù)的不同。這也就是閉包是可以保持函數(shù)執(zhí)行的上下文的由來了。當然,一門不支持閉包的語言是不能允許上面這種寫法的。

             

                這四種屬性是區(qū)分語言特征的重要屬性。至于一門語言是否支持面向對象的寫法或者支持元編程或者泛型之類的東西,并不是十分重要的特性,雖然我們使用起來的感覺非常不同。

             

                那么我們如何選擇我們所需要的特性呢?對于一個簡單的事務腳本來說,我們只需要非常簡單的特性諸如選擇結構和循環(huán)結構,和簡單的計算功能。計算功能可以支持表達式也可以不支持表達式。一門不支持表達式的語言看起來就像MASM支持的那種有宏的匯編語言。就像前些日子CSDN抄得很熱的概念DSL一樣,我們在設計一門腳本語言的時候,想的不應該是這門語言如何如何強大,而應該是這門語言應該如何更好地表達領域相關的信息。

             

                下面這幅圖片顯示的是筆者在高中的時候開發(fā)的一款RPG的地圖編輯器。眾所周知,RPG是需要劇情的,因此編輯器需要在地板上或人物上設置陷阱引發(fā)腳本的執(zhí)行。

             

            RPG由于劇情復雜,需要的控制方法也就很多,因此供給RPG使用的腳本至少應該支持選擇和循環(huán)等。而且有的時候需要使用腳本來完成某些動畫(譬如上圖中的開門腳本),因此腳本也就需要函數(shù)了。至于為什么上面的腳本使用Pascal的語法僅僅是因為筆者當時Delphi用得比較多。這也是筆者第一次實現(xiàn)的一款腳本引擎。

             

            那么,我們如何選擇腳本語言的特性呢?我們要考慮一下系統(tǒng)的復雜度,因為腳本語言的特性跟我們想提供給腳本語言的庫是有很大關系的。

             

            舉個例子,如果提供給腳本的庫經常需要調用到腳本的函數(shù)的話(比如GUI,比如可以給腳本用的類似YACC的東西等),那么腳本最好具有閉包的特性,沒有的話至少也得有函數(shù)指針這種類型。如果提供給腳本的庫的大部分函數(shù)都可以接受很多種不同類型的對象的話,那么腳本最好是無類型的。如果庫很龐大,大到不得不用命名空間和類來提供的話,那腳本無論如何都要有類的。

             

            對于某些專用領域的語言,一般都采用類似自然語言(但是具有嚴格定義)的外觀來組織腳本,最好的例子就是SQL了。如果從語言的角度看,SQLselect是一個具有很多參數(shù),而且大部分參數(shù)都具有缺省值的函數(shù),而且大部分函數(shù)都是一些lambda表達式。因為lambda表達式出現(xiàn)得太多,因此就需要簡化lambda表達式的語法了。所以最終出現(xiàn)在我們面前的語法就是select中到處都可以寫有參數(shù)的表達式,而且這些參數(shù)來自于select的表名和重命名。

             

            如果腳本本身需要非常快的話,那么最好使用強類型或者弱類型。因為這兩種特性的語言的每一個符號都是有確定的類型的,虛擬機的開發(fā)不僅有很多方法,而且還有可能做成JIT(也就是編譯成機器碼)。在這種情況下,庫的供給就要非常注意了。因為在大部分情況下腳本都是在跟庫打交道的,所以交互的部分要詳細考慮。

             

            如果腳本僅僅是用來做一些簡單的配置工作的話,那么表達式可以全免,用命令的外觀設計語法。而且在大多數(shù)情況下連函數(shù)都可以免。這樣的話這門語言就剩下變量、分支和循環(huán)了,就跟Windows的批處理一樣。

             

            最后一個需要提及但是大部分情況下不用管的屬性就是腳本的計算能力。這個計算能力說的不是計算的速度,而是解決的問題的范圍。這個屬性就是圖靈完備了。通俗地講,對于任何一個數(shù)學問題,如果只要C語言算得出來腳本語言都算得出來的話,那么這門腳本語言就是圖靈完備的了。當然,因為C語言也是圖靈完備的,而且圖靈完備的計算能力在有限線程的計算機中是最高的,因此不存在一個數(shù)學問題,某種語言算得出來而C語言算不出來。那么如何判斷一門語言是不是圖靈完備的呢?

             

            簡單的來說,有數(shù)組的語言就是圖靈完備的,有閉包的語言也是圖靈完備的。如果數(shù)組也沒有,閉包也沒有,那么有結構(C語言的structPascalrecord)和有指向結構的指針的語言也是圖靈完備的。因為閉包的內部結構也是一些保留環(huán)境的struct,因此只要能表達遞歸數(shù)據(jù)結構的語言都是圖靈完備的。

             

            這一篇文章就先將到這里了。下一篇文章將會講述如何實現(xiàn)最簡單的命令型腳本語言,再下一篇文章開始將會有幾篇文章講述如何實現(xiàn)一門有數(shù)組和函數(shù)的弱類型腳本語言,接著會對這門語言進行擴充。

            posted on 2008-07-07 07:45 陳梓瀚(vczh) 閱讀(21655) 評論(12)  編輯 收藏 引用 所屬分類: 腳本技術

            評論:
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-07 10:02 | sflypig
            有一個人寫了一本書叫“自己動手寫操作系統(tǒng)”。
            Vczh應該寫一本書叫“手把手教你寫腳本引擎”。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-07 17:13 | 空明流轉
            我說vc,我下次干脆開一個專題叫手把手教你寫Shader編譯器好了。。。
            最近就在干這個。。。正在給shader挑選語法糖。。。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-07 17:29 | 路過
            學習一下,現(xiàn)在的小DD都這么厲害啦。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-07 19:19 | 陳梓瀚(vczh)
            語法糖得你挑,我對Shader的認識又不深入,是你才天天寫Shader……  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-07 22:28 | 空明流轉
            @陳梓瀚(vczh)
            我是說,我寫一個Shader的手把手,和你這個遙相呼應一下。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-07-08 18:09 | cexer
            多謝博主的分享!  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-08-03 07:07 | Lnn
            教教我吧,從最簡單的教起。。。我會很努力的。。。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2008-10-03 06:15 | 免費小說
            用C++寫么,,,,,,,,  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性[未登錄] 2010-09-23 01:28 | forrest
            寫的不錯,贊一個!

            首先關于第三點:強類型、弱類型與無類型。樓主說的太簡略,這里斗膽補充一下:無類型是指變量是無類型的,但是變量指向的對象實際上是有類型的。

            不過話說回來,雖然說語言的編程范式(如面向對象或者面向過程),跟語言本身不是特別有關系(用面向過程的語言,一樣可以編寫面向對象的代碼),但是這是非常大的語法糖,所以也是一個非常重要的考慮方面。異常處理和泛型編程也是一樣的。

            另外需要補充幾點的是:1. 語言本身的內存管理也是一個非常重要的考慮方面,即是否支持垃圾回收和引用計數(shù)。2. 語言的動態(tài)程度,這個與樓主的第三點有點重疊,但是支持多大程度的元編程確實是個問題。3. 參數(shù)和返回值的傳遞方式(按值傳遞還是按引用傳遞,etc.)。4. 作用域規(guī)則  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2010-10-08 03:51 | tt
            相對于硬件來說,一切都是描述式語言吧 -_-  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性 2010-10-08 06:52 | 陳梓瀚(vczh)
            @tt
            代碼是給人看的,不是給硬件看的。這就是為什么硬件不能運行代碼,只能運行編譯后的二進制指令的原因了。所以描述式是針對人而言的哈。  回復  更多評論
              
            # re: 手把手教你寫腳本引擎(一)——挑選語言的特性[未登錄] 2013-06-26 14:00 | alex
            >>一門語言是無類型當且僅當一個固定的符號的類型可以在運行時改變
            python is a strongly typed (also dynamically typed) language.
            you can do this -
            var = 1
            var = "string"
            but you cannot do this -
            var = 1 + "string"  回復  更多評論
              
            国产精品久久久久久五月尺| 狠狠精品久久久无码中文字幕 | 综合久久一区二区三区| 狠狠色伊人久久精品综合网| 一本大道久久东京热无码AV| 漂亮人妻被中出中文字幕久久| 77777亚洲午夜久久多喷| 麻豆AV一区二区三区久久| 亚洲精品无码久久一线| 久久天堂电影网| 无码八A片人妻少妇久久| 久久精品a亚洲国产v高清不卡| 99久久精品免费| 亚洲欧美日韩久久精品第一区| 国产精品一久久香蕉产线看 | 品成人欧美大片久久国产欧美| 久久久久一本毛久久久| 久久久精品人妻一区二区三区四| 久久综合九色综合久99| 久久精品水蜜桃av综合天堂| 久久久久无码专区亚洲av| 国产麻豆精品久久一二三| 奇米影视7777久久精品人人爽| 国产精品成人久久久久三级午夜电影| 亚洲国产欧美国产综合久久| 久久精品无码免费不卡| 久久国产精品-久久精品| 久久人人爽爽爽人久久久| 伊人久久大香线蕉综合5g| 精品久久久久久久久久中文字幕| 2022年国产精品久久久久| 狠狠色伊人久久精品综合网| 久久久久久久久久久| 国产精品成人久久久久久久| 蜜臀久久99精品久久久久久小说| 四虎久久影院| 一本久久精品一区二区| 亚洲国产成人久久一区WWW| 久久亚洲2019中文字幕| 久久综合狠狠综合久久97色| 久久综合色区|