• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 9,  comments - 19,  trackbacks - 0
            本人博客地址:http://m.shnenglu.com/pwq1989/

            上一篇對Luajit的代碼結構和編譯過程做了簡單的描述,這一篇就講一下buildvm在第一步預處理dasc文件的過程和DynASM這個輪子。

            官方連接:http://luajit.org/dynasm.html

            是為了讓你更優雅的C里面擼匯編的一個工具,我記得以前看過一個老外的blog對比過同樣功能的jit code generator的語法,Luajit的作者顯然品位還是很高的。

            我們先來看看如果不用工具硬生生擼代碼的話會發生什么。
            1、你往一段內存里面寫0xB8,0x00,0x01....
            2、你在文件里定義好多label,寫個copy section的宏往內存里面復制,你還不能確定里面到底是什么。(哦。。這個的術語叫Threaded。。。)

            然后再對比下AsmJit或者Xbyak的例子看看(他們的功能差不多),DynASM還提供了.marco實現,就會發現語法真是sweeeet~

            這是我寫著玩的一個草泥馬語jit解釋器(https://github.com/pwq1989/GMHjit)語法真是清新自然啊,如果你想看工業級的應用,可以看看Google的Haberman寫的protobuf的upb庫,里面用DynASM進行了jit,號稱快了多少多少(不去考證了),或者是agentzh寫的sregex正則庫,也是用它做了jit。一般來說DSL配上jit的話一定會快很多就錯不了了。

            下面給一個DynASM的Demo程序(摘抄自這個blog
             1 // DynASM directives.
             2 |.arch x64
             3 |.actionlist actions
             4  
             5 // This define affects "|" DynASM lines.  "Dst" must
             6 // resolve to a dasm_State** that points to a dasm_State*.
             7 #define Dst &state
             8  
             9 int main(int argc, char *argv[]) {
            10   if (argc < 2) {
            11     fprintf(stderr, "Usage: jit1 <integer>\n");
            12     return 1;
            13   }
            14  
            15   int num = atoi(argv[1]);
            16   dasm_State *state;
            17   initjit(&state, actions);
            18  
            19   // Generate the code.  Each line appends to a buffer in
            20   // "state", but the code in this buffer is not fully linked
            21   // yet because labels can be referenced before they are
            22   // defined.
            23   //
            24   // The run-time value of C variable "num" is substituted
            25   // into the immediate value of the instruction.
            26   |  mov eax, num
            27   |  ret
            28  
            29   // Link the code and write it to executable memory.
            30   int (*fptr)() = jitcode(&state);
            31  
            32   // Call the JIT-ted function.
            33   int ret = fptr();
            34   assert(num == ret);
            35  
            36   // Free the machine code.
            37   free_jitcode(fptr);
            38  
            39   return ret;
            40 }

            預處理之后那就會變成這樣子:
             1 //|.arch x64
             2 //|.actionlist actions
             3 static const unsigned char actions[4] = {
             4   184,237,195,255
             5 };
             6  
             7 // []
             8  
             9 //|  mov eax, num
            10 //|  ret
            11 dasm_put(Dst, 0, num);
            dasm_put就是把num參數和actions[]一起放入了Dst(#define Dst &state)的制定的內存中,這時候已經是機器碼的形式了。
            下面是對于acitons[]數組內容的解釋:
            184(B8)-- mov eax, [immediate] 指令的第一個字節
            237       -- 內置的標志DASM_IMM_D, 指明應該放入一個4字節寬度的參數,與上一條指令完成一個MOV
            195(C3)-- 對應ret指令
            255       -- 內置的標志DASM_STOP

            以上就是最簡單的例子,dasm_growpc()是內置的函數,用來增長maxpc, 這樣在程序里面就可以方便寫出jmp => label 這樣的指令了。

            由于DynASM的文檔很少,幸虧還有幾個例子,除了例子唯一能看的就是源碼了,所以在用的時候出現問題是很痛苦的。。當時寫GMHjit就發現了蛋疼的pre-process period bug,后來繞過去了。

            源碼文件有這么幾個
            -- dynasm.lua
            -- dynasm_proto.h
            -- dynasm_*.lua
            -- dynasm_*.h  // * x64  x86  ppc mips arm 等target

            用起來就是lua dynasm.lua a.dasm > a.h 

            下面就從dynasm.lua開始分析下他的源碼

            入口是parseargs函數,里面給的g_opt參數賦默認的值,一個repeat 中調用parseopt解析參數,opt_map就是option對args的函數映射。

            函數wline,wcomment,wsync,wdumplines都是對輸出的目標文件的操作。

            真正的主函數是 translate,把input file變成 output file,在readfile中的doline函數是真正的處理過程,里面判斷是否是Assembler line之后Emit C code,調用dostmt(aline)。里面繼續有map_coreop[*]來處理section macro arch nop_ error_1 include  if endif elseif 等關鍵字,想深入研究的可以自己去看,其中在loadarch中根據arch加載不同的lua庫

            如果arch是x64的話,本質還是require x86
            來看dasm_x86.lua文件

            _M.mergemaps這是關鍵的方法,設置了2個Map的元方法,然后返回,相當于是把方法綁定在table里面傳遞了出去。處理后文件中關鍵的actionlist[]數組和Dasm_put(Dst, ...)的輸出就是這個lua文件的方法。
            里面提供了很多dump方法,可以供我們遇到問題時候調試處理過程。

            action_names就是以后生成的action_list中的內置標志定義,必須與dasm_x86.h中的enum定義一致。
            表明了代表的參數和長度等信息。
            這個文件里面所有的函數就是做了一件事,把你的 |...  這樣子的代碼處理成數組輸出到目標文件中(我是匯編渣渣,里面貌似支持SSE2、3、4+,看不懂,等到以后看到traced jit的時候再去翻手冊把)

            預處理完成之后,就是#include "dasm_x86.h",里面有最關鍵的dasm_State結構體的定義,幾乎里面所有的函數都是對外的API,有init,setup,free等等,除去初始化與free之外,有三個步驟是需要出現在你都代碼中:
            1、dasm_put(Dst,...) 這個是自動生成的,不用我們操心,根據actionlist[]和運行時的參數寫入到Dst指定的內存(Dst->section)中.
            2、dasm_link() 第二個參數是返回的代碼長度大小,這個函數把section合并到一起,處理偏移等等。
            3、dasm_encode() 第二個參數是一個接受encode輸出的buffer指針。

            然后就可以用一個函數指針,比如聲明一個 int (*f)(*int), int ret = f(param) 直接運行剛剛生成的機器碼了。






            posted on 2013-11-30 12:49 右席 閱讀(7193) 評論(0)  編輯 收藏 引用 所屬分類: Luajit
            久久亚洲AV成人无码国产| 怡红院日本一道日本久久 | 亚洲人成伊人成综合网久久久| 色老头网站久久网| 91久久精品91久久性色| 丁香五月综合久久激情| 欧美激情精品久久久久久| 久久综合香蕉国产蜜臀AV| 国产精品久久久久乳精品爆| 囯产精品久久久久久久久蜜桃| 99精品久久精品一区二区| 思思久久好好热精品国产| 国产精品美女久久久久| 国产69精品久久久久APP下载| 狠狠色婷婷久久一区二区三区 | 久久97久久97精品免视看| 国产精品一区二区久久精品涩爱 | 国产女人aaa级久久久级| 99精品国产综合久久久久五月天| 欧美激情精品久久久久| www性久久久com| 99久久国产精品免费一区二区| 久久福利片| 国产精品免费久久久久久久久| 精品熟女少妇av免费久久| 亚洲精品午夜国产va久久| 久久久青草青青国产亚洲免观| 国产美女久久久| 91精品国产综合久久精品| 色婷婷综合久久久久中文| 人妻无码精品久久亚瑟影视| 久久久精品久久久久特色影视| 66精品综合久久久久久久| 99国产欧美精品久久久蜜芽| 亚洲女久久久噜噜噜熟女| 久久精品中文字幕一区| 97久久国产亚洲精品超碰热| 人妻丰满AV无码久久不卡| 国产aⅴ激情无码久久| 亚洲精品白浆高清久久久久久| 少妇久久久久久久久久|