• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 9,  comments - 19,  trackbacks - 0
            本人博客地址:http://m.shnenglu.com/pwq1989/

            上一篇對Luajit的代碼結構和編譯過程做了簡單的描述,這一篇就講一下buildvm在第一步預處理dasc文件的過程和DynASM這個輪子。

            官方連接:http://luajit.org/dynasm.html

            是為了讓你更優雅的C里面擼匯編的一個工具,我記得以前看過一個老外的blog對比過同樣功能的jit code generator的語法,Luajit的作者顯然品位還是很高的。

            我們先來看看如果不用工具硬生生擼代碼的話會發生什么。
            1、你往一段內存里面寫0xB8,0x00,0x01....
            2、你在文件里定義好多label,寫個copy section的宏往內存里面復制,你還不能確定里面到底是什么。(哦。。這個的術語叫Threaded。。。)

            然后再對比下AsmJit或者Xbyak的例子看看(他們的功能差不多),DynASM還提供了.marco實現,就會發現語法真是sweeeet~

            這是我寫著玩的一個草泥馬語jit解釋器(https://github.com/pwq1989/GMHjit)語法真是清新自然啊,如果你想看工業級的應用,可以看看Google的Haberman寫的protobuf的upb庫,里面用DynASM進行了jit,號稱快了多少多少(不去考證了),或者是agentzh寫的sregex正則庫,也是用它做了jit。一般來說DSL配上jit的話一定會快很多就錯不了了。

            下面給一個DynASM的Demo程序(摘抄自這個blog
             1 // DynASM directives.
             2 |.arch x64
             3 |.actionlist actions
             4  
             5 // This define affects "|" DynASM lines.  "Dst" must
             6 // resolve to a dasm_State** that points to a dasm_State*.
             7 #define Dst &state
             8  
             9 int main(int argc, char *argv[]) {
            10   if (argc < 2) {
            11     fprintf(stderr, "Usage: jit1 <integer>\n");
            12     return 1;
            13   }
            14  
            15   int num = atoi(argv[1]);
            16   dasm_State *state;
            17   initjit(&state, actions);
            18  
            19   // Generate the code.  Each line appends to a buffer in
            20   // "state", but the code in this buffer is not fully linked
            21   // yet because labels can be referenced before they are
            22   // defined.
            23   //
            24   // The run-time value of C variable "num" is substituted
            25   // into the immediate value of the instruction.
            26   |  mov eax, num
            27   |  ret
            28  
            29   // Link the code and write it to executable memory.
            30   int (*fptr)() = jitcode(&state);
            31  
            32   // Call the JIT-ted function.
            33   int ret = fptr();
            34   assert(num == ret);
            35  
            36   // Free the machine code.
            37   free_jitcode(fptr);
            38  
            39   return ret;
            40 }

            預處理之后那就會變成這樣子:
             1 //|.arch x64
             2 //|.actionlist actions
             3 static const unsigned char actions[4] = {
             4   184,237,195,255
             5 };
             6  
             7 // []
             8  
             9 //|  mov eax, num
            10 //|  ret
            11 dasm_put(Dst, 0, num);
            dasm_put就是把num參數和actions[]一起放入了Dst(#define Dst &state)的制定的內存中,這時候已經是機器碼的形式了。
            下面是對于acitons[]數組內容的解釋:
            184(B8)-- mov eax, [immediate] 指令的第一個字節
            237       -- 內置的標志DASM_IMM_D, 指明應該放入一個4字節寬度的參數,與上一條指令完成一個MOV
            195(C3)-- 對應ret指令
            255       -- 內置的標志DASM_STOP

            以上就是最簡單的例子,dasm_growpc()是內置的函數,用來增長maxpc, 這樣在程序里面就可以方便寫出jmp => label 這樣的指令了。

            由于DynASM的文檔很少,幸虧還有幾個例子,除了例子唯一能看的就是源碼了,所以在用的時候出現問題是很痛苦的。。當時寫GMHjit就發現了蛋疼的pre-process period bug,后來繞過去了。

            源碼文件有這么幾個
            -- dynasm.lua
            -- dynasm_proto.h
            -- dynasm_*.lua
            -- dynasm_*.h  // * x64  x86  ppc mips arm 等target

            用起來就是lua dynasm.lua a.dasm > a.h 

            下面就從dynasm.lua開始分析下他的源碼

            入口是parseargs函數,里面給的g_opt參數賦默認的值,一個repeat 中調用parseopt解析參數,opt_map就是option對args的函數映射。

            函數wline,wcomment,wsync,wdumplines都是對輸出的目標文件的操作。

            真正的主函數是 translate,把input file變成 output file,在readfile中的doline函數是真正的處理過程,里面判斷是否是Assembler line之后Emit C code,調用dostmt(aline)。里面繼續有map_coreop[*]來處理section macro arch nop_ error_1 include  if endif elseif 等關鍵字,想深入研究的可以自己去看,其中在loadarch中根據arch加載不同的lua庫

            如果arch是x64的話,本質還是require x86
            來看dasm_x86.lua文件

            _M.mergemaps這是關鍵的方法,設置了2個Map的元方法,然后返回,相當于是把方法綁定在table里面傳遞了出去。處理后文件中關鍵的actionlist[]數組和Dasm_put(Dst, ...)的輸出就是這個lua文件的方法。
            里面提供了很多dump方法,可以供我們遇到問題時候調試處理過程。

            action_names就是以后生成的action_list中的內置標志定義,必須與dasm_x86.h中的enum定義一致。
            表明了代表的參數和長度等信息。
            這個文件里面所有的函數就是做了一件事,把你的 |...  這樣子的代碼處理成數組輸出到目標文件中(我是匯編渣渣,里面貌似支持SSE2、3、4+,看不懂,等到以后看到traced jit的時候再去翻手冊把)

            預處理完成之后,就是#include "dasm_x86.h",里面有最關鍵的dasm_State結構體的定義,幾乎里面所有的函數都是對外的API,有init,setup,free等等,除去初始化與free之外,有三個步驟是需要出現在你都代碼中:
            1、dasm_put(Dst,...) 這個是自動生成的,不用我們操心,根據actionlist[]和運行時的參數寫入到Dst指定的內存(Dst->section)中.
            2、dasm_link() 第二個參數是返回的代碼長度大小,這個函數把section合并到一起,處理偏移等等。
            3、dasm_encode() 第二個參數是一個接受encode輸出的buffer指針。

            然后就可以用一個函數指針,比如聲明一個 int (*f)(*int), int ret = f(param) 直接運行剛剛生成的機器碼了。






            posted on 2013-11-30 12:49 右席 閱讀(7192) 評論(0)  編輯 收藏 引用 所屬分類: Luajit
            国产精品亚洲美女久久久| 亚洲国产欧洲综合997久久| 狠狠色丁香久久综合婷婷| 久久国产免费观看精品| 久久香蕉国产线看观看猫咪?v| 伊人久久大香线蕉综合网站| 日产精品99久久久久久| 国产精品九九久久免费视频| 亚洲AV乱码久久精品蜜桃| 国产精品99久久久久久www| 精产国品久久一二三产区区别 | 久久这里只有精品首页| 日日狠狠久久偷偷色综合0| 国内精品久久久久影院日本| 亚洲欧洲中文日韩久久AV乱码| 久久久久一区二区三区| 亚洲AV无码1区2区久久| 一本色综合久久| 国产精品热久久无码av| 久久99热狠狠色精品一区| 精品熟女少妇AV免费久久| 午夜精品久久久内射近拍高清| 狠狠干狠狠久久| 久久精品国产99久久无毒不卡| 一本大道久久香蕉成人网| 狠狠综合久久综合中文88| 成人a毛片久久免费播放| 26uuu久久五月天| 蜜桃麻豆www久久| 国产精品99久久精品| 久久久国产精品亚洲一区| 亚洲va中文字幕无码久久不卡 | 午夜天堂av天堂久久久| 中文国产成人精品久久不卡| 欧美国产成人久久精品| 99久久国产综合精品女同图片 | 精品熟女少妇aⅴ免费久久| 99久久国产综合精品成人影院 | 久久综合九色欧美综合狠狠 | 国产欧美久久久精品| 国产高清美女一级a毛片久久w|