隨筆-162 評論-223 文章-30 trackbacks-0

周知編譯原理龍書闡述的基本塊指令調度算法，它所使用的空的資源預約表RTD與每個指令的資源預約表RT，可以看作二維矩陣，行表示時鐘周期、列表示cpu資源，其定位的元素值1表示占用/預約，0表示空閑/非預約。前者是隨周期遞增而動態擴大的矩陣，后者是固定尺寸(維數)的矩陣（指令花費周期與每周期預約資源皆已知）。在調度時，按帶優先級比如關鍵路徑的拓撲排序基本塊內的指令，順序選取一條指令Inst，計算每前驅發射周期加延遲的結果tmp，取所有tmp的最大值tmax作為Inst的發射周期，再判斷處理器資源是否可用，即RTD和RT作與運算，得到一個新矩陣RTN，若RTN為全零矩陣則tmax為Inst的最終發射周期，否則遞增tmax再做矩陣與運算，直至得到全零矩陣。最后更新RTD，即RTD與RT作或運算結果存于RTD。重復上述過程直到基本塊末尾。

綜上不難看出，如果一個基本塊很大比如有1000條指令，平均每指令花2個周期，則RTD需要2000個條目，若一條目即矩陣每行占用32字節（256種資源數），則總量約64k。當然這對于現代內存體量來說不算什么，但可以有更好的節省內存的做法：RTD尺寸其實可以相對固定，其上限為基本塊中耗費周期最多指令的周期的一個大于1常數因子倍（為兼顧指令并行性），這樣一來就要增加當指令完成時（當前指令發射周期大于前一條的終止周期時復位前一條指令的RTD）從發射周期處復位RTD即作一個矩陣反運算的操作，其它步驟對應的矩陣與、矩陣或運算的操作保留不變。另由于RTD固定了尺寸，因此發射周期遞增后要取模

【備注】以上是我針對簡單機器模型（每種資源數量僅一個，比如整數運算單元1個，內存訪問單元1個，浮點運算單元1個）用布爾矩陣作的優化。如果是復雜的超標量機器即每種資源數有多個，那么只需修改如下：布爾矩陣換成整數矩陣；新增一個機器資源可用總數整數矩陣RDA（單列資源數同值），布爾矩陣與運算換成加法并與RDA比較，若大于RDA則遞增tmax；布爾矩陣或運算換成加法；布爾矩陣反運算換成減法，RTD減RT存于RTD

posted on 2023-09-23 12:14 春秋十二月閱讀(373) 評論(0) 編輯收藏引用所屬分類: Compiler

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 淺談體系結構與內聯優化淺談圖論在寄存器分配中的應用忙表達式數據流分析示例基于矩陣法分析改進指令調度關于程序編譯中的圖論問題思考函數式語言編譯優化動態二進制優化與靜態編譯優化的區別 NFA、DFA、正則表達式的互轉復雜度總結關于格的基本定理簡要總結淺談重命名

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理