轉載:
https://blog.csdn.net/l471094842/article/details/94039624
一、bsub
bsub,提交給lsf作業的命令。
命令格式
bsub [options] command [argument]
bsub -pack job_submission_file
-q 選擇隊列
-i 指定輸入文件
-I 交互模式,此時終端不能輸入
-o 指定輸出文件,作業提交后標準輸出的信息會保存到這個文件中。
-e 指定輸出文件,作業提交后標準錯誤輸出的信息會保存到這個文件中。
-n 指定作業需要的CPU核
-J 作業的名字
-w ‘dependecy_expression’ , 提交作業前,指定操作。
操作有: done
ended, 如 –e “ended(aaaa*)” , 表示作業名中有aaaa的作業,完成之后才可以提交作業
exit
-W 限定作業運行時間
-K 提交作業,并且等待作業完成。當提交作業后,終端打印“waiting for dispath”。當作業完成后,終端打印“job is finished”。作業沒有完成,不能提交新的作業。
%J,可表示作業號
LSF(load sharing facility)是分布資源管理的工具,用來調度、監視、分析聯網計算機的負載。
目的:
通過集中監控和調用,充分共享計算機的CPU、內存、磁盤、license等資源
一組安裝了LSF軟件的計算機組成了一個cluster。cluster內的資源統一監控和調度。
server host:cluster內提交和執行job的計算機
client host:cluster內僅僅提交job的計算機
JOB
–提交給LSF的命令
-LSF負責調度、控制、跟蹤job
命令
l bjobs :查看系統的job
l bsub:提交作業
l bhist:查看作業歷史
l bkill: kill一個作業
bqueues命令,可以查看隊列情況
參數
解釋
QUEUE_NAME
隊列的名字
PRIO
隊列的優先級,數字越大,優先級越高
STATUS
狀態
Open:Active : 表示已激活,可使用
Closed:Active: 表示已關閉,不可使用
MAX
隊列對應的最大CPU核數
l 表示無限
JL/U
單個用戶同時可以使用的CPU核數
NJOBS
排隊、運行和被掛起的總作業所占CPU核數
PEND
排隊中的作用所需CPU核數
RUN
運行中的作業所占CPU核數
SUSP
被掛起的作業所占CPU核數
bsub提交的作業,有一個JOBID和JOB_NAME。JOBID不可設置,JOB_NAME可以設置。
bsub命令的 –J 參數,可以指定 JOB_NAME。
二、例子
一個c程序,如下所示:
編譯生成a.out可執行文件,然后將該文件通過bsub提交,執行。
通過busb命令,將該a.out可執行文件,提交8次作業。-J參數,執行作業的名字。-o參數指定lsf執行該可執行文件的輸出,保存到指定文件。
最后要等待這些作業完成,通過以下bsub命令。
bsub –I –w “ended(aaaaaaaaaa*)” echo “a.out finished”
提交一個作業,只是打印信息:
l -I參數,表示和終端交互,后續提交的任務要等這個任務完成后,才可以提交
l -w ”ended..” 指定該作業要等作業名中有aaaaaaaa的作業都完成后,才可以提交。
執行這些命令的打印信息。每個任務有一個JOB_ID。
執行的過程中,通過bjobs 命令,可以查看作業情況。對于最后一個任務,狀態是PEND的,因此要等之前的任務都完成之后,才可以執行。
posted on 2021-10-05 01:52
小王 閱讀(3761)
評論(0) 編輯 收藏 引用 所屬分類:
linux