轉(zhuǎn)載:
https://blog.csdn.net/l471094842/article/details/94039624
一、bsub
bsub,提交給lsf作業(yè)的命令。
命令格式
bsub [options] command [argument]
bsub -pack job_submission_file
-q 選擇隊(duì)列
-i 指定輸入文件
-I 交互模式,此時(shí)終端不能輸入
-o 指定輸出文件,作業(yè)提交后標(biāo)準(zhǔn)輸出的信息會(huì)保存到這個(gè)文件中。
-e 指定輸出文件,作業(yè)提交后標(biāo)準(zhǔn)錯(cuò)誤輸出的信息會(huì)保存到這個(gè)文件中。
-n 指定作業(yè)需要的CPU核
-J 作業(yè)的名字
-w ‘dependecy_expression’ , 提交作業(yè)前,指定操作。
操作有: done
ended, 如 –e “ended(aaaa*)” , 表示作業(yè)名中有aaaa的作業(yè),完成之后才可以提交作業(yè)
exit
-W 限定作業(yè)運(yùn)行時(shí)間
-K 提交作業(yè),并且等待作業(yè)完成。當(dāng)提交作業(yè)后,終端打印“waiting for dispath”。當(dāng)作業(yè)完成后,終端打印“job is finished”。作業(yè)沒(méi)有完成,不能提交新的作業(yè)。
%J,可表示作業(yè)號(hào)
LSF(load sharing facility)是分布資源管理的工具,用來(lái)調(diào)度、監(jiān)視、分析聯(lián)網(wǎng)計(jì)算機(jī)的負(fù)載。
目的:
通過(guò)集中監(jiān)控和調(diào)用,充分共享計(jì)算機(jī)的CPU、內(nèi)存、磁盤、license等資源
一組安裝了LSF軟件的計(jì)算機(jī)組成了一個(gè)cluster。cluster內(nèi)的資源統(tǒng)一監(jiān)控和調(diào)度。
server host:cluster內(nèi)提交和執(zhí)行job的計(jì)算機(jī)
client host:cluster內(nèi)僅僅提交job的計(jì)算機(jī)
JOB
–提交給LSF的命令
-LSF負(fù)責(zé)調(diào)度、控制、跟蹤job
命令
l bjobs :查看系統(tǒng)的job
l bsub:提交作業(yè)
l bhist:查看作業(yè)歷史
l bkill: kill一個(gè)作業(yè)
bqueues命令,可以查看隊(duì)列情況
參數(shù)
解釋
QUEUE_NAME
隊(duì)列的名字
PRIO
隊(duì)列的優(yōu)先級(jí),數(shù)字越大,優(yōu)先級(jí)越高
STATUS
狀態(tài)
Open:Active : 表示已激活,可使用
Closed:Active: 表示已關(guān)閉,不可使用
MAX
隊(duì)列對(duì)應(yīng)的最大CPU核數(shù)
l 表示無(wú)限
JL/U
單個(gè)用戶同時(shí)可以使用的CPU核數(shù)
NJOBS
排隊(duì)、運(yùn)行和被掛起的總作業(yè)所占CPU核數(shù)
PEND
排隊(duì)中的作用所需CPU核數(shù)
RUN
運(yùn)行中的作業(yè)所占CPU核數(shù)
SUSP
被掛起的作業(yè)所占CPU核數(shù)
bsub提交的作業(yè),有一個(gè)JOBID和JOB_NAME。JOBID不可設(shè)置,JOB_NAME可以設(shè)置。
bsub命令的 –J 參數(shù),可以指定 JOB_NAME。
二、例子
一個(gè)c程序,如下所示:
編譯生成a.out可執(zhí)行文件,然后將該文件通過(guò)bsub提交,執(zhí)行。
通過(guò)busb命令,將該a.out可執(zhí)行文件,提交8次作業(yè)。-J參數(shù),執(zhí)行作業(yè)的名字。-o參數(shù)指定lsf執(zhí)行該可執(zhí)行文件的輸出,保存到指定文件。
最后要等待這些作業(yè)完成,通過(guò)以下bsub命令。
bsub –I –w “ended(aaaaaaaaaa*)” echo “a.out finished”
提交一個(gè)作業(yè),只是打印信息:
l -I參數(shù),表示和終端交互,后續(xù)提交的任務(wù)要等這個(gè)任務(wù)完成后,才可以提交
l -w ”ended..” 指定該作業(yè)要等作業(yè)名中有aaaaaaaa的作業(yè)都完成后,才可以提交。
執(zhí)行這些命令的打印信息。每個(gè)任務(wù)有一個(gè)JOB_ID。
執(zhí)行的過(guò)程中,通過(guò)bjobs 命令,可以查看作業(yè)情況。對(duì)于最后一個(gè)任務(wù),狀態(tài)是PEND的,因此要等之前的任務(wù)都完成之后,才可以執(zhí)行。
posted on 2021-10-05 01:52
小王 閱讀(3839)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
linux