From T2_KR_KNU
Jump to: navigation, search

Torque Batch System 사용법

Tier-3 UI 접속하기

다음과 같이 터미널을 열어서 원격로그인(SSH)으로 접속합니다.

 ssh -X username@kcms-t3.knu.ac.kr( or username@kcms-t2..knu.ac.kr)

CPU 현황 확인

Batch Job을 submit 하기전 CPU 슬롯의 현황을 확인하려면 "knuinfo" 명령어를 사용합니다. cluster118.knu.ac.kr 이 Tier3 Farm의 Computing Element 입니다.

$ knuinfo
-----------------------------------------------------------------------------------------
    CPU	   Free	Total Jobs	Running	Waiting	ComputingElement
     161	     39	       122	    122	      0	cluster118.knu.ac.kr:8443/cream-pbs-cms
-----------------------------------------------------------------------------------------
 Avail Space(kB)  Used Space(kB)  Type 	SE
     78367304438    754298005237  SRM  	cluster142.knu.ac.kr
-----------------------------------------------------------------------------------------

Queue의 종류

Tier3 batch farm에서 사용할 수 있는 Queue들

Job submit

Job submit을 위해서는 다음과 같이 "qsub" 명령어를 사용합니다.

qsub -q cms test.sh

Job 상태 확인

작업의 상태 확인을 위해서는 "qstat"명령을 사용합니다.
전체 작업현황을 확인하려면 다음과 같이 실행하면 됩니다.

qstat

or

$ qstatall
Total Jobs: 1971, R: 731, Q: 1238

or

$ qstatall -a
...
3197189.cluster118         cream_027797206  pilcms29               0 Q cms
3197190.cluster118         cream_739289363  pilcms29               0 Q cms
3197191.cluster118         cream_352171042  pilcms29               0 Q cms
3197192.cluster118         cream_947647995  pilcms29               0 Q cms
Total Jobs: 1971, R: 731, Q: 1238

작업들 중 자신의 작업의 상태를 확인하려면

qstat | grep `whoami`

or

$ myqstat
Total Jobs: 1019, R: 190, Q: 829

or

$myqstat -a
...
3197176.cluster118         run.sh           hanbi                  0 Q cms
3197177.cluster118         run.sh           hanbi                  0 Q cms
3197178.cluster118         run.sh           hanbi                  0 Q cms
3197179.cluster118         run.sh           hanbi                  0 Q cms
3197180.cluster118         run.sh           hanbi                  0 Q cms
3197181.cluster118         run.sh           hanbi                  0 Q cms
3197182.cluster118         run.sh           hanbi                  0 Q cms
Total Jobs: 1019, R: 190, Q: 829

Job 삭제

submit 한 작업을 중간에 취소하기 위해서는 "qdel" 명령을 사용합니다.

qdel <JOBID>

모든 내 작업을 삭제하려면 다음 명령을 사용합니다.

myqdelall

Job submit example 1

$ cat job_submit.sh
#!/bin/bash
qsub  -q cms  \
      -o /dev/null -e /u/user/<userid>/<work_dir> \
      -l walltime=48:00:00,cput=48:00:00 \
      -N b-tagging \
      run.sh
  • "-o" 옵션은 stdout 파일이 저장될 위치를 지정합니다. default 값은 job을 submit한 현재 디렉토리입니다. stdout 파일의 확인이 불필요하다면 /dev/null로 지정하면 저장되지 않습니다.
  • "-e" 옵션은 stderr 파일지 저장될 위치를 지정합니다. default 값은 job을 submit한 현재 디렉토리입니다.
  • "-N" 옵션은 Batch Job 이름을 지정합니다.
  • "-l walltime=72:00:00,cput=48:00:00" 옵션은 작업의 최대 실행 시간을 지정합니다.
$ cat run.sh
#!/bin/bash
export SCRAM_ARCH=slc5_amd64_gcc491
source /cvmfs/cms.cern.ch/cmsset_default.sh
cd /cmsdas/scratch/swlee/DAS/CMSSW_7_4_6_patch6/src/CMSDAS2015/BTaggingExercise/test/
eval `scramv1 runtime -sh`
cmsRun runBTaggingExerciseIPartI_cfg.py
$ ./job_submit.sh

Job submit example 2

  • Job submit 스크립트 예제 파일입니다. 참고하시기 바랍니다.
http://www.physics.purdue.edu/Tier2/files/job_template_cmssw.txt 
http://www.physics.purdue.edu/Tier2/files/createjobs.txt
 ./createjobs.sh jobname #event #job #submitjob cfgfilename nameofcluster