From T3_KR_KNU
Jump to: navigation, search
(request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요?)
(작업이 hold 된 원인을 파악하려면)
Line 12: Line 12:
 
==== 작업이 hold 된 원인을 파악하려면 ====
 
==== 작업이 hold 된 원인을 파악하려면 ====
  
  $ condor_q -l 작업아이디 | grep HoldReason
+
* jobid는 작업아이디 번호입니다.
 +
 
 +
  $ condor_q -l jobid | grep HoldReason
 
  HoldReason = "memory usage exceeded request_memory"
 
  HoldReason = "memory usage exceeded request_memory"
  

Revision as of 06:38, 9 February 2022

1 경북대 HTCondor Job Policy 안내

1.1 MemoryUsage가 RequestMemory보다 많은 작업

  • MemoryUsage가 RequestMemory보다 많은 작업은 Hold 상태로 변경됩니다.

1.2 Hold 상태인 작업

1.2.1 hold 상태인 작업은 ?

  • hold 상태인 작업은 24시간 후에 자동으로 삭제됩니다.

1.2.2 작업이 hold 된 원인을 파악하려면

  • jobid는 작업아이디 번호입니다.
$ condor_q -l jobid | grep HoldReason
HoldReason = "memory usage exceeded request_memory"

1.2.3 request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요?

  • 전체 작업이 메모리가 부족하다면
  • 메모리의 단위는 MB 입니다. 4GB라면 4096
$ condor_qedit 사용자아이디 RequestMemory 필요메모리
$ condor_release 사용자아이디
  • 특정 작업만 메모리가 부족하다면
$ condor_qedit 특정작업아이디 RequestMemory 필요메모리
$ condor_release 특정작업아이디