From T3_KR_KNU
(→작업이 hold 된 원인을 파악하려면) |
(→request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요?) |
||
Line 19: | Line 19: | ||
==== request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요? ==== | ==== request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요? ==== | ||
− | * 전체 작업이 메모리가 | + | * 내가 넣은 전체 작업이 메모리가 부족하고 메모리를 request_memory를 4096MB로 늘리고자 한다면 |
− | + | ||
− | $ condor_qedit | + | $ condor_qedit userid RequestMemory 4096 |
$ condor_release 사용자아이디 | $ condor_release 사용자아이디 | ||
* 특정 작업만 메모리가 부족하다면 | * 특정 작업만 메모리가 부족하다면 | ||
− | $ condor_qedit | + | * jobid는 작업아이디 번호입니다. |
− | $ condor_release | + | |
+ | $ condor_qedit jobid RequestMemory 4096 | ||
+ | $ condor_release jobid |
Revision as of 06:40, 9 February 2022
Contents
경북대 HTCondor Job Policy 안내
MemoryUsage가 RequestMemory보다 많은 작업
- MemoryUsage가 RequestMemory보다 많은 작업은 Hold 상태로 변경됩니다.
Hold 상태인 작업
hold 상태인 작업은 ?
- hold 상태인 작업은 24시간 후에 자동으로 삭제됩니다.
작업이 hold 된 원인을 파악하려면
- jobid는 작업아이디 번호입니다.
$ condor_q -l jobid | grep HoldReason HoldReason = "memory usage exceeded request_memory"
request_memory 부족으로 hold 된 작업은 어떻게 해결해야하나요?
- 내가 넣은 전체 작업이 메모리가 부족하고 메모리를 request_memory를 4096MB로 늘리고자 한다면
$ condor_qedit userid RequestMemory 4096 $ condor_release 사용자아이디
- 특정 작업만 메모리가 부족하다면
- jobid는 작업아이디 번호입니다.
$ condor_qedit jobid RequestMemory 4096 $ condor_release jobid