[삼성리서치] wd 개발 서버 rabbitmq pod 재시작 불가 에러
# 증상
- wd 개발 서버에 인덱싱 안되어 rabbitmq pod 재시작
- rabbitmq pod 2개중 1개 재시작 불가
# 원인
- wd 개발 서버 리스소 부족으로 해당 워커 노드에 pod 배포 불가
# 조치
1. rabbitmq pod 배포 불가능한 워커노드 확인
- 명령어 : oc get pod -o wide | grep rabbitmq
2. 위 1번에서 확인한 워커노드에 pod 배포 안되도록 설정
- 명령어 : oc adm cordon <worker node name>
3. 배포 안됐던 rabbitmq pod 삭제
- 명령어 : oc delete pod <rabbitmq pod name> --force=true
- pod가 삭제되고 다른 워커노드에 pod 배포 확인
4. 위 2번에서 워커노드 pod 배포 안되록 설정했던 내용 원복
- 명령어 : oc adm uncordon <worker node name>
<= 근본 원인이라고 한 위의 서버리소스 부족인지는 어떻게 확인 가능합니까?
<= 리소스 부족 해소 방법은 무엇인지?