Skip to main content

[삼성리서치] wd 개발 서버 rabbitmq pod 재시작 불가 에러


# 증상

- wd 개발 서버에 인덱싱 안되어 rabbitmq pod 재시작

- rabbitmq pod 2개중 1개 재시작 불가


# 원인

- wd 개발 서버 리스소 부족으로 해당 워커 노드에 pod 배포 불가


# 조치

1. rabbitmq pod 배포 불가능한 워커노드 확인

- 명령어 : oc get pod -o wide | grep rabbitmq

2. 위 1번에서 확인한 워커노드에 pod 배포 안되도록 설정

- 명령어 : oc adm cordon <worker node name>

3. 배포 안됐던 rabbitmq pod 삭제 

- 명령어 : oc delete pod <rabbitmq pod name> --force=true

- pod가 삭제되고 다른 워커노드에 pod 배포 확인

4. 위 2번에서 워커노드 pod 배포 안되록 설정했던 내용 원복

- 명령어 : oc adm uncordon <worker node name>

<= 근본 원인이라고 한 위의 서버리소스 부족인지는 어떻게 확인 가능합니까?
<= 리소스 부족 해소 방법은 무엇인지?