웹 개발
헬스 체크 실패할 때 안전하게 대응하는 방법
웹 애플리케이션의 헬스 체크 엔드포인트 문제를 해결하는 방법입니다.
헬스 체크 실패는 빠르게 파악해야 한다
로드밸런서나 오토스케일러가 헬스 체크를 실패하면 애플리케이션이 자동으로 재시작되거나 종료될 수 있다. 처음부터 정답을 찾으려고 하면 오히려 확인 시간이 길어진다.
먼저 목표를 정하자
문제를 해결하기 전에 현재 상태가 정상인지 확인해야 한다.
현재 상태를 파악해야 한다
문제 해결의 흐름을 먼저 끊어서 봐야 한다. 로그가 애매하면 다른 부분을 고쳐도 결과가 바뀌지 않을 수 있다.
먼저 봐야 할 것:
- 헬스 체크 로그
- 정상일 때의 문제 해결 상태
- 명령 출력과 로그
빌드하고 확인하기
npm run build
코드를 수정했다면 반드시 빌드해서 변경사항이 반영되는지 확인한다.
수정 순서를 정하자
화면만 보고 판단하면 놓치는 값이 많다. 로그, 응답, 설정 중 하나를 증거로 잡아야 한다.
확인 체크리스트
- 같은 조건에서 증상이 다시 나오는지 확인한다
- 로그나 응답에서 뭐가 달라졌는지 확인한다
- 공개 환경에서 헬스 체크가 되는지 확인한다
다음 장애를 막기 위한 기록
이번에 헬스 체크 문제를 해결했으면 어떤 값이 달라졌는지 설명할 수 있게 기록해두자. 다음 헬스 체크 실패 때 훨씬 빨리 대응할 수 있다.