서버 운영
서버에서만 터지는 버그를 추적하는 법
서버 운영 중 문제가 터질 때 화면 하나만 보면 안 된다. 로그와 응답을 함께 봐야 원인이 보인다.
서버에서만 문제가 생기면 보통 권한 때문이다. 중요한 건 운영 환경 전체 흐름을 따라가면서 재현 가능한 신호를 찾는 것이다.
먼저 확인할 항목들
운영 환경 문제는 화면만 보고 판단하면 놓치는 값이 많다. 로그, 응답, 설정 중 하나를 증거로 잡아야 한다. 정상 상태를 먼저 정해두면 결과 판단이 빠르다.
문제의 시간대 찾기
중요한 건 서버 문제 자체보다 재현 가능한 단서를 남기는 것이다. 시간대를 확인하면 다음으로 볼 범위가 확 줄어난다.
- 먼저 볼 값: 시간대
- 비교할 값: 정상 상태의 운영 환경
- 남겨둘 기록: 명령 출력, 응답 코드, 수정한 설정
로그와 프로세스 확인하기
중요한 건 서버 문제 자체보다 재현 가능한 단서를 남기는 것이다. 프로세스를 확인하면 다음으로 볼 범위가 확 줄어난다.
sudo ss -lntp
df -h
sudo journalctl -n 80
실행 예시 검토하기
운영 환경 문제는 화면만 보고 판단하면 놓치는 값이 많다. 로그, 응답, 설정 중 하나를 증거로 잡아야 다음을 진행할 수 있다.
권한을 다시 확인하기
- 원래 증상이 같은 조건에서 다시 나는지 확인한다.
- 로그나 응답에서 바뀐 부분을 한 줄로 설명해본다.
- 공개 화면, 빌드 결과, 실제 요청 중 하나로 마지막 확인을 한다.
운영 메모
서버 문제가 반복되면 확인 순서를 고정해두는 게 좋다. 감으로 접근하면 같은 실수를 반복한다. 한 번에 여러 설정을 바꾸지 않는 것만으로도 원인 추적이 쉬워진다.