← 전체 글로 돌아가기

서버 운영

서버 재부팅 로그가 많을 때 디버깅하기

서버 운영 중 로그가 많으면 정상 상태를 먼저 정의하고 체계적으로 접근해야 한다.

서버가 비정상적으로 재부팅되거나 로그가 폭주할 때는 검색해서 들어온 상황보다 재현 조건부터 정확히 잡는 게 빠르다. 로그가 이미 많다면 시간대별로 필터링해서 진짜 원인을 찾아야 한다.

디스크와 프로세스 확인

서버 문제를 분석할 때는 정상 상태를 먼저 정해두는 게 좋다. 그래야 비정상을 빨리 감지할 수 있다.

  • 먼저 볼 값: 디스크 사용량과 실행 중인 프로세스
  • 같이 비교할 값: 정상일 때의 서버 상태
  • 남겨둘 기록: 명령 출력, 응답 코드, 수정한 설정

핵심 명령어

sudo ss -lntp
df -h
sudo journalctl -n 80

실행 중인 프로세스 목록(ss -lntp)과 디스크 사용량(df -h)을 먼저 보고, 최근 시스템 로그(journalctl)를 확인한다. 이 세 가지만 해도 대부분의 서버 이상을 감지할 수 있다.

권한 문제 확인

권한 문제는 재부팅이나 프로세스 종료로 이어진다. 로그에 permission denied 같은 메시지가 없는지 확인해야 한다.

체계적 검증

  1. 원래 증상이 같은 조건에서 다시 나는지 확인한다.
  2. 로그나 응답에서 바뀐 부분을 한 줄로 설명해본다.
  3. 공개 화면, 빌드 결과, 실제 요청 중 하나로 마지막 확인을 한다.

마지막에는 실제 화면이나 공개 URL까지 확인해야 작업이 끝난다. 작은 기록을 남겨두면 다음 문제에 훨씬 빨리 대응할 수 있다.