← 전체 글로 돌아가기

서버 운영

systemd 서비스 문제, 서버 운영에서 빠르게 진단하기

서버 운영 중 systemd 서비스 관련 문제를 발견하고 대응하는 체계적인 절차입니다.

서버 운영에서 systemd 서비스는 핵심이다. 서비스가 실행 안 되면 전체 애플리케이션이 멈춘다.

이럴 때는 화면 하나만 보지 말고 로그와 응답을 같이 봐야 한다.

서버 상황을 빠르게 파악하기

서버 운영 중 작은 이상 신호도 빨리 분리해서 봐야 한다. 나중에 손대려고 하면 관련 정보가 사라진다.

확인할 우선순위:

  • 현재 상황 요약: 어떤 서비스가 먹통인지
  • 증거 모으기: 로그, 권한, 포트 상태
  • 마지막 변경 내용: 뭘 수정했는지

서비스 상태를 명확히 파악하기

systemd 문제는 보통 권한, 경로, 환경 변수 중 하나다.

sudo ss -lntp
df -h
sudo journalctl -n 80

포트가 정말 열려 있는지 확인하고, 디스크 공간은 충분한지, 서비스 로그는 뭘 말하고 있는지 차례대로 체크해야 한다.

작은 실험으로 원인 찾기

서비스 문제를 크게 보면 모든 설정이 의심스러워진다. 작게 나눠서 하나씩 확인해야 한다.

  1. 원래 증상이 같은 조건에서 다시 나오는지 확인한다.
  2. 로그를 보고 뭐가 다른지 정리한다.
  3. 서비스를 다시 시작하거나 설정을 변경한 후 확인한다.

정리하며

서버 운영은 작은 확인을 남겨두면 다음 문제를 훨씬 짧게 처리할 수 있다. 문제가 생겼을 때 기록을 남겨두는 습관이 가장 중요하다.