서버 운영
systemd 서비스 문제, 서버 운영에서 빠르게 진단하기
서버 운영 중 systemd 서비스 관련 문제를 발견하고 대응하는 체계적인 절차입니다.
서버 운영에서 systemd 서비스는 핵심이다. 서비스가 실행 안 되면 전체 애플리케이션이 멈춘다.
이럴 때는 화면 하나만 보지 말고 로그와 응답을 같이 봐야 한다.
서버 상황을 빠르게 파악하기
서버 운영 중 작은 이상 신호도 빨리 분리해서 봐야 한다. 나중에 손대려고 하면 관련 정보가 사라진다.
확인할 우선순위:
- 현재 상황 요약: 어떤 서비스가 먹통인지
- 증거 모으기: 로그, 권한, 포트 상태
- 마지막 변경 내용: 뭘 수정했는지
서비스 상태를 명확히 파악하기
systemd 문제는 보통 권한, 경로, 환경 변수 중 하나다.
sudo ss -lntp
df -h
sudo journalctl -n 80
포트가 정말 열려 있는지 확인하고, 디스크 공간은 충분한지, 서비스 로그는 뭘 말하고 있는지 차례대로 체크해야 한다.
작은 실험으로 원인 찾기
서비스 문제를 크게 보면 모든 설정이 의심스러워진다. 작게 나눠서 하나씩 확인해야 한다.
- 원래 증상이 같은 조건에서 다시 나오는지 확인한다.
- 로그를 보고 뭐가 다른지 정리한다.
- 서비스를 다시 시작하거나 설정을 변경한 후 확인한다.
정리하며
서버 운영은 작은 확인을 남겨두면 다음 문제를 훨씬 짧게 처리할 수 있다. 문제가 생겼을 때 기록을 남겨두는 습관이 가장 중요하다.