IT/리눅스마스터1급

리눅스 서버에서 CPU 사용률이 100% 찍을 때 점검 순서 정리

알콩달콩아빠 2026. 1. 22. 14:04
반응형

1. CPU 사용률 100%, 바로 장애일까?

리눅스 서버에서 CPU 사용률이 100%에 도달했다고 해서
무조건 장애라고 보기는 어렵습니다.

문제는
어떤 프로세스가, 얼마나 오래 CPU를 점유하고 있는지입니다.

순간적인 피크인지
지속적인 과부하인지를 구분하는 것이 먼저입니다.


2. 가장 먼저 확인해야 할 명령어

CPU 문제 발생 시
가장 먼저 실행해야 할 명령어는 다음과 같습니다.

  • top 또는 htop : 실시간 CPU 점유 프로세스 확인
  • uptime : Load Average 확인
  • ps -eo pid,ppid,cmd,%cpu --sort=-%cpu : 상위 프로세스 정렬

이 단계에서
문제 프로세스는 대부분 바로 드러납니다.


3. 자주 발생하는 CPU 과다 사용 원인

실무에서 자주 보는 원인은 다음과 같습니다.

  • 무한 루프에 빠진 애플리케이션
  • 로그 파일 과다 처리
  • 배치 작업 동시 실행
  • 백업 또는 보안 스캔 작업
  • 좀비 프로세스 누적

특히
야간 배치 작업 시간대에
CPU 문제가 집중되는 경우가 많습니다.


4. 무조건 프로세스를 죽여도 될까?

CPU를 많이 쓰는 프로세스를 발견했다고 해서
바로 종료하는 것은 위험할 수 있습니다.

먼저 확인해야 할 사항은 다음과 같습니다.

  • 서비스 영향 여부
  • 재시작 시 정상 복구 가능 여부
  • 동일 문제가 반복되는지 여부

일시적인 조치보다는
근본 원인을 제거하는 방향이 중요합니다.


5. 마무리 정리

리눅스 CPU 사용률 문제는
명령어 몇 개만 제대로 확인해도
대부분 원인 파악이 가능합니다.

중요한 것은
“CPU가 높다”가 아니라
“왜 높은지”를 보는 습관입니다.

다음 장애를 막기 위해
오늘 한 번 점검 루틴을 정리해보세요.

 

LIST