Java/Spring Boot

실무에서 모니터링 사용하기

amungstudy 2023. 9. 27. 19:39

모니터링 관찰 시 전체-> 점점 좁게

 

모니터링 3단계

 

1.애플리케이션 추적(하나만 쓴다면 핀포인트를....)

 

각각의 HTTP 요청을 추적.

장애 생겼을 때 찾기 쉬움.... 요청 쿼리까지 다 나옴!

 

https://github.com/pinpoint-apm/pinpoint

 

GitHub - pinpoint-apm/pinpoint: APM, (Application Performance Management) tool for large-scale distributed systems.

APM, (Application Performance Management) tool for large-scale distributed systems. - GitHub - pinpoint-apm/pinpoint: APM, (Application Performance Management) tool for large-scale distributed sys...

github.com

대용량 트래픽도 대응 가능

 

 

2. 대시보드 구축(마이크로미터, 프로메테우스 그라파나...)

 

둘 다 쓰는게 가장 좋다...

 

3. 로그

 

툴에 안나오는 경우도 있음.

같은 HTTP요청으로 알 수 있도록 UUID 지정해서 로그찍어주면 찾기 쉬운데 자동으로 해주는게 MDC.

 

* 알람


모니터링 툴에서 일정 이상 수치가 넘어가면, 슬랙, 문자 등을 연동
알람은 2가지 종류로 꼭 구분해서 관리
경고, 심각
경고는 하루 1번 정도 사람이 직접 확인해도 되는 수준(사람이 들어가서 확인)
심각은 즉시 확인해야 함, 슬랙 알림(앱을 통해 알림을 받도록), 문자, 전화
예)
디스크 사용량 70% 경고
디스크 사용량 80% 심각
CPU 사용량 40% 경고
CPU 사용량 50% 심각
경고와 심각을 잘 나누어서 업무와 삶에 방해가 되지 않도록 해야함