시스템 가동 시간 측정 및 모니터링 도구
모든 시스템 관리자가 바라는 것은 시스템이 100% 가동되는 것입니다. 하지만 현실적으로 이는 불가능에 가깝기 때문에 이상적인 목표로 여겨집니다. 계획된 유지보수 시간을 제외하더라도 시스템은 언젠가는 중단될 수밖에 없습니다. 물론 모든 관리자는 시스템이 가능한 한 오래 가동되기를 바라며, 가동 시간을 확실하게 증명하고 싶어합니다. 이때 필요한 것이 바로 가동 시간 모니터링 도구입니다. 가동 시간 측정 도구라고도 불리는 이 도구는 시스템의 가동 시간을 정확하게 파악하고 증명하는 데 중요한 역할을 합니다.
가동 시간을 전문적으로 측정하는 도구는 없을 수 있지만, 대부분의 모니터링 도구에는 시스템의 여러 지표 중 하나로 가동 시간 모니터링 기능이 포함되어 있습니다. 지금부터 가동 시간 측정에 유용한 도구들을 살펴보겠습니다.
다양한 도구들을 살펴보기 전에 먼저 가동 시간 측정의 중요성에 대해 알아보겠습니다. 왜 가동 시간이 중요한 지표인지, 어떻게 측정할 수 있는지에 대해 살펴볼 것입니다. 그런 다음, 가동 시간 측정에 활용할 수 있는 다양한 유형의 도구들에 대해 알아보겠습니다. 특히 로컬 서버 가동 시간 측정 도구와 원격 웹 가동 시간 측정 서비스의 차이점을 명확히 설명할 것입니다. 이 모든 정보를 바탕으로 현재 사용 가능한 최고의 도구들을 검토해 보겠습니다. 로컬 서버 가동 시간 측정에 효과적인 5가지 도구와 함께 웹사이트 가동 시간 측정에 유용한 3가지 서비스를 알아보겠습니다.
가동 시간을 측정해야 하는 이유
가동 시간을 측정하는 가장 큰 이유는 가동 시간의 증거를 확보하기 위해서입니다. 시스템 중단은 어떤 원인에서 발생하든 모든 조직에 큰 불편을 초래합니다. 시스템이 중단되면 많은 직원이 정상적인 업무를 할 수 없고, 시스템이 복구될 때까지 기다려야 합니다. 이러한 상황에서 시간은 매우 느리게 흐르는 것처럼 느껴지며, 관리자와 경영진을 포함한 많은 사람들이 실제보다 중단 시간이 더 길다고 생각하게 됩니다.
많은 IT 부서는 가동 시간과 관련하여 다른 부서와 서비스 수준 계약(SLA)을 맺습니다. 이 계약에서 일정 비율의 가동 시간을 요구합니다. 따라서 가동 시간을 측정하고 기록하는 것은 현재 상황을 객관적으로 파악하는 데 도움이 됩니다. 예를 들어, 2시간 중단이 발생했더라도 한 달 동안 99.997%의 가동 시간을 유지할 수 있습니다. 이는 상당히 양호한 수치이며, SLA에서 99.99%의 가동 시간을 요구하는 경우에도 계약을 준수하는 것입니다.
가동 시간 측정 도구의 종류
시스템 관리자는 주로 두 가지 유형의 가동 시간에 관심을 가집니다. 각각 측정에 다른 도구가 필요합니다. 첫 번째는 로컬 가동 시간으로, 개별 서버 및 장비의 가동 시간을 나타냅니다. 두 번째는 인터넷 서비스의 가용성으로, 예를 들어 웹 사이트의 가동 시간이나 사용 가능성을 모니터링하는 것을 의미합니다. 이러한 유형의 가동 시간 측정은 서버 자체의 가동 시간보다는 시스템의 전반적인 가용성을 측정합니다.
로컬 서버 가동 시간 측정
로컬 서버 가동 시간 측정은 비교적 간단합니다. 대부분의 운영 체제에는 가동 시간 카운터가 내장되어 있습니다. 따라서 가동 시간 측정 도구는 이 카운터를 원격으로 읽고 로컬에 저장하기만 하면 됩니다. 이러한 카운터는 일반적으로 시스템 가동 시간을 일, 시간, 분, 초 단위로 표시합니다. 가동 시간 측정 도구는 이 데이터로부터 백분율을 계산합니다.
원격 웹 서비스 가동 시간 측정
원격 웹 서비스 가동 시간 측정은 조금 다릅니다. 가동 시간 카운터가 일반적으로 제공되지 않으므로 시스템이 정상적으로 작동하는지 주기적으로 확인해야 합니다. 여기서 측정 시간의 정확도는 검사 간격에 따라 결정됩니다. 예를 들어 가동 시간 모니터링 서비스가 5분마다 웹사이트를 확인한다면, 검사 사이에 발생하는 4분간의 중단은 감지할 수 없습니다. 따라서 검사 간격이 짧은 서비스를 선택하는 것이 중요합니다.
서버 가동 시간 측정 도구
대부분의 장비에는 가동 시간 카운터가 내장되어 있으며, 일반적으로 SNMP를 통해 원격으로 읽을 수 있습니다. 따라서 많은 네트워크 모니터링 도구를 사용하여 서버 가동 시간을 모니터링할 수 있습니다. 여기서는 시스템 가동 시간을 측정하고 모니터링하는 데 유용한 5가지 도구를 소개합니다.
1. SolarWinds 서버 및 애플리케이션 모니터(무료 평가판)
SolarWinds는 네트워크 관리 분야에서 잘 알려진 기업입니다. 이 회사는 20년 이상 네트워크 관리 도구를 개발해 왔으며, 네트워크 성능 모니터와 같은 일부 제품은 많은 찬사를 받고 있습니다. SolarWinds는 무료 도구로도 유명하며, 네트워크 관리의 특정 요구 사항을 처리하는 다양한 도구를 제공합니다. Kiwi Syslog 서버와 SolarWinds TFTP 서버가 대표적인 예입니다.
SolarWinds 제품 중 가동 시간 측정 및 모니터링에 가장 적합한 도구는 SolarWinds 서버 및 애플리케이션 모니터입니다. 이 도구는 서버, 운영 매개변수, 프로세스, 실행 중인 애플리케이션을 모니터링하는 데 유용합니다. 서버 가동 시간뿐만 아니라 서버에서 실행되는 애플리케이션의 가동 시간도 측정합니다. 이 도구는 소규모 네트워크에서부터 여러 사이트에 수백 대의 서버가 분산된 대규모 네트워크까지 쉽게 확장할 수 있습니다. 또한 Amazon Web Services 및 Microsoft Azure와 같은 클라우드 호스팅 서비스도 쉽게 모니터링할 수 있습니다.
SolarWinds 서버 및 애플리케이션 모니터는 설정이 매우 간단합니다. 초기 구성은 자동 검색 프로세스를 통해 쉽게 수행할 수 있습니다. 장치 검색은 2단계로 진행됩니다. 먼저 서버를 검색하고, 그다음 서버에서 실행 중인 애플리케이션을 찾습니다. 검색할 애플리케이션 목록을 지정하여 검색 프로세스를 빠르게 진행할 수도 있습니다. 일단 설치가 완료되면 사용자 친화적인 GUI를 통해 간단한 작업을 수행할 수 있습니다. 정보는 표 또는 그래프 형식으로 표시할 수 있습니다.
SolarWinds 서버 및 애플리케이션 모니터의 가격은 최대 150개의 모니터링 대상에 대해 $2,995부터 시작하며, 모니터링되는 구성 요소, 노드, 볼륨의 수에 따라 가격이 올라갑니다. 제품을 구매하기 전에 사용해 볼 수 있도록 30일 무료 평가판을 제공합니다.
2. ManageEngine OpManager
ManageEngine은 네트워크 관리 도구 분야의 또 다른 주요 기업입니다. ManageEngine OpManager를 사용하면 라우터, 스위치, 방화벽, 서버, 가상 머신의 장애 및 성능을 모니터링할 수 있습니다. 이 도구는 서버 및 주요 애플리케이션을 지속적으로 모니터링하기 위해 여러 공급업체를 지원합니다. SNMP 및 WMI 프로토콜을 통해 주기적으로 서버를 모니터링하여 서버가 최고 성능을 유지하는지 확인합니다. 수집된 모든 데이터는 과거 성능 추적 및 문제 해결에 사용할 수 있습니다.
장치 성능은 실시간에 가깝게 모니터링되며, 라이브 대시보드 및 그래프에서 확인할 수 있습니다. 이 도구는 가동 시간 외에도 대역폭, 패킷 손실, 오류, 폐기와 같은 주요 지표를 모니터링합니다. 또한 가용성, CPU 로드, 디스크 공간, 메모리 사용률과 같은 물리적 및 가상 서버의 성능 지표를 모니터링할 수 있습니다.
ManageEngine OpManager는 보고 기능도 강력합니다. 가동 시간 보고서를 포함한 100개 이상의 기본 제공 보고서를 제공하며, 일정을 예약하고, 사용자 정의하고, 원하는 형식으로 내보낼 수 있습니다. Free, Essential, Enterprise의 세 가지 버전 중에서 선택할 수 있으며, 모니터링할 수 있는 장치 수(무료 버전의 경우 10개에서 엔터프라이즈 버전의 경우 10,000개)와 기능 세트가 다릅니다.
3. Paessler 라우터 트래픽 그래퍼(PRTG)
Paessler 라우터 트래픽 그래퍼(PRTG)는 잘 알려진 모니터링 플랫폼입니다. Paessler는 PRTG가 가장 빠르고 쉽게 설정할 수 있는 모니터링 도구 중 하나라고 주장합니다. Paessler에 따르면 몇 분 안에 시스템을 가동할 수 있다고 합니다. 제품의 빠른 속도와 쉬운 설정은 자동 검색 기능 덕분입니다. 설치 후 네트워크를 검색하고, 발견된 구성 요소와 각 장치에 적합한 모니터를 자동으로 추가합니다.
PRTG는 사용자 인터페이스와 관련하여 몇 가지 옵션을 제공합니다. 기본 Windows 콘솔, Ajax 기반 웹 인터페이스, Android 또는 iOS용 모바일 앱 중에서 선택할 수 있습니다. 특히 모바일 앱은 모바일 장치 카메라를 사용하여 장비에 부착된 QR 코드를 스캔하여 장비 상태를 빠르게 확인할 수 있습니다. PRTG는 SNMP 외에도 WMI, NetFlow, Sflow와 같은 프로토콜을 사용하여 시스템 가동 시간과 같은 다양한 매개변수를 모니터링할 수 있습니다.
4. 왓츠업 골드
Ipswitch의 WhatsUp Gold는 오랜 역사를 가진 도구입니다. 과거에는 운영 매개변수보다는 시스템 가용성 및 가동 시간을 모니터링하는 데 주로 사용되었습니다. 이 도구는 서버가 다운될 때마다 어떤 장비가 작동하고 어떤 장비가 작동하지 않는지 알려주며, 호출기를 통해 알림을 보냈습니다. 오늘날에도 WhatsUp Gold는 여전히 이메일 및 SMS를 포함한 다양한 방법으로 알림을 전송할 수 있는 강력한 경고 시스템을 갖추고 있습니다.
현재 WhatsUp Gold는 장비의 작동 상태를 모니터링하는 것 외에도 대역폭 사용량을 측정하고, 서비스가 응답하는지 확인할 수 있는 포괄적인 모니터링 플랫폼입니다. 예를 들어 Exchange 및 SQL 서버, Active Directory, IIS, Apache 웹 서비스의 가동 시간을 모니터링합니다. 또한 서버 팜이 클라우드 기반인 경우 WhatsUp Gold를 사용하여 Amazon AWS 또는 Microsoft Azure 설치를 모니터링할 수 있습니다.
5. 자빅스
로컬 가동 시간 측정 및 모니터링 도구 목록의 마지막은 무료 오픈 소스 제품인 Zabbix입니다. 무료임에도 불구하고 Zabbix는 상용 제품과 유사한 전문적인 인터페이스를 갖추고 있습니다. 하지만 전문적인 외관은 이 제품을 선택해야 하는 유일한 이유는 아닙니다. Zabbix는 매우 인상적인 기능 세트를 제공합니다. 일부 경쟁업체와 마찬가지로 네트워킹 장비뿐만 아니라 대부분의 네트워크 연결 장치를 모니터링합니다. 가동 시간 측정 및 모니터링 기능도 뛰어납니다.
SNMP 외에도 Zabbix는 IMPI를 사용하여 장치를 모니터링합니다. 이를 통해 대역폭, 가동 시간, 장치 CPU 및 메모리 사용률, 일반 장치 상태, 구성 변경 사항을 모니터링할 수 있습니다. 또한 이메일 또는 SMS 알림은 물론 로컬 스크립트를 실행할 수 있는 완벽하게 사용자 정의 가능한 알림 시스템을 갖추고 있습니다.
Zabbix는 훌륭한 보고 엔진을 함께 제공합니다. 가용성 보고서라고 하는 실제 가동 시간 보고서를 포함하여 여러 기본 제공 보고서를 제공합니다. Zabbix는 Linux 플랫폼에서만 실행되며 설정이 다소 복잡할 수 있지만, 무료라는 점을 고려하면 충분히 감수할 만한 단점입니다.
원격 서버 가동 시간 모니터링 서비스
전자상거래 웹사이트의 가동 시간을 파악하려는 경우와 같이 인터넷 관점에서 시간을 측정해야 하는 경우 다른 유형의 도구가 필요합니다. 이 경우에는 웹사이트를 정기적으로 검사하고 가동 시간을 보고하는 클라우드 기반 서비스가 필요합니다. 수많은 서비스가 있지만, 여기서는 몇 가지 엄선된 도구를 소개합니다.
6. 가동시간 로봇
Uptime Robot은 클라우드 기반 모니터링 플랫폼으로, 최대 50개의 웹 페이지를 5분마다 폴링하여 모니터링합니다. 이 도구는 가동 시간을 측정할 뿐만 아니라 모니터링 중인 페이지가 응답을 멈추면 이메일을 통해 알려줍니다. 또한 모니터링되는 요소의 가동 시간 및 중단 시간을 보여주는 기본 보고 엔진을 제공합니다.
보다 정확한 모니터링을 원하거나 모니터링할 페이지가 50개가 넘는 경우 Uptime Robot Pro 플랜을 월 $5.50(1년 선불 결제 시 $4.50)에 사용할 수 있습니다. Pro 플랜은 1분 폴링 간격, SSL 모니터링, 고급 알림 등의 기능을 추가로 제공합니다.
7. 업타임 닥터
Uptime Doctor는 유사한 유형의 서비스를 제공합니다. 무료 버전에서는 5개의 웹 페이지만 모니터링할 수 있지만, 1분마다 폴링합니다. 또한 알림 기능이 유연하여 이메일 외에도 SMS 및 푸시 알림을 제공합니다. 가동 시간 보고서도 제공합니다.
추가 테스트 용량을 위해 Uptime Doctor는 매월 $7.95에서 $31.95 사이의 가격으로 세 가지 유료 플랜을 제공합니다. 유료 플랜은 주로 허용되는 테스트 수(각각 10개, 20개, 30개)에 따라 가격이 다릅니다.
8. 신선함
Freshworks의 Freshping은 안정적인 가동 시간 및 성능 모니터링 서비스를 제공합니다. 이 서비스는 무료이며, 항상 무료로 제공될 것이라고 주장합니다. 이 서비스는 전 세계 10곳에서 1분 간격으로 최대 50개의 서로 다른 URL을 모니터링합니다.
무료 서비스 외에도 엔터프라이즈 수준은 월 $42부터 사용할 수 있습니다. 최대 250개의 URL을 모니터링할 수 있으며, 무료 버전에서는 6개월만 보관할 수 있는 데이터를 36개월 동안 보관할 수 있습니다. Freshping의 고유한 기능은 고객에게 사이트 상태를 전달하는 데 사용할 수 있는 공개 상태 페이지를 사용할 수 있다는 것입니다.
결론
어떤 도구를 선택하든, 여기서 살펴본 도구들은 모두 양질의 가동 시간 측정을 제공합니다. 유용한 기능이 많은 로컬 도구들이 많으니 시간을 내어 분석하고 한두 가지를 사용해 보십시오. 최종 선택은 무엇보다도 사용자에게 유용한 기능이 있는지 여부에 따라 결정되어야 합니다.