재해 복구 용어 이해 – RTO, RPO, 장애 조치, BCP 등

재해 복구 계획은 조직이 비정상적인 상황이 발생하기 전에 갖추어야 할 가장 중요한 조치입니다.

IT 산업에서는 재난 및 그 후유증을 처리하기 위한 계획, 조치 및 절차가 포함된 공식 문서를 작성하는 것으로 시작합니다.

재해는 사전 예고 없이 갑자기 발생하는 이벤트로 유형이 다양할 수 있습니다. 그리고 그것이 착륙하면 개인과 조직은 재정적 문제와 사용자 경험을 포함하여 다양한 종류의 어려움에 직면하게 됩니다.

공격이 발생하면 그 영향을 최소화하고 작업을 더 빨리 복원할 준비가 되어 있어야 합니다. 여기서 실용적인 재해 복구 계획을 준비하면 재해를 보류하거나 예방하는 데 도움이 됩니다. 또한 사용자 경험, 비용 및 가동 중지 시간 측면에서 후유증을 줄일 수 있습니다.

또한 계획, 인력, 전략, 장비 및 시스템을 유지하여 모든 것을 다시 실행에 옮길 수 있도록 준비해야 합니다. 그러나 이를 위해서는 재해 복구를 깊이 이해해야 합니다.

이 기사에서는 주요 재해 복구 용어와 함께 이에 대해 자세히 설명하여 이러한 불리한 조건에서 용감하게 맞서고 더 강해질 수 있도록 하겠습니다.

의 시작하자!

재난이란 무엇입니까?

재난은 IT 산업을 포함하여 어디에서나 일어날 수 있는 예기치 못한 사건입니다. 그것은 자연적으로 또는 사람에 의해 발생하며 회사의 운영을 방해하고 인프라 구조를 방해할 수 있습니다.

결과적으로 조직과 조직의 고객, 공급업체, 직원 및 파트너가 영향을 받습니다. 재정, 업계 평판, 고객 신뢰 및 보안 경계 측면에서 조직에 부담을 줍니다.

따라서 이러한 시나리오를 극복하려면 사전에 대비해야 합니다. 이를 위해서는 모든 작업과 데이터를 즉시 복구해야 합니다. 간단히 말해서, 고객을 위해 가능한 한 최단 간격으로 모든 것을 복구할 수 있도록 조직을 준비해야 합니다.

재난은 사이버 공격, 방해 공작, 테러 공격, 랜섬웨어 또는 물리적 위협, 허리케인, 지진, 화재, 홍수, 산업 재해, 정전 등과 같은 다양한 유형입니다.

재해 복구란 무엇을 의미합니까?

재해 복구는 재해를 당한 후 정상적인 운영을 회복하는 과정입니다. 여기에는 하드웨어, 소프트웨어, 장비, 연결, 네트워킹, 전원 및 데이터에 대한 액세스 재개가 포함됩니다. 재난이 발생하기 전에 조직을 준비하기 위해 문서화된 프로세스에서 규칙과 절차를 설정해야 합니다.

그러나 조직의 시설이 파괴된 경우 통신, 운송, 소싱, 작업 위치 등을 작업하여 일부 활동을 확장해야 합니다.

재해 복구 계획이 중요한 이유는 무엇입니까?

자연 재해든 인재든 재해 복구를 위한 완벽한 계획을 작성하는 것은 모든 IT 산업에 필수적입니다. 계획을 원활하게 수행할 수 있도록 적절한 직원과 도구가 올바른 장소에 있는지 확인하세요.

재해 복구가 중요한 이유에 대해 자세히 알아보겠습니다.

피해 제한

재난은 예측할 수 없습니다. 언제 오고 가는지는 아무도 모릅니다. 그러나 인프라에 대한 피해를 통제하기 위해 사전에 준비합니다.

예를 들어 홍수가 발생하기 쉬운 지역에서는 필수 문서와 장비 유형을 최상층에 놓아 손상을 방지할 수 있습니다.

마찬가지로 사이버 공격이 데이터를 침해하거나 도용하기 전에 필수 데이터를 백업하십시오.

서비스 복원

재해 복구를 위한 견고한 계획을 준비하면 모든 서비스를 정상 형태로 빠르고 쉽게 복원할 수 있습니다. 이는 짧은 시간 내에 거의 모든 주요 자산과 서비스를 복구할 수 있음을 의미합니다.

방해 최소화

내일이나 수술의 다음 단계에서 무슨 일이 일어날지 알 수 없습니다. 그러나 완벽한 복구 계획을 사용하면 결과에 대해 크게 걱정할 필요가 없습니다. 인프라는 최소한의 중단으로 작업을 계속할 수 있습니다.

훈련 및 준비

IT 인프라는 지붕 아래에서 일하는 많은 직원으로 구성됩니다. 모든 사람은 긴급 상황 발생 시 필요하고 예상되는 대로 즉시 조치를 취하기 위해 복구에 대해 알고 있어야 합니다.

  Photoshop에서 텍스트를 추가하거나 편집하는 방법

적절한 준비는 또한 조직과 관련된 모든 사람의 스트레스 수준을 낮출 것입니다. 또한 예상치 못한 상황이 발생할 경우 필요한 조치를 취하도록 직원을 교육할 수 있습니다.

재해 복구 용어

재해 복구를 보다 자세히 이해하기 위해 용어부터 시작하겠습니다.

RTO

RTO(복구 시간 목표)는 재무 성장에 영향을 주지 않고 재해를 견딜 수 있도록 조직이 비즈니스의 특성에 따라 설정하는 시간입니다.

RTO를 설정하는 동안 회사는 여러 면에서 조직에 영향을 줄 수 있는 가동 중지 시간을 확인해야 합니다. 재해 후에도 비즈니스 운영을 계속할 수 있는 실행 가능한 전략을 연구하는 데 사용됩니다. 고객은 애플리케이션에서 문제가 발생하면 앱이 다시 조치를 취하는 데 시간이 얼마나 걸릴지 묻습니다. 해답은 모든 조직의 RTO입니다.

예: PayPal 또는 Pioneer와 같은 온라인 거래 회사가 예측할 수 없는 사건에 직면했다고 가정합니다. 이 경우 RTO는 작업을 복구하기에 충분히 빠릅니다.

즉, 회사는 재무 또는 데이터 형태의 결과를 피하기 위해 RTO를 1-2 시간으로 설정합니다.

RPO

RPO(복구 시점 목표)는 정보의 시간과 양 측면에서 IT 인프라가 처리할 수 있는 데이터 손실입니다.

혼란스럽다?

이체, 일정, 지불 등을 포함하여 은행의 거래를 기록하는 데이터베이스의 예를 들어 보겠습니다. 재해가 발생하면 데이터베이스를 실시간으로 복구합니다. 이 경우 재해 당시 데이터베이스와 재해 후 데이터베이스 복구 간의 차이는 0입니다.

일부 회사의 경우 백업에서 모든 정보를 복구하는 데 약 24시간이 걸릴 수 있지만 때로는 치명적일 수 있습니다. RPO 요구 사항에 따라 인프라를 설정하는 것이 중요합니다. 여기에는 백업 빈도 향상, 아키텍처에 대기 데이터베이스 추가 등이 포함됩니다.

장애 조치

장거리 여행을 하는 상황을 생각해 보십시오. 예상치 못한 이유로 갑자기 타이어 펑크가 났습니다. 차량에 있는 스페어 타이어와 결함 있는 타이어를 교체할 수 있는 도구에 감사드립니다.

장애 조치는 동일한 방식으로 작동합니다.

재해 발생 시 백업 연결이 필요하다는 의미입니다. 간단히 말해서 장애 조치는 재해 발생 시 정보를 복구 시스템으로 전환하는 데 사용할 수 있는 네트워크와 시스템을 보유하는 것을 의미합니다.

장애 조치는 인프라 또는 하드웨어 장애가 있는 경우에도 모든 서비스가 원활하게 실행되도록 합니다. 이렇게 하면 조직에서 데이터 및 수익 손실을 방지하고 최종 사용자의 서비스 중단을 방지할 수 있습니다.

수동으로 설정하거나 자동으로 작동하여 데이터를 대기 서버로 이동하도록 할 수 있습니다.

장애 복구

IT 페일백은 재해가 처리된 후 원래 프로덕션을 원래 위치(시스템)로 되돌리는 간단한 작업입니다. 공격 중에 기업은 모든 워크로드가 VM 복제본 또는 백업 시스템으로 전송되는 장애 조치(failover) 작업을 따릅니다.

하지만 다음 복귀 단계를 그냥 지나칠 수는 없습니다. 모든 것을 복구하고 다시 조치를 취하면 모든 워크로드를 원래 VM 또는 시스템으로 전송해야 합니다. 작업 부하를 원래 작업 공간이나 시스템으로 반환하는 이 전체 프로세스를 장애 복구라고 합니다. 공격 후 “돌아온다”는 의미입니다.

장애 복구는 기업의 예정된 유지 관리에도 사용됩니다. 페일백은 항상 페일오버 후에 발생하는 것이 사실입니다. 즉, 장애 조치는 필수 데이터 복구의 첫 번째 단계이고 장애 복구는 두 번째 단계입니다. 클라우드에서 클라우드로, 온프레미스에서 온프레미스로, 온프레미스에서 클라우드로 또는 이들의 조합 간에 설정할 수 있습니다.

박사

재해 복구(DR)는 정해진 기간 내에 자산을 복구할 계획을 미리 구축하는 프로세스입니다.

DR은 조직이 예기치 않은 이벤트에서 신속하게 대응하고 모든 단일 서비스를 복구할 수 있는 기능을 제공합니다. 또한 예상치 못한 사고가 발생한 경우 즉각적인 조치를 취하는 방법에 대한 지침이 포함된 공식 문서를 제공합니다.

BCP

BCP(비즈니스 연속성 계획)는 IT 인프라가 서버, 모바일 장치, 개인용 컴퓨터 및 네트워크에 대한 IT 중단을 처리하기 위한 전략을 세울 수 있도록 하는 가장 수용 가능한 재해 복구 계획 중 하나입니다.

  Netflix에서 오류 코드 u7121 3202 수정

BCP는 조직이 주요 비즈니스 요구 사항을 충족하기 위해 엔터프라이즈 소프트웨어 및 생산성을 재구축할 계획을 세우는 데 도움이 된다는 점에서 재해 복구와 약간 다릅니다.

여기에서 기업은 사이버 공격이나 자연 재해와 같은 잠재적 위협을 극복하기 위해 복구 시스템을 만듭니다. 자산을 보호하고 모든 서비스가 파업 후 신속하게 다시 작동할 수 있도록 설계되었습니다.

BCM

BCM(비즈니스 연속성 관리)은 비즈니스 프로세스에 대한 위협으로부터 보호하도록 특별히 설계된 위험 관리 프로세스입니다. BCM은 BCP의 다음 단계로, 비즈니스의 모든 사람이 즉시 계획에 응답하고 모든 필수 항목을 복구할 수 있도록 복구 계획을 검증합니다.

BCM은 외부 및/또는 내부 위협에 직면했을 때 인프라 위험을 식별하는 관리 프레임워크 역할을 합니다. 또한 정기적인 테스트를 통해 프레임워크가 효율적으로 작동하여 예측 가능성을 높이고 위험을 줄이며 향후 공격에 대한 계획을 조정하도록 합니다.

비아

BIA(Business Impact Analysis)는 중요한 시스템, 운영 및 프로세스를 식별하여 비즈니스의 생존율을 분석하는 프로세스입니다. 운영 중단으로 인한 재해가 조직에 미치는 영향에 대해 알려줍니다.

BIA는 강력한 복구 전략을 수립하는 데 도움이 될 수 있는 핵심 정보를 수집하기 위해 공격이 실제로 발생하기 전에 결과를 예측합니다. 또한 장비 교체 비용, 현금 흐름 손실, 이익, 급여 등 고장으로 인한 비용을 식별합니다.

BIA 보고서를 작성할 때 비즈니스와 관련된 중요한 프로세스, 다양한 영역에 대한 중단의 영향, 허용 기간, 허용 가능한 영역, 재정 비용 등을 고려해야 합니다.

콜 트리

콜 트리는 비상 상황에서 호출할 직원 목록을 선별하는 프로세스입니다. 나무와 같은 구조를 따르는 절차입니다.

예를 들어, 재난 발생 시 한 사람이 긴급 메시지로 소규모 그룹 구성원에게 연락하고 해당 직원은 각 그룹에 개별적으로 전화를 겁니다. 이러한 방식으로 모든 직원은 위협이 발생하는 동안 정보를 받고 할당된 작업을 시작하여 모든 기능과 프로세스를 제시간에 복구합니다. 목록을 만드는 것은 간단하지만 실시간으로 구현하는 것은 혼란을 야기합니다.

모든 비상 직원이 경계 상태를 유지할 수 있도록 정기적인 호출 활동을 수행해야 합니다. 정기적인 테스트는 성능에 심각한 영향을 줄 수 있는 변경되거나 누락된 숫자를 식별하는 데 도움이 될 수도 있습니다.

호출 트리에는 긴급 상황에서 지침을 전달하는 데 사용할 정보가 포함되어 있습니다. 수동으로 수행할 수도 있지만 오늘날의 디지털 세계에서는 사람들이 자동화를 사용하여 프로세스를 가속화하고 구성원에게 알립니다.

지휘센터/통제센터

위기 시 복구 계획에 대한 명령 또는 통제를 제공하기 위해 특별히 준비된 가상 또는 물리적 시설입니다. 재난 발생 시 시스템 및 기능을 관리하기 위해 팀과 통신합니다.

전통적으로 인프라는 적절한 접근 방식 없이 위기를 처리하는 지휘 센터에 의존합니다. 오늘날 조직은 제어 센터를 완벽하게 설계하여 즉각적인 대응을 핵심 역량으로 전환합니다.

재난이 감지되면 지휘 센터는 신속하게 복구 단계로 이동합니다. 또한 서비스, 언론, 배달 등의 경우 보고 지점 역할을 합니다. 또한 이러한 시나리오에서 여러 분야의 사람들을 모읍니다.

사고 대응

사고 대응은 공격에 대처하기 위해 제공되는 대응 유형입니다. 적시에 네트워크 및 데이터 보안을 효과적으로 보존하기 위해 올바른 절차와 인력의 도움을 받아 수행됩니다.

조직이 예상치 못한 사건에 앞서 사고 계획이 있다면 실시간으로 위협으로부터 데이터를 보호할 수 있습니다. 사고 대응 전문가는 항상 문제에 주의를 기울이고 사고 발생 시 자연스럽게 행동합니다. 그들은 보안 침해를 피하기 위해 특정 조치를 취하여 재해 복구 중에 한 단계도 건너뛰지 않도록 합니다.

처음에는 중요한 데이터를 파악하고 클라우드나 원격 위치에 저장하여 안전을 보장해야 합니다. 사고 대응 계획을 정기적으로 업데이트하여 현재 인프라 요구 사항과 진화하는 사이버 위협을 해결합니다.

지원

백업 솔루션은 IT 인프라가 데이터 사본을 유지 관리하고 적시에 안전하게 저장할 수 있도록 도와줍니다. 데이터베이스 손상, 실수로 모든 데이터 삭제 또는 기타 문제에 직면한 경우 데이터를 즉시 복원하고 서비스를 계속 사용할 수 있도록 백업을 준비해야 합니다.

  이메일을 특정 Outlook 폴더로 자동 정렬하는 방법

비정상적인 이벤트 발생 후 모든 데이터에 쉽게 액세스할 수 있도록 파일을 복제하고 안전한 위치에 저장하는 작업이 포함됩니다. 사이트에 장애가 발생하더라도 데이터를 복원할 수 있도록 여러 위치에 데이터를 백업하면 도움이 됩니다.

회복력

서비스 및 시스템을 손상시키지 않으면서 재난에 저항하거나 견딜 수 있는 커뮤니티, 주, 조직 및 개인의 능력을 재난 복원력이라고 합니다.

조직은 위험으로 인한 많은 양의 스트레스를 억제할 준비가 되어 있어야 합니다. 누군가가 와서 구조하기를 기다리는 대신 더 나은 계획으로 손실을 최소화할 수 있는 능력이 있는지 확인하십시오. 이렇게 하면 재해를 수용하고 IT 인프라를 효율적으로 복구하는 데 도움이 됩니다.

여기에서 주요 목표는 필요할 때마다 적시에 필수 기능과 구조를 보존하고 복원하는 것입니다. 재난에 강한 조직이 되려면 사전에 대비하고 위험을 예측하고 변화에 적응하고 공유하고 배우며 다양한 부문을 통합하고 위험 수준을 관리하는 능력이 있어야 합니다.

SLA

SLA(서비스 수준 계약)는 비상 시 서비스를 복원하는 데 소요될 수 있는 시간을 최종 사용자에게 언급하는 재해 계획입니다.

SLA는 고객의 데이터가 안전하고 손상되거나 제3자와 공유되지 않음을 보장합니다. 최종 사용자 문제에 대한 단일 연락 창구입니다.

모든 IT 인프라는 고객에게 SLA에 대한 보증을 제공합니다. 따라서 사전에 최종 사용자와 통신해야 합니다.

SPOF

SPOF(Single Point of Failure)는 다른 많은 시스템이나 응용 프로그램이 연결되는 장비, 개인, 리소스 또는 응용 프로그램의 일부입니다.

이러한 장비나 리소스가 다운되면 시스템에 연결된 모든 필수 부품도 함께 다운됩니다. 따라서 전체 프로세스와 비즈니스 운영이 영향을 받습니다.

따라서 조직을 계속 운영하려면 이러한 문제를 처리하는 전략이 있어야 합니다. 가장 먼저 할 수 있는 일은 더 많은 영향을 미칠 수 있는 단일 장비 또는 시스템을 식별하는 것입니다. 다음으로, 비즈니스 영향 분석을 실행하고 위험 평가 점수를 얻어 앞으로 일어날 장면을 파악하십시오. 이벤트 전에 파헤쳐보고 찾으십시오.

모든 SPOF를 나열한 후에는 복구 프로세스에 따라 분류합니다. 각각의 SPOF를 세 가지 범주로 분류합니다.

  • 적은 시간과 예산으로 쉽고 직접 복구하십시오.
  • 복구는 어렵지만 복구를 위한 안정적인 프로세스를 개발할 수 있습니다.
  • 다운되면 복구할 수 있는 방법이 없습니다.

카테고리에 따라 적절하게 행동할 수 있습니다.

시스템 복구

하드웨어 오류가 발생하면 복구 프로세스를 실행하여 특정 시스템이나 서버를 원래 형태로 복구해야 합니다. 그리고 전체 시스템을 복구하려면 복구 요구 사항, 백업, 펌웨어 호환성 및 하드웨어 호환성을 준비해야 합니다.

시스템 복구는 시스템을 이전 설정 또는 새 제품과 동일한 상태로 재설정하는 프로세스입니다. 이렇게 하면 시스템에 설치된 소프트웨어나 응용 프로그램으로 인한 모든 바이러스 감염이 지워집니다.

이 프로세스에는 인위적이거나 자연적인 중단에 대비하여 데이터 가용성을 보장하기 위해 특정 절차를 설정하고 따르는 IT 인프라의 복구 계획이 포함됩니다.

시스템 복원

시스템 복원은 특정 파일과 정보를 적시에 이전 상태로 복원할 수 있는 복구 도구입니다.

시스템 복원을 사용하면 레지스트리 키, 설치된 프로그램, 드라이버, 시스템 파일 등을 이전 버전으로 복구할 수 있습니다. 이것은 많은 재난에서 생명의 은인 역할을 합니다.

테스트 계획

테스트 전략, 견적, 리소스, 마감일, 목표 및 일정에 대한 정보를 저장하는 문서를 말합니다. 하드웨어 및 소프트웨어 안전을 보장하기 위해 테스트를 실행하는 청사진으로 작동합니다.

여기에는 재난 후유증을 관리하기 위해 계획된 절차와 단계에 따른 다양한 테스트가 포함됩니다. 귀하와 귀하의 조직이 행동 과정에서 단 한 단계도 건너뛰지 않도록 준비하기 위해 정기적인 테스트를 수행하십시오. 이러한 방식으로 IT 인프라는 단점을 이해하고 전투에 대비할 수 있습니다.

결론

재난은 언제 일어날지 아무도 모릅니다. 따라서 적절한 안전 및 보안 조치는 모든 비즈니스에 필수적입니다.

재해 복구 용어는 공격 및 재해에 대응하는 방법을 이해하는 데 도움이 됩니다. 또한 사전에 대비하여 예상치 못한 상황에서 인프라를 보호할 수 있습니다. 효과적인 실시간 재해 복구 전략을 만들어 수백만 달러를 절약하고 고객의 신뢰를 얻을 수 있습니다.