과거, 전사 작업은 단순하고 지루한 과정으로 여겨졌습니다. 의사, 언론인, 그리고 다양한 분야의 전문가들은 녹음기에 음성 메모나 인터뷰 내용을 담아 컴퓨터 앞에서 일일이 타이핑해야 했습니다.
하지만 2020년대에 들어서면서 오디오 녹음을 텍스트로 변환해주는 다양한 서비스들이 등장했습니다. 중요한 질문은 이러한 서비스들이 안전한가 하는 점입니다. 결국, 우리는 민감한 대화나 개인 음성 메시지를 업로드해야 할 수도 있기 때문입니다.
이제 이러한 서비스들이 어떻게 작동하는지, 그리고 우리의 정보를 어떻게 보호할 수 있는지 자세히 알아보겠습니다.
오디오 전사 서비스의 작동 원리
오디오 전사 서비스는 일반적으로 세 가지 유형으로 나눌 수 있습니다. 첫 번째는 인공지능과 머신러닝 모델을 활용하여 음성을 처리하는 완전 자동화 방식입니다. 두 번째는 사람이 직접 전사하는 방식으로, 비용이 가장 높습니다. 세 번째는 컴퓨터 처리와 인간의 검토가 결합된 방식입니다.
가장 익숙한 것은 아마도 첫 번째 범주일 것입니다. Google, Apple, 그리고 Otter.ai와 같은 서비스들은 음성 신호를 디지털 데이터로 변환합니다. 그런 다음 이 데이터를 매우 작은 단위(때로는 1000분의 1초)로 분할하여 알려진 음소와 대조합니다.
이러한 알고리즘들은 음소의 맥락을 파악하고 통계 및 AI 모델을 통해 최종 텍스트를 생성합니다. 이러한 완전 자동화된 서비스는 비용 효율적이지만, 특히 소음이 심하거나 여러 사람이 동시에 말하는 환경에서는 정확도가 떨어질 수 있습니다.
사람이 직접 전사하는 서비스에는 Rev와 같이 사전 검증된 전사자와 고객을 연결해주는 플랫폼이 있습니다. 또한 Upwork나 Fiverr와 같은 프리랜서 플랫폼에서 전사자를 고용할 수도 있습니다.
마지막으로, 컴퓨터와 인간의 결합 방식에서는 AI가 초벌 작업을 수행한 후 사람이 결과를 검토하고 오류를 수정합니다.
전사 서비스의 보안 문제점
최근 몇 년 동안 여러 전사 서비스들이 보안 침해 및 스캔들의 대상이 되었습니다.
가장 오래되고 충격적인 사례 중 하나는 2000년대에 음성 메시지를 SMS 메시지로 변환해주는 서비스를 제공했던 SpinVox입니다. 당시에는 기술 혁신으로 여겨졌고, 많은 투자와 언론의 관심, 그리고 고객을 빠르게 확보했습니다.
하지만 실제로는 고객이 모르는 사이에 음성 메시지가 파키스탄, 모리셔스, 남아프리카와 같은 지역의 콜센터 직원들에 의해 처리되고 있었습니다. 한 내부 관계자는 음성 메시지의 2%만이 컴퓨터로 처리되고 나머지 98%는 약 10,000명의 저임금 노동자들이 처리했다고 주장했습니다.
파키스탄 SpinVox 사무실 직원들이 임금을 제대로 받지 못하자, 고객에게 직접 메시지를 보내 항의하기 시작했습니다. 결국 진실이 밝혀지면서 SpinVox는 큰 타격을 입었고, 결국 Nuance라는 세계적인 음성 인식 회사에 매각되었습니다.
최근에는 사이버 보안 저널리스트인 Brian Krebs가 MEDantex에서 발생한 대규모 데이터 유출 사건을 폭로했습니다. 캔자스에 기반을 둔 의료 전문가를 위한 음성 녹음 서비스 제공업체였던 MEDantex에서 민감한 의료 기록이 포함된 데이터(일부는 2007년까지 거슬러 올라감)가 유출된 것입니다. 이 정보는 보안되지 않은 포털에서 Microsoft Word 파일 형태로 다운로드할 수 있었습니다.
자동화된 전사 서비스조차도 완전히 안전한 것은 아닙니다. 완전히 컴퓨터 기반의 서비스를 사용하는 경우에도, 회사들이 품질 관리를 위해 인력 계약업체를 활용할 수 있기 때문입니다.
2019년, 벨기에 뉴스 사이트인 VRT NWS는 Google 계약자들이 개인과 Google Home 스마트 비서 간의 대화를 엿듣고 있었다는 사실을 밝혀냈습니다. 한 계약자는 VRT NWS에 해당 대화 내용을 제공하기까지 했습니다. 그 중 상당수는 매우 민감하고 사적인 내용이었습니다.
Amazon, Apple, Microsoft 또한 유사한 방식으로 계약업체를 활용하고 있는 것으로 드러났습니다. 즉, 누군가가 여러분의 가상 비서의 음성 녹음을 들을 수 있다는 의미입니다.
온라인 전사 서비스, 정말 안전한가?
가장 중요한 질문은 온라인 전사 서비스가 과연 안전한가 하는 점입니다. 안타깝게도, 이 질문에 대한 답은 다소 복잡합니다.
최근 몇 년 동안 음성 전사 분야는 많은 발전을 이루었고, 극단적인 악성 사례들은 대부분 사라졌습니다.
그럼에도 불구하고, 우리의 데이터(개인적인 대화)를 제3자에게 맡길 때는 그들의 보안 시스템에 의존해야 합니다. 이러한 사실은 온라인 서비스뿐만 아니라 인간 전사자를 이용할 때도 마찬가지입니다.
결국 두 가지 질문을 던져야 합니다. 첫째, 해당 서비스를 얼마나 신뢰할 수 있는가? 둘째, 우리의 대화가 얼마나 민감한가?
전사 서비스를 선택하기 전에 항상 회사에 대한 조사가 필요합니다. 회사의 평판은 좋은가? 안정적으로 운영되고 있는가? 과거에 데이터 유출 사고가 있었는가? 개인 정보 보호 정책을 통해 데이터 처리 및 보안 방법을 명확하게 설명하고 있는가?
앞서 언급했듯이, AI 기반 서비스는 품질 관리 목적으로 직원이나 제3자 계약업체를 이용하는 경우가 많습니다. 이러한 검토가 모든 텍스트 변환에 적용되는 것은 아니지만, 누군가가 여러분의 대화를 들을 가능성은 언제나 존재합니다.
대부분의 경우 이것이 서비스를 이용하지 못할 정도의 큰 문제는 아니지만, 대화 내용이 매우 사적이거나 사업상 민감한 경우에는 텍스트 편집기를 열고 전통적인 방식으로 직접 전사하는 것을 고려해 볼 수 있습니다.