Alexa, 직원들이 내 데이터를 보는 이유는 무엇입니까?

여러 매체에서 아마존 직원이 알렉사와의 대화에서 생성된 음성 녹음을 듣는다는 블룸버그의 보도가 있었습니다. 하지만 이러한 상황은 아마존만의 문제가 아닙니다. 여러 기술 기업이 사용자가 업로드한 개인 정보에 접근할 수 있는 방식에 대해 알아보겠습니다.

개인 메모 열람부터 미성년자 스토킹까지

에버노트 직원이 사용자의 비공개 메모를 읽을 수 있다는 논란부터, 구글이나 페이스북 직원들이 개인 정보를 이용하여 다른 사람을 스토킹한 사례까지 다양합니다. 몇 가지 구체적인 사례를 살펴보겠습니다.

에버노트는 2017년 1월, 개인 정보 보호 정책을 변경하면서 ‘서비스 개선’을 명목으로 직원들이 사용자의 개인 메모를 열람할 수 있도록 허용했습니다. 사용자들의 거센 반발에 에버노트는 후에 직원들이 접근하기 전에 먼저 사용자의 동의를 구할 것이라고 약속했지만, 이는 기업이 손쉽게 개인 정보 접근 권한을 부여할 수 있다는 점을 시사합니다. 사용자는 에버노트와 정보를 공유할 때 회사의 정책에 따라 데이터가 안전하게 보호될 것이라고 기대하지만, 회사는 언제든 정책을 변경할 수 있다는 점을 유념해야 합니다. 구글의 경우에는 사이트 안정성 엔지니어가 서버 접근 권한을 이용하여 미성년자를 스토킹하고 감시한 사건이 있었습니다. 그는 구글 보이스 통화 기록, 채팅 기록에 접근하고, 심지어 한 십대의 친구 목록에서 스스로를 차단 해제했습니다. 이처럼 사이트 안정성 엔지니어는 업무상 필요한 모든 데이터에 접근할 수 있으며, 2010년에 발생한 이 사건과 같이 직원이 권한을 남용할 위험이 항상 존재합니다. 페이스북에서도 보안 엔지니어가 접근 권한을 악용하여 온라인에서 여러 여성을 스토킹한 사례가 있습니다. 또한, 다른 직원들이 과거 연인을 스토킹하는 등 유사한 사례도 있었습니다. 앱에 이메일 접근 권한을 부여하는 것은 위험할 수 있습니다. 이러한 경우, Gmail이나 Outlook.com 같은 계정의 이메일이 해당 앱 관계자에게 노출될 수 있습니다. 월스트리트 저널에 따르면, 앱 개발에 참여한 일부 엔지니어들이 알고리즘 학습을 위해 수십만 건의 이메일을 열람한 적도 있습니다.

이것이 전부가 아닙니다. 과거 페이스북에서는 앱 개발자에게 개인 사진이 노출되는 버그가 있었고, 고용주들은 슬랙에서 개인 메시지를 열람할 수 있습니다. 심지어 미국 국가안보국(NSA)조차도 내부 감시 시스템을 사용하여 직원이 전 배우자를 감시하다가 적발되었습니다. 또한, 아마존 사례처럼 수사 영장이 발부되면 데이터를 보유한 모든 기업은 정부에 데이터를 제공해야 합니다. 알렉사는 살인 사건의 증거로 활용된 적도 있습니다.

클라우드는 타인의 컴퓨터일 뿐

우리가 데이터를 ‘클라우드’ 서비스에 업로드한다는 것은, 결국 해당 데이터를 기업의 서버에 저장한다는 것을 의미합니다. 그리고 기업은 원한다면 해당 데이터에 접근할 수 있습니다.

우리의 음성 녹음이 직원들에 의해 들여다보인다는 사실이 다소 충격적일 수 있지만, 이러한 현상은 너무나 많은 데이터가 생성되고, 기업들이 이 데이터를 조사할 수 없을 것이라고 쉽게 가정해 버리는 우리의 경향 때문일지도 모릅니다. 또는, 기술 기업들이 개인 정보를 함부로 열람하는 것을 막는 법률이 필요하다고 생각할 수도 있습니다. 하지만 적어도 미국에서는 기업이 이러한 데이터 접근을 금지하는 법률이 없는 것으로 알려져 있습니다.

음성 비서와 관련해서도, 아마존뿐만 아니라 개인 정보 보호를 중요시하는 애플조차도 시리 녹음을 활용하여 알고리즘을 개선하고 있습니다. 또한 블룸버그는 구글의 일부 검토자들이 구글 홈 기기에 녹음된 내용을 듣고 있다고 보도했습니다.

데이터 접근이 정당화되는 경우

물론, 스토커나 권한 남용자들의 사례를 제외하고도, 기업 직원이 데이터에 접근해야 할 타당한 이유도 있습니다.

정부 요청 법원은 기업에 수사 목적으로 필요한 데이터를 제출하도록 명령할 수 있습니다.
알고리즘 학습 기계 학습은 사람의 개입이 필요하며, 이는 알렉사나 시리 음성 녹음 검토, 에버노트 메모 검토 등으로 이어집니다.
품질 보증 기업은 서비스 품질을 모니터링하기 위해 녹음이나 다른 데이터를 검토할 수 있습니다.
고객 지원 고객 지원을 제공하기 위해 기업은 사용자의 동의를 얻어 데이터를 열람할 수 있습니다.
신고된 위반 기업은 위반 신고를 조사하기 위해 데이터를 열람할 수 있습니다. 예를 들어, 페이스북에서 다른 사용자가 괴롭힘 등 위반 사항을 신고하면 페이스북은 해당 대화를 검토할 수 있습니다.

유일한 해결책: 종단 간 암호화

이러한 문제들은 인터넷 작동 방식에서 비롯됩니다. ‘암호화’를 통해 데이터가 보호된다고 하지만, 실제로는 데이터가 사용자의 기기에서 기업 서버로 전송될 때만 암호화됩니다. 물론, 해당 기업의 서버에 암호화되어 저장될 수도 있지만, 기업은 필요에 따라 접근할 수 있습니다. 결국, 기업은 데이터를 해독해서 사용자에게 전달해야 합니다.

이 문제를 해결할 수 있는 유일한 방법은 종단 간 암호화 또는 클라이언트 측 암호화를 사용하는 것입니다. 이는 사용자가 사용하는 소프트웨어가 사용자의 장치에서 데이터를 암호화하고, 암호화된 데이터만 기업 서버에 저장하여 기업이 접근할 수 없도록 하는 것을 의미합니다. 즉, 데이터의 소유권이 전적으로 사용자에게 있다는 것입니다.

하지만 이러한 방식은 여러 면에서 불편함을 초래합니다. 예를 들어 구글 포토 같은 서비스는 서버에서 자동으로 사진을 처리할 수 없게 되며, 기업은 데이터를 ‘중복 제거’할 수 없어 저장 비용이 증가하게 됩니다. 음성 비서의 경우에는 모든 처리가 로컬에서 이루어져야 하므로, 기업이 음성 데이터를 활용하여 비서 기능을 향상시키는 것이 어려워집니다.

또한, 암호화 키를 분실하면 더 이상 데이터에 접근할 수 없습니다. 기업이 사용자에게 데이터 접근 권한을 복원해 줄 수 있다면, 처음부터 기업이 데이터에 접근할 수 있다는 의미가 됩니다.