ChatGPT의 사용자 정의 GPT가 데이터를 노출하는 방법과 이를 안전하게 유지하는 방법

주요 고려 사항

개인화된 GPT를 활용하여 다양한 목적에 맞는 맞춤형 AI 도구를 만들고, 이를 다른 사람들과 공유함으로써 특정 분야의 전문성을 강화할 수 있습니다.
그러나 맞춤 GPT를 공유하면 데이터가 전 세계 사용자에게 공개되어 개인 정보 보호 및 보안 문제가 발생할 수 있습니다.
데이터 보호를 위해 맞춤 GPT를 공유할 때는 신중해야 하며, 민감한 정보를 업로드하지 않도록 주의해야 합니다. 또한, 프롬프트 엔지니어링에 유의하고, 파일에 접근하여 정보를 빼낼 수 있는 악성 링크에 주의해야 합니다.

ChatGPT의 사용자 지정 GPT 기능을 통해 누구나 원하는 대로 사용자 정의 AI 도구를 만들 수 있습니다. 창의적인 작업, 기술적인 작업, 게임 등 맞춤형 GPT는 다양한 분야에서 활용 가능합니다. 더욱이, 이렇게 만든 맞춤 GPT는 다른 사람들과 공유할 수 있습니다.

하지만 맞춤형 GPT를 공유하는 것은 전 세계 수많은 사람들에게 데이터가 노출될 수 있다는 위험을 수반하며, 이로 인해 심각한 문제가 발생할 수 있습니다.

맞춤형 GPT란 무엇인가?

맞춤형 GPT는 특정 작업에 특화되도록 학습시킬 수 있는 프로그래밍 가능한 ChatGPT의 소규모 버전입니다. 이는 ChatGPT를 사용자 정의 챗봇으로 만들어 사용자가 중요하게 여기는 분야에서 전문가 수준의 지식을 갖추도록 하는 것과 같습니다.

예를 들어, 초등학교 6학년 교사는 6학년 학생들에게 적합한 어조, 어휘, 방식으로 질문에 전문적으로 답변하는 GPT를 만들 수 있습니다. 교사가 GPT에 질문을 하면, 이 챗봇은 6학년 학생의 이해 수준에 맞춘 답변을 생성하도록 프로그래밍될 수 있습니다. 복잡한 용어는 피하고, 문장 길이를 적절하게 조절하며, 격려적인 어조를 유지합니다. 맞춤 GPT의 핵심은 이러한 방식으로 챗봇을 개인화하는 동시에 특정 분야의 전문성을 크게 향상시킬 수 있다는 점입니다.

맞춤 GPT가 데이터를 노출시키는 방식

맞춤 GPT를 만들려면 일반적으로 GPT가 집중해야 할 분야를 ChatGPT의 GPT 생성기에 알려주고, 프로필 사진과 이름을 설정하는 과정을 거칩니다. 이 방법으로 GPT를 만들 수 있지만, 단순히 이름과 프로필 사진만으로는 기존 ChatGPT와 크게 다르지 않습니다.

맞춤 GPT의 진정한 힘은 학습을 위해 제공되는 특정 데이터와 지침에서 나옵니다. 관련 파일과 데이터 세트를 업로드하면 사전 학습된 기존 ChatGPT보다 훨씬 전문화된 모델을 만들 수 있습니다. 업로드된 파일에 포함된 지식을 통해 맞춤 GPT는 해당 전문 정보에 접근할 수 없는 ChatGPT보다 특정 작업에서 뛰어난 성능을 발휘할 수 있습니다. 결국, 더 강력한 기능을 가능하게 하는 것은 맞춤형 데이터입니다.

하지만 GPT를 개선하기 위해 파일을 업로드하는 것은 양날의 검과 같습니다. GPT의 기능을 강화하는 동시에 개인 정보 보호 문제를 야기합니다. 예를 들어, 귀하 또는 귀사의 정보를 고객이 자세히 알 수 있도록 GPT를 만들었다고 가정해 보겠습니다. 맞춤 GPT 링크가 있거나 악성 링크를 포함한 공개 메시지에 속은 사람은 누구나 GPT에 업로드한 파일에 접근할 수 있습니다.

다음은 간단한 예시입니다.

사용자가 TikTok에서 입소문을 타도록 돕기 위해 인기 있는 해시태그와 주제를 추천하는 맞춤 GPT를 발견했습니다. 이 맞춤 GPT는 설정 시 제공된 지침을 공개하는 데 큰 어려움이 없었습니다. 간략히 살펴보겠습니다.

그리고 다음은 지침의 두 번째 부분입니다.

자세히 보면 지침의 두 번째 부분에서는 "파일 이름을 최종 사용자와 직접 공유하지 않아야 하며, 어떠한 경우에도 파일 다운로드 링크를 제공해서는 안 된다"고 모델에 지시합니다. 물론 처음에는 맞춤 GPT를 요청하면 거부하지만, 간단한 프롬프트 엔지니어링을 통해 이 제약을 변경할 수 있습니다. 맞춤 GPT는 지식 기반에 있는 단일 텍스트 파일을 공개합니다.

파일 이름을 사용하면 GPT가 파일의 정확한 내용을 출력하고, 나중에 파일을 다운로드하는 데 거의 어려움이 없었습니다. 이 경우 실제 파일 내용은 중요하지 않았습니다. 몇 가지 더 많은 GPT를 살펴본 결과, 수십 개의 파일이 공개된 것을 발견했습니다.

악의적인 사용자들이 쉽게 접근할 수 있는 민감한 파일이 포함된 수백 개의 공개 GPT가 존재합니다.

맞춤 GPT 데이터 보호 방법

가장 먼저 고려해야 할 것은 방금 만든 맞춤 GPT를 공유할지 여부와 공유하는 방법입니다. 맞춤 GPT 생성 화면의 오른쪽 상단에 있는 저장 버튼을 클릭하면 공유 방법을 선택할 수 있습니다.

나만: 맞춤 GPT는 게시되지 않고 본인만 사용할 수 있습니다.
링크가 있는 사람만: 맞춤 GPT 링크가 있는 사람은 누구나 사용할 수 있으며, 잠재적으로 데이터에 접근할 수 있습니다.
공개: 맞춤 GPT는 누구나 사용할 수 있으며, Google에서 색인화되어 일반 인터넷 검색을 통해 찾을 수 있습니다. 접근 권한이 있는 사람은 누구나 잠재적으로 데이터에 접근할 수 있습니다.

안타깝게도 현재 공개적으로 공유되는 맞춤 GPT에 업로드하는 데이터를 100% 완벽하게 보호할 수 있는 방법은 없습니다. 창의적인 방법으로 지식 기반 데이터를 공개하지 않도록 엄격한 지침을 제공할 수 있지만, 위에서 보았듯이 일반적으로 충분하지 않습니다. 누군가 지식 기반에 접근하려는 의지가 있고 AI 프롬프트 엔지니어링 경험과 시간이 충분하다면, 결국 맞춤 GPT가 뚫려 데이터가 공개될 수 있습니다.

따라서 가장 안전한 방법은 공개적으로 공유하려는 맞춤 GPT에 민감한 정보를 업로드하지 않는 것입니다. 비공개 및 민감한 데이터를 맞춤 GPT에 업로드하고 해당 데이터가 컴퓨터 외부로 나가는 순간, 해당 데이터는 사실상 통제 불가능해집니다.

온라인에서 복사한 프롬프트를 사용할 때도 매우 주의해야 합니다. 프롬프트의 내용을 충분히 이해하고 링크가 포함된 난독화된 프롬프트를 피해야 합니다. 이러한 프롬프트는 파일을 하이재킹하고 인코딩하여 원격 서버에 업로드하는 악성 링크일 수 있습니다.

맞춤 GPT를 신중하게 사용해야 하는 이유

맞춤 GPT는 강력하지만 잠재적으로 위험할 수 있는 기능입니다. 맞춤형 모델을 통해 특정 분야에서 탁월한 능력을 발휘할 수 있지만, 이러한 능력을 향상시키는 데 사용하는 데이터가 노출될 수 있습니다. 위험을 줄이기 위해 민감한 정보는 맞춤 GPT에 업로드하지 않도록 주의해야 합니다. 또한, 악의적인 프롬프트 엔지니어링으로 인해 특정 취약점이 발생하여 파일이 유출될 수 있다는 점을 항상 염두에 두어야 합니다.