AI 챗봇 표절 탐지를 위한 완벽한 가이드

ChatGPT와 같은 AI 챗봇은 질문에 답하는 데 그치지 않습니다. 그들은 인간과 같은 이메일, 커버 레터, 에세이, 시, 블로그 게시물 등을 작성할 수 있습니다.

AI 쓰기는 카멜레온과 같습니다. 다른 유형의 쓰기와 너무 잘 어우러져 차이를 구분하기 어려울 것입니다.

불행히도 이것은 AI가 사람 대신 무언가를 썼을 때 우리 인간이 감지하기 매우 어렵게 만듭니다. 물론, 우리 모두는 셜록 홈즈의 조언을 받아들이고 “불가능을 제거”할 수 있지만 누가 그럴 시간이 있겠습니까?

위 문단을 인공지능이 썼다고 하면? 예, YouWrite에 이 게시물에 대한 간단한 소개를 작성해 달라고 요청했습니다. 꽤 설득력이 있죠? 그게 문제인데, 아무나 그걸 자신의 작품으로 제시해 이득을 볼 수 있다는 건 너무 설득력이 있다.

AI는 단순히 내용을 바꾸지 않습니다. 그들은 주제를 배우고 RLHF를 사용하여 자연어로 제시합니다. 즉, 생성된 콘텐츠는 읽는 데 로봇처럼 느껴지지 않으며 표절을 잡기 위해 온라인에서 사용할 수 있는 데이터와 비교할 수도 없습니다.

AI가 생성한 콘텐츠를 잡는 것은 쉽지 않으며 100% 정확도로 잡을 수 있다는 잘못된 희망을 주지 않을 것입니다. 그러나 약간의 탐정 작업과 AI 쓰기 탐지 도구의 도움을 받으면 대부분의 AI 작품을 잡을 수 있습니다.

아래에서 AI 표절을 감지하는 수동 방법과 일부 자동 도구도 찾을 수 있습니다.

AI 표절 수동 감지 🕵️

ChatGPT는 AI 표절에 관해서도 큰 문제가 되지 않습니다. 동일한 GPT-3 기술을 기반으로 하고 쓰기용으로 제작된 대체 도구가 많이 있습니다. 이들은 매우 발전된 기술로 잡기 어려운 인간과 유사한 콘텐츠를 만들기 위해 특별히 제작되었습니다.

자동 감지 도구는 콘텐츠 유형, 길이 및 복잡성에 따라 적중하거나 누락됩니다. 따라서 적어도 현재로서는 수동으로 점을 연결하여 글이 AI로 생성되었는지 여부를 파악하는 것이 가장 좋은 방법입니다.

아래에는 AI 생성 콘텐츠를 포착하기 위해 찾을 수 있는 몇 가지 일반적인 단서가 나열되어 있습니다.

데스크탑 및 서버 패치를 위한 5 SCCM(System Center Configuration Manager) 대안

#1. 오래된 정보

ChatGPT 및 기타 GPT-3 기반 AI는 2021년 말에 지식이 잘렸습니다. 일부 AI 봇에는 최신 정보를 찾기 위한 검색 엔진이 내장되어 있지만 여전히 오래된 데이터에 의존하여 다음과 같은 긴 형식의 콘텐츠를 작성합니다. 에세이 또는 블로그 게시물.

특히 2021년 이전에 오래된 데이터에 대해 지속적으로 언급하는 글을 본다면 AI가 생성한 것일 수 있습니다.

아래 스크린샷에서 YouWrite에게 최근 FIFA 월드컵에 대해 알려달라고 요청했고, 이것이 나온 것입니다.

최근 2022년 월드컵 대신 2018년 월드컵에 대해 이야기합니다. 2022년 월드컵과 같은 최근 이벤트에 대해 이야기하도록 도구가 업데이트되었지만 긴 게시물을 작성하기 위해 여전히 오래된 데이터를 사용합니다.

#2. 설명에 동일한 문장 구조 사용

여러 제품/앱에 대한 설명을 작성할 때 AI는 일반적으로 동일한 문장 구조를 사용하여 제품 설명에 맞게 편집합니다. 설명은 일반적으로 The, It, A 또는 제품 이름과 같은 동일한 단어로 시작합니다. 설명에는 반복되는 전용 포커스도 있습니다.

예를 들어 아래에서 ChatGPT에 “데이터 입력 작업 웹사이트”에 대해 알려달라고 요청했습니다. 모든 설명이 “A”로 시작하고 엄격한 초점이 있는 것을 볼 수 있습니다.

나는 YouChat에도 같은 질문을 했고, 똑같은 일을 했고 처음에 각 웹사이트의 이름을 반복했고, 설명 자체는 각각의 말을 바꾼 버전처럼 보입니다.

분석 중인 글에 본질적으로 유사한 설명이 있는 경우 AI 글을 잡을 수 있는 좋은 방법입니다.

#삼. 짧은 문장 사용

대부분의 글에서 AI는 기껏해야 하나의 쉼표가 있는 한 줄짜리 문장을 사용합니다. 오류 가능성을 최소화하려고 노력할 수도 있지만 콜론, 세미콜론 또는 두꺼운 수평선을 사용해야 할 수도 있는 긴 문장을 작성하는 것은 피합니다.

이것이 AI 글쓰기를 잡을 수 있는 최고의 단서가 아니라는 것을 알고 있지만 의심을 더 증명하기 위해 고려해 볼 가치가 있습니다.

#4. 잘못된 정보를 제공할 수 있음

일반적으로 일종의 지침과 관련된 복잡한 질문의 경우 AI가 의도를 이해하지 못하고 잘못된 정보를 제공할 수 있습니다. 나는 여기서 구식 정보에 대해 말하는 것이 아니라 주제를 파악하지 못할 때 자신있게 잘못된 정보를 알려줍니다.

예를 들어 YouWrite에 “PC 없이 안드로이드 폰을 루팅하는 방법”을 알려달라고 요청했습니다. 그것은 여전히 교육의 어느 시점에서 PC 사용과 관련된 방법을 보여주었습니다.

Splashtop은 Microsoft 원격 데스크톱의 실행 가능한 대안입니까?

#5. 개인적인 의견을 추가하지 않습니다

무언가에 대해 이야기할 때 AI는 알려진 사실에 대해서만 이야기합니다. 인간과 달리 개인적인 경험에 대해 이야기하지 않습니다. AI에게 직접 작성하도록 지시할 수 있지만 기본적으로 수행하지 않는 경향이 있습니다.

글이 잘 알려진 사실에 대해서만 이야기하고 있다는 것을 알게 되면 AI가 작성했을 가능성이 높습니다. 예를 들어 앱에 대해 이야기할 때 탐색이 얼마나 부드러운지 또는 실제로 앱을 사용하는 방법 대신 기능에 대해 이야기합니다.

#6. 간단한 설명

AI는 현재 사용 가능한 지식에 제한을 받기 때문에 간단한 설명과 설명을 작성하는 경향이 있습니다. 제 경험상 Android 루팅과 같은 특정 주제에 대해 이야기하면 최대 2-3문단 내에서 설명을 유지합니다. 그리고 앱이나 제품과 같은 항목의 설명은 일반적으로 한 단락을 초과하지 않습니다.

인간은 기능, 제한 사항, 개인적인 경험, 가격 등 무언가에 대해 깊이 있게 쓸 수 있습니다. 반면 AI는 일반적으로 주요 기능이나 하이라이트에 초점을 맞추기 때문에 글도 짧습니다. 강사가 더 자세한 정보를 요구하면 잘못된 정보의 가능성이 크게 높아집니다.

#7. 작가 이력 확인

교사나 웹마스터로서 작가의 이전 작업이나 과제에 접근할 수 있는 경우 의심스러운 글과 비교하는 것이 좋습니다. 작가가 AI와 비슷한 글쓰기 스타일을 가지고 있을 가능성은 거의 없습니다. AI는 글쓰기 톤을 변경할 수 있지만 선택하는 스타일은 다소 일반적이며 사용자의 톤을 복사할 수 없습니다.

이 게시물의 도입부에서 AI가 생성한 단락을 예로 들어 보겠습니다. 내 이전 게시물을 읽은 사람이라면 내 글쓰기 스타일이 그것과 완전히 다르다는 것을 쉽게 알 수 있습니다.

작가의 전작 2~3개만 읽어보고 수상한 글의 문체와 일치하는지 확인하면 된다.

AI 표절을 감지하는 도구

AI로 작성된 콘텐츠를 감지할 수 있는 여러 가지 도구가 있습니다. 그러나 정확도는 서로 다르며 콘텐츠 유형 및 길이에 따라 실패할 수 있습니다.

ChatGPT, GPT-3 Playground, WriteSonic, Rytr 및 YouWrite에서 생성된 다양한 유형의 콘텐츠를 사용하여 이러한 도구를 테스트했습니다. 그들은 ChatGPT 및 GPT-3 Playground에서 생성된 모든 유형의 콘텐츠를 감지했습니다.

전용 쓰기 도구에 대한 결과는 엇갈렸지만 흥미롭게도 모두 YouWrite를 감지하지 못했습니다. YouWrite가 감지를 피하기 위해 의도적으로 사람과 같은 실수를 하기 때문이라고 추측합니다.

콘텐츠를 수동으로 확인하는 것과 함께 이러한 도구를 사용하는 것이 좋습니다. 먼저 이러한 도구 중 하나를 사용하여 콘텐츠를 분석한 다음 수동으로 단서를 확인하여 의혹을 추가로 확인합니다.

Linux에 Skype를 설치하는 방법

아래에는 최상의 결과를 제공하고 사용하기 가장 쉬운 항목이 나열되어 있습니다.

참고: 시연을 위해 “망고의 이점”에 대해 WriteSonic에서 생성된 텍스트를 사용하겠습니다.

#1. 대규모 콘텐츠

Content At Scale의 AI 콘텐츠 탐지기가 내가 실행한 대부분의 테스트에서 가장 정확하다는 것을 알았습니다. 스캔당 최대 2500자를 스캔할 수 있으며 실제 또는 가짜 콘텐츠 밀도를 보여주는 백분율 예측을 수행합니다.

60% 이상의 가짜 콘텐츠는 적어도 대부분이 AI 콘텐츠로 작성되었다고 가정하는 것이 안전합니다. 아래 스크린샷에서 96% 콘텐츠가 가짜라는 것을 볼 수 있습니다. AI로 완전히 생성했습니다.

#2. 지피티제로

AI가 생성한 콘텐츠를 정확히 확인하려면 GPTZero가 좋은 선택입니다. GPTZero는 콘텐츠에 점수를 매기지 않습니다. 대신 AI가 생성했을 가능성이 있는 정확한 콘텐츠를 강조 표시합니다.

텍스트의 무작위성에 대한 아이디어를 얻기 위해 당혹감 및 파열성 점수를 표시하지만 더 중요한 것은 스캔당 5000자를 지원하고 파일을 업로드할 수도 있다는 것입니다. 대용량 콘텐츠를 스캔하면 정확도 향상에 큰 도움이 됩니다.

#삼. GPT-2 출력 검출기

ChatGPT의 제작자는 자신의 작업을 감지하는 봇도 제공합니다. GPT-2와 GPT-3는 훈련에 사용되는 총 데이터만 다르기 때문에 이 GPT-2 감지기는 GPT-3 기반 AI에서도 잘 작동합니다.

스캔할 수 있는 콘텐츠의 양에는 제한이 없으므로 매우 긴 AI 생성 콘텐츠를 감지하는 데 적합합니다. 또한 특히 ChatGPT로 생성된 콘텐츠의 경우 정확도가 괜찮다는 것을 알았습니다. 그러나 예측에서 약간 잃기 때문에 콘텐츠의 50% 이상이 가짜로 표시되는 경우에만 결과를 고려하십시오.

#4. Writer AI 콘텐츠 탐지기

Writer AI Content Detector 결과는 AI 작성 도구에서 콘텐츠를 감지할 때 의심스럽지만 ChatGPT에서 생성된 콘텐츠에는 훌륭하게 작동합니다. 스캔당 1500자를 스캔할 수 있으며 콘텐츠가 이미 게시된 경우 콘텐츠의 URL을 추가할 수도 있습니다.

내 테스트 AI 생성 텍스트의 경우 콘텐츠의 94%가 인간이 생성했으며 이는 다른 도구에 비해 상당히 떨어집니다. 그럼에도 불구하고 특히 이미 게시된 경우 ChatGPT 콘텐츠를 감지하는 데 여전히 사용할 가치가 있습니다.

#5. 초안 및 목표

간단하면서도 강력한 AI 쓰기 감지 도구입니다. 내 경험상 Draft & Goal은 Content At Scale과 비슷한 결과를 제공했지만 단어 수 제한이 없으므로 긴 글을 스캔할 수 있습니다. 그러나 스캔 시간은 스캔한 콘텐츠의 양에 따라 늘어납니다.

내 예제 텍스트의 경우 텍스트의 94%가 AI로 생성되었다고 합니다.

내 생각 💭

저는 개인적으로 AI 도움말이 실제로 작가의 장애물을 제거하고 모든 정보를 한 곳에서 얻고 영감을 찾는 좋은 방법이라고 생각합니다. 그러나 AI는 이미 알려진 지식으로 제한되므로 인간의 글쓰기를 대체해서는 안 됩니다.

복사를 방지하기 위해 최고의 표절 검사 도구를 탐색할 수도 있습니다.