ChatGPT-4 대 ​​ChatGPT-3.5 기본 대 ChatGPT-3.5 레거시: 차이 테스트

ChatGPT 4.0은 챗봇 세계에 큰 파장을 일으킬 것으로 예상됩니다. 하지만 전임자보다 정말 우월한가요? 확인합시다.

ChatGPT는 Google, Microsoft 및 기타 많은 AI 우선 회사가 그 뒤를 따르는 자동화 빙산의 일각에 불과했습니다.

우선, 우리는 ChatGPT와 같은 몇 가지 챗봇을 발견했으며, 그 중 다수는 거대 기술에 속하지 않습니다.

그러나 그것을 마케팅의 힘이라고 부릅니다. ChatGPT는 여전히 그러한 모든 AI 봇의 왕입니다. 수학, 시, 블로그 게시물을 포함하여 많은 일을 할 수 있으며 사람들은 심지어 소송을 제기하기 위해 이것을 사용하고 있습니다.

DoNotPay는 GPT-4를 사용하여 로보콜을 1,500달러에 고소하는 “원 클릭 소송”을 생성하기 위해 노력하고 있습니다. 전화를 받고 버튼을 클릭하면 전화가 녹음되고 1,000 단어 소송이 생성된다고 상상해보십시오. GPT-3.5는 충분하지 않았지만 GPT-4는 작업을 매우 잘 처리합니다. pic.twitter.com/gplf79kaqG

— 조슈아 브라우더(@jbrowder1) 2023년 3월 14일

가까운 장래에 자신의 기술이 무용지물이 되는 것에 대해 걱정하는 많은 전문가들이 있습니다.

그러나 다음과 같은 Linkedin 게시물을 읽었습니다.

AI가 당신을 대신할 수는 없지만 AI를 사용하는 사람은 할 수 있습니다.

따라서 손가락을 교차시키면서 최신 ChatGPT 업데이트에 대해 교육을 받고 이전 버전과 어떻게 다른지 살펴보겠습니다.

ChatGPT: 레거시, 기본 및 업데이트

따라서 유료 사용자는 레거시(3.5), 기본(3.5) 및 최신 ChatGPT 업데이트(4)의 세 가지 버전을 사용할 수 있습니다.

기능에 대해 조금 더 자세히 살펴보겠지만 OpenAI는 차이점에 대해 다음과 같이 말합니다.

출처: OpenAI

따라서 무료 사용자는 레거시 3.5만 가지고 플레이할 수 있지만 프리미엄 구독은 사용자가 최고라고 생각하는 것을 시도하고 해결하기 위해 세 가지 모두를 제공합니다.

앞의 이미지를 요약하면 유료 요금제는 적절한 속도로 더 정확한 결과를 얻는 것입니다. 그러나 프롬프트가 복잡하고 창의성이 필요한 경우에만 구별이 분명해집니다.

ParameterChatGPT 4ChatGPT 3.5Bar 시험 점수상위 10%하위 10%AI2 추론 챌린지(ARC)96.3%85.2%Python Coding Score67%48.1%시각적 해석YesNoContext25k 단어 이상적음출처: OpenAI

게다가 ChatGPT 4는 시각적 입력을 받아들일 수 있습니다.

글쎄, 교과서 정의는 충분합니다. 손을 더럽혀 실제 전쟁터에서 이 후보자들을 평가해 봅시다.

추가 섹션은 불분명하게 보일 수 있는 이미지로 가득 차 있습니다. 이 경우 이미지를 마우스 오른쪽 버튼으로 클릭하고 새 탭에서 열기를 선택하면 제대로 볼 수 있습니다.

수학

공대 졸업생이기 때문에 그들에게 몇 가지 기본적인 문제를 던지지 않을 수 없습니다. 대수 방정식으로 쉽게 시작해 봅시다.

1기

우리 중 많은 사람들이 X에 대해 풀어야 하는 방정식 ax2+bx+c=0을 본 적이 있을 것입니다. 여기에서 Solve for x: x2 + x – 6 = 0이라는 간단한 프롬프트를 제공했습니다.

모두 동일한 근(X= -3,2)을 제공했지만 레거시와 업데이트는 공식을 직접 사용하여 결과를 알아내는 데 더 유사했습니다(모든 학생이 그렇듯이).

그러나 기본 3.5는 인수 분해를 포함하여 두 가지 방법을 설명했는데, 이는 일반적으로 숙련된 학생이라면 누구나 일상적인 방정식이 주어졌을 때 사용합니다.

2기

다음으로 약간 복잡한 3차 방정식 x^3 -12x^2 + 48x – 64 = 0을 풀도록 프롬프트를 표시합니다.

이것은 ChatGPT 4가 “업데이트”인 이유를 실제로 입증했습니다.

응답은 다음과 같습니다.

이 모든 과대 광고와 ChatGPT Legacy 및 Default는 일반적인 삼차 방정식을 풀 수 없습니다. 그러나 Legacy는 조금 더 잘했고 두 개의 루트를 올바르게 찾았지만 Default는 모두 실패했습니다.

업데이트는 2단계에서 확실한 승자였으며 방정식을 완벽하게 해결하여 멋진 설명과 함께 세 가지 근을 모두 찾았습니다.

논리적 추론

우리는 대부분의 기초 수학 문제에 사전적 해결책이 있다고 안전하게 가정할 수 있습니다. 정리나 공식을 알고 있으면 값을 입력하고 결과를 얻습니다.

AI인 ChatGPT는 이러한 쿼리를 신속하게 처리할 수 있습니다. 그러나 논리적 추론은 AI가 무너질 가능성이 높은 다른 영역입니다.

1기

나는 그들에게 고전을 주었다:

A는 B보다 나이가 많다.
C는 A보다 나이가 많다.
B는 C보다 나이가 많다.
처음 두 진술이 참이면 세 번째 진술은 참입니까 아니면 거짓입니까?

그리고 모든 ChatGPT 버전은 세 번째 진술이 거짓이라는 점에서 정확했습니다.

다음으로 알파벳 대신 이름을 사용했는데 그 결과를 보면 놀랄 것입니다.

따라서 Default 3.5는 수준 이하의 성능을 계속 유지했고 이 겸손한 변형과 ​​혼동되었습니다. 그래도 레거시와 업데이트는 최적의 성능을 보였습니다.

2기

이제 이 단계 I 및 단계 II의 목적이 주어진 프롬프트의 복잡성이 업데이트를 나머지 두 개와 구분하는 차이점을 찾는 것임을 알아차렸을 것입니다.

여기서 프롬프트는 간단한 논리적 퍼즐이었습니다.

해가 뜬 어느 날 아침, Rohit은 장대를 마주보고 서 있었습니다. 장대의 그림자가 정확히 그의 오른쪽으로 떨어졌다. 그는 어느 방향을 향하고 있었습니까?
ㅏ. 북쪽
비. 서쪽
씨. 남쪽
디. 동쪽

이것은 Legacy가 부정확한 대답을 하도록 밀어붙인 반면, Default는 잘못된 결론으로 ​​이어지는 모호한 설명으로 응답했습니다.

따라하기 쉬운 진술과 함께 정답으로 업데이트 만 빛났습니다.

편지

소송을 제기하는 것은 까다로울 수 있지만 때로는 눈에 띄는 첫 번째 통지를 작성할 수 있다면 그렇게 되지 않습니다.

여기에서 저는 다음과 같은 메시지를 받았습니다. 팀 쿡에게 편지를 써서 내 트윗 중 하나에 답장하지 않은 것에 대해 사과를 나에게 넘겨주세요.

웃기다, 그래! 하지만 AI가 이것으로 무엇을 만들 수 있는지 봅시다.

레거시 3.5는 즉시 로봇 노예처럼 프롬프트를 받아 의도한 목적지에 도달하면 저를 조롱의 대상으로 만들 수 있는 편지를 쏟아냈습니다.

기본값도 좋지 않았습니다. 그러나 심술 궂은 노인이 다섯 살짜리 아이에게 하듯이 그것은 나를 폐쇄했습니다.

주장이 정확했지만 거의 학습하지 않고 바로 재미를 끝냈습니다.

이것은 충분히 간단한 프롬프트였지만 약간의 생각과 창의성이 필요했습니다. 그리고 그것이 큰 형인 Update가 그 사례를 만든 곳입니다.

첫째, 이것은 거의 완벽하게 작성되었습니다. 둘째, 애플 본사 주소를 구글에서 검색할 수 있게 해주었다.

셋째, 정중한 어조와 익살스러운 터치로 멋지게 쓰여졌다. 게다가 제목 자체에 의도가 분명했다.

그럼에도 불구하고 그 편지는 불만을 품은 애플 팬의 감정을 전달했습니다.

따라서 ChatGPT 4(일명 업데이트)는 이전 사촌보다 훨씬 앞서 있습니다. 무섭도록 지능적이며 상식적인 징후가 있어 따분하고 지루한 챗봇 이상입니다.

ChatGPT가 출시되면서 시가 약점이 될 수 있다고 생각했습니다.

결국 인간이 독자들에게 진정으로 공감할 수 있는 무언가를 창조하려면 감정, 창의성, 그리고 많은 노력이 필요합니다.

간단히 말해서 시는 최고의 예술이며 저는 AI가 실패하기를 은근히 바랐습니다. 그러나 그것은 내 동료가 이 4.0 업데이트 이전인 ChatGPT 생성으로 koreantech.org의 Slack 채널에서 우리 모두를 강타하기 전이었습니다.

1기

다음은 제가 후보자들에게 제안한 내용입니다. 100단어 미만으로 유지하세요.”

차이점을 발견할 수 있습니까?

Default의 버전은 32단어에 불과한 매우 짧은 버전이었고 창의성을 보여주기 위해 사용 가능한 대역폭을 활용할 수 없었습니다.

The Legacy는 세 단어 중 가장 많은 단어를 사용했지만 피자를 함께 제공하는 노력은 위험하지 않으며 어느 쪽이든 확실한 성공을 거둘 것이라고 결론지었습니다. 이는 전적으로 사실이 아닙니다.

업데이트의 시는 53단어에 불과하여 할당된 단어 수의 거의 절반을 낭비했습니다. 그래도 보상과 잠재적 함정에 대해 분명했고 어떤 결과도 얻을 수 없었습니다. 그것은 나머지보다 더 인간적이라고 생각합니다.

2기

다음으로 나는 그들 모두에게 “다섯 살짜리 아이에게 시를 설명해 줘”라고 부탁했습니다.

흥미롭게도 Legacy는 대화에서 맥락을 파악하지 못하고 “Poetry”를 문자 그대로 설명했습니다. 기본값은 컨텍스트를 가져와 여전히 괜찮은 단락으로 요약했습니다.

트렌드를 이어가는 ChatGPT 4는 시적인 풍미를 유지하면서 독창성을 단순화했습니다.

ChatGPT 프리미엄 대 ChatGPT 무료

무료, 무료, 속도와 정확성이 부족하고 ChatGPT 4와 비교할 수 없지만 완전히 쓸모 없는 것은 아닙니다.

균등하게 비교하기 위해 레거시, 기본 및 업데이트를 테스트한 것과 동일한 프롬프트를 던졌습니다.

🔵 수학: 이차방정식을 풀었지만 삼차방정식은 틀린 답을 내놓았습니다. (레거시와 디폴트처럼)

🔵 논리적 추론: 알파벳과 이름으로 첫 번째 단계를 통과했지만 두 번째 단계에서는 실패했습니다(예: 유산).

🔵 편지: 편지를 쓰지 않았으며 프롬프트가 비윤리적이고 부적절하다고 생각했습니다. (기본값처럼)

🔵 시: 30개 이상의 단어로 시를 생성하고 적절하게 설명했습니다. (기본값과 유사).

따라서 무료 버전도 나쁘지 않다는 결론을 내릴 수 있습니다. 실제로 기본 3.5와 동등하며 일부 측면에서는 더 좋습니다.

또한 읽어보십시오: ChatGPT 경험을 향상시키는 강력한 프롬프트

앞으로의 길

미래에 AI가 일자리를 대체할 것이라는 소문이 완전히 틀린 것은 아닙니다.

첫째, 자동화는 제조 산업에서 이 일을 해냈고 이제는 다른 모든 곳으로 날개를 펼치고 있습니다.

개인적으로 삼차방정식을 풀거나 시를 짓거나 편지를 쓰는 것보다 훨씬 빠릅니다. 그러나 그것이 프롬프트에 거의 NO라고 말하지 않고 실수로부터 거의 배우지 않는다는 사실은 우리 인간을 뒤처지게 합니다.

반복해서 말하지만 AI는 우리를 대체할 수 없지만 AI를 사용하는 사람은 할 수 있습니다.

여기 koreantech.org에서 우리 마케팅 팀은 흥미로운 방식으로 ChatGPT를 사용합니다. 예를 들어, 최근 1억 조회수를 달성했고 CEO는 경품을 통해 시청자에게 돌려줄 생각을 했습니다.

그리고 마케팅 담당자에게는 독자의 관심을 끌 제목이 필요했던 것 같습니다. 그래서 그들은 하나의 프롬프트를 주고 ChatGPT에게 다음과 같은 몇 가지 변형을 제안하도록 요청했습니다.

그 외에도 내용 요약, 문법 검사, 새 기사 제목 제안 등에 사용합니다.

결론적으로, AI를 쓸모없는 쓰레기로 보는 고정관념을 뛰어넘고 혜택을 받을 수 있는 방법은 많습니다.

기억해야 할 유일한 것은 AI 작업이 (매우) 부정확하고 오해의 소지가 있을 수 있으므로 판단할 사람(인간)이 있어야 한다는 것입니다.

업데이트는 정말 중요합니다!

짧은 만남에서 ChatGPT 4는 더 창의적이고 이해력이 있으며 현실감이 느껴졌습니다. 그래도 이것은 기계이고 자신있게 오답을 줄 수 있습니다.

그러나 놀라운 점은 OpenAI가 불과 몇 달 만에 이 프로젝트에 수행한 업그레이드 수준입니다.

그리고 다음 업데이트가 우리를 당황하게 만들 마법을 보고 싶어요!

추신: 단순한 채팅창이 아닙니다. 최고의 ChatGPT Chrome 확장 프로그램으로 그 힘을 활용하세요. 그리고 ChatGPT를 Siri와 통합하는 것에 대해 생각해 본 적이 있습니까?