Google의 Gemini AI가 출시되었지만 ChatGPT보다 나은가요?

주요 시사점

  • Google의 AI 모델 Gemini에는 다양한 작업과 복잡성 수준에 초점을 맞춘 Ultra, Pro, Nano의 세 가지 변형이 있습니다.
  • Gemini Ultra는 주요 AI 벤치마크에서 유망한 결과를 보여주지만 2023년 12월 현재 공개적으로 사용할 수 없습니다. 구글은 2024년 1월에 출시될 것이라고 밝혔습니다.
  • Gemini Pro를 사용할 수 있으며 성능은 꽤 좋지만 현재 GPT-4를 무너뜨리는 데는 실패했습니다.

Google은 Gemini AI 모델이 ChatGPT Plus를 지원하는 모델인 OpenAI의 GPT-4보다 우수할 것이라고 지속적으로 약속해 왔습니다. 이제 Google Gemini가 출시되었으므로 마침내 이를 테스트하고 Gemini가 GPT-4와 어떻게 비교되는지 확인할 수 있습니다.

Google이 2023년 3월 Bard를 출시했을 때 기대할만한 이유는 많았습니다. 마지막으로 OpenAI의 ChatGPT 독점이 무너지고 가치 있는 경쟁을 벌이게 될 것입니다.

그러나 Bard는 사람들이 기대했던 AI 타이탄이 아니었으며 GPT-4는 여전히 지배적인 생성 AI 채팅 봇 플랫폼으로 남아 있습니다. 이제 Google의 Gemini가 출시되었습니다. 하지만 오랫동안 기다려온 AI 모델이 ChatGPT보다 나은가요?

Google의 Gemini AI 모델이란 무엇입니까?

Gemini는 텍스트, 오디오, 이미지, 비디오를 포함한 다양한 데이터 형식을 이해하고 작동할 수 있는 Google의 가장 유능한 생성 AI 모델입니다. 가장 뛰어난 AI 기술을 바탕으로 통합 AI 모델 드로잉 기능을 만들려는 Google의 시도입니다. Gemini는 세 가지 변형으로 제공됩니다.

  • Gemini Ultra: 매우 복잡한 작업을 처리하도록 설계된 가장 크고 성능이 뛰어난 변형입니다.
  • Gemini Pro: 다양한 작업에 걸쳐 고성능을 확장하고 제공하기 위한 최고의 모델이지만 Ultra보다 성능이 떨어집니다.
  • Gemini Nano: 온디바이스 작업 배포를 위해 설계된 가장 효율적인 모델입니다. 예를 들어 개발자는 Gemini Nano를 사용하여 모바일 앱이나 통합 시스템을 구축하여 강력한 AI를 모바일 공간에 도입할 수 있습니다.
  • 공식 블로그에서는 키워드, Google은 Gemini Ultra가 여러 벤치마크에서 최첨단 제품보다 성능이 뛰어나다고 말합니다. Google은 Gemini Ultra가 여러 주요 벤치마크에서 업계 최고의 GPT-4를 능가한다고 주장합니다.

    엄격한 MMLU 벤치마크에서 전례 없는 90.0% 점수를 획득한 Google은 Gemini Ultra가 57개 주제에 걸친 다각적인 테스트에서 인간 수준의 성능을 능가한 최초의 모델이라고 밝혔습니다.

    Google

    Gemini Ultra는 또한 Go, JavaScript, Python, Java 및 C++를 포함하여 세계에서 가장 널리 사용되는 일부 프로그래밍 언어로 고품질 코드를 이해하고 설명하고 생성할 수 있습니다. 서류상으로는 모두 훌륭한 결과입니다. 그러나 이것들은 모두 벤치마크일 뿐이며, 벤치마크가 항상 전체 내용을 말해주지는 않습니다. 그렇다면 Gemini는 실제 작업에서 얼마나 잘 수행됩니까?

    Google Gemini AI 사용 방법

    Gemini AI 모델의 세 가지 변형 중에서 지금 바로 Gemini Pro를 사용할 수 있습니다. Gemini Pro는 현재 Google의 Bard 챗봇에서 사용할 수 있습니다. Bard와 함께 Gemini Pro를 사용하려면 다음으로 이동하세요. bard.google.com Google 계정으로 로그인하세요.

    Google은 Gemini Ultra가 2024년 1월에 출시될 것이라고 밝혔으므로 지금은 ChatGPT에 대한 Gemini Pro 테스트에 만족해야 했습니다.

    Gemini를 GPT-3.5 및 GPT-4와 비교하는 방법

    새로운 AI 모델이 출시되면 OpenAI의 GPT AI 모델에 대해 테스트됩니다. 이는 일반적으로 다른 모델과 경쟁해야 하는 최첨단 모델로 받아들여집니다. 그래서 Bard와 ChatGPT를 사용하여 Gemini의 수학, 창의적 글쓰기, 코드 생성 및 이미지 입력의 정확한 처리 능력을 테스트했습니다.

    우리가 생각할 수 있는 가장 쉬운 수학 문제부터 시작하여 두 챗봇 모두에게 -1 x -1 x -1을 풀도록 요청했습니다.

    바드가 먼저 갔다. 우리는 질문을 두 번 반복했는데 모두 잘못된 대답이 돌아왔습니다. 우리는 세 번째 시도에서 답을 얻었지만 그것은 중요하지 않습니다.

    GPT-3.5에서 실행되는 ChatGPT를 사용해 보았습니다. 첫 번째 재판은 맞았습니다.

    Gemini의 이미지 해석 능력을 테스트하기 위해 우리는 일부 인기 있는 밈을 해석하는 작업을 맡았습니다. 사람이 포함된 이미지는 해석할 수 없다며 거절했다. GPT-4V를 실행하는 ChatGPT는 기꺼이 이를 완벽하게 수행할 수 있었습니다.

    문제 해결 및 코딩 능력을 테스트하면서 이미지를 해석하도록 하는 또 다른 시도를 시도했습니다. Gemini Pro를 실행하는 Bard에게 스크린샷을 주고 HTML과 CSS 코드를 해석하고 작성하여 스크린샷을 복제하도록 요청했습니다.

    소스 스크린샷은 다음과 같습니다.

    아래는 HTML과 CSS를 사용하여 스크린샷을 해석하고 복제하려는 Gemini Pro의 시도입니다.

    그리고 여기에 스크린샷을 복제하려는 GPT-4의 시도가 있습니다. GPT-4가 역사적으로 코딩 분야에서 강력했다는 점을 고려하면 결과는 놀라운 일이 아닙니다. 우리는 이전에 GPT-4를 사용하여 처음부터 웹 앱을 구축하는 방법을 시연했습니다.

    Gemini Pro에게 Tesla(전기차 브랜드)에 대한 시를 만들어 달라고 요청했습니다. 과거에 수행한 이전 테스트에 비해 약간의 개선이 나타났습니다. 결과는 다음과 같습니다.

    이 시점에서 우리는 슈퍼차지된 GPT-4보다는 GPT-3.5와 결과를 비교하는 것이 더 적절할 것이라고 생각했습니다. 그래서 우리는 GPT-3.5를 실행하는 ChatGPT에 비슷한 시를 만들어 달라고 요청했습니다.

    개인적인 선택일 수도 있지만 Gemini Pro의 견해가 더 나은 것 같습니다. 하지만 우리는 당신이 판사가 되도록 하겠습니다.

    Gemini가 ChatGPT보다 나은가요?

    Google이 Bard를 출시하기 전에는 이것이 우리가 기다려온 ChatGPT 대회일 것이라고 생각했지만 그렇지 않았습니다. 이제 Gemini가 출시되었습니다. 지금까지 Gemini Pro는 ChatGPT에 강력한 성능을 제공할 모델로 보이지 않습니다.

    Google은 Gemini Ultra가 훨씬 더 좋아질 것이라고 말합니다. 우리는 그것이 Gemini Ultra 발표에서 제시된 주장을 충족하거나 초과하기를 진심으로 바랍니다. 그러나 Google 생성 AI 도구의 최고 버전을 확인하고 테스트하기 전까지는 이 도구가 다른 AI 모델 경쟁자를 압도할 수 있는지 알 수 없습니다. 현재로서는 GPT-4가 확실한 AI 모델 챔피언으로 남아 있습니다.