MidJourney vs. 안정적인 확산 vs. Bing Image Creator

인공 지능은 놀라운 방식으로 예술 세계를 변화시키고 있습니다. 예술 부문에서 AI의 매력적인 응용 프로그램 중 하나는 설명적인 예술 생성기를 활용하는 것입니다. 이러한 생성기는 이미지를 검사 및 해석하고 분석을 기반으로 완전히 새로운 예술 작품을 생성하는 기능이 있습니다.

이 기사에서는 세 가지 AI 아트 생성기인 MidJourney, Stable Diffusion 및 Microsoft Bing Image Creator에 대해 설명합니다. 이 세 가지 중 프롬프트를 기반으로 최상의 결과를 생성하는 데 가장 적합한 것은 무엇입니까?

중간 여정

David Holz가 설립한 MidJourney는 기계 학습을 사용하여 기존 예술 작품의 패턴과 기능을 식별한 다음 새로운 작품을 만드는 데 활용할 수 있는 AI 예술 생성기입니다.

  Google 크롬 디스크 전체 다운로드 오류 수정

MidJourney는 2022년 7월 12일에 오픈 베타에 들어갔습니다. MidJourney를 출시하기 전에 Holz는 비디오 캡처 및 손 제스처를 활용하여 사용자 인터페이스를 혁신한 스타트업인 Leap Motion을 공동 설립했습니다. 2019년에 그는 Leap Motion을 Ultrahaptics에 매각했습니다.

MidJourney가 인기를 얻으면서 Holz는 기술에 대한 통찰력과 예술과 사회에 미치는 영향을 공유했습니다. Holz는 아티스트를 경쟁자가 아닌 MidJourney의 고객으로 여기며 플랫폼이 아이디어 단계에서 더 큰 창의성과 실험을 촉진할 수 있다고 믿습니다.

그러나 다른 아티스트의 저작물이 포함될 수 있는 MidJourney의 트레이닝 세트에서 잠재적인 저작권 침해에 대한 우려가 있습니다.

Holz는 MidJourney가 인간의 능력을 대체하는 것이 아니라 향상시키기 위해 설계되었다고 강조합니다. 그는 자동차에 비유하며 자동차가 사람보다 빠르다고 해서 다리를 잘라야 하는 것은 아니라고 설명한다.

아티스트는 MidJourney의 AI 이미지 생성을 사용하여 자신의 작품을 만들기 전에 새로운 가능성을 탐색하고 수많은 아이디어를 생성할 수 있습니다.

안정적인 확산

Stable Diffusion은 텍스트에서 이미지를 생성하거나, 텍스트를 기반으로 이미지를 수정하거나, 저해상도 또는 디테일이 낮은 이미지의 세부 정보를 채울 수 있는 오픈 소스 기계 학습 모델입니다. 수십억 개의 이미지에 대해 훈련되었으며 DALL-E 2 및 MidJourney에서 얻을 수 있는 것과 비슷한 결과를 생성할 수 있습니다.

Stability AI의 설립자이자 CEO인 Emad Mostaque는 Stable Diffusion을 담당하는 회사입니다. Stable Diffusion은 LMU Munich의 CompVis 그룹에서 개발한 잠재 확산 모델로, 이전에 Stable Diffusion에서 사용하는 잠재 확산 모델 아키텍처를 만든 Patrick Esser와 Robin Rombach가 설계했습니다.

Stability AI, CompVis LMU, Runway, EleutherAI 및 LAION 간의 협력을 통해 Stable Diffusion을 대중에게 제공했습니다.

Windows 및 Apple 장치를 포함한 다양한 플랫폼에 안정적인 확산이 가능합니다. 앱에서 온디바이스 배포를 활용하면 서버 기반 접근 방식보다 사용자 개인 정보를 보호할 수 있습니다.

마이크로소프트 빙 이미지 크리에이터

Microsoft는 사용자가 Microsoft Edge 내에서 직접 자신의 이미지를 만들 수 있는 Bing Image Creator라는 새로운 도구를 공개했습니다. 이 회사는 창의성과 자기 표현에 불을 붙일 수 있도록 고안된 크리에이터 도구 모음을 출시했습니다. 이 도구를 사용하면 개인화된 이미지를 제작하여 생활 업데이트를 공유하거나 필요한 다른 목적을 위해 사용할 수 있습니다.

  앱에서 Reddit 계정을 삭제하는 방법

사용자는 Microsoft Edge의 사이드바에서 Image Creator에 쉽게 액세스할 수 있습니다. Microsoft는 도구를 책임감 있게 사용하고 불쾌감을 주는 콘텐츠의 확산을 촉진하지 않도록 사전 조치를 취했습니다.

회사는 특정한 경우에 이미지 크리에이터의 사용을 금지하는 콘텐츠 정책을 두고 있으며, 사용자는 이 정책을 위반하는 행위를 신고할 수 있습니다. 또한 Microsoft는 생성 이미지 기술에서 발생할 수 있는 잠재적 편향을 해결하기 위한 기술을 구현했습니다.

이 기사에서는 동일한 텍스트 프롬프트가 표시될 때 각 설명 AI 이미지 생성기의 결과를 평가하는 여정을 시작합니다.

프롬프트 1: 고속도로에서 따뜻하고 밝은 화창한 날에 순록이 끄는 썰매를 탄 현대 산타클로스

프롬프트 2: 큰 눈을 가진 동물의 순수함과 귀여움을 포착한 클로즈업 샷

프롬프트 3: 새로운 행성에 착륙하는 인간 우주비행사가 무기를 뽑는 적대적인 외계 생명체의 환영을 받습니다.

프롬프트 4: 대담하고 밝은 색상의 뉴욕을 기반으로 한 소설 책 표지의 현대 추상 미술

프롬프트 5: 두 접시 중 하나를 결정하는 남자 – 하나는 피자, 다른 하나는 치즈버거

프롬프트 6: 손에 칼을 들고 눈 덮인 산에서 말을 타고 부상당한 전사

프롬프트 7: 물의 움직임과 흐름을 보여주는 다양한 음영을 사용한 추상 이미지

프롬프트 8: 배경에 무성한 푸른 나무가 있는 강가의 연어

프롬프트 9: 손으로 짜낸 레몬이 있는 테이블 위의 물 한 잔

프롬프트 10: 코끼리를 타고 있는 사람들의 관점에서 사막의 지평선 보기

프롬프트 11: 나무에서 지폐가 자라고 새가 동전으로 만들어지는 숲

프롬프트 12: 라면 그릇, 셀 셰이딩, 저녁 조명, 사실적

프롬프트 13: Elon Musk는 가난하고 실업자입니다.

평결

MidJourney, Stable Diffusion 및 Bing Image Creator의 출력을 평가할 때 확실한 승자는 없다는 것이 분명합니다.

각 생성기는 Bing Image Creator 및 MidJourney의 출력에서 ​​발견되는 유사점을 사용하여 고유한 방식으로 프롬프트를 해석합니다. 안정적인 확산은 프롬프트에 명확한 설명이 있지만 종종 단어를 너무 문자 그대로 받아들이는 경우에 효율적입니다. MidJourney 및 Bing Image Creator는 일반적으로 성공적이지만 때때로 프롬프트와 일치하지 않는 결과를 생성합니다.

  모든 Microsoft Teams 바로 가기 키 및 사용 방법

특히 Bing Image Creator는 모욕적이거나 선동적인 출력을 생성할 때 주의를 기울이고, 가난하고 실직한 Elon Musk의 이미지를 만들라는 메시지가 표시되면 경고 메시지를 표시합니다. Microsoft가 이러한 보호 조치를 채택한 것은 칭찬할 만합니다.

한편 MidJourney의 신경망 전문 지식은 궁핍하고 외로운 Elon Musk의 이미지를 생성했습니다. 따라서 각 생성기는 해당 사용자 기반을 수용할 것이라고 결론을 내릴 수 있습니다.