저는 NightCafe로 최고의 AI 이미지 생성기 5개를 테스트했는데, 이 제품이 다른 제품보다 더 뛰어난 성능을 보였습니다.

당신이 좋아하는 모든 도구가 한 곳에 있습니다

생성적 AI 시대에 기업들은 사용자가 창의적인 콘텐츠를 쉽고 효율적으로 제작할 수 있도록 지원하는 최고의 도구와 플랫폼을 제공하기 위해 경쟁하고 있습니다. 이러한 도구 중 Midjourney, ChatGPT, Gemini 등은 이미지 및 텍스트 생성 분야의 선두 주자로 손꼽힙니다.

해당 분야의 경쟁 AI 이미지 생성기 Ideogram과 같은 여러 회사가 치열하게 경쟁하고 있습니다. 중도 그리고 OpenAI 당신이 그들의 제품을 사용하도록 설득하기 위해서입니다. 그래서 저는 나이트카페 팬 몇 년째 사용하고 있어요. DALL-E 3, Flux 등 주요 모델들을 한곳에 모아놨어요. 구글 이미지 그리고 표의문자.

AI가 생성한 사진에는 바리스타가 여성에게 커피를 건네주는 모습이 담겨 있습니다.

저는 수년에 걸쳐 많은 AI 이미지를 제작해 왔는데, 각 모델마다 고유한 특징을 가지고 있습니다. 예를 들어, Flux는 다양한 버전으로 제공되는 훌륭한 다목적 모델입니다. Imagen 4는 포토리얼리즘에 탁월하고, Ideogram은 GPT-4o를 제외한 다른 어떤 모델보다 텍스트를 더 잘 처리합니다.

사용 나이트카페여러 모델에 동일한 프롬프트를 적용해 보거나, Google Imagen을 사용하여 기차역의 사실적인 이미지를 만든 후, 이를 표의문자 프로젝트의 시작 이미지로 사용하여 스타일리시한 캡션이나 로고를 오버레이할 수 있습니다. 또한, 여러 모델에 동일한 프롬프트를 적용하여 어떤 모델이 가장 마음에 드는지 확인할 수도 있습니다.

NightCafe는 Kling, Runway Gen-4, Luma Dream Machine, Wan 2.1을 포함한 대부분의 주요 비디오 모델도 지원합니다. 이 테스트에서는 사진 모델에 중점을 두겠습니다.

최적의 모델 선택: 생성적 AI로의 여정

다양한 스마트 모델을 보유하면 신중하게 테스트하고 평가하여 자신의 창의적 비전과 개인적 취향에 맞는 모델을 찾을 수 있는 절호의 기회가 됩니다. 이러한 모델 간의 차이점은 생각보다 훨씬 깊고 영향력이 크다는 것을 금방 깨닫게 될 것입니다.

Flux와 Imagen과 같은 주요 모델 외에도 Flux와 Stable Diffusion의 개선 및 수정 버전을 나타내는 커뮤니티 모델도 있습니다. 이러한 맥락에서 저는 OpenAI GPT1, Recraft v3, Google Imagen 4, Ideogram 3, 그리고 Flux Kontext라는 핵심 모델에 집중했습니다. 이 모델들은 생성 AI 분야 혁신의 선두를 달리고 있습니다.

비교 및 평가 과정을 용이하게 하기 위해, 이 목적에 맞춰 특별히 고안된 테스트 프롬프트를 개발했습니다. 이 프롬프트는 높은 수준의 사실적인 표현을 요구하며, 정교한 텍스트 요구 사항을 갖춘 복잡한 장면을 제시합니다. 이러한 접근 방식을 통해 각 모델이 세부적인 디테일을 처리하고 지정된 텍스트 요구 사항을 준수하면서 고품질의 사실적인 이미지를 생성하는 능력을 평가할 수 있습니다.

1. 구글 이미지 4

Google Imagen 4는 Gemini 앱에서 사용자의 요청에 따라 이미지를 생성하는 데 사용되는 기본 모델이며, Google Slides에서도 프레젠테이션용 일러스트레이션을 제작하는 데 사용되는 모델입니다. Imagen 4는 고급 기능을 통해 간단한 텍스트 설명을 기반으로 사실적이고 고품질의 이미지를 생성할 수 있습니다.

초기 테스트에서 Imagen 4는 카페의 시각적으로 매력적인 이미지를 생성했는데, 특히 피어오르는 연기가 눈에 띄게 강조되었습니다. 요청대로 두 사람을 장면에 성공적으로 포함시켰고, 요청된 차량을 정확하게 묘사했습니다. 그러나 요청된 텍스트는 최종 이미지에 나타나지 않았습니다. 이러한 사소한 단점에도 불구하고, Google Imagen 4는 특히 Gemini나 Google Slides와 같은 애플리케이션에서 사용할 때 강력한 이미지 제작 도구로 여전히 활용되고 있습니다.

2. 플럭스 콘텍스트 맥스

커피를 제공하는 바리스타
Black Forest Labs의 Flux 모델은 가장 다재다능하고 오픈 소스 모델 중 하나입니다. Kontext의 출시로 자연어를 더 잘 이해하는 이미지 모델을 확보하게 되었습니다. 즉, OpenAI의 기본 GPT-4o 이미지 생성 방식과 유사하게, 특히 텍스트나 복잡한 장면을 렌더링할 때 더욱 정확한 결과를 생성합니다.

Flux Kontext는 "카페 마탱" 이미지를 완벽하게 포착했고, 여성 이미지도 정확하게 구현했으며, Imagen보다 더 프랑스적인 느낌을 주지만, 사진적으로는 정확하지 않다고 생각합니다. 이 모델은 생성 AI 분야에서 중요한 발전을 이루었으며, 텍스트 설명에서 이미지를 생성하는 데 있어 향상된 정확도와 사실성을 제공하여 디자이너, 아티스트, 그리고 기타 크리에이티브 전문가들에게 강력한 도구가 될 것입니다.

3. OpenAI GPT 이미지-1

OpenAI의 GPT Image-1 모델은 1년의 기존 GPT-2018 모델과 혼동해서는 안 되며, 멀티미디어 AI 분야의 패러다임 전환을 상징합니다. 이미지 해상도 향상을 위해 특별히 설계된 이 모델은 Adobe, Figma, Canva, NightCafe 등 디자인 및 디지털 크리에이티브 분야의 주요 기업들이 사용하는 강력한 도구입니다. GPT Image-1은 자연어 단서에 대한 고급 이해 기능을 제공하여 사용자가 텍스트 설명만 입력하면 사실적이고 상세한 이미지를 제작할 수 있도록 지원합니다.

인상적인 성능에도 불구하고 이 모델은 몇 가지 한계에 직면해 있습니다. 특히 9:16이나 16:9와 같은 일반적인 종횡비를 지원하지 않아 정사각형 이미지만 생성할 수 있다는 점이 가장 큰 한계입니다. 첨부된 예시에서 이 모델은 원하는 트럭과 이름을 성공적으로 포착했지만, 전반적인 장면 품질은 만족스럽지 않습니다. 또한, 모델이 두 번째 우산을 무작위로 생성했고, 손의 배치가 부자연스러워 일부 경우 완벽한 사실감을 구현하는 데 어려움을 겪고 있음을 보여줍니다.

바리 스타

4. 표의문자 v4

바리 스타

Ideogram은 출시 이후 제가 가장 좋아하는 이미지 생성 AI 모델 중 하나였습니다. 읽기 쉬운 텍스트를 안정적으로 생성하고 스타일 측면에서 다른 모델보다 훨씬 유연합니다. Ideogram 웹사이트에는 잘 설계된 대시보드와 기본 제공 업그레이드 도구가 포함되어 있습니다.

결과물은 완벽하지는 않습니다. 바리스타가 이상하게 몸을 기울인 모습이죠. 하지만 조명이 더 사실적이고, 트럭이 도로가 아닌 인도에 있는 장면이 더 사실적으로 표현되었습니다. 또한, 더 현대적으로 보이고, 텍스트도 읽기 쉽고 디자인도 훌륭합니다.

5. 리크래프트 v3

Recraft v3 Barista 이미지

프로그램으로 여겨진다. 재제작 완벽한 디자인 템플릿으로 텍스트와 일러스트레이션 제작에 이상적이지만, 그렇다고 해서 멋진 이미지를 만들 수 없다는 것은 아닙니다. 이 프로그램은 재제작 이 제품은 출시되자마자 시장에 혁명을 일으켰고, 다른 모델보다 우수한 성적을 거두어 순위표에서 정상을 차지했습니다.

하지만 개인적으로는 결과에 크게 감명받지 못했습니다. 이미지 자체는 시각적으로 매력적이지만, 이는 주로 장면에 주어진 공간 때문이었습니다. 그런데 연기가 지나치게 강조되어 있고, 커피 마차는 어디에 있는 걸까요? 무엇보다 중요한 것은 텍스트 중심 모델인데도 글자나 텍스트 표시가 전혀 없다는 것입니다.

완벽한 선택: Flux Kontext Max

바리 스타

Flux는 시각적인 측면에서 몇 가지 문제가 있었지만, 가장 일관성 있고 읽기 쉽고 명확한 카피라이팅을 보여주었습니다. 만약 이 이미지들을 상업적으로 스톡 이미지로 사용한다면 Google Imagen 4를 선택하겠지만, 순수하게 시각적인 관점에서만 본다면 Flux가 더 좋습니다.

Flux Kontext의 또 다른 장점은 수정이 쉽다는 것입니다. 보조 명령어를 입력하여 트럭 색상을 변경하거나 노부인을 사업가로 바꿀 수 있습니다. Gemini에서는 가능하지만 Imagen에서는 불가능합니다. Gemini 2 이상에서 기본 이미지 생성 기능을 사용해야 합니다.

Kontext를 사용하여 이미지를 변경하려면, 원래 Kontext 이미지가 아니더라도 NightCafe에서 이미지를 클릭하고 "편집 프롬프트"를 선택하세요. 이 기능은 약 2.5 크레딧이 소모되며, 간단한 설명 텍스트 명령만 입력하면 됩니다.

NightCafe에 대한 결론

이 테스트에서는 각 모델 중 가장 비싼 버전, 즉 각 이미지를 생성하는 데 가장 오랜 처리 시간이 걸린 버전을 사용했습니다. 이를 통해 더욱 공정한 비교를 할 수 있었습니다. 정말 놀라웠던 것은 각 모델이 동일한 설명적 프롬프트를 해석하는 방식에 상당한 차이가 있었다는 점이었습니다. 하지만 놀라지 않았던 것은 모든 모델이 그 프롬프트를 따르는 데 있어 상당한 개선을 경험했다는 점이었습니다.

NightCafe의 장점은 AI 콘텐츠 제작을 위한 원스톱 서비스라는 점입니다. 모든 주요 이미지 및 비디오 템플릿을 사용할 수 있을 뿐만 아니라, 콘텐츠 제작에 특화된 다양한 게임, 활동, 그룹으로 구성된 대규모 커뮤니티를 자랑합니다. 또한, 앱에서 제작한 모든 이미지를 편집하고 보정할 수 있습니다. 얼굴 보정, 선명도 조정, 확대 등 다양한 기능을 제공합니다. NightCafe는 고급 도구와 든든한 지원 커뮤니티를 제공하는 종합적인 AI 이미지 제작 플랫폼으로, 크리에이터에게 탁월한 선택입니다.

댓글이 닫혔습니다.