이제 Gemini에 사진을 업로드하고 편집할 수 있습니다.

전문화:

이제 Gemini에서 사진을 무료로 업로드하고 편집할 수 있습니다. 이 기능은 오늘부터 모든 사용자에게 점진적으로 제공됩니다.
사용자는 대화형 텍스트 프롬프트를 통해 Gemini에서 AI 이미지를 만들고 편집할 수도 있습니다.
Google은 Gemini에 있는 모든 AI 생성 이미지에 눈에 보이는 워터마크와 눈에 보이지 않는 SynthID 디지털 워터마크가 포함될 것이라고 확인했습니다.

마지막으로, Google은 Gemini에서 텍스트 메시지를 통해 이미지를 편집하는 기능을 도입합니다. 이제 기존 이미지를 업로드하고 Gemini에서 텍스트 대화를 통해 편집할 수 있습니다. 또한, Gemini를 사용하여 AI 기반 이미지를 만들고 복제하여 이미지를 수정할 수 있습니다. Gemini 이미지 편집 기능은 오늘부터 모든 사용자에게 점진적으로 출시됩니다. 이 새로운 기능은 사용자 경험을 향상시키고 강력한 크리에이티브 도구를 제공합니다.

Google은 AI Studio에서 Gemini 2.0 Flash 모델을 사용하여 네이티브 이미지 편집을 최초로 시연했습니다. 저는 2월에 이 모델을 테스트했는데, 대화형 이미지 편집이 얼마나 쉽게 가능한지 놀라웠습니다. Google의 네이티브 이미지 생성 모델에 대응하여 OpenAI도 ChatGPT에서 네이티브 이미지 편집 및 생성 기능을 선보였습니다.

이로 인해 지브리 트렌드 ChatGPT는 빠르게 확산되어 사용량을 증가시켰습니다. 이제 Google은 Gemini 일반 사용자용 앱에 네이티브 이미지 편집 기능을 추가했습니다. Gemini 모바일 앱과 웹 모두에서 이미지를 편집할 수 있습니다. 이 기능 덕분에 Gemini는 생성 AI 분야에서 강력한 경쟁자로 자리매김했습니다.

내가 비교한 이후로 ChatGPT와 Gemini 간의 네이티브 이미지 편집Gemini가 세대 간 캐릭터/장면 일관성 유지에 훨씬 뛰어나다고 말할 수 있습니다. ChatGPT는 각 세대마다 전체 이미지를 변경하는 반면, Gemini는 매우 일관성이 뛰어납니다. 그러나 이미지 생성 측면에서는 ChatGPT가 Gemini보다 성능이 뛰어납니다. 이는 사용된 모델의 아키텍처 차이를 반영합니다.

이제 구글이 여전히 Imagen 3 확산 기반 모델을 사용하여 이미지를 생성하는지, 아니면 Gemini 모델의 기본 이미지 생성 기능을 사용하는지 알아봐야 합니다. 참고로, OpenAI는 GPT-4o AI 모델을 사용하여 이미지를 생성하고 수정합니다. 이러한 발전은 인공지능 분야의 지속적인 경쟁을 보여줍니다.

또한, 구글은 Gemini를 사용하여 생성되거나 수정된 모든 이미지에 보이지 않는 SynthID 디지털 워터마크가 내장되어 있다고 밝혔습니다. 더 나아가, 구글은 Gemini를 사용하여 생성된 모든 이미지에 눈에 보이는 워터마크를 추가할 예정입니다. 이 조치는 인공지능 활용의 투명성과 책임성을 강화하기 위한 것입니다.

쌍둥이 자리