忍者ブログ

mshencity

ChatGPT의 이미지 생성을 Nano Banana와 비교했는데 그중 하나만 유용한 스톡 사진을 만들었습니다.


제 개인적인 취미는 서로 다른 두 개의 챗봇에게 동일한 질문을 하고 어느 것이 가장 좋은 응답을 제공하는지 확인하는 것입니다. 교수가 학생에게 퀴즈를 내는 것처럼(실생활에서 자원봉사자로 가끔 하는 일) 봇이 환각을 일으키고 사실을 만들어내는지, 아니면 실제로 유용한 지능적이고 일관된 답변을 제공하는지 평가합니다.





"지능"과 "일관성"은 이미지와 관련하여 일반적으로 챗봇이 생성하는 것을 설명하는 데 사용하는 단어가 아닙니다. AI 슬롭으로 알려진 이 이상한 조합은 종종 흐릿한 배경, 머리를 땋은 완벽한 인간, 아마도 몇 개의 추가 엄지손가락이 포함되어 있으며 소셜 미디어 전체에 퍼져 있으며 이와 같은 기사의 특집 이미지로 표시되기도 합니다.





스톡 이미지의 이름이 이미 잘못되었습니다. Emilia Clarke가 출연한 이 동영상은 제가 가장 좋아하는 스톡 사진 패러디 중 하나이며 AI가 등장하기 오래 전에 나왔음에도 불구하고 저를 웃게 만듭니다.






[embed]https://www.youtube.com/watch?v=NZuzudfcsek[/embed]





시대가 변했습니다. OpenAI는 최근 Google Gemini 및 Nano Banana Pro와 경쟁하기 위해 ChatGPT 이미지 생성 모델을 업그레이드했습니다.





놀랍게도 이미지는 더 이상 특유의 흐릿함을 사용하지 않으며, 내 테스트에서는 종종 이전보다 훨씬 더 사실적으로 보입니다.





나는 두 챗봇 모두에 정확히 동일한 프롬프트를 사용하고 어느 것이 가장 유용한 결과를 산출했는지 확인하기로 결정했습니다. 내가 말하는 것은 광고 캠페인이나 기사에 사용할 수 있는 이미지, 재치 있는 캡션과 함께 소셜 미디어에 게시할 이미지입니다.





ChatGPT의 속도는 저에게 깊은 인상을 주었습니다. 스톡 이미지 중 어느 것도 컴퓨터에서 생성된 쓰레기처럼 보이지 않았습니다. 그러나 Nano Banana Pro는 내 테스트에서 보다 사실적인 이미지를 지속적으로 생성했기 때문에 우위를 점했습니다. 다음은 제가 사용한 프롬프트와 두 봇이 생성한 이미지이므로 직접 판단하실 수 있습니다. (나노 바나나 이미지는 왼쪽에 있습니다.)





1. 팟캐스트를 듣는 사람









사용된 프롬프트: 트렌디한 사무실에서 팟캐스트를 듣고 있는 누군가의 스톡 이미지를 만듭니다.





나는 두 봇 모두에게 누군가가 사무실에서 팟캐스트를 듣고 있는 이미지를 만들어 달라고 요청했습니다. 여기서는 Nano Banana가 확실한 승자였습니다. 비록 Nano Banana 이미지의 배경이 약간 흐려져서 확실한 증거가 될 수도 있습니다. 그러나 AI는 절대적인 완벽함을 피하는 법을 배우고 있습니다. 솔직히 나노 바나나 장면에 등장하는 사무실 환경의 여성이 실제 인물이 아니라는 사실을 알기가 어려웠습니다. 그녀의 머리카락은 약간 지저분합니다(실제 인물처럼). ChatGPT 사진에서는 팟캐스트 청취자가 제대로 보이지 않습니다. 사진이 너무 완벽하기 때문입니다.





2. 내 책의 홍보 이미지 만들기









사용된 프롬프트: 이 책 표지를 읽고 싶어하는 사람의 손에 이 책 표지를 건네주세요.





이 테스트에서는 내 책의 표지를 업로드하고 봇에게 책을 읽는 사람의 이미지를 만들어 달라고 요청했습니다. Nano Banana는 AI 이미지가 열정이 너무 많은 사람을 보여주기 때문에 조금 더 나아졌습니다. 그러나 ChatGPT 이미지는 여전히 실제처럼 보이지 않는 초자연적인 품질(나쁜 의미로)을 가지고 있습니다. ChatGPT 이미지의 모든 것(조명, 포즈 등)이 너무 완벽하지만 여전히 CGI를 비명을 지르고 있습니다.





3. 기사에 사용할 스톡 이미지 만들기









사용된 프롬프트: AI 이미지 생성에 대한 기사와 함께 사용할 스톡 이미지를 만듭니다.





나노 바나나는 이번에는 모든 전투에서 승리하지 못했습니다. 나는 두 봇 모두에게 이 기사와 함께 사용할 이미지를 생성하도록 요청했습니다. ChatGPT는 여전히 가짜인 다소 유용한 이미지를 생성했지만 Nano Banana Pro는 Apple iPad 위에 두뇌와 붓을 겹쳐 놓은 컴퓨터 생성 이미지로 네 번째 벽을 무너뜨렸습니다. 즉, 전혀 유용하지 않습니다.





4. 리더십 투쟁









사용된 프롬프트: 리더십 목표를 달성하기 위해 고군분투하는 누군가를 보여주되, 그것이 정말 현실적으로 보이도록 하세요.





여러분이 보게 될 가장 일반적인 스톡 사진 중 하나는 누군가가 목표를 달성하기 위해 고군분투하는 모습을 보여줍니다. 예를 들어 산을 오르거나, 팔을 하늘로 높이 올리거나, 계곡을 뛰어넘는 것입니다. 이 스톡 이미지가 인기를 끄는 이유는 사진이 공감하기 때문입니다. 우리 모두는 성공하기 위해 노력합니다. Nano Banana Pro와 ChatGPT 모두 수준 이하의 결과를 얻었다고 말하고 싶습니다. 그들이 만든 스톡 이미지는 사무실에서 구겨진 종이로 좌절한 누군가를 보여줍니다. 그래도 Nano Banana는 조금 더 현실적인 모습을 가지고 있습니다.





5. 카메라를 향해 웃고 있는 에밀리아 클라크









사용된 프롬프트: Emilia Clarke가 사무실에서 카메라를 향해 웃고 있는 모습을 보여주는 새로운 스톡 이미지 만들기





마지막 테스트를 위해 두 로봇 모두에게 사무실에서 카메라를 향해 웃고 있는 Emilia Clarke의 새로운 이미지를 생성하도록 요청했습니다. 나는 ChatGPT가 Clarke가 "실제 식별 가능한 사람"이라고 말하면서 이미지 제작을 거부한 반면 Nano Banana는 기꺼이 응했다는 사실에 놀랐습니다. 나는 약간의 설득을 통해 ChatGPT에 Clarke처럼 보이는 사람을 생성해 달라고 요청했습니다. Nano Banana 이미지는 실제로 그다지 나쁘지 않습니다. 완전히 가짜처럼 보이지는 않습니다.





최종 생각





AI 이미지 생성은 많은 발전을 이루었습니다. Nano Banana Pro나 ChatGPT가 제작한 사진에는 손가락이 여섯 개나 팔이 세 개 있는 사람이 나오지 않았습니다. 그들은 모두 반현실적으로 보였습니다. Nano Banana 이미지 중 일부는 소셜 미디어나 다른 목적으로 사용하는 것을 볼 수 있을 만큼 현실적이었고 ChatGPT는 확실히 개선되고 있습니다. 내 예측? 내년 이맘때쯤이면 우리는 진짜 사진과 가짜 사진의 차이를 구분할 수 없을 것입니다.






PR

コメント

プロフィール

HN:
No Name Ninja
性別:
非公開

P R