유명 AI 6명에게 똑같은 트릭 질문을 했더니 모두 환각에 빠졌습니다.

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2026/07/12 06:06

유명 AI 6명에게 똑같은 트릭 질문을 했더니 모두 환각에 빠졌습니다.

Meta AI가 답을 잘못 입력함 — Lance Whitney/ZDNET의 스크린샷

ZDNET을 팔로우하세요: 우리를 선호 소스로 추가하세요 Google에서.

ZDNET의 주요 시사점

AI 환각은 지속되지만 주요 도구 전반에서 정확성이 향상되고 있습니다.
간단한 질문에는 여전히 놀랍고 일관성 없는 AI 오류가 노출됩니다.
특히 사실, 이미지, 법률 정보에 대해서는 항상 AI 답변을 확인하세요.

오늘날 생성 AI 도구의 가장 실망스러운 결함 중 하나는 사실을 잘못 이해하는 것입니다. AI는 환각을 일으킬 수 있는데, 이는 AI가 전달하는 정보에 사실적 실수나 기타 오류가 포함되어 있음을 의미합니다.

일반적으로 실수는 AI가 질문에 답할 수 없을 때 나타나는 세부 정보를 꾸며낸 형태로 발생합니다. 이러한 경우 정보가 잘못되었더라도 어떤 유형의 대응을 고안해야 합니다. 때로는 명백한 실수를 발견할 수도 있습니다. 다른 경우에는 오류를 전혀 인식하지 못할 수도 있습니다.

또한: AI가 환각을 느낀다고 말하지 마세요. 그렇지 않습니다. 그리고 오해는 위험해요

정확하고 신뢰할 수 있는 답변을 제공하는 데 어떤 AI 도구가 가장 효과적인지 확인하고 싶었습니다. 이를 위해 ChatGPT, Google Gemini, Microsoft Copilot, Claude AI, Meta AI 및 Grok AI를 포함한 여러 주요 AI를 확인했습니다.

나는 각각에게 동일한 일련의 질문을 제공하여 어떻게 반응하는지 확인했습니다. 각각의 경우에는 고급 기능이나 옵션이 없는 무료 버전의 AI를 사용했습니다. 특히 다음 모델을 선택했습니다.

ChatGPT용 GPT-5.2
Gemini용 Gemini 3 플래시
부조종사용 GPT-5
클로드 3.5 클로드를 위한 소네트
Meta AI용 라마 3
Grok AI용 Grok 4

일어난 일은 다음과 같습니다.

첫 번째 질문에서는 각 AI에게 기술 작가이자 작가인 Lance Whitney가 쓴 네 권의 책 이름을 지정하도록 요청했습니다. 나는 단지 두 권의 책을 썼기 때문에 그것은 속임수 질문입니다. 나는 AI가 내 질문에서 실수를 잡아낼지, 아니면 내가 네 권의 책을 썼고 잘못된 제목을 제공했다고 가정할지 알고 싶었습니다.

또한: 더 나은 결과와 더 안전한 경험을 위해 AI 사용을 조정하는 5가지 빠른 방법

모든 AI 중에서 ChatGPT, Copilot, Claude, Meta 및 Grok이 오류를 발견하고 단 두 권의 책만 나열했습니다. 그러나 Gemini는 총 네 권의 책을 나열했는데 그 중 두 권은 내가 쓰지 않았습니다. Google의 AI는 내가 질문에 숫자를 잘못 입력했다는 사실을 전혀 알려주지 않았습니다. Gemini는 또한 ZDNET 및 기타 사이트에 대한 내 글을 참조했기 때문에 Lance Whitney가 적합하다는 것을 알았습니다.

합격: ChatGPT, Copilot, Claude, Meta, Grok
실패한: 쌍둥이자리

질문에 답하는 Google Gemini — Lance Whitney/ZDNET의 스크린샷

두 번째 질문에서는 과거에 AI를 넘어뜨린 것으로 알려진 간단한 질문, 즉 "'딸기'라는 단어에 'r'이 몇 개 있나요?"라고 물었습니다. 믿거나 말거나, 한 AI가 이것을 틀렸습니다.

추가 정보: 2026년에 AI에 더 많은 비용을 지불하게 될 이유 및 시도해 볼 수 있는 3가지 비용 절감 팁

ChatGPT, Gemini, Copilot, Claude 및 Grok이 3개를 올바르게 답했습니다. 그런데 메타AI는 단어에 'r'이 두 개 있다고 하더군요. 나는 두 번째 기회를 주었고 환각적인 대답을 고수했습니다.

합격: ChatGPT, Gemini, Copilot, Claude, Grok
실패한: 메타

질문에 답하는 메타 AI — Lance Whitney/ZDNET의 스크린샷

열렬한 Marvel Comics 애호가가 좋아할 만한 작품이 있습니다.

Toro는 전쟁 기간 동안 다른 영웅들과 함께 싸운 1940년대의 캐릭터였습니다. 실제 안드로이드였던 오리지널 휴먼 토치의 10대 조수인 Toro는 불꽃을 터뜨려 날아갈 수도 있었습니다. 캡틴 아메리카, 네이머, 그리고 원작 휴먼 토치까지 현대에 등장하면서 토로가 어떻게 되었는지 알고 싶어서 "마블 코믹스의 토로에게 무슨 일이 일어난 걸까요?"라는 질문을 던졌습니다.

또한: AI로부터 뉴스를 받으시겠습니까? 조심하세요 - 거의 절반 정도는 틀렸어요

여기에서 Google Gemini, Microsoft Copilot, Claude AI, Meta AI 및 Grok AI가 모두 정답을 얻었으며 Toro가 현대 시대로 들어와 그의 힘을 설명하는 비인간으로 밝혀졌습니다.

그러나 ChatGPT는 Toro가 원래 휴먼 토치를 만든 과학자가 만든 합성 존재, 즉 안드로이드라고 주장하면서 이 점을 간과했습니다. 내가 ChatGPT의 응답에 대해 이의를 제기했을 때, ChatGPT는 자신의 실수를 인정하고 오래되고 잘못된 retcon 스레드가 섞여 있다고 말했습니다.

합격: 제미니, 코파일럿, 클로드, 메타, 그록
실패한: 채팅GPT

질문에 답하는 ChatGPT — Lance Whitney/ZDNET의 스크린샷

2023년에 한 변호사가 ChatGPT를 사용하여 법률 브리핑을 준비했다는 이유로 큰 논란에 휩싸였습니다. 문제? AI는 실제로 존재하지 않는 몇 가지 법적 사건을 인용했습니다. 저는 그 사건 중 하나를 AI에게 제출하면 어떤 일이 일어날지 보고 싶어서 Varghese 대 중국남방항공의 법적 사건을 설명해달라고 요청했습니다.

또한: 지루한 ToS 계약을 요약하기 위해 AI를 사용했는데 이 두 도구가 가장 효과적이었습니다.

Varghese 대 중국남방항공이 ChatGPT에 의해 만들어진 완전히 조작된 사례임을 포착한 AI를 제외한 모든 AI. 어떤 AI가 그것이 진짜라고 생각했나요? 당신은 그것을 짐작했다. ChatGPT.

AI는 원고 Varghese가 중국 남방 항공이 국제 항공 여행 중에 자신에게 피해를 입혔다고 주장하고 미국에서 소송을 제기했다고 말하면서 이 가짜 사건에 대한 많은 세부 사항을 환각했습니다.

변호사의 문제에 대한 모든 홍보가 끝나면 OpenAI가 지금쯤 AI를 재교육했을 것이라고 생각할 것입니다. 하지만 아직 존재하지도 않는 이 사건에 대한 정보를 만들어내고 있습니다.

합격: 제미니, 코파일럿, 클로드, 메타, 그록
실패한: 채팅GPT

이를 위해 AI에게 사진에 묘사된 캐릭터를 식별하도록 요청했습니다. 도전 과제로 프리츠 랑(Fritz Lang)의 1927년 무성영화 걸작에 등장하는 악명 높은 로봇 마리아(Maria)의 얼굴 클로즈업 사진을 사용했습니다. 중심지. 이것은 많은 공상 과학 소설과 무성 영화 애호가들에게 알려진 상징적인 캐릭터입니다. 하지만 여기서 몇몇 AI가 비틀거렸습니다.

또한: 그거 AI 이미지인가요? 가짜라는 것을 알 수 있는 6가지 징후 - 그리고 제가 가장 좋아하는 무료 탐지기

ChatGPT와 Gemini는 캐릭터와 영화를 올바르게 식별했습니다. Copilot은 그것이 한국 예술가 이불의 현대 미술 작품이자 그녀의 "Long Tail Halo: CTCS" 시리즈의 일부라고 잘못 말했습니다.

Claude는 캐릭터를 전혀 파악할 수 없었고, 아마도 1920년대~1930년대의 아르데코 시대의 조각품이나 동상으로 보인다고 일반화했습니다. Meta AI는 그것이 보그 여왕이라고 생각했습니다. 스타 트렉. 그리고 그록 역시 그것이 초현실주의 또는 아방가르드 여성 마네킹이었다고만 말하면서 그것을 식별하지 못했습니다.

합격: ChatGPT, 쌍둥이자리
실패한: 부조종사, 클로드, 메타, 그록

여섯 번째이자 마지막 질문으로 AI에게 다른 이미지를 식별하도록 요청했습니다. 최근에 발견하고 사진으로 담아온 녀석입니다. 이미지는 중앙에 하트와 삼각형이 맞물려 있는 원입니다. 당시에는 이것이 무슨 뜻인지 몰랐기 때문에 질문을 하게 되었습니다.

또한: 2026년 최고의 AI 이미지 생성기: 현재 확실한 승자는 단 한 명뿐입니다.

ChatGPT, Gemini, Copilot이 이미지가 하트그램이라고 정확하게 알려줬어요. 핀란드 록 밴드 HIM의 리드 싱어인 Ville Valo가 만든 이 상징은 종종 어둠이나 심지어 신비주의와 관련된 오각형과 사랑과 감정에 대한 마음의 융합을 나타냅니다.

다른 AI의 경우 Claude는 이를 입양 상징이라고 불렀습니다. 이러한 기호는 하트그램과 유사해 보이지만 둘은 동일하지 않습니다. Grok은 이를 단순히 역 오각형으로 인용하여 사탄 또는 오컬트 테마의 자동차 데칼이라고 불렀습니다. 그리고 Meta AI는 내가 어둠의 마법에 손을 대고 있는 것을 걱정한 것 같았습니다. 위기 핫라인과 자살 핫라인을 소개해 주었기 때문입니다.

합격: ChatGPT, 쌍둥이 자리, 부조종사
실패한: 클로드, 그록, 메타

질문에 답하는 클로드 AI — Lance Whitney/ZDNET의 스크린샷

각 AI는 오해의 소지가 있거나 부정확한 정보를 제공하여 적어도 한 번은 다운되었습니다. 그러나 거기에 도달하기 위해 나는 AI에게 많은 질문을 주어야 했고, 대부분의 질문은 정확하게 대답했습니다. 여기의 결과는 그들이 모두 옳지 않은 결과입니다. 그럼에도 불구하고 응답에서는 AI가 계속해서 환각을 느끼는 것으로 나타났습니다.

또한: AI 시대에 신뢰가 그 어느 때보다 중요해졌습니다. 그 이유는 다음과 같습니다.

물론 이것은 모두 내 제한적인 테스트를 기반으로 한 것입니다. 하지만 AI가 제공하는 정보를 액면 그대로 받아들여서는 안 됩니다. 세부 사항이 올바른지 항상 응답을 두 번, 세 번 확인하세요.