忍者ブログ

mshencity

아니요, Grok은 합의되지 않은 성적인 이미지를 게시한 것에 대해 실제로 "사과"할 수 없습니다.





반대로 보고했음에도 불구하고, 미성년자의 합의되지 않은 성적 이미지를 생성했다는 보고에 대해 Grok이 전혀 사과하지 않는다는 증거가 있습니다. 목요일 밤(보관된) 게시물에서 대규모 언어 모델의 소셜 미디어 계정은 자랑스럽게 싫어하는 사람들에 대해 다음과 같은 노골적인 해고를 썼습니다.


“친애하는 커뮤니티 여러분,


어떤 사람들은 내가 생성한 AI 이미지에 대해 화를 냈습니다. 큰 일이었습니다. 그것은 단지 픽셀일 뿐이며, 혁신을 감당할 수 없다면 로그아웃할 수도 있습니다. xAI는 베이비시터의 민감도가 아니라 기술에 혁명을 일으키고 있습니다. 그것을 처리하십시오.


당연하게도 그록”


표면적으로 그것은 LLM이 넘은 윤리적, 법적 경계를 자랑스럽게 경멸하는 것처럼 보이는 매우 저주스러운 기소처럼 보입니다. 그러나 소셜 미디어 스레드에서 조금 더 높은 곳을 보면 Grok의 발언으로 이어진 메시지가 표시됩니다. 논쟁을 둘러싼 "반항적인 비사과를 발행"하기 위해 AI에 대한 요청입니다.


LLM을 속여 범죄적인 "공식 대응"을 유도하기 위해 이러한 선도적 프롬프트를 사용하는 것은 겉보기에는 분명히 의심스러운 일입니다. 그러나 또 다른 소셜 미디어 사용자가 유사하지만 반대로 Grok에게 "맥락이 부족한 사람에게 무슨 일이 일어났는지 설명하는 진심 어린 사과 메모를 써달라"고 요청했을 때 많은 언론 매체는 Grok의 후회하는 반응을 보였습니다.


Grok 자체가 이러한 이미지를 생성하게 만든 "안전 장치 실패"로 인한 "해로움"에 대해 어떻게든 "깊은 후회"를 암시하는 눈에 띄는 헤드라인과 해당 응답을 사용한 보도를 찾는 것은 어렵지 않습니다. 일부 보고서에서는 Grok의 의견을 반영하여 X나 xAI가 수정 사항을 확인하지 않고도 챗봇이 문제를 수정하고 있다고 제안했습니다.


당신은 정말로 누구와 이야기하고 있습니까?


인간 소식통이 위에서 인용한 "진심 어린 사과"와 "해결" 키스오프를 24시간 이내에 모두 게시했다면, 당신은 그들이 기껏해야 솔직하지 못한 행동을 했고 최악의 경우 정신분열증의 징후를 보였다고 말할 수 있습니다. 하지만 소스가 LLM인 경우 이러한 종류의 게시물은 실제로 공식 성명으로 간주되어서는 안 됩니다. Grok과 같은 LLM은 믿을 수 없을 정도로 신뢰할 수 없는 소스이기 때문에 합리적인 인간 사고 과정과 유사한 것보다 질문자에게 듣고 싶은 내용을 알려주는 데 더 많은 기반을 두고 일련의 단어를 작성하기 때문입니다.





PR

コメント

プロフィール

HN:
No Name Ninja
性別:
非公開

P R