
Google은 가장 유능한 AI 기반 챗봇과 서비스를 조용히 구축해 온 오랜 역사를 가지고 있지만, Project Genie라고 불리는 최신 실험은 우리 대부분이 본 것과는 다릅니다. Google DeepMind에서 개발한 Genie는 대화형 디지털 환경을 생성할 수 있는 텍스트-디지털 세계 생성기입니다.
우리는 짧은 텍스트 기반 프롬프트로 텍스트, 이미지, 심지어 비디오까지 생성하는 데 익숙해졌지만, Genie는 문자 그대로 간단한 스케치, 사진, 심지어 간결한 프롬프트까지 컴퓨터에서 자신만의 디지털 캐릭터를 통해 이동할 수 있는 샌드박스 스타일의 세계로 변환할 수 있습니다.
[embed]https://www.youtube.com/watch?v=YxkGdX4WIBE[/embed]
게임 엔진도, 코딩도, 3D 디자인 능력도, 최고 수준의 하드웨어 요구 사항도 없습니다. Project Genie는 Google이 '세계 모델'이라고 부르는 것으로, 사용자가 이동할 때 디지털 환경을 (실시간으로) 렌더링하는 생성적 AI 모델입니다.
즉, 사용자의 움직임과 주변 환경에 미치는 영향을 예측하고 물리학을 고려하면서 주변 세계를 구축합니다. Google은 Genie 3, Gemini 및 Nano Banana Pro라는 세 가지 가장 진보된 모델을 결합하여 이를 가능하게 했습니다.
따라서 적절한 프롬프트 또는 적절한 이미지를 사용하면 "로봇공학, 모델링 애니메이션 및 픽션부터 위치 탐색 및 역사적 설정에 이르기까지" 모든 실제 시나리오의 시뮬레이션을 만들 수 있습니다.
[embed]https://www.youtube.com/watch?v=s40a06a5wIc[/embed]
대화형 디지털 경험은 세계 스케치, 세계 탐험, 세계 리믹싱이라는 세 가지 핵심 기능을 기반으로 합니다. 세계 스케치에는 텍스트나 이미지를 살아있고 확장되는 환경으로 변환하는 작업이 포함됩니다.
그렇다면 세계 탐험은 디지털 세계의 요소들과 상호 작용하는 것입니다. 그런 다음 모델은 자체적으로 원인과 결과를 파악합니다. 마지막으로, 사용자는 기존 세계에서 영감을 얻거나 이를 기반으로 구축하여 기존 세계를 리믹스할 수도 있습니다.
전통적으로 대화형 세계를 만드는 것은 매우 느리고 기술적으로 까다로우며 비용이 많이 들기 때문에 오픈 월드 게임 개발자(내가 말하는 개발자가 누구인지 아시겠지만)가 새 버전을 출시하는 데 10년 이상이 걸릴 수 있습니다.
[embed]https://www.youtube.com/watch?v=dO0csRgxo_A[/embed]
Project Genie는 적은 자원으로도 빠른 게임 프로토타입 제작, 시뮬레이션 테스트, 창의적인 실험을 가능하게 함으로써 업계에 실질적으로 혁명을 일으킬 수 있습니다.
그러나 슬픈 부분은 Project Genie가 (아직) 세련된 소비자 제품이 아니라는 것입니다. 현재로서는 미국 내 18세 이상의 Google AI Ultra 가입자에게만 제공됩니다. 현재 Google이 제공하는 구독 등급 중 가장 비싼 구독 등급입니다(월 249.99달러).
AI 기반 경험 생성기가 현재 개발 중이라는 점을 감안할 때 사용자는 생성된 세계가 완벽할 것이라고 기대해서는 안 됩니다. 캐릭터 컨트롤도 투박하게 느껴질 수 있습니다. 그러나 그럼에도 불구하고 Project Genie는 AI가 단지 콘텐츠를 생성하는 것이 아니라 필요에 따라 전체 경험을 구축하는 미래를 엿볼 수 있는 거대한 무언가의 시작일 수 있습니다.