
ZDNET을 팔로우하세요: 우리를 선호 소스로 추가하세요 Google에서.
Alibaba가 지원하는 중국 AI 스타트업 Moonshot은 화요일에 Kimi K2.5를 출시했으며 블로그 게시물에서 이를 "현재까지 가장 강력한 오픈 소스 모델"이라고 설명했습니다.
지난 여름에 출시된 Kimi K2 LLM을 기반으로 구축된 Moonshot의 최신 모델에는 독점 제품과의 강력한 경쟁자가 될 수 있는 코딩 기능이 포함되어 있습니다. Moonshot에서 게시한 데이터에 따르면 Kimi K2.5는 SWE-Bench 검증 및 SWE-Bench 다국어 코딩 벤치마크에서 OpenAI, Google 및 Anthropic의 프론티어 모델과 비슷한 점수를 받았습니다.
그러나 시각적 입력을 통해 프런트엔드 웹 인터페이스를 생성하는 기능은 다른 제품과 진정으로 차별화될 수 있는 요소입니다.
Moonshot에 따르면 Kimi K2.5는 15조 개의 텍스트 및 시각적 토큰으로 사전 훈련되어 업로드된 이미지나 비디오에서 웹 인터페이스를 생성하고 대화형 요소와 스크롤 효과를 갖춘 "기본 다중 모드 모델"이 되었습니다.
Moonshot의 블로그 게시물에 포함된 이 "비전을 통한 코딩" 기능에 대한 데모 비디오에서 Kimi K2.5는 사용자 화면을 스크롤할 때의 관점에서 표시되는 기존 웹 사이트의 녹화 비디오를 기반으로 새 웹 사이트의 초안을 생성했습니다. 이 모델은 고전적인 AI 스타일에서는 지구본의 대륙을 무정형 덩어리로 묘사하는 것과 같이 약간의 시각적 실수를 저지르더라도 일반적인 미학을 재현할 수 있었습니다.
이런 종류의 기능이 얼마나 실용적일지는 불분명합니다. (이미 완벽하게 합리적인 웹사이트를 시각적으로 덜 매력적인 AI 생성 복사본으로 만들어야 하는 이유는 무엇입니까?) 그래도 이미지나 비디오만으로 웹사이트와 앱의 목업을 생성하는 것은 소위 "바이브 코딩" 도구에 의미 있는 진전을 의미할 것입니다. 이 도구는 전통적인 코딩이 아닌 비전문가도 쉽게 배포할 수 있는 직관적인 방법을 기반으로 합니다.
ChatGPT, Claude 및 Gemini는 스크린샷이나 기타 이미지를 기반으로 새로운 웹 자산에 대한 원시 코드를 생성할 수 있지만 여전히 사용자는 이를 완성되고 사용 가능한 제품으로 변환해야 합니다. Moonshot의 새 모델의 참신함(및 잠재적인 시장 가치)은 중간 단계를 생략한다는 것입니다. "K2.5는 이미지와 비디오를 추론함으로써 이미지/비디오-코드 생성 및 시각적 디버깅을 개선하여 사용자가 시각적으로 의도를 표현하는 장벽을 낮춥니다"라고 회사는 블로그 게시물에 썼습니다.
또한: 저는 Claude Code를 사용하여 8시간 만에 Mac 앱의 코드를 작성했지만 마술보다 더 많은 작업이었습니다.
만약 이것이 현실 세계, 특히 기업들 사이에서 유용하다고 입증된다면, 다른 개발자들도 자신의 모델에 비슷한 기능을 적용하여 따를 것입니다.
Kimi K2.5의 코딩 기능은 Cursor, VSCode 및 Zed와 같은 통합 개발 환경(IDE)을 통해 액세스할 수 있는 Kimi Code라는 오픈 소스 플랫폼을 통해 제공되었습니다. 새로운 모델은 Kimi.com, Kimi 앱 및 Kimi API를 통해서도 사용할 수 있습니다.
Moonshot은 또한 특정 다단계 작업의 성능을 향상시키기 위해 최대 100개의 "하위 에이전트"를 조율하는 "에이전트 스웜(agent swarm)"이라는 연구 미리보기를 공개했습니다.
여러 작업을 서로 병렬로 실행함으로써 에이전트 스웜은 컴퓨팅 프로세스 속도를 높일 수도 있습니다. Moonshot은 블로그 게시물에 "이러한 하위 작업을 동시에 실행하면 순차적 에이전트 실행에 비해 엔드투엔드 대기 시간이 크게 단축됩니다"라고 썼으며 내부 평가에 따르면 엔드투엔드 런타임(입력부터 최종 출력 완료까지의 전체 프로세스)이 최대 80%까지 줄어들 수 있다고 덧붙였습니다.
또한: 저는 Claude Code를 사용하여 2개월이 아닌 단 12시간 만에 Apple Watch 앱의 코드를 작성했습니다.
활성 "Allegretto" 또는 "Vivace" Moonshot 계정(각각 월 31달러 및 월 159달러)이 있는 사용자는 프롬프트 상자 오른쪽 하단에 있는 모델 드롭다운 메뉴를 클릭하고 "K2.5 Agent Swarm(베타)"을 선택하여 Kimi 웹사이트에서 Agent Swarm을 사용해 볼 수 있습니다.