
ZDNET을 팔로우하세요: 우리를 선호 소스로 추가하세요 Google에서.
AI에 대한 많은 두려움 중 하나는 AI가 사람들의 직업을 대체할 것이라는 점입니다. 그리고 새로운 연구에 따르면 그러한 두려움이 근거가 없는 것은 아니지만 적어도 현재로서는 과장되었을 수 있다고 합니다.
인공지능이 인간만큼 효과적으로 프로젝트를 완료할 수 있는지 여부를 측정하기 위해 연구자 그룹은 여러 AI에 수행할 일련의 작업 프로젝트를 제공했습니다. 실제 원격 프리랜서 작업자가 이미 수행한 프로젝트에는 게임 개발, 제품 디자인, 아키텍처, 데이터 분석 및 비디오 애니메이션이 포함되었습니다.
보다 구체적으로 작업에는 다음과 같은 과제가 포함되었습니다.
또한: Gemini, Perplexity 및 Grok AI에 대해 ChatGPT의 Deep Research를 테스트하여 어느 것이 가장 좋은지 확인했습니다.
다양한 난이도를 포함하는 실제 사람들이 수행하는 작업에는 $10,000의 비용이 들고 완료하는 데 100시간 이상이 걸렸습니다. AI 자동화가 인간이 수행하는 원격 작업과 어떻게 비교되는지 측정하기 위해 연구원들은 원격 노동 지수(RLI)라는 벤치마크를 설정했습니다.
연구원들이 설명했듯이 RLI의 목적은 원격 작업 플랫폼에서 수백 개의 길고 실제적이고 경제적으로 가치 있는 프로젝트를 자동화하는 AI의 능력을 테스트하는 것입니다.
또한: ChatGPT Plus는 $20의 가치가 있나요? Free 및 Pro 요금제와 비교해 보았는데, 여기에 제 조언이 있습니다.
연구에 사용된 AI 모델은 Manus, Grok 4, Sonnet 4.5, GPT-5, ChatGPT 에이전트 및 Gemini 2.5 Pro였습니다.
그렇다면 그들은 어떻게 공연했는가? 별로 좋지 않습니다.
연구원들은 "AI 시스템이 기존의 많은 벤치마크를 포화시켰지만, 최첨단 AI 에이전트가 RLI에서 거의 바닥 수준의 성능을 발휘한다는 사실을 발견했습니다."라고 밝혔습니다. "가장 성능이 뛰어난 모델의 자동화율은 2.5%에 불과합니다. 이는 현대 AI 시스템이 위탁 작업으로 받아들여질 만큼의 품질 수준으로 대부분의 프로젝트를 완료하지 못한다는 것을 보여줍니다."
마누스가 2.5%의 성과율로 가장 좋은 성적을 거두었습니다. Grok 4와 Sonnet 4.5는 2.1%로 동점을 기록했고, GPT-5가 1.7%로 그 뒤를 이었고, ChatGPT 에이전트가 1.3%로 그 뒤를 이었습니다. Gemini는 0.8%로 꼴찌를 기록했습니다.
또한: AI가 당신의 일을 위해 다가오고 있나요? 당신의 두려움을 달래줄 수 있는 노동 지표 하나를 소개합니다.
연구원 중 한 명인 Dan Hendrycks는 X의 게시물을 통해 테스트와 결과에 대해 설명했습니다. Hendrycks는 AI가 똑똑하기는 하지만 아직 그다지 유용하지 않으며 전체 자동화 비율이 3% 미만이라는 점을 인정했습니다.
AI가 업무에 실패한 이유를 설명하기 위해 Hendrycks는 많은 AI 기능이 부족하다고 말했습니다. AI는 장기 기억 저장 장치가 없기 때문에 현장에서 학습하지 않습니다. 게다가 AI의 시각적 능력은 제한되어 있어 여러 작업을 수행하는 데 필요한 기술입니다.
이 모든 것은 AI로 대체될 것을 걱정하는 근로자들에게는 좋은 소식으로 들립니다. 오른쪽? 글쎄, 아직 이력서를 찢지 마세요. 이 테스트에는 다소 고급 기술이 필요한 창의적인 작업이 구체적으로 포함되었습니다. AI가 다른 유형의 작업과 프로젝트를 더 쉽게 처리할 가능성이 높습니다. 게다가 AI는 점점 더 똑똑해지고 더 많은 능력을 갖추게 될 것입니다.
또한: 새로운 직업이 필요하신가요? 이러한 AI 역할은 미국에서 가장 빠르게 성장하고 있다고 LinkedIn은 말합니다.
연구원들은 "완전한 자동화 비율은 낮지만 우리의 분석에 따르면 모델은 꾸준히 개선되고 있으며 이러한 복잡한 작업의 진행 상황은 측정 가능하다는 것을 보여줍니다."라고 말했습니다. "이는 AI 자동화의 궤적을 추적하기 위한 공통 기반을 제공하여 이해관계자가 그 영향을 사전에 탐색할 수 있도록 해줍니다."
네, 만약을 대비해 이력서를 최신 상태로 유지하는 것이 가장 좋습니다.

2014년에도 여전히 공장 스테레오가 멈춘 듯한 느낌이 드는 자동차가 있다면, 이것은 여러분이 할 수 있는 가장 깔끔한 삶의 질 업그레이드 중 하나입니다. Kenwood DMX4710S 6.8인치 멀티미디어 수신기는 $299.99이는 $100 할인 그만큼 $399.99 비교값. 주요 특징은 간단합니다. Apple CarPlay와 Android Auto를 유선으로 연결하면 휴대폰과 같은 방식으로 최신 내비게이션, 통화, 문자, 음악을 이용할 수 있으면서도 운전 중에 더 안전하고 쉽게 사용할 수 있습니다.
이 제품은 기존 헤드 유닛을 대체하도록 설계된 6.8인치 터치스크린 멀티미디어 수신기입니다. 유선 CarPlay/Android Auto를 사용하면 휴대폰을 연결하고 지도, 팟캐스트, 재생 목록 및 음성 제어를 위한 친숙한 인터페이스를 이용할 수 있습니다. 일관된 연결을 선호하고 운전 중에 휴대전화를 충전하려는 경우 유선도 도움이 됩니다.
이는 "일상 드라이버" 업그레이드입니다. 대시보드에 이리저리 흔들리는 휴대폰 마운트보다 더 선명한 인터페이스, 더 쉬운 미디어 제어, 훨씬 더 나은 탐색 경험을 제공합니다.
이 거래는 모든 여행, 출퇴근, 심부름, 도로 여행 등 모든 것을 개선하는 몇 안 되는 업그레이드 중 하나이기 때문에 의미가 있습니다. CarPlay/Android Auto는 길 안내 및 핸즈프리 통신을 위해 휴대폰을 사용하는 경우 특히 유용합니다. 운전 중 휴대전화를 만지작거리는 마찰과 유혹을 줄여줍니다.
또한: 설치 부품이 여전히 필요할 수 있으므로 이 카테고리에서는 $100 할인이 적용됩니다. 차량에 따라 대시 키트, 배선 하니스, 안테나 어댑터 및 스티어링 휠 제어 어댑터가 필요할 수 있습니다. 전문적인 설치 비용을 지불하는 경우 이는 또 다른 비용입니다. 이 할인은 올바르게 수행하는 데 따른 "추가 비용"을 상쇄하는 데 도움이 됩니다.
~에 $299.99Kenwood DMX4710S는 깨끗한 터치스크린과 신뢰할 수 있는 유선 CarPlay/Android Auto로 구형 자동차를 현대화하려는 경우 확실한 가치를 제공합니다. 설치를 편안하게 처리할 수 있다면(또는 이미 비용을 지불할 계획이 있다면) 지금이 구매하기에 현명한 시기입니다. 특히 무선 전화 통합을 원하는 경우 다른 모델이 필요하지만 간단하고 안정적인 업그레이드를 위해서는 이 거래를 정당화하기 쉽습니다.

이는 월간 구독을 기꺼이 감수하지 않을 수도 있는 클라우드에 관심이 있는 Xbox 플레이어에게 적당히 유용한 옵션이라고 가정합니다. 그러나 Microsoft가 Cloud Gaming을 사용하여 가끔 플레이어에게 새로운 방식으로 다가갈 수 있는 좀 더 창의적인 방법을 생각해 낼 수도 있을 것 같습니다.
Microsoft가 스트리밍 플레이어에게 30분 분량의 데모 스트림을 제공하지 못하는 이유는 무엇입니까? 어느 짧은 광고를 시청하는 대가로 Xbox Cloud Gaming 타이틀을 사용할 수 있습니까? 아니면 단순히 Xbox Live Arcade 스타일의 판매 전략으로 사용할 수 있습니까? 아니면 Netflix처럼 가끔 광고를 시청하려는 플레이어에게 스트리밍 전용 Game Pass 구독에 대한 할인된 액세스를 제공하는 것은 어떨까요? Microsoft는 최신 영화에 iTunes와 같은 서비스를 제공하는 것처럼 플레이어가 며칠 동안 타이틀의 디지털 사본을 대여하기 위해 몇 달러를 지출하도록 할 수도 있습니다.
그것은 우리 머리 꼭대기에 있는 몇 가지 아이디어일 뿐입니다. 그리고 그들은 모두 Xbox 플레이어가 이미 구매한 게임의 복사본을 스트리밍할 수 있는 방법으로 광고를 사용하는 것보다 잠재적으로 더 영향력이 있다고 느낍니다.
2019년에 우리는 Stadia의 엄격한 플레이 전 구매 스트리밍 비즈니스 모델이 결국 불운한 클라우드 게임 실험의 매력을 어떻게 제한했는지 언급했습니다. Microsoft는 Google의 실패로부터 교훈을 얻어 게임 경험을 위해 최신 고급 하드웨어에 액세스할 수 없는 플레이어에게 다가가기 위해 스트리밍을 사용하는 새로운 방법을 실험해야 합니다.

번지(Bungie)가 오랫동안 개발해 온 추출 슈팅 게임 마라톤(Marathon)이 3월 5일 출시될 예정이며, 사전 주문 개시에 앞서 새로운 게임 플레이 예고편이 공개되었습니다. PlayStation 5, Xbox Series X|S, PC로 출시되며 가격은 40달러입니다.
예고편에서는 러너로 플레이하면서 군대를 파견하고 귀중한 장비를 가지고 탈출하기 위해 침투하게 될 식민지인 Tau Ceti IV를 플레이어에게 다시 소개합니다. 다양한 능력과 특혜를 제공하는 다양한 Runner Shell을 활용하여 파티에서 역할을 정의하거나 솔로 플레이를 계획하는 경우 구축 방법을 선택할 수 있습니다. 아래 액션에서는 Bungie의 시그니처 총격전을 선보이며 아트 스타일은 그 어느 때보다 인상적입니다.
마라톤은 당초 2025년 9월 23일에 출시될 예정이었지만 게임 메커니즘에 대한 비판을 불러일으킨 일련의 공개 테스트로 인해 무기한 연기되었습니다. Bungie는 개발 시간이 길어질수록 게임의 생존 요소, 스토리 및 세계 구축, 솔로 및 듀오 플레이어를 위한 더 나은 소셜 경험 등을 개선할 계획인 주요 영역에 대해 언급했습니다.
마라톤을 출시할 소니는 게임이 2026년 3월 말 이전에 출시될 것이라고 팬들에게 약속했으며, 번지 또한 출시에 앞서 공개 베타가 2월 말에 진행될 것이라고 확인했습니다. Marathon의 개발은 논란으로 가득 차 있었으며 Bungie는 결국 허가 없이 범인의 자산을 훔쳤다고 비난한 아티스트와 문제를 해결했습니다.
출시가 지연된 이후 Arc Raiders는 추출 슈팅 장르를 폭풍처럼 몰아치며 수십만 명의 동시 플레이어를 확보하고 출시 후 몇 달 동안 이를 유지했습니다.
분석 회사인 유사한 웹(Similarweb)의 최근 추정에 따르면 Meta의 Threads는 모바일에서 Elon Musk의 X보다 훨씬 앞서 나가고 있습니다. 보고서. 1월 첫 번째 기간 동안 Threads는 전 세계적으로 모바일 장치에서 일일 평균 약 1억 4,300만 명의 활성 사용자를 기록했으며, X의 경우 약 1억 2,600만 명에 달했습니다.
Similarweb의 전년 대비 스냅샷에 따르면 전년 대비 37.8% 증가한 반면, X의 일일 모바일 시청자는 같은 기간 동안 11.9% 감소했습니다. 미국에서는 상황이 더 혼합되어 있는데, X는 여전히 모바일에서 좁은 우위를 점하고 있습니다. 유사한 웹 데이터에 따르면 X는 1월 초 일일 활성 미국 모바일 사용자가 약 2,120만 명인 반면 Threads의 경우 약 1,950만 명입니다.
그러나 Threads의 미국 모바일 사용량은 지난 한 해 동안 상당히 빠르게 증가하여 X의 18%에 비해 거의 42%나 급증했습니다. X는 데스크톱에서 훨씬 더 큰 규모를 유지하고 있으며 일일 사용자 수는 약 1억 5천만 명에 달하거나 전 세계적으로 방문하는 반면 Threads의 웹 존재 수는 9백만 명에 불과합니다.
Forbes는 또한 Twitter 창립자 Jack Dorsey가 시작한 또 다른 경쟁 텍스트 기반 플랫폼인 의 유사한 웹 데이터에 대해서도 보고했습니다. Dorsey는 2024년 여름에 이사회를 떠났고 나중에 다음과 같이 말했습니다. 그는 Twitter와 관련하여 Bluesky가 "회사로서 우리가 저지른 모든 실수를 말 그대로 반복"하고 있다고 믿었습니다. 소셜 네트워크는 2024년에 등록을 시작했으며 현재 일일 모바일 사용자 기반은 360만 명에 달합니다. 이 사용자 수는 전년 대비 44.4% 감소했습니다.
X는 xAI의 Grok 챗봇을 통해 다시 한 번 뜨거운 물에 빠졌습니다. 이 챗봇은 사진의 동의 없이 사용자의 요청에 따라 플랫폼에 있는 여성의 사진을 변경했습니다. 어떤 경우에는 챗봇이 미성년자 소녀의 이미지를 변경하기도 했습니다. 이로 인해 회사는 비구독자의 이미지 생성을 차단하고 어떤 유형의 이미지를 생성할 수 있는지에 대해 더욱 견고한 보호 조치를 취했습니다. 지연된 조치는 Grok이 수만 장의 이미지를 생성한 지 몇 주 후와 캘리포니아 법무장관 이후에 이루어졌습니다.