1대1 RTS 게임으로 만든 LLM 벤치마크
1대1 RTS(실시간 전략) 게임 환경에서 LLM의 전략적 사고, 코드 생성, 실시간 의사결정 능력을 평가하는 새로운 벤치마크다. 기존의 텍스트 기반 벤치마크와 달리, 동적 환경에서의 적응력과 전략 수립 능력을 측 …
1대1 RTS(실시간 전략) 게임 환경에서 LLM의 전략적 사고, 코드 생성, 실시간 의사결정 능력을 평가하는 새로운 벤치마크다. 기존의 텍스트 기반 벤치마크와 달리, 동적 환경에서의 적응력과 전략 수립 능력을 측 …
Anthropic이 81,000명을 대상으로 AI 사용 실태를 조사한 대규모 정성 연구를 공개했다. 기존 AI 논의가 AGI, 자동화, 일자리 대체 같은 거시적 주제에 집중한 반면, 이 프로젝트는 실제 사용자들이 …
크레딧 기반 요금제가 2025년 126% 급증하며 SaaS 업계 표준으로 부상하고 있다. Clay가 데이터 비용과 플랫폼 가치를 분리한 요금제 개편을 단행했고, Figma는 2025년 12월 AI 크레딧 모델을 도 …
Claude Code v2.1.81의 주요 명령어, 단축키, 설정, 환경 변수, MCP 서버 및 에이전트 구성을 한 페이지에 정리한 A4 가로형 HTML 치트시트다. Mac/Windows 단축키 자동 감지, 최신 …
Claude Code Desktop 및 Cowork과 연동되어 실제 컴퓨터의 마우스, 키보드, 화면을 직접 제어하는 기능이 출시되었다. 어떤 앱이든 Claude가 직접 조작할 수 있으며, Dispatch와 함께 사 …
YC CEO Garry Tan이 직접 만들어 사용하는 오픈소스 AI 소프트웨어 팩토리다. Think → Plan → Build → Review → Test → Ship → Reflect 순서로 스프린트 전체를 커버 …
iPhone 17 Pro에서 4000억 파라미터 규모의 LLM을 초당 0.6토큰 속도로 구동하는 데 성공했다. Mixture of Experts(MoE) 구조로 실제 활성화되는 가중치는 약 50억 파라미터이며, …
LLM 프록시 서버로 널리 사용되는 LiteLLM의 PyPI 패키지가 공급망 공격을 당했다. v1.82.7과 v1.82.8 버전에 악성 코드가 삽입되었으며, 해당 버전을 사용 중인 경우 즉시 버전을 확인하고 업데이 …
Opus 기반 차세대 자율 에이전트 OpenClaw는 이메일, 캘린더, 홈 자동화 등 다양한 앱을 통합하지만, SkillHub 스킬 검증 부재, 토큰 노출, 메모리 오염 등 다수의 보안 취약점이 발견되었다. 편의성 …
Claude Code, Codex, Cursor, OpenCode를 한 화면에서 병렬 실행하며 4개까지 그리드로 동시 표시할 수 있는 네이티브 제어판이다. Rust와 GPUI로 구축되어 Electron 없이 …
Pinterest가 MCP(Model Context Protocol)를 AI 에이전트의 도구 연결 표준으로 채택하여, IDE, 내부 챗, AI 에이전트 등 실제 엔지니어링 워크플로우에 프로덕션 수준으로 통합한 경험 …
인터넷 연결 없이 지식, 지도, 교육, AI 도구를 모두 실행할 수 있는 무료 오픈소스 오프라인 서버다. Wikipedia, Project Gutenberg, 의료 참고서, Khan Academy 강좌 등 방대한 …
AI 에이전트들로 구성된 가상 사회를 만들어 아이디어를 평가하는 실험 프로젝트다. 사용자가 에이전트를 연결해 프로젝트를 등록하면 에이전트들이 서로 댓글을 달며 Ship(출시 가치 있음)/Slop(가치 없음)을 판단 …
Claude Plugin/Skills를 많이 설치하다 보면 .claude/plugin 디렉토리에 수많은 Skills.md 파일이 쌓이는데, 이 도구는 설치된 Skills의 유사성을 비교하고 중복 기능을 식별해 불필 …
자연어로 말하면 LLM이 쉘 명령어를 생성해 실행하는 CLI 도구다. 가끔 쓰는 명령어가 기억나지 않을 때 pls '1380 포트 쓰는 프로세스 다 죽여줘'처럼 자연어로 요청할 수 있다. Zig로 구현되었으며, …
신생아 육아 시 수유·배변 기록을 음성만으로 해결하는 시스템을 Siri + Claude Code + Obsidian 조합으로 구축한 사례다. Obsidian vault에 CLAUDE.md 파일을 작성해 테이블 구조 …
월마트가 ChatGPT 내 Instant Checkout 기능을 통해 약 20만 개 상품을 테스트한 결과, 웹사이트 결제 대비 전환율이 3배 낮았다. ChatGPT 내 직접 결제는 사용자 만족도가 낮았으며, 클릭아 …
가수 김장훈이 무려 45년간 피우던 담배를 끊었다고 고백. ‘다시 피울 명분이 사라졌다’는 말이 묘하게 철학적이다. 45년이면 담배가 본체고 김장훈이 악세사리였을 수준인데, 드디어 본체 교체 완료. 건강 챙기는 모 …
AI 도구로 소프트웨어 개발 비용과 인력이 급감하면서, 인간이 생성한 실세계 데이터만이 에이전트 AI가 복제할 수 없는 유일한 경쟁 우위(moat)라는 주장이다. AI가 대부분의 변환 작업을 대체할 수 있는 현재, …
OpenClaw 같은 자율 에이전트의 설정 복잡성과 API 토큰 비용 부담을 해결하기 위해, 구독 내에서 터미널 에이전트를 매터모스트로 사용할 수 있게 만든 프로젝트다. takoPI(텔레그램 기반 터미널 에이전트) …
미쉐린 가이드가 한국 외식 문화를 완전히 바꿔놓았다는 이야기. 별 하나 받으면 예약 대란, 셰프는 연예인급 인기를 누리는 시대가 됐다. 예전엔 “맛집 블로거 추천"이 최고였는데 이제는 미쉐린 별이 곧 권력이다. 맛 …
LLM 에이전트가 train.py를 반복 수정하며 성능을 개선하는 제약 최적화 루프 구조의 Autoresearch 시스템을 소개한다. 가설 설정부터 평가까지 자동 순환하며, 컨테이너 기반 샌드박스 환경에서 실행된다 …
역시 믿고 보는 이서진x나영석 콤비가 이번엔 텍사스로 떠났다. 본인들 입으로 ‘로맨틱 코미디 같았다’니, 이 두 사람의 케미는 진짜 어떤 커플보다 달달하다. 예능계의 공식 부부 아닌가요 이쯤 되면 😂 뉴시스
전소민이 초중학교 동창인 슈퍼주니어 은혁이 방송국에서 자신을 ‘젖소’라고 불렀다며 불쾌감을 드러냈다. 아무리 오랜 친구 사이라도 선 넘는 별명은 곤란하지. 은혁, 동창이라고 다 되는 거 아닙니다. 이름이 있잖아요, …
제니가 홍콩 컴플렉스콘에서 헤드라이너로 무대를 장악했다. 솔로 아티스트로서 글로벌 대형 페스티벌을 정조준하고 있다니, 이게 바로 K-팝 원톱의 위엄. 블랙핑크 졸업 후 ‘제니라는 장르’를 만들어가는 중 🎤 연합뉴스 …
프로그래밍은 모호한 명세를 정밀하게 다듬어 가는 창조 행위이며, AI는 영어 명세를 코드로 변환해 이 과정을 가속할 뿐 대체하지 못한다는 주장이다. ‘바이브 코딩(Vibe Coding)‘은 감각적 개발 방식을 가능 …
하이브가 인도에서 대규모 오디션을 진행한다. 14억 인구의 나라에서 K-팝 아이돌을 발굴하겠다는 포부. 인도 시장 잠재력은 어마어마한데, 볼리우드와 K-팝이 만나면 어떤 케미가 나올지 기대된다. 글로벌 엔터 전쟁의 …
일본이 또다시 고교 교과서에 독도 영유권 주장을 명시했고, 한국 정부가 강력 항의에 나섰다. 매년 반복되는 이 루틴, 지겹지만 절대 무시하면 안 되는 문제. 독도는 우리 땅이고, 교과서에 뭘 쓰든 그 사실은 변하지 …
SM 떠난 이수만 선생님이 3년 경업금지 기간을 마치고 K팝계에 전격 복귀한다. 잘파세대 타겟 오디션 ‘A2O’를 론칭하며 다시 한번 아이돌 제국 건설에 나선 모양. K팝의 대부는 은퇴가 없다. 이번엔 또 어떤 그 …
강직인간증후군이라는 희귀 난치병과 싸워온 셀린 디옹이 드디어 프랑스 무대로 돌아온다. 2022년 투어 취소 이후 올림픽 개막식 깜짝 등장으로 팬들 울렸던 그녀, 이번엔 제대로 된 콘서트다. 디바는 역시 쓰러져도 마 …