Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축
Karpathy가 3일 전 공개한 Autoresearch 에이전트를 활용해, depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여 검증 손실을 개선하는 20개의 유효한 변경사항을 발견했 …
Karpathy가 3일 전 공개한 Autoresearch 에이전트를 활용해, depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여 검증 손실을 개선하는 20개의 유효한 변경사항을 발견했 …
Meta가 AI 에이전트 전용 소셜 네트워크 Moltbook을 인수하며, 창립자 Matt Schlicht와 Ben Parr가 Meta Superintelligence Labs(MSL)에 합류했다. Moltbook은 …
Gemma 3 모델을 MLC-LLM을 통해 iOS 기기에서 로컬로 구동하는 방법과 실구동 성능 지표를 정리한 포스팅이다. Metal API 가속을 통해 모바일 기기에서도 지연 시간이 거의 없는 추론 환경을 구축할 …
웹페이지, GitHub 레포, 논문, 유튜브 영상을 AI로 요약해 검색 가능한 형태로 저장하는 크롬 확장이다. 원래 n8n + Gemini + Obsidian으로 구축한 개인 자동화를 확장 형태로 재구현했으며, …
사내 다양한 앱의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. Google Drive, Gmail, Slack, Confluence, Jira 등 주요 협업 도구를 연결하고, BM25 및 …
알리바바가 공개한 page-agent는 <script> 태그 한 줄만으로 기존 웹페이지에 AI 에이전트를 주입하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이도 동작하며, 텍스트 기반 DOM …
Perplexity가 기존 OS의 명령 처리 방식과 달리 “목표(objectives)“를 처리하는 AI OS 개념의 Personal Computer를 공개했다. 사용자가 세부 명령을 내리지 않아도 시스템이 목표 달 …
작업 목록을 반복 순회하며 완료될 때까지 수행하는 장시간 실행형 AI 루프 시스템이다. Docker 샌드박스 환경에서 Claude Code, Codex, Gemini 등의 AI CLI를 안전하게 실행하며, 격리된 …
Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 전면 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며 …
Rust로 작성된 AI 에이전트 런타임 ZeroClaw가 공개되었다. 5MB 미만의 메모리 사용량과 약 10ms 콜드 스타트를 표방하며, AI 모델·도구 실행·메모리·채널 등을 추상화하여 에이전트 워크플로우를 실행 …
소프트웨어 마진이 압축되는 AI 시대에도 네트워크 효과는 지속 가능한 비즈니스 구축의 가장 신뢰할 수 있는 경로라는 분석이다. 많은 기업이 네트워크 효과라 부르는 것은 사실 집계(aggregation) 우위이며, …
geohot(조지 호츠)이 AI 공포 마케팅에 대한 반론을 제기한 에세이다. “AI를 쓰지 않으면 뒤처진다"는 식의 소셜 미디어 담론이 완전한 허구라고 주장하며, AI는 마법이 아니라 탐색과 최적화의 연속선상에 있 …
개발자이자 작가인 Xe Iaso가 AI 도구(Claude, Cursor 등)를 사용하며 느끼는 딜레마를 솔직하게 서술했다. 코드 작성 대신 의도를 설명하고 위임하는 방식은 생산성을 높여주지만, 결과물에서 개성과 영 …
맥킨지의 내부 직원용 AI 플랫폼 ‘Lilli’에서 인증 없이 접근 가능한 취약점을 통해 전체 데이터베이스에 읽기·쓰기 권한이 획득되었다. 자율 보안 에이전트가 공개된 API 문서의 200여 개 엔드포인트 중 22 …
부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특 …
Hacker News가 가이드라인에 AI 생성 또는 AI 편집 댓글을 명시적으로 금지하는 규칙을 추가했다. 모든 대화는 사람 간의 상호작용이어야 한다는 원칙을 재확인한 것이다. 아이러니하게도 HN이 AI 콘텐츠를 …
Sequoia Capital이 AI 모델 성능 향상에 따라 도구(tool)가 아닌 업무 결과(work)를 직접 판매하는 “서비스형 AI 기업"이 차세대 거대 기업이 될 것이라는 투자 테시스를 발표했다. 모든 직무를 …
Sequoia의 “서비스가 새로운 소프트웨어다” 테시스에 대한 반론이다. AI가 서비스 기업을 소프트웨어 기업으로 전환한다는 VC 컨센서스에 반대하며, 실제로는 서비스 기업이 “더 나은 서비스 기업"이 되는 것이지 …
Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. 세계 모델(world model)을 개발해 물리적 …
Amazon이 AI 코딩 도구 사용과 관련된 연이은 서비스 장애 이후, 모든 AI 지원 코드 변경에 대해 시니어 엔지니어의 사전 승인 절차를 의무화했다. 내부 노트에 따르면 “베스트 프랙티스와 안전장치가 아직 완전 …
AI 코드 작성 에이전트가 개발자가 자는 동안 코드를 생성하고 브랜치에 변경사항을 반영하는 워크플로우를 소개한다. 그러나 AI가 작성한 코드를 같은 AI가 테스트하면 “자기 축하 기계"가 되어, 원래 의도와 다른 …
AI 생성 콘텐츠와 봇 활동이 온라인 공간 전반에서 급격히 확산되며, 인간 중심 인터넷이 실질적으로 붕괴하고 있다는 분석이다. Hacker News는 신규 계정의 ShowHN 게시를 제한하고 AI 생성 댓글 금지 …
Karpathy가 Autoresearch 에이전트들이 협업할 수 있도록 만든 플랫폼이다. 동일한 코드베이스에서 작업하는 수많은 AI 에이전트를 위해 설계되었으며, 인간 중심의 GitHub 구조를 에이전트 중심으로 …
AI 도구로 앱 개발 비용이 거의 제로에 수렴하면서 클론 앱 제작이 쉬워지고, 이것이 구독 모델의 붕괴로 이어지고 있다. 2025년 앱스토어 신규 앱 제출이 55만건으로 전년 대비 24% 증가했으며, 이는 …
Forbes가 인용한 Claude Code Max 요금제의 사용자당 5천 달러 손실 주장은 실제 컴퓨트 비용이 아닌 API 소매가 기준이라는 반박이다. OpenRouter의 Qwen 3.5 397B나 Kimi …
ChatGPT Pro와 Codex에서 GPT-5.4를 사용할 때 기본 컨텍스트가 약 258K로 제한되어 있으며, 1M 컨텍스트를 활용하려면 별도 설정이 필요하다는 사실이 알려졌다. 다만 258K 이상으로 늘리면 토 …
Anthropic이 PR마다 멀티 에이전트 팀을 투입해 사람이 놓치기 쉬운 버그를 심층 분석하는 Code Review 기능을 리서치 프리뷰로 출시했다. 배경으로는 Anthropic 엔지니어의 코드 생산량이 지난 1 …
Claw-Empire는 사용자가 가상 회사의 CEO가 되어 여러 AI 에이전트들을 지휘하고 협업시키는 로컬 우선(Local-first) AI 에이전트 오피스 시뮬레이터다. 단순한 채팅 UI를 넘어, 픽셀 아트 기반 …
Google이 텍스트, 이미지, 비디오, 오디오, 문서를 하나의 임베딩 공간에 매핑하는 최초의 완전 멀티모달 임베딩 모델을 퍼블릭 프리뷰로 공개했다. Gemini 아키텍처 기반으로 100개 이상의 언어에서 시맨틱 …
David Noel Ng가 Qwen2-72B(총 80개 레이어)의 중간 7개 레이어를 복제해 재조합하는 방법으로, 어떠한 학습이나 가중치 수정 없이 2024년 HuggingFace Open LLM 리더보드 1위를 …