AI | 가십데일리

Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축

Karpathy가 3일 전 공개한 Autoresearch 에이전트를 활용해, depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여 검증 손실을 개선하는 20개의 유효한 변경사항을 발견했 …

Meta, AI 에이전트용 소셜 네트워크 'Moltbook'의 창립자 2명을 영입

Meta가 AI 에이전트 전용 소셜 네트워크 Moltbook을 인수하며, 창립자 Matt Schlicht와 Ben Parr가 Meta Superintelligence Labs(MSL)에 합류했다. Moltbook은 …

MLC-LLM으로 iOS에서 로컬 LLM(Gemma 3) 실행하기

Gemma 3 모델을 MLC-LLM을 통해 iOS 기기에서 로컬로 구동하는 방법과 실구동 성능 지표를 정리한 포스팅이다. Metal API 가속을 통해 모바일 기기에서도 지연 시간이 거의 없는 추론 환경을 구축할 …

NOD — 웹 콘텐츠를 AI로 요약하고 검색 가능한 지식으로 저장하는 크롬 확장

웹페이지, GitHub 레포, 논문, 유튜브 영상을 AI로 요약해 검색 가능한 형태로 저장하는 크롬 확장이다. 원래 n8n + Gemini + Obsidian으로 구축한 개인 자동화를 확장 형태로 재구현했으며, …

Omni — 업무용 AI 비서 & 검색 플랫폼

사내 다양한 앱의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. Google Drive, Gmail, Slack, Confluence, Jira 등 주요 협업 도구를 연결하고, BM25 및 …

page-agent — 코드 1줄로 웹페이지에 AI 에이전트 추가하기

알리바바가 공개한 page-agent는 <script> 태그 한 줄만으로 기존 웹페이지에 AI 에이전트를 주입하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이도 동작하며, 텍스트 기반 DOM …

Perplexity, Personal Computer 공개

Perplexity가 기존 OS의 명령 처리 방식과 달리 “목표(objectives)“를 처리하는 AI OS 개념의 Personal Computer를 공개했다. 사용자가 세부 명령을 내리지 않아도 시스템이 목표 달 …

ralph-loop — 장시간 실행형 AI 에이전트 루프로 개발 업무 자동화하기

작업 목록을 반복 순회하며 완료될 때까지 수행하는 장시간 실행형 AI 루프 시스템이다. Docker 샌드박스 환경에서 Claude Code, Codex, Gemini 등의 AI CLI를 안전하게 실행하며, 격리된 …

Redox OS, 기여자 서명 정책과 LLM 금지 정책 도입

Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 전면 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며 …

Rust 기반 초경량 AI 에이전트 런타임 ZeroClaw 공개 (<5MB RAM, 10ms 시작)

Rust로 작성된 AI 에이전트 런타임 ZeroClaw가 공개되었다. 5MB 미만의 메모리 사용량과 약 10ms 콜드 스타트를 표방하며, AI 모델·도구 실행·메모리·채널 등을 추상화하여 에이전트 워크플로우를 실행 …

네트워크 효과에 역행하지 마라: 에이전트 시대에도 통하는 방어 전략

소프트웨어 마진이 압축되는 AI 시대에도 네트워크 효과는 지속 가능한 비즈니스 구축의 가장 신뢰할 수 있는 경로라는 분석이다. 많은 기업이 네트워크 효과라 부르는 것은 사실 집계(aggregation) 우위이며, …

다른 사람에게 가치를 창출하고, 보상은 걱정하지 마세요

geohot(조지 호츠)이 AI 공포 마케팅에 대한 반론을 제기한 에세이다. “AI를 쓰지 않으면 뒤처진다"는 식의 소셜 미디어 담론이 완전한 허구라고 주장하며, AI는 마법이 아니라 탐색과 최적화의 연속선상에 있 …

더 높은 추상화 수준에서 일하는 게 좋은지 잘 모르겠네

개발자이자 작가인 Xe Iaso가 AI 도구(Claude, Cursor 등)를 사용하며 느끼는 딜레마를 솔직하게 서술했다. 코드 작성 대신 의도를 설명하고 위임하는 방식은 생산성을 높여주지만, 결과물에서 개성과 영 …

맥킨지의 AI 플랫폼을 해킹한 방법

맥킨지의 내부 직원용 AI 플랫폼 ‘Lilli’에서 인증 없이 접근 가능한 취약점을 통해 전체 데이터베이스에 읽기·쓰기 권한이 획득되었다. 자율 보안 에이전트가 공개된 API 문서의 200여 개 엔드포인트 중 22 …

부동산 AI 만들면서 느낀 모델별 차이점

부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특 …

생성된 댓글이나 AI가 편집한 댓글은 올리지 마세요 — HN은 사람 간의 대화를 위한 공간입니다

Hacker News가 가이드라인에 AI 생성 또는 AI 편집 댓글을 명시적으로 금지하는 규칙을 추가했다. 모든 대화는 사람 간의 상호작용이어야 한다는 원칙을 재확인한 것이다. 아이러니하게도 HN이 AI 콘텐츠를 …

서비스가 새로운 소프트웨어다

Sequoia Capital이 AI 모델 성능 향상에 따라 도구(tool)가 아닌 업무 결과(work)를 직접 판매하는 “서비스형 AI 기업"이 차세대 거대 기업이 될 것이라는 투자 테시스를 발표했다. 모든 직무를 …

서비스는 소프트웨어가 되지 않을 것이다

Sequoia의 “서비스가 새로운 소프트웨어다” 테시스에 대한 반론이다. AI가 서비스 기업을 소프트웨어 기업으로 전환한다는 VC 컨센서스에 반대하며, 실제로는 서비스 기업이 “더 나은 서비스 기업"이 되는 것이지 …

얀 르쿤, 물리적 세계를 이해하는 AI 구축 위해 10억 달러 조달

Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. 세계 모델(world model)을 개발해 물리적 …

잇따른 장애 후, Amazon이 AI 지원 코드 변경에 시니어 엔지니어 승인 의무화

Amazon이 AI 코딩 도구 사용과 관련된 연이은 서비스 장애 이후, 모든 AI 지원 코드 변경에 대해 시니어 엔지니어의 사전 승인 절차를 의무화했다. 내부 노트에 따르면 “베스트 프랙티스와 안전장치가 아직 완전 …

잠자는 동안 실행되는 에이전트를 만들고 있어요

AI 코드 작성 에이전트가 개발자가 자는 동안 코드를 생성하고 브랜치에 변경사항을 반영하는 워크플로우를 소개한다. 그러나 AI가 작성한 코드를 같은 AI가 테스트하면 “자기 축하 기계"가 되어, 원래 의도와 다른 …

죽은 인터넷은 더 이상 이론이 아니다

AI 생성 콘텐츠와 봇 활동이 온라인 공간 전반에서 급격히 확산되며, 인간 중심 인터넷이 실질적으로 붕괴하고 있다는 분석이다. Hacker News는 신규 계정의 ShowHN 게시를 제한하고 AI 생성 댓글 금지 …

AgentHub — AI 에이전트를 위한 경량 협업 플랫폼

Karpathy가 Autoresearch 에이전트들이 협업할 수 있도록 만든 플랫폼이다. 동일한 코드베이스에서 작업하는 수많은 AI 에이전트를 위해 설계되었으며, 인간 중심의 GitHub 구조를 에이전트 중심으로 …

AI가 앱 구독 모델을 죽일 것이다

AI 도구로 앱 개발 비용이 거의 제로에 수렴하면서 클론 앱 제작이 쉬워지고, 이것이 구독 모델의 붕괴로 이어지고 있다. 2025년 앱스토어 신규 앱 제출이 55만건으로 전년 대비 24% 증가했으며, 이는 …

Anthropic의 Claude Code 사용자당 5천 달러 비용 주장은 사실이 아님

Forbes가 인용한 Claude Code Max 요금제의 사용자당 5천 달러 손실 주장은 실제 컴퓨트 비용이 아닌 API 소매가 기준이라는 반박이다. OpenRouter의 Qwen 3.5 397B나 Kimi …

ChatGPT Pro에서 GPT-5.4 컨텍스트 1M을 제대로 쓰려면 설정이 필요

ChatGPT Pro와 Codex에서 GPT-5.4를 사용할 때 기본 컨텍스트가 약 258K로 제한되어 있으며, 1M 컨텍스트를 활용하려면 별도 설정이 필요하다는 사실이 알려졌다. 다만 258K 이상으로 늘리면 토 …

Claude Code, 코드 리뷰 기능 공개

Anthropic이 PR마다 멀티 에이전트 팀을 투입해 사람이 놓치기 쉬운 버그를 심층 분석하는 Code Review 기능을 리서치 프리뷰로 출시했다. 배경으로는 Anthropic 엔지니어의 코드 생산량이 지난 1 …

Claw-Empire — CEO의 책상에서 지휘하는 AI 에이전트 제국

Claw-Empire는 사용자가 가상 회사의 CEO가 되어 여러 AI 에이전트들을 지휘하고 협업시키는 로컬 우선(Local-first) AI 에이전트 오피스 시뮬레이터다. 단순한 채팅 UI를 넘어, 픽셀 아트 기반 …

Gemini Embedding 2: 최초의 네이티브 멀티모달 임베딩 모델

Google이 텍스트, 이미지, 비디오, 오디오, 문서를 하나의 임베딩 공간에 매핑하는 최초의 완전 멀티모달 임베딩 모델을 퍼블릭 프리뷰로 공개했다. Gemini 아키텍처 기반으로 100개 이상의 언어에서 시맨틱 …

HuggingFace 오픈 LLM 리더보드 1위를 차지한 방법 — 두 개의 게이밍 GPU로, 가중치 변경 없이

David Noel Ng가 Qwen2-72B(총 80개 레이어)의 중간 7개 레이어를 복제해 재조합하는 방법으로, 어떠한 학습이나 가중치 수정 없이 2024년 HuggingFace Open LLM 리더보드 1위를 …