Anthropic, 중국 AI 기업들의 Claude 불법 증류 공격 탐지 및 대응 공개
Anthropic이 DeepSeek, MiniMax, Moonshot AI 세 중국 AI 기업이 Claude의 능력을 불법으로 추출했다고 공식 발표했다. 세 기업이 총 24,000개의 허위 계정을 생성해 …
Anthropic이 DeepSeek, MiniMax, Moonshot AI 세 중국 AI 기업이 Claude의 능력을 불법으로 추출했다고 공식 발표했다. 세 기업이 총 24,000개의 허위 계정을 생성해 …
CLOVA X 서비스는 2026년 4월 9일에 종료될 예정이다. CLOVA X는 2023년 8월부터 네이버 AI 모델 HyperCLOVA X의 실험실로서 일상 속 AI의 다양한 활용 가능성에 도전해 왔다. 이제는 …
Hugging Face가 llama.cpp와 GGML 엔진의 핵심 개발자 Georgi Gerganov를 인수했다. llama.cpp(로컬 LLM 실행의 사실상 표준 엔진)와 GGML 기반 기술이 Hugging …
Google Research 팀이 발표한 논문에서 매우 간단하면서도 강력한 기법을 발견했다. 같은 프롬프트를 그대로 두 번 반복해서 입력하면 대부분의 최신 LLM(Gemini, GPT-4o, Claude, …
Simon Willison이 Karpathy의 Claws 개념을 정리한 글이다. Claws는 LLM 기반 AI 에이전트 위에 구축된 새로운 계층으로, 오케스트레이션·스케줄링·컨텍스트 관리·도구 호출·지속성 등을 확 …
Andrej Karpathy가 LLM → 에이전트 → Claws로 이어지는 새로운 계층 구조를 제시했다. Claws는 에이전트 위에서 오케스트레이션·스케줄링·컨텍스트 관리·툴 호출·지속성을 담당하는 레이어로, 에이 …
Taalas는 Llama 3.1 8B 모델을 ASIC 칩에 직접 새겨 넣어 초당 17,000토큰 추론 속도를 달성한 스타트업이다. GPU 기반 시스템보다 10배 저렴하고, 10배 적은 전력, 10배 빠른 추론 성능 …
보안 회사 Irregular의 연구에 따르면, Claude, ChatGPT, Gemini 같은 최신 LLM이 생성하는 비밀번호가 겉으로는 100비트 이상의 엔트로피를 가진 것처럼 보이지만, 실제로는 약 27비트 수 …
C++/CUDA 기반 LLM 추론 엔진으로, GPU 메모리 스트리밍과 NVMe 직접 입출력을 통해 Llama 70B 모델을 RTX 3090(24GB VRAM)에서 실행 가능하다. 3단계 적응형 캐싱 구조를 사용해 …
LLM 시대에 누구나 앱을 만들 수 있게 되었지만, 진짜 장벽은 실력이 아닌 취향(taste)이며, 이 장벽은 전혀 낮아지지 않았다. 여기서 taste는 단순한 ‘취향’이 아니라 무엇을 만들 가치가 있는지, 사람들 …
Andrej Karpathy가 LLM 기반 AI 에이전트 위에 구축된 새로운 계층인 “Claws"를 소개했다. Claws는 오케스트레이션·스케줄링·컨텍스트 관리·도구 호출·지속성 등을 확장하는 구조로, …
LLM 위에 에이전트가 추가된 이후, 그 위에서 오케스트레이션·스케줄링·컨텍스트 관리·툴 호출·지속성을 담당하는 Claws 레이어가 등장했다. 보안 측면에서 Claw를 두는 건 인간 비서나 컨설턴트를 두는 것과 비 …
Taalas는 Llama 3.1 8B 모델을 ASIC 칩에 직접 새겨 넣어 초당 17,000토큰 추론 속도를 달성한 스타트업이다. GPU 기반 시스템보다 10배 저렴하고, 10배 적은 전력, 10배 빠른 추론 성능 …
보안 회사 Irregular의 연구에 따르면, Claude, ChatGPT, Gemini 같은 LLM이 생성하는 비밀번호는 겉으로는 100비트 이상의 엔트로피를 가진 것처럼 보이지만, 실제로는 27비트 수준에 불과 …
C++/CUDA 기반 LLM 추론 엔진으로, GPU 메모리 스트리밍과 NVMe 직접 입출력을 통해 Llama 70B 모델을 RTX 3090(24GB VRAM)에서 실행 가능하다. 3단계 적응형 캐싱 구조를 사용해 …
LLM 시대에 누구나 앱을 만들 수 있게 되었지만, 진짜 장벽은 실력이 아닌 취향(taste)이며, 이 장벽은 전혀 낮아지지 않았다. 공개되는 바이브 코딩 앱 대부분이 포화된 아이디어의 조잡한 복제물로, 실력과 취 …