RAG on 가십데일리

PDF 논문 RAG, 텍스트만으로 충분할까? - Gemini embedding 002 임베딩 검색 실험

Thu, 02 Apr 2026 00:00:00 +0000

Gemini embedding-2-preview의 네이티브 멀티모달 임베딩으로 학술 논문 PDF의 텍스트 임베딩과 이미지 임베딩을 비교 실험한 결과다. 같은 페이지의 텍스트-이미지 코사인 유사도 평균이 0.642로, SEM 사진, 그래프, 공간 배치 등 약 36%의 시각 정보가 텍스트 임베딩에 반영되지 않는다는 결론이다. ColPali와 비교 시 영문에서는 ColPali가 우수하나, 한국어 등 비영어권에서는 정확도가 크게 떨어진다는 피드백도 공유되었다.

커뮤니티 의견

@mammal: “ColPali와 비교해서는 어떤가요?”

@230kimi: “영문은 colpali가 확실히 더 좋은것 같습니다. 다만 한국어나 비영어권에서 정확도가 확 내려가더라구요”

💡 실무 포인트: 논문 RAG 파이프라인 구축 시 텍스트만으로는 약 36%의 시각 정보가 누락되므로, 도표나 그래프가 중요한 문서에는 멀티모달 임베딩을 병행하라.

법률적 시각(Legal AI)에서 본 온톨로지(Ontology)의 개념

Thu, 02 Apr 2026 00:00:00 +0000

법률 AI 분야에서 RAG와 온톨로지의 역할 차이를 명확히 정의한 글이다. RAG는 외부 문서 검색으로 최신 정보 접근성을 높이는 반면, 온톨로지는 검색된 자료 내 개념들을 같은 의미 체계로 정렬하고 법적 관계를 구조화하는 역할을 한다. 법률의 순환참조 특성이 RAG 적용 시 문맥이나 레퍼런스를 잃어버릴 우려가 있다는 실무적 지적도 포함되었다.

커뮤니티 의견

@ahiou: “정말 좋은 글이네요 온톨로지에 대한 개념이 명확하게 이해됐습니다.”

@antryu00: “과거 경험상 법률의 경우 순환참조가 너무 많아서 RAG 적용 시 문맥이나 레퍼런스를 잃어버릴 우려가 있었던 것 같습니다.”

💡 실무 포인트: 법률 등 순환참조가 많은 도메인에 RAG를 적용할 때는 온톨로지 기반 개념 정렬을 선행하여 문맥 손실을 방지하라.

법망 - PostgreSQL 기반 한국 법령 전체를 JSON으로 제공하는 에이전트용 API

Thu, 02 Apr 2026 00:00:00 +0000

한국 법령 정보를 AI 에이전트가 소비하기 쉬운 JSON 형태로 제공하는 REST API 서비스다. 국가법령정보센터 제공 법령 99.9% 이상을 수록하며, 매주 토요일 최신 동기화한다. PostgreSQL + pgvector 기반으로 주요 조문 20만 건의 768차원 임베딩을 제공해 시맨틱 검색을 지원한다. 인증키 없이 사용 가능하며 rate limit은 분당 100회다. 공개 24시간 내 누적 2만 건 이상의 API 호출이 있었고, 작성자는 변호사시험 후에도 계속 유지보수할 예정이라 밝혔다. 유사한 프로젝트(legalize-kr)도 진행 중이며, k-skill에서 법령 정보 스킬로 통합 계획도 공유되었다.

PDF 논문 RAG, 텍스트만으로 충분할까? - Gemini embedding 002 임베딩 검색 실험

Wed, 01 Apr 2026 00:00:00 +0000

Gemini embedding-2-preview 네이티브 멀티모달 임베딩으로 학술 논문 PDF의 텍스트 임베딩과 이미지 임베딩을 비교 실험한 결과다. 같은 페이지의 텍스트-이미지 코사인 유사도 평균이 0.642로, SEM 사진·그래프 곡선·공간 배치 등 약 36%의 시각 정보가 텍스트 임베딩에 반영되지 않는 것으로 나타났다. 18개 쿼리 테스트에서 이미지 임베딩이 텍스트 대비 유의미한 검색 성능 차이를 보였다. ColPali와의 비교에서는 영문에서 ColPali가 우세하지만 한국어 등 비영어권에서는 정확도가 크게 하락한다는 피드백이 있었다.

커뮤니티 의견

@mammal: “ColPali와 비교해서는 어떤가요?”

@230kimi: “영문은 ColPali가 확실히 더 좋은것 같습니다. 다만 한국어나 비영어권에서 정확도가 확 내려가더라구요”

💡 실무 포인트: PDF 기반 RAG 파이프라인 구축 시 텍스트 임베딩만으로는 시각 정보의 36%를 놓칠 수 있다. 도표·그래프가 중요한 문서는 멀티모달 임베딩 또는 이미지 임베딩 병행을 검토하라.

Shopify의 데이터 구조화 여정: One-Shot LLM에서 DSPy 기반 에이전틱 아키텍처로

Wed, 01 Apr 2026 00:00:00 +0000

Shopify가 수백만 개의 비정형 커머스 데이터를 구조화하기 위해 One-Shot LLM 방식에서 DSPy 기반 멀티 에이전트 아키텍처로 전환한 과정을 공유했다. GPT-4/5급 대형 모델 대신 자체 호스팅된 Qwen(32B/72B급) 모델과 DSPy 프레임워크를 결합해 비용 효율성과 품질을 동시에 달성했다. 전문화된 에이전트가 각각 특정 데이터 유형을 처리하는 구조다.

💡 실무 포인트: 대규모 비정형 데이터 처리에서 단일 LLM 호출보다 DSPy 기반 멀티 에이전트 파이프라인이 비용과 품질 모두 우수할 수 있다. 자체 호스팅 모델과 DSPy 조합을 검토해보라.

법률적 시각(Legal AI)에서 본 온톨로지(Ontology)의 개념

Wed, 01 Apr 2026 00:00:00 +0000

RAG와 온톨로지의 역할을 법률 AI 관점에서 구분한 글이다. RAG는 외부 문서 검색으로 최신 정보 접근성을 높이는 데 강점이 있고, 온톨로지는 검색된 자료 안의 개념들을 동일 의미 체계로 정렬하고 법적 관계를 구조화하는 데 강점이 있다. 법률 분야는 순환참조가 매우 많아 RAG 적용 시 문맥이나 레퍼런스를 잃어버릴 우려가 있다는 실무 경험도 공유되었다.

커뮤니티 의견

@antryu00: “과거 경험상 법률의 경우 순환참조가 너무 많아서 RAG 적용 시 문맥이나 레퍼런스를 잃어버릴 우려가 있었던 것 같습니다.”

💡 실무 포인트: 도메인 특화 RAG 구축 시 단순 벡터 검색만으로는 부족할 수 있다. 법률·의료 등 순환참조가 많은 분야는 온톨로지 기반 지식 그래프를 병행하여 문맥 유실을 방지하라.

Show GN: MemAware – AI 에이전트가 "내가 뭘 알고 있는지"를 아는지 측정하는 벤치마크

Sat, 28 Mar 2026 00:00:00 +0000

기존 메모리 벤치마크(LoCoMo, LongMemEval, MemoryAgentBench 등)가 ‘과거 대화에서 답을 찾을 수 있는가’라는 검색 성능만 측정한다는 한계를 지적하고, 에이전트가 자신의 지식 상태를 인식하는 메타인지 능력을 평가하는 새로운 벤치마크를 제안한다. 검색 엔진 성능이 아닌 진정한 메모리 시스템 평가를 지향한다.

관련 레퍼런스

MemAware GitHub 저장소

💡 실무 포인트: 에이전트 메모리 시스템을 구축할 때, 정보 검색 정확도뿐 아니라 ‘모른다는 것을 아는’ 메타인지 능력도 설계에 반영해야 환각을 줄일 수 있다.

럭셔리 자동차 정비소를 위한 AI 리셉셔니스트 구축기 - Part 1

Thu, 26 Mar 2026 00:00:00 +0000

고급 정비소의 전화 응답 부재로 인한 매출 손실을 해결하기 위해, RAG 기반 AI 리셉셔니스트 ‘Axle’을 개발한 사례다. 웹사이트에서 수집한 실제 서비스·가격 정보를 근거로 정확한 견적을 안내한다. 다만 커뮤니티에서는 동일 수리 이력 없이는 견적이 부정확할 수 있고, 일부 주에서는 잘못된 견적이 법적 문제가 될 수 있다는 현실적 우려가 제기되었다.

커뮤니티 의견

@GN⁺: “예전에 서비스 어드바이저로 일했음. 부품 재고와 가격은 시시각각 변함. 시스템이 이를 반영하지 못하면 혼란만 초래함. 유용한 부분은 차량 픽업 알림 정도뿐임.”

💡 실무 포인트: RAG 기반 AI 상담 시스템을 구축할 때, 실시간으로 변동하는 데이터(재고, 가격)와 법적 책임 범위를 사전에 검토하고, AI가 확답하지 못하는 영역은 사람에게 에스컬레이션하는 설계가 필수다.

월 15만원짜리 Claude Code가 바꾼 아이디어-실행 사이클

Mon, 23 Mar 2026 00:00:00 +0000

Claude Code 월 구독 후 3D 그래픽, RAG, 뉴스레터 자동화 등을 사전 지식 없이 몇 시간 만에 구현한 경험기다. 코드를 한 줄도 들여다보지 않아도 “돌아가는” 수준을 넘는 결과물이 나오며, 하루 종일 사용해도 할당량의 1/3도 소진하지 못할 만큼 여유가 있다고 평가한다.

💡 실무 포인트: 새로운 기술 스택을 빠르게 프로토타이핑할 때 Claude Code를 활용하면, 학습 곡선 없이 MVP 수준의 결과물을 단시간에 확보할 수 있다.

Show GN: 틸노트 - 키워드 하나로 AI가 노트를 써주는 지식관리 도구

Fri, 20 Mar 2026 00:00:00 +0000

2022년 TIL 노트 앱에서 출발해, 키워드나 프롬프트를 입력하면 AI가 웹 검색과 노트 검색을 수행해 자동으로 노트를 작성하는 지식관리 플랫폼으로 진화했다. AI 에이전트가 리서치부터 작성까지 담당하는 개인 지식 베이스 도구다.

💡 실무 포인트: 학습 노트나 기술 메모 작성을 AI에 위임하면 지식 축적 속도를 높일 수 있으나, 검증 단계는 필수다.

Hipocampus - AI 에이전트를 위한 영구 메모리 시스템 (제로 인프라)

Thu, 19 Mar 2026 00:00:00 +0000

Claude Code나 OpenClaw 같은 AI 에이전트의 세션 간 기억 상실 문제를 해결하는 영구 메모리 시스템이다. MEMORY.md 단일 파일의 한계를 넘어 구조화된 메모리 관리를 제공하며, 별도 인프라 없이 동작한다. 기존 날짜별 작업 기록 + grep 방식의 대안으로 활용할 수 있다.

커뮤니티 의견

@gykim: “저는 모든 작업 기록을 날짜 단위로 남겨서 grep하도록 하고 있는데 이걸 한번 써봐야겠습니다”

💡 실무 포인트: 장기 프로젝트에서 AI 에이전트의 컨텍스트 유지가 필요하다면 Hipocampus 같은 구조화된 메모리 시스템을 도입하라.

부동산 AI 만들면서 느낀 모델별 차이점

Sat, 14 Mar 2026 00:00:00 +0000

부동산 특화 AI를 구축하면서 겪은 GPT, Claude 등 모델별 성능 차이와 한계를 공유한다. 범용 LLM은 부동산 가격정보가 부정확하고, 과거 데이터를 현재인 양 제시하거나 근거 없는 정보를 사실처럼 전달하는 문제가 있다. RAG나 LoRA 파인튜닝보다 Python 크롤링으로 실시간 데이터를 수집한 뒤 파이프라인을 통해 응답하게 하는 방식이 더 효과적이었다는 실전 경험이 공유되었다.

커뮤니티 의견

@kurthong: “rag 같은것보다 데이터는 파이썬 같은 걸로 크롤링하고 봇은 그 크롤링 결과만 몇가지 형태의 파이프라인을 통해 대답하게 하니 결과가 훨씬 좋았던 경험이 있어서요”

@kravi: “정확한 정보전달이 중요한 서비스는 결과물 검증용 계층을 따로 추가할수도 있겠어요”

💡 실무 포인트: 도메인 특화 AI 서비스에서는 RAG보다 실시간 데이터 파이프라인 + 검증 계층 구조가 정확도에서 우위를 보일 수 있다.

NOD — 웹 콘텐츠를 AI로 요약하고 검색 가능한 지식으로 저장하는 크롬 확장

Fri, 13 Mar 2026 00:00:00 +0000

웹페이지, GitHub 레포, 논문, 유튜브 영상을 AI로 요약해 검색 가능한 형태로 저장하는 크롬 확장이다. 원래 n8n + Gemini + Obsidian으로 구축한 개인 자동화를 확장 형태로 재구현했으며, FastAPI 백엔드를 사용한다.

💡 실무 포인트: 개인 지식 관리(PKM) 파이프라인에서 “n8n + LLM + 노트앱” 조합은 검증된 자동화 패턴.

Omni — 업무용 AI 비서 & 검색 플랫폼

Fri, 13 Mar 2026 00:00:00 +0000

사내 다양한 앱의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. Google Drive, Gmail, Slack, Confluence, Jira 등 주요 협업 도구를 연결하고, BM25 및 pgvector 기반의 전문 검색과 벡터 검색을 결합한 하이브리드 검색을 제공한다.

부동산 AI 만들면서 느낀 모델별 차이점

Fri, 13 Mar 2026 00:00:00 +0000

부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특화 한계가 뚜렷하다. RAG나 LoRA 파인튜닝보다는 Python 크롤링으로 최신 데이터를 수집하고, LLM은 해당 결과를 파이프라인 형태로 처리하게 하는 방식이 더 좋은 결과를 보였다는 실무 경험이 공유되었다.

커뮤니티 의견

@kurthong: “이미 업데이트가 적극적으로 잘 되고 있는 데이터들에 대해선 RAG보다 크롤링 결과만 몇가지 형태의 파이프라인을 통해 대답하게 하니 결과가 훨씬 좋았던 경험이 있어서요”

@yaa30: “AI에게 너무 의존적인 형태로 맡기려다보니 어려워지는 느낌 아닐까요?”

💡 실무 포인트: 도메인 특화 AI 구축 시, RAG보다 “크롤링 → 구조화 → LLM 파이프라인” 아키텍처가 최신 데이터 정확도에서 유리할 수 있다.

Omni — 업무용 AI 비서 & 검색 플랫폼

Thu, 12 Mar 2026 00:00:00 +0000

사내 다양한 앱(Google Drive, Gmail, Slack, Confluence, Jira 등)의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. BM25 및 pgvector 기반의 전문 검색과 시맨틱 검색을 결합하여 Unified Search를 제공한다.

💡 실무 포인트: 사내 지식 검색 시스템 구축 시 BM25(키워드) + pgvector(시맨틱) 하이브리드 검색 아키텍처를 참고할 수 있다.

Show GN: Endigest — 글로벌 테크 블로그를 AI로 자동 수집·요약해주는 서비스

Thu, 12 Mar 2026 00:00:00 +0000

Meta, Google, Spotify, Airbnb 등 글로벌 테크 기업의 기술 블로그 RSS 피드를 자동으로 수집하고, AI 기반의 한국어 핵심 요약을 제공하는 서비스다. Frontend, Backend, Infra 등 분야별로 분류하여 필요한 기술 트렌드만 빠르게 파악할 수 있다.

Show GN: Endigest - 글로벌 테크 블로그를 AI로 자동 수집·요약해주는 서비스

Wed, 11 Mar 2026 00:00:00 +0000

Meta, Google, Spotify, Airbnb 등 글로벌 테크 기업의 기술 블로그 RSS 피드를 자동 수집하고, AI 기반 한국어 핵심 요약을 제공하는 서비스다. Frontend, Backend, Data, Infra 등 분야별로 분류해 필요한 기술 트렌드만 선택적으로 소비할 수 있다.

💡 실무 포인트: 기술 블로그 모니터링을 자동화하고 싶다면 RSS + AI 요약 파이프라인을 참고해 자사 도메인에 특화된 정보 수집 시스템을 구축할 수 있다.

Grep은 죽었다: Claude Code가 기억하게 만드는 방법

Sun, 08 Mar 2026 00:00:00 +0000

클로드 코드의 세션 간 컨텍스트 유실 문제를 해결하기 위해 로컬 검색 엔진 QMD와 /recall 스킬을 결합한 메모리 시스템을 구축한 사례다. QMD는 Obsidian 볼트를 인덱싱하는 로컬 검색 엔진으로, BM25·시맨틱·하이브리드 세 가지 검색 모드를 지원한다. /recall 스킬은 시간 기반 필터링과 컨텍스트 주입을 통해 Claude Code가 이전 세션의 작업 내용을 참조할 수 있게 한다. 세션마다 컨텍스트가 초기화되는 Claude Code의 근본적 한계를 외부 메모리 시스템으로 보완하는 실용적 접근이며, CLAUDE.md의 자동 메모리 기능과 상호 보완적으로 활용할 수 있다. 커뮤니티에서 가장 활발한 토론이 이루어진 글이다.

Context Mode - Claude Code의 컨텍스트 소비를 98% 줄이는 MCP 서버

Tue, 03 Mar 2026 00:00:00 +0000

외부 도구 호출 시 대량의 원시 데이터가 컨텍스트 윈도우를 빠르게 소모하는 문제를 해결하는 MCP 서버이다. Claude Code와 도구 출력 사이에서 데이터를 압축·필터링하여 315KB를 5.4KB로 축소(98% 절감)한다. FTS5 인덱스 기반이며, Model2Vec + sqlite-vec를 결합한 하이브리드 검색기로 확장 가능하다.

커뮤니티 의견

@GN⁺: “Model2Vec + sqlite-vec + FTS5를 결합한 하이브리드 검색기를 만들었음. 전체 15,800개 파일 재인덱싱은 4분, 일일 증분은 10초 미만”

💡 실무 포인트: Claude Code 사용 시 컨텍스트 소비가 문제라면 Context Mode 도입을 검토하라. FTS5 + 벡터 검색 하이브리드 패턴은 다른 RAG 시스템에도 적용 가능.

Google AI 검색이 콘텐츠를 읽는 방식 실증 분석

Fri, 27 Feb 2026 00:00:00 +0000

SEO 전문가 Dan Petrovic이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding snippet)로 뽑아내는지 처음으로 실증적으로 밝혔다. 질문에서 query fanout이 발생하고, 특정 문장 단위로 grounding snippet이 추출되는 방식을 확인했다.

💡 실무 포인트: AI 검색 최적화 시 문장 단위의 명확한 정보 제공, 구조화된 콘텐츠 작성 중요

Google AI 검색이 콘텐츠를 읽는 방식 실증 분석

Wed, 25 Feb 2026 00:00:00 +0000

SEO 전문가 Dan Petrovic(DEJAN)이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding snippet)로 뽑아내는지 처음으로 실증적으로 밝혔다. 질문에서 query fanout이 발생하고, 각 쿼리에 대해 관련 문장을 추출하는 방식으로 작동한다. SEO 전략 수립에 중요한 인사이트를 제공한다.

💡 실무 포인트: AI 검색 최적화를 위해 콘텐츠 구조화 방식 재검토. 핵심 정보를 명확한 문장 단위로 구분하고 질문-답변 형식 콘텐츠 강화.