AI Agent에이전트 패턴업데이트 2026.04.28

에이전틱 RAG

별칭에이전틱 RAGAgent-driven RAG

한 줄 정의

단순히 한 번 검색해서 답하는 RAG가 아니라, 에이전트가 검색 쿼리·전략·재시도를 능동적으로 결정해가며 정보를 모으는 패턴입니다.

자세히 알아보기

기존 RAG는 보통 '질문 → 한 번 검색 → 답변'이라는 직선 구조였습니다. Agentic RAG는 여기에 에이전트의 판단을 끼워 넣어 흐름을 비선형으로 바꿉니다. 첫 검색 결과가 부족하면 쿼리를 다시 짜서 재검색하고, 출처 신뢰도가 낮다고 판단되면 다른 소스로 갈아타고, 필요하면 여러 도구를 조합해 정보를 보강합니다. 단발 RAG의 한계 — 잘못된 청크 하나가 답을 통째로 망치는 문제 — 를 풀기 위해 자연스럽게 등장한 패턴입니다.

동작 흐름은 보통 네 단계로 정리됩니다. 첫째, 쿼리 분해(query decomposition) — 사용자 질문을 여러 하위 질문으로 쪼갭니다. 둘째, 검색 전략 선택(retrieval routing) — 벡터 검색·키워드 검색·SQL·웹 검색 등 어디로 갈지 에이전트가 결정합니다. 셋째, 자기 평가(self-eval) — 모은 결과가 답변에 충분한지 모델이 직접 판단합니다. 넷째, 재시도 또는 종료. 보조적으로 reranking·cross-check·source diversification 같은 기법이 끼어듭니다.

Villion·GEO 관점에서 Agentic RAG는 게임의 단위를 바꿉니다. '검색당 몇 번 인용되는가'에서 '하나의 사용자 질문에서 수십 회 도는 내부 검색에서 우리가 얼마나 자주 등장하는가'로 KPI가 옮겨갑니다. Perplexity·ChatGPT·Gemini Deep Research 모두 이 패턴 위에 올라가 있어서, 한 번의 사용자 질문이 내부적으로 30~50번의 검색·재검색으로 펼쳐지는 일이 흔합니다. '한 방의 인용'을 노리는 콘텐츠 전략은 점점 효율이 떨어지고, '같은 사실이 여러 출처에서 일관되게 등장하는' 분산형 신호 전략이 자연스럽게 강해집니다.

다른 패턴과 비교하면 위치가 분명합니다. 단발 RAG는 '한 번 찾아 답하기', Agentic RAG는 '필요한 만큼 찾아 답하기', Agentic Search는 사용자 질문 자체를 능동적으로 확장해 답변을 합성하는 더 큰 우산입니다. 즉 Agentic RAG는 Agentic Search 안에서 검색·재검색을 책임지는 핵심 엔진이라고 보면 직관적입니다. 구현 측면에선 LangGraph·LlamaIndex·OpenAI Agents SDK 모두 자체 Agentic RAG 패턴을 표준 컴포넌트로 제공하기 시작했습니다.

한국 시장 맥락에서 흔한 오해는 'Agentic RAG는 결국 RAG의 마이너 업그레이드'라는 인식입니다. 콘텐츠 노출 측면에선 정반대에 가깝습니다. 단발 RAG 시대엔 한 페이지의 SEO 최적화로 인용이 가능했지만, Agentic RAG 시대엔 에이전트가 같은 사실을 여러 출처에서 교차 검증합니다. 그래서 자사 사이트 한 곳에서 정확한 정보를 외치는 것보다, 신뢰할 만한 외부 매체·커뮤니티·지식 그래프에서 같은 사실이 일관되게 노출되도록 만드는 작업이 더 큰 차이를 만듭니다. GEO 작업의 무게중심이 'on-site SEO'에서 'cross-source consistency'로 옮겨가는 핵심 동력입니다.

관련 용어

우리 브랜드는 AI 답변에 어떻게 등장하고 있을까요?

Villion은 ChatGPT·Perplexity·AI Overview에서 브랜드 인용 현황을 진단하고, 인용률과 언급 점유율을 끌어올리는 작업을 자동화합니다.

무료 진단 받기