에이전트 메모리
한 줄 정의
에이전트가 이전 대화·작업 결과를 기억하고 다음 행동에 반영하기 위한 저장·검색 메커니즘 전체를 가리킵니다.
자세히 알아보기
에이전트는 기본적으로 '컨텍스트 윈도우'에 들어 있는 정보만 알고 있습니다. 그래서 같은 사용자가 어제 한 요청을 오늘 다시 떠올리려면, 별도의 메모리 시스템이 필요합니다. 흔히 단기 메모리(현재 세션), 장기 메모리(벡터 DB·요약본), 에피소드 메모리(과거 작업 기록) 정도로 나누어 설계합니다.
마케팅 관점에서 메모리는 '브랜드와의 관계 데이터'를 어디까지 에이전트가 참고할 수 있는지를 결정합니다. 고객 선호·과거 구매 이력을 기억한 채로 추천이 이뤄지면 전환율이 올라가지만, 동시에 프라이버시·보안 이슈도 같이 따라옵니다.
구현 측면에서는 RAG(검색 증강 생성)와 메모리의 경계가 점점 흐려지는 흐름입니다. 둘 다 '필요한 정보를 외부에서 끌어와 LLM에 주입한다'는 본질이 같기 때문에, 실무에서는 두 개념을 한 묶음으로 설계하는 경우가 많습니다.
관련 용어
AI 에이전트
사용자의 목표를 받아 스스로 계획을 세우고 도구를 호출해가며 작업을 끝까지 수행하는 LLM 기반 시스템을 가리킵니다.
LLMRAG
LLM이 답하기 전에 외부 문서나 검색 결과를 가져와 근거로 활용하는 구조로, ChatGPT Search·Perplexity 같은 AI 검색 답변의 핵심 기법입니다.
LLM컨텍스트 윈도우
LLM이 한 번에 입력으로 받아들일 수 있는 토큰의 최대 길이로, 모델이 한 번에 참고할 수 있는 문맥의 크기를 결정합니다.
AI AgentReAct
LLM이 '생각(Thought) → 행동(Action) → 관찰(Observation)' 루프를 반복하며 도구를 호출해 문제를 푸는 대표적인 에이전트 패턴입니다.
LLMLLM
방대한 텍스트 데이터로 학습돼 사람의 언어를 이해하고 생성하는 대규모 신경망 모델로, ChatGPT·Claude·Gemini의 기반이 됩니다.
우리 브랜드는 AI 답변에 어떻게 등장하고 있을까요?
Villion은 ChatGPT·Perplexity·AI Overview에서 브랜드 인용 현황을 진단하고, 인용률과 언급 점유율을 끌어올리는 작업을 자동화합니다.
무료 진단 받기