중간 정보 누락
한 줄 정의
긴 컨텍스트의 가운데에 위치한 정보가 양 끝보다 활용도가 크게 떨어지는 현상으로, '중요한 내용은 앞·뒤에 두라'는 실무 원칙의 출처입니다.
자세히 알아보기
Lost in the Middle은 2023년 스탠퍼드 연구진이 정리한 현상으로, LLM이 컨텍스트 양 끝(앞쪽·뒤쪽)에 있는 정보는 잘 활용하지만 가운데 부분 정보는 놓치는 경향이 강하다는 관찰입니다. 'U자형 정확도 곡선'이라는 표현이 대표적입니다. 모델·버전마다 정도는 다르지만 큰 흐름은 비슷합니다.
마케팅 관점에서 의미 있는 포인트는 두 가지입니다. 하나는 사내 AI 어시스턴트에 긴 문서를 넣을 때 '핵심 결론·정책·숫자는 가운데가 아니라 처음이나 마지막에 두자'는 실무 가이드, 다른 하나는 GEO 콘텐츠를 쓸 때 '한 페이지의 가운데 단락에 핵심을 묻어두지 말자'는 콘텐츠 구성 원칙입니다.
현장에선 RAG·문서 요약·긴 PDF 분석 같은 작업에서 이 효과를 자주 마주칩니다. 청크의 순서를 바꾸거나, 결정적 정보를 앞으로 끌어올리거나, 마지막에 한 번 더 강조하는 식으로 우회합니다.
출처
관련 용어
컨텍스트 품질 저하
컨텍스트가 길어질수록 LLM이 정보를 점점 덜 정확하게 활용하는 현상으로, '큰 컨텍스트 윈도우 = 품질 보장'이 아니라는 사실의 핵심 근거입니다.
LLM컨텍스트 윈도우
LLM이 한 번에 입력으로 받아들일 수 있는 토큰의 최대 길이로, 모델이 한 번에 참고할 수 있는 문맥의 크기를 결정합니다.
LLMRAG
LLM이 답하기 전에 외부 문서나 검색 결과를 가져와 근거로 활용하는 구조로, ChatGPT Search·Perplexity 같은 AI 검색 답변의 핵심 기법입니다.
LLM컨텍스트 엔지니어링
프롬프트 한 줄을 다듬는 것을 넘어, 모델에게 '어떤 컨텍스트를 어떻게 조립해서 줄지' 전체를 설계하는 작업으로 2024~2025년 새롭게 자리 잡은 개념입니다.
LLMLLM
방대한 텍스트 데이터로 학습돼 사람의 언어를 이해하고 생성하는 대규모 신경망 모델로, ChatGPT·Claude·Gemini의 기반이 됩니다.