AI 크롤러
한 줄 정의
AI 모델 학습 또는 AI 검색 답변 생성을 위해 운영되는 웹 크롤러를 통칭하며, GPTBot·ClaudeBot·Google-Extended가 대표적입니다.
자세히 알아보기
AI Crawler는 LLM 학습이나 AI 검색 답변 생성을 위해 운영되는 크롤러를 한 단어로 묶은 표현입니다. GPTBot·ClaudeBot·PerplexityBot·Google-Extended·CCBot처럼 개별 봇이 많아지다 보니, 정책 문서나 마케팅 자료에서 묶어 부를 단어가 필요해서 자연스럽게 자리잡았습니다.
마케터 입장에서 'AI Crawler 정책'이라고 할 때의 핵심 결정은 두 가지입니다. (1) 우리 콘텐츠가 LLM 학습 데이터에 들어가도 되는가, (2) AI 검색 답변에 인용되길 원하는가. 두 결정이 서로 달라질 수 있어서, 봇 단위로 다르게 세팅하는 사이트가 많아지고 있습니다.
AI Crawler 풀이 빠르게 늘어나는 만큼, 한 번 robots.txt를 정해 두고 방치하면 새로 등장한 봇이 누락될 가능성이 큽니다. 정기적으로 봇 목록을 갱신하고, 정책 의도(학습 차단/답변 노출 허용 등)에 맞춰 일관되게 관리하는 게 일반적인 운영 방식입니다.
관련 용어
AI 크롤링
AI 학습·답변 생성용 크롤러가 웹을 수집하는 동작 일반을 가리키며, 일반 검색 크롤링과 다른 정책·부하 특성을 가집니다.
GEO·AEOGPTBot
OpenAI가 ChatGPT 학습·검색용으로 운영하는 웹 크롤러로, robots.txt를 통해 접근을 허용하거나 차단할 수 있습니다.
GEO·AEOClaudeBot
Anthropic이 Claude 학습·답변 생성을 위해 운영하는 웹 크롤러로, robots.txt를 통해 제어할 수 있습니다.
GEO·AEOGoogle-Extended
구글이 Gemini·Vertex AI 학습용으로 별도 분리해 둔 크롤러 식별자로, 일반 검색용 Googlebot과 따로 통제할 수 있습니다.
GEO·AEOllms.txt
사이트 루트에 두는 텍스트 파일로, LLM에게 '이 사이트의 핵심 콘텐츠가 어디에 있는지'를 안내하기 위해 제안된 비공식 규약입니다.