AI 크롤링
한 줄 정의
AI 학습·답변 생성용 크롤러가 웹을 수집하는 동작 일반을 가리키며, 일반 검색 크롤링과 다른 정책·부하 특성을 가집니다.
자세히 알아보기
AI Crawling은 GPTBot·ClaudeBot·Google-Extended 같은 AI Crawler가 실제로 웹을 도는 행동 자체를 가리키는 표현입니다. 일반 검색 크롤링과 헷갈리기 쉽지만, 두 가지가 다른 점이 있습니다. 첫째, 정책 결정의 결이 다르고(학습/답변 인용 분리), 둘째, 일부 AI 봇은 트래픽 부하가 비교적 큰 편이라 운영 측면의 고려도 따라옵니다.
마케터 관점에서 AI Crawling을 이해해 두면 좋은 이유는 robots.txt 정책 결정이 단순한 'on/off'가 아니라는 점이 보이기 때문입니다. '학습 데이터 사용은 거부하지만 검색 답변에는 인용되고 싶다' 같은 결정은 AI Crawling을 어떤 봇이 어떤 목적으로 하느냐를 알 때 가능해집니다.
또 하나, AI Crawling은 사용자 요청 시점에 실시간으로 일어나는 형태도 늘어나고 있습니다. ChatGPT-User처럼 사용자가 답변을 요청하는 그 순간에 페이지를 가져가는 봇은, 학습용 봇보다 봇 식별자가 자주 바뀌고 정책 차이도 큽니다. 정기적인 점검이 필요한 부분입니다.
관련 용어
AI 크롤러
AI 모델 학습 또는 AI 검색 답변 생성을 위해 운영되는 웹 크롤러를 통칭하며, GPTBot·ClaudeBot·Google-Extended가 대표적입니다.
GEO·AEOGPTBot
OpenAI가 ChatGPT 학습·검색용으로 운영하는 웹 크롤러로, robots.txt를 통해 접근을 허용하거나 차단할 수 있습니다.
GEO·AEOOAI-SearchBot
OpenAI가 ChatGPT Search 색인을 위해 별도로 운영하는 크롤러로, 학습용 GPTBot과는 정책을 분리해 통제할 수 있습니다.
GEO·AEOClaudeBot
Anthropic이 Claude 학습·답변 생성을 위해 운영하는 웹 크롤러로, robots.txt를 통해 제어할 수 있습니다.
GEO·AEOllms.txt
사이트 루트에 두는 텍스트 파일로, LLM에게 '이 사이트의 핵심 콘텐츠가 어디에 있는지'를 안내하기 위해 제안된 비공식 규약입니다.