헌법 기반 AI
Constitutional AI (CAI)
한 줄 정의
Anthropic이 제안한 정렬 기법으로, 사람이 일일이 점수를 매기는 대신 '헌법(원칙)' 문서를 기준으로 모델이 자신의 답변을 스스로 평가하고 고치도록 학습시킵니다.
자세히 알아보기
Constitutional AI는 RLHF(인간 피드백 기반 강화학습)의 보완·대안으로 Anthropic이 2022년에 제안한 방법입니다. 사람이 모든 응답에 점수를 매기는 대신, '해를 끼치지 않는다', '도움이 된다', '정직하다' 같은 원칙들을 글로 명시하고, 모델이 그 원칙을 기준으로 자기 답변을 비판·수정하도록 학습시킵니다.
마케터에게 직접 보이는 영향은 'Claude의 답변 스타일'입니다. Claude가 종종 ChatGPT나 Gemini보다 더 신중하고, 위험한 요청에 부드럽게 거절하는 톤을 보이는 이유 중 큰 부분이 Constitutional AI에 있습니다. 같은 질문이라도 모델별로 답변 결이 다른 까닭이 여기서 옵니다.
Constitutional AI가 만능은 아닙니다. 헌법 자체가 잘못 쓰여 있으면 모델 행동도 같이 어긋나고, 다국어·문화권에 따라 같은 원칙이 다르게 해석되는 문제도 남아 있습니다. 그래서 실무에서는 RLHF·평가 시스템·HITL과 함께 다층 방어로 쓰이는 경우가 많습니다.
출처
관련 용어
Claude
Anthropic이 개발한 LLM 시리즈로, 안전성·긴 문맥 처리·도구 사용에 강점을 가지고 있어 기업·개발자 환경에서 폭넓게 쓰입니다.
AI Agent권한 모델
에이전트가 어떤 도구·데이터·행동에 접근할 수 있는지 정의하는 체계로, 자율 에이전트 운영의 핵심 안전장치입니다.
AI Agent에이전트 평가
에이전트가 목표를 얼마나 정확하고 안전하게 수행하는지 측정하기 위한 테스트·지표 체계로, 일반 LLM 평가와는 결이 다릅니다.
AI Agent휴먼 인 더 루프
에이전트가 자율적으로 작업을 수행하되, 중요한 결정 단계에서는 사람이 검토·승인하도록 끼워 넣는 운영 방식입니다.
LLMLLM
방대한 텍스트 데이터로 학습돼 사람의 언어를 이해하고 생성하는 대규모 신경망 모델로, ChatGPT·Claude·Gemini의 기반이 됩니다.
우리 브랜드는 AI 답변에 어떻게 등장하고 있을까요?
Villion은 ChatGPT·Perplexity·AI Overview에서 브랜드 인용 현황을 진단하고, 인용률과 언급 점유율을 끌어올리는 작업을 자동화합니다.
무료 진단 받기