발행 2026-06-12

AI에 인용되는 페이지의 조건

AI 답변에 내 페이지가 인용될지는 검색 순위가 아니라 패시지 단위의 인용가능성(citability)이 결정합니다. 2026년 3월 Ahrefs 분석에서 구글 AI 개요(AI Overview)가 인용한 출처의 31.0%는 오가닉 검색 100위 밖 페이지였습니다. 순위가 낮아도 인용은 됩니다. 그리고 인용가능성은 측정 가능한 것만 다루면 충분히 개선할 수 있습니다.

AI는 페이지에서 무엇을 보고 인용을 결정하나?

AI는 페이지 전체가 아니라 자기완결적인 답변 블록(패시지)을 뽑아 인용합니다. 한 질문에 맥락 없이도 완결되게 답하는 짧은 문단, 그 안의 사실·통계·출처가 신호가 됩니다. 그래서 "이 페이지가 상위에 있나"보다 "이 문단이 그 질문에 바로 답하나"가 더 중요합니다.

이건 추측이 아니라 실험으로 확인된 방향입니다. KDD 2024에 발표된 Princeton 연구진의 GEO 논문(Aggarwal 외, 2024)은 본문에 통계·인용문·출처를 추가하는 기법이 생성형 엔진 응답 안에서 출처가 인용될 가시성을 최대 약 40%까지 끌어올렸다고 보고했습니다. 특히 검색 순위가 낮은(5위권) 페이지가 가장 큰 수혜를 봤습니다.

위치도 신호입니다. 같은 Princeton 연구가 시사하듯, 핵심 답을 글 위쪽에 자립적으로 배치하는 편이 유리합니다. 결론을 끝까지 미루지 않는 글이 인용에 가깝습니다.

검색 순위(SEO)와 AI 인용(GEO)은 어떻게 다른가?

SEO는 검색 결과에서 순위를 다투는 일이고, GEO(생성형 엔진 최적화)는 AI가 인용할 만한 답이 되는 일입니다. 둘은 상관이 있지만 같지 않습니다. 순위가 토대를 만들어 줄 뿐, 인용을 보장하지는 않습니다. 인용은 패시지가 결정합니다.

수치가 이 간극을 보여줍니다. Ahrefs(2026)가 86만 건의 검색 결과와 400만 개 AI 개요 URL을 분석한 자료에서, AI 개요 인용 출처 중 오가닉 상위 10위 안에 든 페이지는 37.9%뿐이었습니다. 11~100위가 31.2%, 그리고 31.0%는 100위 밖에서 끌려왔습니다(2026-06 원문 기준 갱신 — 오가닉 블루링크만 따로 보면 각각 37.1% / 26.2% / 36.7%로, 어느 쪽으로 봐도 상위 10위 비중은 절반에 못 미칩니다). 같은 추세의 시계열에서 상위 10위 페이지의 인용 비중은 2025년 7월 약 76%에서 2026년 초 약 38%로 절반 가까이 떨어졌습니다(Ahrefs / Search Engine Journal, 2026).

그렇다고 SEO를 버리라는 말은 아닙니다. 분석 요약(BrightEdge / Search Engine Journal, 2025)에 따르면 전체 질의의 약 52%는 AI 개요가 아예 뜨지 않습니다. 그 절반 이상의 질의에서는 전통 오가닉 검색이 여전히 전부입니다. SEO는 필요조건이고, GEO는 그 위에 얹는 별개의 레이어입니다.

인용가능성을 높이는 구조적 조건은?

핵심은 여섯입니다. ① 질문형 헤딩 아래 대략 40~60단어의 자립적 직답 블록 ② 사실·통계 밀도와 명확한 출처 ③ 비교는 표로 정리 ④ 시맨틱 HTML과 구조화 데이터 ⑤ 저자·운영 주체를 잇는 E-E-A-T/엔티티 신호 ⑥ 남과 겹치지 않는 고유한 정보. 화려한 문장이 아니라 기계가 떼어 쓰기 좋은 구조와, 기대고 서기에 안전한 신호가 인용을 끌어옵니다.

직답 블록의 권장 형식은 한 질문에 맥락 없이도 완결되는 짧은 자립 패시지입니다(Averi, 2026). "대략 40~60단어"는 절대 규칙이라기보다 권장값입니다 — 핵심은 길이가 아니라 자기완결성입니다. 그 한 문단만 떼어 읽어도 답이 되어야 합니다.

예를 들어, 같은 내용도 이렇게 달라집니다.

고치기 전: "저희 도구는 여러 가지 항목을 다양한 관점에서 살펴봐서, 페이지를 더 좋게 만드는 데 도움을 드립니다. 자세한 내용은 아래에서 확인하세요."

고친 후: "zupzup는 웹페이지를 8 카테고리 84 분석기로 진단합니다. 검색 순위는 추적하지 않습니다. 대신 직답 블록·사실 밀도·표 구조·시맨틱 마크업처럼 검색과 AI 답변에 잡히는 데 영향을 주는 신호를, 무엇부터 고칠지 우선순위로 알려줍니다. 분석은 100% 브라우저 안에서 실행됩니다."

고친 쪽은 헤딩 없이 떼어 읽어도 한 질문("이 도구는 뭘 하나?")에 완결되게 답합니다. 모호한 형용사 대신 사실값을 담았고, 앞 문장만으로 핵심이 섭니다.

구조화 데이터(JSON-LD)는 정직하게 헤지할 영역입니다. 구글과 마이크로소프트는 생성형 기능에 schema를 사용한다고 공식 확인했고, 추출 정확도에는 도움이 됩니다(Search Engine Land, 2026). 다만 JSON-LD를 추가한 페이지 1,885건을 추적한 분석에서는 AI 인용 변화가 사실상 0에 가까웠습니다(Ahrefs via Stan Ventures, 2026). 즉 schema는 추출을 돕는 위생 항목이지, "넣으면 인용된다"는 보장은 아닙니다.

다섯 번째 신호는 누가 말하는가입니다. AI는 인용 후보를 고를 때 답이 "기대고 서기에 안전한가"를 봅니다 — 경험·전문성·권위·신뢰(E-E-A-T)가 그 판단의 축입니다. 그래서 실제 자격을 갖춘 저자 표기, 운영 주체(Organization)와 저자(Author)를 잇는 일관된 엔티티 신호가 인용가능성에 영향을 줍니다. 익명의 본문보다, 누가 어떤 근거로 쓴 글인지가 드러나는 페이지가 더 안전한 출처로 읽힙니다. 이건 한 페이지를 넘어 사이트·저자 단위로 쌓이는 권위의 문제이기도 한데, 그 바깥 신호(사이트 단위 권위·최신성·오프사이트 멘션)는 2026년의 GEO를 다룬 글에서 별도로 정리했습니다.

여섯 번째는 고유한 정보입니다. AI는 검증할 수 없는 내용을 반복하길 꺼립니다 — 그래서 기존 상위 문서를 그대로 재진술한 페이지는 인용 후보에서 잘 선택되지 않습니다(Surfer, 2025). 같은 사실을 한 번 더 말하는 글보다, 직접 측정한 수치·1차 관찰·고유한 관점을 담은 글이 "여기서만 얻을 수 있는 정보"로 떼어 쓰기 좋습니다. 남과 같은 말은 인용 이유가 약합니다.

전통 SEO vs GEO 체크포인트

체크포인트	전통 SEO 관점	GEO(AI 인용) 관점
단위	페이지·키워드 순위	패시지(자기완결 직답 블록)
헤딩	키워드 포함	질문형 + 바로 아래 직답
사실·통계	있으면 좋음	출처와 함께, 밀도 있게
비교 정보	본문 서술	표로 구조화
구조화 데이터	리치 결과용	추출 정확도 보조(인용 부스트는 입증 약함)
저자·신뢰 신호	저자 표기는 선택	E-E-A-T·엔티티(Author↔Organization) — 안전한 출처 신호
정보의 고유성	키워드 충족이면 충분	재진술 회피 — 고유 데이터·관점이 인용 이유
접근 제어	robots.txt	robots.txt (llms.txt는 현재 미작동)

쿼리 팬아웃 — AI는 질문 하나를 여러 개로 쪼갠다

AI 검색은 한 질문을 여러 하위질문으로 분해해 병렬로 답을 모은 뒤 종합합니다. 이걸 쿼리 팬아웃(query fan-out)이라고 합니다. 그래서 한 주제의 여러 하위질문에 두루 답하는 페이지가, 한 키워드만 노린 페이지보다 인용에 유리합니다.

이건 구글이 공식적으로 설명한 메커니즘입니다. 2025년 5월 발표에서 구글은 AI 모드가 Gemini의 커스텀 버전을 사용하고, Deep Search는 한 질의에서 수백 개의 하위질의를 발행한다고 밝혔습니다(Google, 2025). 업계 분석들은 일반적인 질의 하나가 대략 8~12개의 하위질문으로 확장된다고 추정합니다(iPullRank 등, 2025). 한 페이지가 여러 하위질문에 반복 등장할수록 인용 확률이 올라갑니다. 그리고 한 페이지를 넘어, 하위질문별로 묶인 페이지 군집(토픽 클러스터)이 사이트 단위로 있으면 더 유리합니다 — 클러스터 전략은 2026년의 GEO를 다룬 글에서 다룹니다.

llms.txt 같은 건 효과가 있나?

현재로서는 거의 없습니다. 2025~2026년 시점 기준, 주요 AI 봇이 llms.txt 파일을 실제로 읽지 않습니다. 접근을 통제하려면 llms.txt가 아니라 robots.txt를 써야 합니다. 인용 준비 점검에서 llms.txt는 우선순위가 낮은 항목입니다.

근거는 견고합니다. Semrush(2025)가 한 사이트에 llms.txt를 설치한 뒤 2025년 8~10월을 관찰했을 때, GPTBot·ClaudeBot·PerplexityBot·Google-Extended 같은 주요 봇의 해당 파일 방문은 0회였습니다. 구글도 공식 입장을 냈습니다 — John Mueller는 "현재 어떤 AI 시스템도 llms.txt를 쓰지 않는다"고 했고(2025), Gary Illyes도 구글은 지원하지 않으며 계획도 없다고 확인했습니다(Search Central Live APAC, 2025-07-23). 반면 GPTBot·ClaudeBot·Google-Extended·PerplexityBot 같은 주요 크롤러는 모두 robots.txt를 준수합니다(Search Engine Land, 2025). 점검은 실효 있는 신호에 쓰는 편이 낫습니다.

AI 인용이 트래픽 질에도 영향을 주나?

이건 단정하기 어려운 영역입니다. 한 벤더 분석에서는 ChatGPT 추천 트래픽의 전환율이 비브랜드 오가닉보다 높게 나왔지만, 별도 학술 연구에서는 오히려 낮게 나왔습니다. 카테고리와 구매 경로에 따라 갈립니다. 그래서 zupzup는 전환율을 약속하지 않습니다 — 측정 가능한 것만 다룹니다.

구체적으로, 94개 이커머스 브랜드의 GA4를 본 분석(Visibility Labs via Search Engine Land, 2025)에서는 ChatGPT 추천 트래픽 전환율이 1.81%로 비브랜드 오가닉 1.39%보다 높았습니다. 다만 같은 분석에서도 평균 주문액(AOV)은 오히려 14.3% 낮았습니다 — 같은 데이터 안에서도 지표마다 방향이 갈립니다. 반면 Kaiser & Schulze의 학술 연구(Marketing Science, 2025)는 ChatGPT 추천 트래픽이 구글 오가닉·유료보다 전환과 세션당 매출이 낮다고 보고했습니다. 두 결과가 상충하므로, 인용 자체를 매출 보장으로 읽어선 안 됩니다.

내 페이지가 인용 준비됐는지 어떻게 점검하나?

위 조건을 항목으로 바꿔 하나씩 점검하면 됩니다 — 질문형 헤딩과 자립 직답, 사실·출처 밀도, 표 구조, 시맨틱 HTML과 schema, 저자·운영 주체 표기, 고유 정보, robots.txt 접근. zupzup는 이걸 8 카테고리 84 분석기로 진단해, 점수가 아니라 무엇부터 고칠지 우선순위로 알려줍니다.

zupzup는 검색 순위나 AI 인용 횟수를 추적하지 않습니다. 추적할 수 없는 것은 약속하지 않습니다. 대신 페이지가 검색·AI 답변에 잡히는 데 영향을 주는 신호를 사실값으로 진단하고, 실제 도달성·앵커 링크 도달성·표 접근성까지 다층으로 검증합니다. 분석은 100% 브라우저 안에서 실행되며, 페이지 본문은 외부로 전송되지 않습니다.

결론 / 다음 단계

순위가 아니라 인용가능성입니다. AI는 페이지를 통째로 보지 않고, 그 질문에 바로 답하는 패시지를 떼어 인용합니다. 자립적 직답, 사실·출처 밀도, 표 구조, 시맨틱 마크업 — 이 신호들은 측정할 수 있고, 측정하면 무엇부터 고칠지 보입니다.

내 페이지가 지금 그 조건을 갖췄는지 한 화면으로 보고 싶다면, zupzup로 인용가능성을 진단해 보세요. 점수가 아니라 방향을, 측정 가능한 것만.

→ zupzup로 내 페이지 진단하기