EEAT는 Google이 검색 결과 품질을 평가하는 네 가지 잣대로 경험(Experience) · 전문성(Expertise) · 권위(Authoritativeness) · 신뢰(Trust)의 머리글자입니다. Google Search Quality Evaluator Guidelines Section 3.4는 그중 가장 중요한 요소를 Trust로 못 박았습니다. AI 검색 시대에도 EEAT는 약해진 게 아니라 더 실무적으로 중요해졌습니다.

GEO 진단의 4축 — EEAT · 토픽 권위도 · 엔티티 현저성 · 청크 적합도

“우리 회사가 ChatGPT 답변에 얼마나 자주 등장하나요?”

이 질문에 답하려면 숫자 가 필요해요. 그것도 4 AI × 4 측정 축 매트릭스 위에 정렬된 9 KPI 형태로.

이 글에서는 한국 기업의 AI 답변 가시성을 측정하는 4 진단 축 — EEAT · 토픽 권위도 · 엔티티 현저성 · 청크 적합도 — 가 각각 무엇이고, 왜 이 4개가 합쳐져야 AI 답변 가시성의 진짜 점수 가 보이는지 정리해볼게요.

EEAT가 뭔가요?

EEAT는 Google이 검색 결과 품질을 평가하는 네 가지 잣대 로, 경험(Experience) · 전문성(Expertise) · 권위(Authoritativeness) · 신뢰(Trust) 의 머리글자입니다. 한 문장으로 정리하면 — “이 콘텐츠를 쓴 사람이 정말 그 주제를 알고 있고, 우리가 믿을 만한가?” 를 4가지 각도에서 묻는 것이에요.

Google이 직접 채용한 Quality Rater (검색 품질 평가자) 들에게 배포하는 공식 평가 매뉴얼 — Search Quality Evaluator Guidelines — 의 Section 3.4는 EEAT 4 요소의 정의를 명시하면서, 그중 가장 중요한 것을 신뢰(Trust) 로 못 박았습니다.

📚 EEAT 공식 정의

"The most important member at the center of the E-E-A-T family is Trust."

— E-E-A-T 가족의 중심에서 가장 중요한 구성원은 신뢰 입니다.

Google, Search Quality Evaluator Guidelines, Section 3.4

Google Search Central — E-E-A-T 확장 공식 발표 블로그 게시글 (2022-12) — 출처: Google Search Central Blog — E-E-A-T 확장 발표 (2022-12)

AI 검색 시대에 EEAT가 약해졌다 는 오해가 종종 있는데, 실제로는 반대 예요. Search Engine Land의 Lily Ray는 최근 글에서 이렇게 분석했습니다.

"the content that performs best in AI Overviews or receives citations from ChatGPT is, more often than not, the same high-quality, well-optimized content that excels in traditional Google Search."

— AI Overviews에서 가장 잘 작동하는 콘텐츠는 대체로 기존 Google 검색에서도 강한 고품질·고최적화 콘텐츠 다.

Lily Ray, AI search is booming, but SEO is still not dead (Search Engine Land, 2025-07)

즉 EEAT 점수가 높은 회사일수록 AI 답변에 인용될 확률 도 높아진다는 뜻이에요. GEO 진단의 첫 축 인 이유가 여기 있습니다.

구체 예시 하나 짚어볼게요. 같은 주름 개선 크림_을 파는 K뷰티 자사몰 두 곳이 있다고 해봐요. A 자사몰은 _제품 이름·가격·구매 버튼 뿐이에요. B 자사몰은 거기에 더해 임상 시험 결과 + 피부과 전문의 인터뷰 + 실제 사용자 리뷰 + 작성자 약력 까지 같이 보여줘요. ChatGPT에 “주름 개선에 좋은 K뷰티 크림 추천해줘” 라고 물으면 AI는 거의 항상 B를 답변에 인용해요. 같은 제품을 팔아도 누가 썼는지·왜 믿을 만한지 가 보이는 페이지가 EEAT 점수에서 앞서기 때문입니다.

토픽 권위도는 어떻게 만들어지나요?

토픽 권위도(Topical Authority)는 “특정 주제에 대한 사이트의 전문성과 신뢰성” 입니다. Semrush의 공식 정의가 가장 깔끔해요.

"Topical authority refers to a website's expertise and credibility on a particular subject."

— 토픽 권위도는 특정 주제에 대한 웹사이트의 전문성과 신뢰성 을 뜻한다.

Semrush, What is Topical Authority?

Semrush는 이 점수를 자사 Keyword Overview에서 Low / Moderate / Relevant / High 4단계로 노출합니다. 즉 막연한 개념이 아니라 실제로 측정 가능한 SEO 운영 단위 라는 거예요.

토픽 권위도를 만드는 가장 검증된 패턴은 콘텐츠 필러(Content Pillar) 전략입니다. 한 주제에 대해 허브 페이지(pillar) + 그 주변을 둘러싸는 깊이 있는 하위 글(cluster) 을 만들어 내부 링크 로 연결하는 구조죠.

Ahrefs는 AI 검색 시대에 콘텐츠 필러가 더 중요해졌다고 말합니다.

"AI systems like ChatGPT literally map out how close your content is to specific topics in their 'understanding.'"

— ChatGPT 같은 AI 시스템은 우리 콘텐츠가 특정 주제에 얼마나 가까운지를 자기 모델의 이해 안에 말 그대로 매핑한다.

Ahrefs, Content Pillars: What They Are & How to Build Them for SEO & AI Visibility

허브-스포크가 뭔지 잠깐 풀어볼게요. 자전거 바퀴 를 떠올리면 쉬워요. 가운데 축(허브) 에 바퀴살(스포크) 들이 박혀 있죠. 콘텐츠도 똑같이 — 주제 전체를 정리한 종합 페이지(허브) 하나에 그 주제의 세부 글들(스포크) 을 내부 링크로 묶어 두는 구조입니다.

구체 예시. 한국 라면 회사 X가 “한국 라면 완전 가이드” 라는 허브 페이지를 만들고, 그 아래에 재료 비교 · 끓이는 법 · 매운맛 등급 · 글로벌 추천 5선 · 면 굵기별 분류 · 보관 방법 · 영양 정보 · 신제품 트렌드 8개 세부 글을 운영하면서 모든 세부 글에서 다시 허브 페이지로 링크 를 걸어요. 이렇게 허브-스포크 + 내부 링크 가 누적되면 AI는 “한국 라면 = X 회사가 가장 자세히 다루는 주제” 로 인식하기 시작합니다. 글 5편만 분산해 올린 경쟁사와 완전히 다른 토픽 권위도 가 만들어지는 거예요.

한국 시장의 약점은 분명해요. 상세페이지·브랜드 스토리·보도자료 단편 콘텐츠는 풍부한데, 허브-스포크 구조 로 한 주제를 깊게 묶은 사이트는 드뭅니다. 토픽 권위도 점수가 낮을 수밖에 없는 구조예요.

엔티티 현저성, AI는 어떻게 인식할까요?

엔티티 현저성(Entity Salience) 은 비유가 아니라 Google이 실제로 쓰는 0~1.0 점수 입니다. Google Cloud Natural Language API 공식 문서가 정의를 못 박아 놨어요.

먼저 엔티티 부터 풀어볼게요. 엔티티는 AI가 인식하는 고유한 이름표 예요. 우리가 “삼성전자” 라고 쓰면 AI는 그것을 Samsung Electronics Co., Ltd. 라는 회사 엔티티 로 매핑합니다. 같은 회사를 삼성·SS전자·Samsung 으로 다양하게 부르더라도 AI 머릿속에서는 하나의 엔티티 노드 에 연결돼요. 문제는 한국 중소 브랜드는 AI 학습 데이터에 이름이 충분히 등장하지 않아서 아예 엔티티로 인식조차 안 되는 경우가 많다는 점이에요. 그러면 AI 답변에 회사 이름이 나타날 수가 없어요 — 회사 자체가 AI 세계에서 존재하지 않는 셈이니까요.

"The salience score for an entity provides information about the importance or centrality of that entity to the entire document text."

— 엔티티의 salience 점수는 그 엔티티가 문서 전체에서 얼마나 중요하고 중심적인지 를 알려준다.

Google Cloud, Entity | Cloud Natural Language API

같은 문서가 대부분의 엔티티 타입은 Wikipedia URL 또는 Google Knowledge Graph MID를 metadata로 가질 수 있다 고도 명시합니다. 즉 AI는 우리 회사를 이름 문자열 로만 보지 않고 knowledge graph 안의 엔티티 노드 로 인식해요. 그 노드의 연결 밀도 가 높을수록 _AI 답변에 인용될 확률_도 높아집니다.

Aleyda Solis는 AI 검색에서 잘 작동하는 브랜드의 10가지 특성 중 “Recognizable” 을 별도 항목으로 분리해 정리했습니다.

"Make your brand easy for systems to identify as a distinct entity."

— 당신의 브랜드를 시스템이 별개의 엔티티로 쉽게 식별할 수 있게 만들어라.

Aleyda Solis, The 10 Key Characteristics of AI Search Winning Brands

Aleyda Solis — AI Search Winning Brands 강연 (YouTube) — 출처: YouTube — Aleyda Solis 강연

엔티티 신호를 끌어올리는 가장 빠른 방법은 1번 글에서도 짚었던 두 가지 — Schema.org Organization 마크업 + /llms.txt 파일 — 이에요. 추가로 sameAs 배열에 공식 채널 4개 이상 연결 하면 AI가 “이 회사 = 저 회사 = 또 저기 그 회사” 라는 엔티티 동일성을 인식하기 시작합니다.

엔티티 그래프 — 회사 노드와 주변 연결

AI는 우리 회사를 문자열이 아닌 그래프 안의 노드로 인식합니다. 연결 밀도가 높을수록 현저성 점수가 올라갑니다.

Wikipedia 페이지 LinkedIn 공식 Knowledge Graph YouTube 채널 권위 매체 인용 (약함) 학술·정부 인용 (약함)

우리 회사
엔티티

실선 = 강한 연결 (Schema sameAs · 공식 프로필) · 점선 = 약한 신호 (외부 인용 부족). 한국 기업은 보통 점선 영역이 비어 있어 현저성이 낮습니다.

Google은 별도로 Knowledge Graph Search API 라는 공식 검색 API를 운영합니다. “The Knowledge Graph Search API lets you find entities in the Google Knowledge Graph” — 즉 Google이 엔티티 단위로 콘텐츠를 다룬다는 가장 분명한 1차 증거예요 (Google Developers).

청크 적합도가 왜 중요한가요?

청크 적합도(Chunk Fitness)는 “AI가 페이지를 200~500자 단위로 잘랐을 때, 그 청크가 답변에 인용되기 얼마나 적합한가” 의 점수입니다. AI는 페이지를 통째로 인용하지 않고 청크 단위 로 추출하기 때문에, 이 점수가 GEO의 핵심 처방 지점이에요.

청크가 뭔지 간단히 풀어볼게요. 우리가 쓰는 한 페이지가 1,500자라면, AI는 그것을 200~500자짜리 작은 덩어리(청크) 3~5개 로 자르고 그중 하나 만 답변에 인용해요. 같은 페이지 안에서도 Q&A 형태 단락 과 긴 서술 단락 은 뽑힐 확률이 매우 다릅니다. 직답·정의·표·리스트 형태의 청크가 서술식 긴 문단 보다 훨씬 잘 뽑혀요. Contextual Retrieval 은 각 청크 앞에 그 청크가 무엇에 관한 것인지 한 줄 맥락을 붙여, 엉뚱한 청크가 뽑히는 검색 실패 를 절반 가까이 줄였다는 게 위 Anthropic 보고의 의미입니다.

학술 원전인 GEO 논문(Aggarwal 외, KDD 2024)은 청크 단위 처방의 효과를 수치로 보고했습니다.

"Generative Engine Optimization can improve the visibility of websites by up to 40%."

— GEO는 웹사이트 가시성을 최대 40%까지 높일 수 있다.

Aggarwal et al., GEO: Generative Engine Optimization (arXiv 2311.09735 v3, KDD 2024)

Pranjal Aggarwal — GEO 논문 1저자 · Carnegie Mellon University PhD Student — 출처: pranjal2041.github.io

여기서 한 단계 더 들어간 게 Contextual Retrieval — 청크 앞 에 짧은 문맥 한 문장 을 붙여 인용 실패율을 크게 낮추는 방법이에요. Anthropic은 2024년 9월 공식 발표에서 다음 수치를 제시했습니다.

"This method can reduce the number of failed retrievals by 49% and, when combined with reranking, by 67%."

— 이 방법은 검색 실패를 49% 줄이고, reranking과 결합하면 67% 까지 줄인다.

Anthropic, Introducing Contextual Retrieval (2024-09)

Anthropic — Introducing Contextual Retrieval (2024-09-19) — 출처: anthropic.com

다만 분할 방법론은 만능이 아님 도 함께 알아둘 필요가 있어요. NAACL Findings 2025에 게재된 학술 비교 연구는 “semantic chunking의 계산 비용은 일관된 성능 향상으로 정당화되기 어렵다” 고 결론지었습니다 (arXiv 2410.13070). 즉 어떤 청크 분할 방식을 쓰느냐 보다 각 청크에 직답·근거·인용을 어떻게 담느냐 가 더 결정적인 변수라는 뜻이에요.

청크 점수를 결정하는 4 요소

한 청크가 100점 만점 중 몇 점인지는 이 4 요소의 합으로 결정됩니다. 50점 이상이 AI 답변에 인용되는 적격선입니다.

1 직답성 최대 25점

첫 1~2 문장이 질문에 곧장 답한다. Q&A형 H2와 정의 박스 형태가 가장 강함.

2 정형 근거 최대 25점

통계 · 1차 출처 인용 · 표 · 리스트 같은 구조화된 근거가 청크 안에 들어있다.

3 적정 길이 최대 25점

단락이 200~500자 의미 단위로 끊어진다. 너무 짧으면 맥락 부족, 너무 길면 분할 손실.

4 문맥 문장 최대 25점

청크 앞에 "이 청크가 무엇에 관한 것인가" 한 줄이 붙는다 (Contextual Retrieval, Anthropic 2024).

청크 점수 = 직답성 + 정형 근거 + 적정 길이 + 문맥 문장 ≥ 50점 → 인용 적격

한 페이지 안에 10~20개 청크가 있을 때, 50점 이상 청크 비율이 그 페이지의 AI 답변 인용 가능성을 결정합니다. 4 요소 중 최소 2개를 만점에 가깝게 채워야 통과선을 넘기기 쉽습니다.

4축이 어떻게 9 KPI로 합쳐지나요?

GeoMoment의 9 KPI 는 다음 구조로 통합돼요.

기본 5축 — Overall · ChatGPT · Gemini · Claude · Perplexity (4 AI별 + 통합 점수 1개)
깊이 분석 4축 — EEAT · 토픽 권위도 · 엔티티 현저성 · 청크 적합도 (지금까지 다룬 4축)

이 두 묶음이 만나서 4 측정 축 × 4 답변 엔진 = 16 셀 매트릭스 가 생기고, 그 위에 Overall 통합 점수 1개 가 얹히는 구조입니다. 그래서 9 KPI 가 곧 4 + 4 + 1 의 다른 표현이에요.

숫자가 헷갈리시면 이렇게 정리하세요. 4축 × 4 AI = 16 세부 칸 의 정밀 진단표가 깊이 분석용이고, 그 위에 전체 통합 점수 1개 + AI별 종합 점수 4개 가 빠른 요약용이에요. 즉 9 KPI = AI별 점수 4 + 측정 축별 점수 4 + 종합 점수 1. 16 세부 칸은 어디부터 손볼지 를 찾을 때, 9 KPI는 한 화면에서 약점 영역 을 가리킬 때 봅니다.

4 측정 축 × 4 답변 엔진 매트릭스

한 진단표 안에서 어느 AI · 어느 축이 약한지 한 눈에 보이게 정렬됩니다.

ChatGPT

Gemini

Claude

Perplexity

EEAT

토픽
권위도

엔티티
현저성

청크
적합도

16 셀 + Overall 통합 점수 1개 + 4 AI별 점수 4개 = 총 9 KPI

왜 4축을 한꺼번에 봐야 할까요. *한 축만 보면 해석이 어긋나기_ 때문이에요.

EEAT만 높고 청크 적합도가 낮은 페이지 — 권위 있는 글을 썼지만 AI가 인용할 만한 직답 단위 가 부족
엔티티 현저성만 높고 토픽 권위도가 낮은 회사 — 브랜드 이름은 알려졌지만 깊이 있는 주제 클러스터 가 없음
토픽 권위도만 높고 EEAT가 낮은 사이트 — 글은 많지만 저자 정보·출처·신뢰 신호 가 부족

4축은 서로를 보완 합니다. 한 화면에 함께 보여야 처방의 방향이 정확해져요.

우리 회사 4축, 오늘 어떻게 점검할까요?

오늘 12 문항 자기 진단 체크리스트 한 번 돌려보시면 됩니다. 각 축에 3 문항씩, 예/아니오 로 빠르게 답할 수 있어요.

4축 × 3문항 = 12 문항 자기 진단

예 / 아니오 로 답하고, 아니오가 많은 축이 우리 회사의 보강 우선순위입니다.

EEAT 경험·전문성·권위·신뢰

모든 글에 작성자 이름·직책·약력이 명시되어 있다
본문에 권위 매체·정부 통계·학술 자료 인용이 5건 이상 있다
회사의 분야 전문 경력이 사이트 어딘가에 1차 자료로 드러나 있다

토픽 권위도 주제 깊이 + 클러스터

한 주제군에 글이 5편 이상 누적되어 있다
허브-스포크 구조의 내부 링크가 적용되어 있다
핵심 카테고리 페이지가 자체 정의·핵심 자료를 담고 있다

엔티티 현저성 엔티티 그래프 연결

Schema.org Organization 마크업이 head에 들어가 있다
sameAs 배열에 공식 채널 4개 이상이 연결되어 있다
회사명이 Wikipedia·Knowledge Graph에 인덱싱되어 있다

청크 적합도 청크 단위 직답·근거

H2를 질문형(Q&A) 으로 쓰고 첫 1~2문장에 직답이 있다
주요 청크에 통계·인용·표 같은 정형 근거가 들어있다
긴 한 문단보다 200~500자 의미 단위로 단락이 나뉜다

아니오가 가장 많은 축이 지금 가장 시급한 보강 영역 입니다. 4축을 한 번에 측정·진단받고 싶으시면 무료 GEO 진단으로 4 AI 동시 측정 결과를 받아보세요.

자기 진단으로 대략적 약점 은 보이지만, 어느 페이지의 어느 청크가 몇 점인지 까지는 직접 측정해야 알 수 있어요. 직접 측정이 어렵거나 처방 우선순위 가 막막하면 무료 GEO 진단으로 한 번 물어봐주세요. ChatGPT · Perplexity · Gemini · Claude 네 개 AI에 동시에 던져서 4축 중 어디가 약한지 9 KPI 리포트로 풀어드려요 🙂

HubSpot의 한국어 가이드도 허브-스포크 구현 시점에 함께 보시면 좋아요 — 주제, 기둥 페이지 및 하위 주제 키워드 (자동 번역 페이지, 영문 원본이 정본).

다음 글에서는 청크 단위 처방의 5가지 패턴 — Q&A H2, 정의 박스, 비교 표, 엔티티 풍부화, 권위 출처 카드 — 을 오늘 페이지에 그대로 적용 가능한 형태로 정리했어요.

EEAT가 뭔가요?

토픽 권위도는 어떻게 만들어지나요?

엔티티 현저성, AI는 어떻게 인식할까요?

엔티티 그래프 — 회사 노드와 주변 연결

청크 적합도가 왜 중요한가요?

청크 점수를 결정하는 4 요소

4축이 어떻게 9 KPI로 합쳐지나요?

4 측정 축 × 4 답변 엔진 매트릭스

우리 회사 4축, 오늘 어떻게 점검할까요?

4축 × 3문항 = 12 문항 자기 진단

우리 회사는 ChatGPT 답변에 얼마나 노출되고 있을까요?

같이 읽으면 좋은 글