구글 서치콘솔에서 페이지가 색인되지 않는 이유와 해결 방법: 초보자를 위한 상세 가이드

구글 서치콘솔에서 "페이지가 색인되지 않음"이라는 메시지를 받았을 때, 그 원인과 해결 방법을 아주 자세히, 그리고 초보자도 이해할 수 있도록 설명해 드리겠습니다. 위 이미지에서 나온 다섯 가지 오류를 하나씩 분석하고, 각각의 원인과 해결 방법을 단계별로 정리해 볼게요. 이 글을 읽고 나면 색인 문제를 해결하는 데 큰 도움이 될 거예요!

1. robots.txt에 의해 차단됨

robots.txt 파일을 확인하는 모습
< robots.txt 관련 >

어떤 문제인가요?
`robots.txt`는 웹사이트에서 검색 엔진 크롤러(예: 구글봇)가 어떤 페이지를 읽을 수 있고, 어떤 페이지를 읽지 말아야 하는지를 알려주는 파일이에요. 이 파일에 "이 페이지는 크롤링하지 마세요"라는 설정이 되어 있으면, 구글봇이 페이지를 색인(구글 검색 결과에 등록)하지 못해요. 예를 들어, `Disallow: /shop/`이라는 설정이 있으면 `/shop/`으로 시작하는 모든 페이지가 차단돼요.

왜 이런 문제가 생겼을까요?

  • 실수로 중요한 페이지를 차단했을 수도 있어요.
  • 이전에 테스트용으로 차단 설정을 했는데, 나중에 해제하지 않았을 가능성이 있어요.
  • 웹사이트 제작자가 모든 페이지를 차단하도록 설정해 놓고 잊어버린 경우도 있어요.

해결 방법: 단계별로 알아볼게요!

  1. robots.txt 파일 찾기: 웹사이트 주소 뒤에 `/robots.txt`를 붙여서 확인해 보세요. 예: `example.com/robots.txt`. 브라우저에서 이 주소를 입력하면 파일 내용을 볼 수 있어요.
  2. 차단 규칙 확인: 파일 안에 `Disallow:`로 시작하는 줄이 있는지 확인하세요. 예를 들어, `Disallow: /blog/`가 있으면 `/blog/` 아래의 모든 페이지가 차단된 거예요. 문제가 되는 페이지가 이 규칙에 포함되어 있는지 확인하세요.
  3. 규칙 수정: 차단이 필요 없는 페이지라면 `Disallow:` 규칙을 삭제하거나 수정하세요. 이 작업은 웹사이트 서버에 접근하거나 FTP 프로그램(예: FileZilla)을 통해 파일을 편집해야 할 수도 있어요. 잘 모르겠다면 웹사이트 관리자나 개발자에게 도움을 요청하세요.
  4. 테스트하기: 구글 서치콘솔의 "robots.txt 테스터" 도구를 사용해 수정된 설정이 올바른지 확인하세요.
  5. 색인 요청: 문제가 해결되었다면 구글 서치콘솔에서 "URL 검사" 도구를 열고, 해당 페이지의 URL을 입력한 뒤 "색인 생성 요청" 버튼을 눌러 구글봇이 다시 크롤링하도록 요청하세요.

추가 팁: `robots.txt` 파일을 수정할 때는 신중해야 해요. 잘못 수정하면 다른 중요한 페이지까지 색인이 안 될 수 있으니, 수정 전 백업을 꼭 만들어 두세요. 모든 페이지를 차단하는 `Disallow: /` 같은 설정이 있다면, 반드시 삭제하거나 필요한 부분만 남겨두세요.

2. 적절한 표준 태그가 포함된 대체 페이지 지

HTML 소스 코드에서 canonical 태그를 확인하는 모습
< canonical 태그 관련 >

어떤 문제인가요?
이 오류는 페이지가 중복 콘텐츠로 판단되어 구글이 색인하지 않은 경우에 나타나요. 예를 들어, 같은 내용이 `example.com/page1`과 `example.com/page1?sort=new`처럼 여러 URL에 걸쳐 있을 때, 구글은 어떤 URL을 검색 결과에 보여줄지 결정해야 해요. 이때 "표준 태그(canonical tag)"라는 걸 사용해서 "이 URL이 원본이에요"라고 알려줘야 하는데, 이 태그가 없거나 잘못 설정되면 구글이 색인을 거부할 수 있어요.

왜 이런 문제가 생겼을까요?

  • 중복된 페이지가 많아서 구글이 혼란스러워했을 수 있어요.
  • '[link rel="canonical"][/link] 태그가 아예 없거나, 잘못된 URL을 가리키고 있을 가능성이 있어요.
  • CMS(예: 워드프레스)나 플러그인 설정이 잘못된 경우도 있어요.

해결 방법: 단계별로 알아볼게요!

  1. 페이지 소스 코드 확인: 문제가 되는 페이지에 들어가서 브라우저에서 "페이지 소스 보기"를 선택하거나, 키보드 단축키 `Ctrl+U`(Windows) 또는 `Command+U`(Mac)를 눌러 소스 코드를 확인하세요.
  2. canonical 태그 찾기: [head] 섹션에서 `[link href="원본URL" rel="canonical"][/link] 태그가 있는지 확인하세요. 예를 들어, 원본 URL이 `example.com/page1`라면 태그는 [link href="https://example.com/page1" rel="canonical"][/link] 이렇게 되어 있어야 해요.
  3. 태그 수정 또는 추가:
    • 태그가 없으면 추가하세요. HTML 코드의 [head] 섹션에 위와 같은 태그를 넣어 주세요.
    • 태그가 잘못된 URL을 가리키고 있다면 올바른 URL로 수정하세요.
    • 워드프레스를 사용한다면 Yoast SEO나 Rank Math 같은 플러그인을 사용해 canonical 태그를 쉽게 설정할 수 있어요.
  4. 중복 페이지 점검: 중복된 페이지가 있다면(예: `?sort=new` 같은 URL 파라미터), 필요 없는 페이지는 삭제하거나 리디렉션(301 리디렉션)으로 원본 URL로 연결되도록 설정하세요.
  5. 색인 요청: 구글 서치콘솔의 "URL 검사" 도구에서 수정된 URL을 입력하고 "색인 생성 요청"을 제출하세요.

추가 팁: 구글 서치콘솔의 "URL 검사" 도구에서 "크롤링된 페이지" 탭을 보면 구글이 canonical 태그를 어떻게 인식했는지 확인할 수 있어요. 중복 콘텐츠가 많다면 사이트 구조를 정리하는 것도 좋은 방법이에요.

3. 리디렉션이 포함된 페이지

브라우저 개발자 도구에서 리디렉션 경로를 확인하는 모습
< 리디렉션 관련 >

어떤 문제인가요?
이 오류는 페이지가 다른 URL로 리디렉션(예: 301 또는 302 리디렉션)되고 있는데, 리디렉션된 페이지가 색인에 적합하지 않은 경우에 발생해요. 리디렉션은 사용자를 한 페이지에서 다른 페이지로 자동으로 이동시키는 기술이에요. 예를 들어, `example.com/old-page`가 `example.com/new-page`로 리디렉션되도록 설정할 수 있어요.

왜 이런 문제가 생겼을까요?

  • 리디렉션된 최종 페이지가 404 오류(페이지 없음) 상태일 수 있어요.
  • 리디렉션이 너무 복잡하거나, 여러 번 반복(체인 리디렉션)되어 구글봇이 따라가기 어려운 경우가 있어요.
  • 리디렉션된 페이지가 `robots.txt`나 다른 설정으로 차단된 경우도 있어요.

해결 방법: 단계별로 알아볼게요!

  1. 리디렉션 확인: 브라우저에서 문제가 되는 URL을 입력하고, 어디로 리디렉션되는지 확인하세요. 개발자 도구(Chrome에서 `F12` 키 → "Network" 탭)를 사용하면 리디렉션 경로를 자세히 볼 수 있어요.
  2. 리디렉션 설정 점검:
    • 리디렉션은 보통 `.htaccess` 파일(Apache 서버)이나 서버 설정(Nginx 등)에서 관리돼요. 예를 들어, `.htaccess` 파일에 이런 코드가 있을 수 있어요:
      Redirect 301 /old-page /new-page
    • 리디렉션이 필요 없는 경우라면 삭제하거나 수정하세요.
  3. 최종 페이지 점검: 리디렉션된 최종 페이지가 정상적으로 작동하는지 확인하세요.
    • 404 오류가 발생한다면 페이지를 복구하거나 리디렉션 설정을 변경하세요.
    • 최종 페이지가 `robots.txt`로 차단되어 있다면 앞서 설명한 방법으로 차단을 해제하세요.
  4. 색인 요청: 문제가 해결되었다면 구글 서치콘솔에서 "URL 검사" 도구를 사용해 최종 URL을 입력하고 "색인 생성 요청"을 제출하세요.

추가 팁: 리디렉션이 너무 많으면 구글봇이 크롤링을 포기할 수 있으니, 가능한 한 단순하게 설정하세요. 301 리디렉션(영구 이동)은 SEO에 유리하지만, 302 리디렉션(임시 이동)은 색인에 혼란을 줄 수 있으니 주의하세요.

4. 크롤링됨 - 현재 색인되지 않음

콘텐츠 품질을 개선하는 작업을 보여주는 이미지
< 콘텐츠 품질 관련 >

어떤 문제인가요?
구글봇이 페이지를 크롤링(방문해서 내용을 읽음)했지만, 색인하지 않기로 결정한 경우예요. 즉, 구글 검색 결과에 이 페이지가 나타나지 않아요.

왜 이런 문제가 생겼을까요?

  • 콘텐츠 품질 문제: 페이지 내용이 너무 짧거나, 사용자에게 유용하지 않다고 판단될 수 있어요(얇은 콘텐츠).
  • 중복 콘텐츠: 다른 페이지와 내용이 거의 동일해서 구글이 색인할 필요를 느끼지 못했을 수 있어요.
  • 페이지 중요도 낮음: 구글이 이 페이지를 중요하지 않다고 판단했을 가능성이 있어요.

해결 방법: 단계별로 알아볼게요!

  1. 콘텐츠 품질 개선:
    • 페이지 내용을 더 풍부하게 채우세요. 예를 들어, 블로그 글이 200~300단어로 너무 짧다면 800~1000단어 정도로 늘려 보세요.
    • 사용자에게 유용한 정보를 제공하세요. 단순히 키워드를 반복하는 대신, 독자가 궁금해할 만한 정보를 자세히 다루세요.
    • 이미지, 표, 리스트 등을 추가해 콘텐츠를 더 읽기 쉽게 만들어보세요.
  2. 중복 콘텐츠 제거: 다른 페이지와 비슷한 내용이 있다면 고유한 콘텐츠로 수정하거나, 중복된 페이지를 삭제하세요.
  3. 메타 태그 최적화:
    • [title] 태그와 `[meta name="description"][/meta]` 태그를 페이지에 맞게 설정하세요. 예:
      <title>나만의 블로그 - 유용한 팁과 정보</title>
      <meta name="description" content="이 블로그에서는 유용한 팁과 정보를 제공합니다.">
    • 키워드를 과도하게 반복(키워드 스터핑)하지 말고, 자연스럽게 사용하세요.
  4. 내부 링크 추가: 다른 페이지에서 이 페이지로 연결되는 링크를 추가해서 페이지의 중요도를 높여 보세요. 예를 들어, 홈페이지나 관련 블로그 글에서 "여기에서 더 알아보기" 같은 링크를 걸어 주세요.
  5. 색인 요청: 구글 서치콘솔에서 "URL 검사" 도구를 사용해 수정된 페이지의 URL을 입력하고 "색인 생성 요청"을 제출하세요.

추가 팁: 구글은 사용자 경험을 중요하게 생각해요. 페이지가 모바일에서도 잘 보이는지(모바일 친화성), 로딩 속도가 빠른지 확인하세요. 구글의 "페이지 경험 보고서"를 확인하면 개선할 부분을 더 자세히 알 수 있어요.

5. 발견됨 - 현재 색인되지 않음

사이트맵을 구글 서치콘솔에 제출하는 모습
< 사이트맵 관련 >

어떤 문제인가요?
구글이 페이지를 발견했지만(예: 사이트맵이나 링크를 통해), 아직 크롤링하거나 색인하지 않은 경우예요.

왜 이런 문제가 생겼을까요?

  • 크롤링 예산 부족: 구글은 하루에 크롤링할 수 있는 페이지 수(크롤링 예산)가 제한적이에요. 사이트가 크거나 페이지가 많으면 모든 페이지를 크롤링하지 못할 수 있어요.
  • 페이지 우선순위 낮음: 구글이 이 페이지를 중요하지 않다고 판단했을 가능성이 있어요.
  • 사이트 속도 문제: 페이지 로딩 속도가 느리면 구글봇이 크롤링을 미룰 수 있어요.

해결 방법: 단계별로 알아볼게요!

  1. 사이트맵 제출:
    • 사이트맵(sitemap.xml)은 웹사이트의 모든 페이지 URL을 정리한 파일이에요. 이 파일을 만들어서 구글 서치콘솔에 제출하면 구글봇이 페이지를 더 쉽게 발견할 수 있어요.
    • 워드프레스라면 Yoast SEO 같은 플러그인이 자동으로 사이트맵을 만들어 줘요.
    • 구글 서치콘솔의 "사이트맵" 메뉴에서 `example.com/sitemap.xml`을 제출하세요.
  2. 내부 링크 강화: 중요한 페이지로 연결되는 내부 링크를 추가해서 구글봇이 쉽게 찾도록 도와주세요. 예를 들어, 홈페이지에서 "최신 글 보기" 같은 링크를 걸어 주세요.
  3. 페이지 속도 개선:
    • 페이지 로딩 속도를 빠르게 만들기 위해 이미지 크기를 줄이거나(압축 도구: TinyPNG 추천), 캐싱을 설정하세요.
    • 구글의 PageSpeed Insights 도구를 사용해 속도 문제를 점검하고 개선하세요.
  4. 모바일 친화성 점검: 구글은 모바일 우선 색인(Mobile-First Indexing)을 사용하므로, 페이지가 모바일에서도 잘 보이는지 확인하세요. 구글의 "모바일 친화성 테스트" 도구를 사용하면 도움이 돼요.
  5. 색인 요청: 시간이 지나도 색인되지 않으면, 구글 서치콘솔의 "URL 검사" 도구에서 URL을 입력하고 "색인 생성 요청"을 제출하세요.

추가 팁: 새로운 페이지라면 시간이 조금 걸릴 수 있어요. 구글봇이 크롤링 예산에 따라 천천히 색인할 수도 있으니, 너무 조급해하지 마세요. 사이트맵을 주기적으로 업데이트하고 제출하면 색인 속도가 빨라질 수 있어요.

꾸준한 점검이 중요해요!

구글 서치콘솔에서 페이지 색인 문제를 해결하려면, 먼저 오류의 원인을 정확히 파악하는 게 중요해요. `robots.txt`, canonical 태그, 리디렉션 설정을 점검하고, 콘텐츠 품질을 높이는 작업을 꾸준히 해보세요.

문제가 해결되지 않는다면, 구글 서치콘솔의 "색인 생성 범위" 보고서를 주기적으로 확인하면서 어떤 부분을 더 개선해야 할지 분석해 보세요. 또, 구글의 공식 도움말 페이지나 커뮤니티(예: 구글 서치콘솔 헬프 포럼)에서 다른 사용자들의 경험을 참고하는 것도 큰 도움이 될 거예요.