구글 웹마스터 – 사이트의 검색 순위가 낮은 경우 확인할 사항

사이트의 검색 실적 확인

구글의 스팸정책에 대해 구글 담당자의 입장을 담은 영상입니다.요약하면 아래와 같습니다.
구글은 웹스팸에 대해 수동적으로 대처할 방침인가요?

그럴 경우, 검색결과에서 사이트를 제외시키나요? 순위를 내리나요?
– 구글은 스팸에 대해 수동으로 삭제할 방침입니다.
– 본질적으로는 부정행위, 위장행위를 막고자 함입니다.

이하, Google Search Console 고객센터의 도움말입니다.

Google의 목표는 모든 검색어에 대해 가장 관련성이 높은 검색결과를 표시하는 것입니다. 검색결과는 Google 검색 색인을 기반으로 하여 표시되며 Google 검색 색인은 웹에서 콘텐츠가 추가되거나 수정될 때마다 갱신됩니다. 콘텐츠가 변경되거나 Google의 순위 결정 알고리즘이 업데이트되면 검색결과에서 URL의 게재순위가 바뀌거나 드물게는 삭제될 수도 있습니다.

이와 같은 순위 변동 체계가 복잡해 보일 수도 있습니다. 요약하자면 웹에서 다른 사이트와 잘 연결된 사이트는 다음 크롤링 시 Google 검색결과에 추가될 가능성이 큽니다. Google에서는 특정 페이지가 계속해서 Google 색인에 게재되거나 특정 순위에 게재된다고 보장하지는 않습니다. 하지만 웹마스터 가이드라인을 참조하면 크롤러가 쉽게 접근할 수 있도록 사이트를 관리하는 데 유용한 정보를 얻을 수 있습니다. 웹마스터 가이드라인에 명시된 권장사항을 준수하는 웹사이트는 Google 검색결과에 항상 포함될 확률이 높아집니다.

Google 검색결과에서 사이트가 보이지 않거나 이전보다 게재순위가 낮아진 경우, 다음 단계에 따라 이러한 문제를 일으킨 원인을 확인할 수 있습니다.

  • Google 색인에 사이트가 포함되어 있는지 확인
  • 사이트가 직접 스팸 조치의 영향을 받지 않았는지 확인
  • Google에서 사이트를 찾아 크롤링할 수 있는지 확인
  • Google에서 사이트를 색인에 등록할 수 있는지 확인
  • 콘텐츠가 유용하며 관련성이 높은지 확인

Google 색인에 사이트가 포함되어 있는지 확인

  • site: 검색 수행사이트가 Google 검색결과에 나타나지 않는다고 웹마스터가 문의할 때 실제로 확인해 보면 포함되어 있는 경우가 많습니다. 사이트가 Google 색인에 포함되어 있는지 알아보는 가장 빠른 방법은 Google에서 사이트의 전체 URL을 검색하는 것입니다. 예를 들어 site:google.com을 검색하면 http://www.google.com/search?num=100&q=site:google.com과 같은 검색결과가 나타납니다. 이때 site: 연산자와 도메인 이름 사이에는 공백이 없어야 합니다.URL로 Google 사이트 검색을 수행할 때 결과에 사이트가 표시되면 사이트가 Google 색인에 포함되어 있는 것입니다.이전에는 색인이 생성되던 사이트에 더 이상 색인이 생성되지 않는다면 Google 웹마스터 가이드라인을 위반하여 제외된 것일 수 있습니다. 가이드라인을 검토하여 문제가 있으면 수정한 다음 재검토 요청을 제출하시기 바랍니다.
  • 도메인 이름으로 사이트 순위 확인Google에서 www.[yourdomain].com을 검색합니다. 검색결과에 사이트가 표시되지 않거나 검색결과 순위가 낮은 경우 사이트가 웹마스터 가이드라인을 위반하여 직접 스팸 조치가 취해졌을 수 있습니다. 예를 들어, 사이트에 멀웨어 같은 특정 문제가 있다고 확인되는 경우 Google에서 메시지 센터를 통해 사용자에게 알려드립니다. 또한 사이트가 웹마스터 가이드라인을 준수하는지 검토해야 합니다. 문제가 해결되었으면 재검토 요청을 제출합니다.
  • 새 콘텐츠에 대해 Google에 알림사이트가 최근에 생성되었다면 Google에서 아직 모를 수 있습니다. Google에 새 사이트에 대해 알려 주세요. 사이트맵을 제출하면 새 페이지를 Google 색인에 신속하게 포함할 수 있습니다. 사이트가 이미 색인에 포함되어 있어도 Sitemap을 제출하여 가장 중요하게 생각하는 페이지에 대해 Google에 알릴 수 있습니다.

사이트가 직접 스팸 조치의 영향을 받지 않았는지 확인

  • 직접 조치 페이지 확인Google에서는 자동화된 시스템을 사용하여 웹페이지를 크롤링하고 색인을 생성하고 서비스하지만, 검색결과의 품질을 유지하기 위해 직접 조치를 취하기도 합니다. 사이트가 스팸을 포함하거나 기타 사유로 웹마스터 가이드라인을 위배하면 직접 조치를 취하여 검색결과에서 사이트의 순위를 낮추거나 완전히 삭제합니다. 또한 사이트 순위가 직접 스팸 조치의 영향을 받는 경우 Search Console의 직접 조치 페이지에서 내용을 직접 알립니다. (이 데이터를 보려면 사용자 사이트를 추가하고 확인한 상태여야 합니다.) (이 데이터를 보려면 사용자 사이트를 추가하고 확인한 상태여야 합니다.)

Google에서 사이트를 찾아 크롤링할 수 있는지 확인

Googlebot은 크롤링으로 새로운 페이지와 업데이트된 페이지를 찾아 Google 색인에 추가합니다. Google의 크롤링 과정은 이전 크롤링 과정에서 생성되고 웹마스터가 제공한 사이트맵 데이터가 추가된 웹페이지 URL 목록에서 시작됩니다. Googlebot은 이러한 웹사이트를 방문할 때 각 페이지의 링크를 감지하여 이를 크롤링할 페이지 목록에 추가합니다. 이렇게 파악된 새 사이트, 기존 사이트의 변경사항, 비활성 링크에 따라 Google 색인이 업데이트됩니다.

  • 크롤링 오류를 확인합니다. Search Console의 크롤링 오류 페이지에는 Google에서 크롤링하려고 했지만 액세스할 수 없었던 사용자 사이트의 URL에 대한 세부정보가 표시됩니다. 오류를 검토하여 수정 가능한 것은 모두 수정합니다. Googlebot이 다음에 사이트를 크롤링할 때 이러한 변경사항을 파악하여 Google 색인을 업데이트합니다.
  • robots.txt 파일을 검토합니다. robots.txt 테스트 도구를 사용해 robots.txt 파일을 분석하여 사이트 내 URL이나 디렉토리에서 Googlebot을 차단하는지 확인할 수 있습니다.
  • 메타태그로 차단되는 URL이 없는지 확인합니다.
  • 사이트 구조를 검토하여 쉽게 액세스할 수 있는지 확인합니다. 대부분의 검색 엔진은 텍스트 기반입니다. 자바스크립트, DHTML, 이미지 또는 Silverlight와 같은 리치 미디어를 사용하여 탐색 페이지와 링크를 만드는 경우 Googlebot이나 기타 스파이더가 사이트를 크롤링하는 데 문제가 생길 수 있습니다.
  • 최근에 사이트의 구조를 변경했거나 새 도메인으로 이동한 경우 페이지의 순위가 낮아질 수 있습니다. 이를 방지하려면 .htaccess 파일에서 301 리디렉션(‘RedirectPermanent’)을 사용하여 사용자, Googlebot 및 기타 스파이더를 리디렉션할 수 있습니다. Apache에서는 .htaccess 파일, IIS에서는 관리 콘솔을 통해 리디렉션을 수행할 수 있습니다. 301 HTTP 리디렉션에 대한 자세한 내용은 http://www.ietf.org/rfc/rfc2616.txt를 참조하세요.
  • 사이트맵을 만들어 제출합니다. 사이트가 이미 색인에 포함되어 있어도 사이트맵을 제출하면 사이트에 대한 정보와 함께 가장 중요하게 생각하는 URL을 Google에 알릴 수 있습니다. 사이트맵은 특히 사이트에 동적 콘텐츠가 있거나 Googlebot에서 쉽게 검색할 수 없는 콘텐츠가 있는 경우를 비롯하여 사이트가 새로 만들어졌거나 사이트에 연결된 링크가 많지 않은 경우에 유용합니다.

Google이 사이트를 색인에 등록할 수 있는지 확인

Googlebot은 크롤링하는 각 페이지를 처리하여 각 페이지에서 파악된 모든 단어와 단어의 위치로 구성된 거대한 색인을 컴파일합니다. 또한 Title 태그나 Alt 속성과 같은 주요 콘텐츠 태그와 속성에 포함된 정보도 처리합니다. Google에서는 다양한 콘텐츠 유형과 함께 HTML, PDF, Flash 파일 형식도 처리할 수 있지만, Silverlight와 같은 기타 리치 미디어 형식의 파일을 크롤링하거나 색인을 생성하는 데는 문제가 있을 수 있습니다.

  • 사이트의 색인 통계를 확인합니다. 이 통계는 사이트가 Google 색인에서 어떻게 나타나는지 보여줍니다.
  • 사이트의 구조를 다시 검토합니다. 대부분의 검색 엔진과 마찬가지로 Google도 텍스트를 기반으로 합니다. 따라서 이미지나 Flash 파일을 제외한 대부분의 리치 미디어 파일에 포함된 텍스트 또는 자바스크립트에 숨겨져 있거나 로그인이 필요한 페이지는 Googlebot이 읽을 수 없습니다. 텍스트 기반의 읽기 쉬운 콘텐츠를 사용하면 다른 사용자들과 Googlebot이 쉽게 액세스하는 데 도움이 됩니다.

콘텐츠가 유용하며 관련성이 높은지 확인

  • 검색어 페이지를 살펴보면 사용자가 사이트에 어떻게 도달하는지 알 수 있습니다. 첫 번째 열은 사이트가 가장 많이 게재된 Google 검색어입니다. 또한 페이지에는 각 검색어에 대한 노출수, 클릭수 및 클릭률(CTR)이 표시됩니다. 이 정보는 사용자가 검색하는 내용(검색어)과 사용자가 어떤 검색어를 검색할 때 내 사이트를 자주 클릭하는지를 확인하는 데 특히 유용합니다. 예를 들어 에스프레소 머신과 커피 메이커로 검색하는 경우 사이트가 Google 검색결과에 자주 게재되지만 이 검색어에 대한 CTR이 낮은 경우, 사이트에 커피 기계에 대한 정보가 포함되어 있다는 사실이 분명하게 나타나지 않기 때문일 수 있습니다. 이 경우 사용자의 관심을 끌도록 더 적절한 내용으로 콘텐츠를 보강해 볼 수 있습니다. 하지만 유인 키워드를 반복하면 사이트 방문자들이 키워드와 관련 없는 콘텐츠에 실망하게 되고 사이트 순위에도 부정적인 영향을 줄 수 있습니다.
  • Search Console에서 HTML 개선사항 페이지를 확인합니다. title 태그와 메타 설명으로 구성된 설명 정보는 사이트의 콘텐츠에 대한 유용한 정보를 제공합니다. 또한 이 설명 텍스트는 검색결과 페이지에 표시되므로 설명 텍스트가 유용하면 사용자가 클릭할 확률도 더 높아집니다.
  • 사이트에 대한 정보를 널리 알립니다. 사이트로 연결되는 링크가 많을수록 Google에서는 검색어와 관련성이 높은 유용한 사이트라고 판단합니다. 사이트로 연결되는 자연 링크란 다른 사이트에서 해당 콘텐츠의 중요성을 인식하고 방문자에게 유용할 것으로 판단하여 생성되는 링크, 즉 웹의 동적 특성을 통해 자연스럽게 생성되는 링크를 말합니다.
  • 세이프서치를 사용 중지하여 성인용이라고 표시된 콘텐츠가 있는지 확인합니다. Google의 세이프서치 필터는 포르노와 성적인 콘텐츠가 포함된 사이트를 검색결과에서 삭제합니다. 100% 정확하지는 않지만 세이프서치는 키워드와 구문, URL, Open Directory 카테고리를 검사하는 독자적인 첨단 기술을 사용합니다.
  • 잘 만든 이미지 콘텐츠는 트래픽을 유도하는 데 많은 도움이 됩니다. 이미지를 게시할 때 최적의 사용자 환경을 만들 수 있는 방법에 대해 고민하고 Google의 이미지 가이드라인을 지켜 주시기 바랍니다.

경쟁업체가 순위에 부정적인 영향을 미치거나 Google 색인에서 사이트를 삭제하는 것은 거의 불가능합니다. 자신의 사이트로 링크된 다른 사이트와 관련해 우려 사항이 있는 경우 해당 사이트의 웹마스터에게 문의하시기 바랍니다. Google에서는 웹 정보를 집계 및 정리만 할 뿐 웹페이지 콘텐츠를 직접 관리하지는 않습니다.

경우에 따라 Google 데이터 센터 때문에 검색결과에 변동이 생길 수 있습니다. Google 검색을 수행하면 검색어가 Google 데이터 센터로 전송되어 검색결과를 가져옵니다. 수많은 데이터 센터가 있기 때문에 지리적 위치 및 검색 트래픽과 같은 많은 요인에 의해 검색어를 어디로 보낼지가 결정됩니다. 모든 데이터 센터가 동시에 업데이트되는 것은 아니므로 검색어를 처리하는 데이터 센터에 따라 검색결과가 약간씩 다를 수 있습니다.

구글 색인 생성 및 결과 게재

Googlebot은 크롤링하는 각 페이지를 처리하여 각 페이지에서 파악된 모든 단어와 해당 단어의 위치로 구성된 거대한 색인을 컴파일합니다. 또한 Title 태그나 ALT 속성과 같은 주요 콘텐츠 태그와 속성에 포함된 정보도 처리합니다.

사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색하고 사용자에게 가장 관련성이 높은 것으로 판단되는 결과를 표시합니다. 관련성은 특정 페이지에 대한 PageRank를 포함하여 200가지 이상의 요인에 의해 결정됩니다. PageRank는 다른 페이지로부터의 수신 링크에 근거하여 페이지의 중요도를 측정하는 수단입니다. 간단히 말해 다른 사이트에서 특정 사이트의 페이지로 연결되는 각 링크는 해당 사이트의 PageRank에 추가됩니다. 모든 링크가 같은 것은 아닙니다. Google은 스팸 링크 및 검색결과에 부정적인 영향을 미치는 사례를 식별하여 사용자 경험을 향상시키기 위해 최선을 다하고 있습니다. 가장 좋은 유형의 링크는 콘텐츠의 품질에 근거하여 제공되는 링크입니다.

검색결과 페이지에서의 사이트 순위를 올리고 싶으면 Google이 사이트를 제대로 크롤링하고 색인 생성하는 것이 중요합니다.

웹마스터 사용자 게시판
https://productforums.google.com/forum/#!forum/webmaster-ko