블로그스팟 RSS 가져올 수 없음 일반 HTTP 오류 404 error (ft. 구글 블로거 사이트맵)

블로그스팟 RSS 가져올 수 없음이 뜨면서 사이트맵에 액세스하는 중에 오류가 발생했습니다. 

사이트맵이 지정된 주소에 있고 Google에서 차단되지 않았는지 확인하세요. 

디버깅에 관한 추가 도움말은 고객센터를 참고하시기 바랍니다.

워드프레스, 티스토리, 구글 블로거 등 블로그나 웹사이트를 운영하다보면 이걸 보게 되죠. 

구글 서치 콘솔이나 빙 웹사이트 도구에서 갑자기 구글 블로그스팟 RSS가 가져올 수 없음 오류를 반환할 때가 있습니다. 

구글 블로그스팟 rss는 https://www.{블로그주소}.blogspot.com/feeds/posts/default?alt=rss 이런 형식을 띄어야 하는데요. 

일반 HTTP 오류 404는 RSS 페이지를 찾을 수가 없는 상황입니다. 

간단하지만 어려운 웹 구조와 RSS 그리고 사이트맵에 대해서 알아보겠습니다. 

블로그스팟 RSS 가져올 수 없음 일반 HTTP 오류 404 (ft. 구글 블로거 사이트맵)
블로그스팟 RSS 가져올 수 없음 일반 HTTP 오류 404 (ft. 구글 블로거 사이트맵)

RSS란 무엇인가?

RSS(Really Simple Syndication, Rich Site Summary) 는 웹사이트의 최신 콘텐츠(기사, 블로그 포스트, 뉴스, 음원, 동영상 등)를 자동으로 수집하고 구독할 수 있도록 하는 웹 피드 형식입니다. 포탈의 봇들이 매번 웹사이트를 직접 방문하지 않아도 새 글이 올라왔는지 확인할 수 있는 것이 RSS입니다. 쉽게 말하면 내 블로그 또는 웹사이트를 요약해놓은 것이라고 생각하시면 됩니다.

작동방식 : 웹사이트 업데이트 → RSS 피드 생성 → RSS 리더기 자동 수집 → 사용자 확인

※ 피드(Feed): 웹사이트의 업데이트 정보를 담은 XML 파일

※ RSS 리더기: 피드를 수집하고 정리해주는 앱/프로그램/웹서비스

※ 구독(Subscribe): 관심있는 사이트의 RSS 주소를 리더기에 추가

RSS 와 사이트맵 차이점 

RSS 피드는 독자(포탈 봇)들이 새 글을 구독할 수 있도록 하고, 동시에 사이트맵은 검색 엔진이 사이트 구조를 파악해서 모든 글을 색인하도록 하는데 도움을 줍니다. 

눈치빠른 분이라면 이해하셨겠지만 RSS는 글이 없다면 생성되지 않습니다. 그리고 신규 사이트의 경우는 RSS를 인식하는데 길게는 일주일까지 걸릴 수도 있습니다. 

RSS를 쓰는 이유

RSS는 내가 구독한 웹사이트 (블로거 포함) 내의 모든 콘텐츠를 시간순으로 모두 확인 가능하도록 요약된 것입니다. 유저들은 볼 수 없지만 웹에서 RSS를 썼을 때 장점은 아래와 같습니다.

  • 시간 절약: 여러 사이트를 한곳에서 확인 가능
  • 실시간 알림: 새 콘텐츠 즉시 확인
  • 스팸 없음: 이메일 구독과 달리 스팸 걱정 없음
  • 개인정보 보호: 이메일 주소 공개 불필요
  • 광고 없음: 깔끔한 콘텐츠만 제공

RSS 구조에 대한 이해

구글 블로거 사이트맵 & RSS 구조
구글 블로거 사이트맵 & RSS 구조 

RSS(Really Simple Syndication)는 XML(eXtensible Markup Language) 형식을 기반으로 한 표준화된 문서 구조입니다. 웹사이트의 업데이트 정보를 기계(봇)가 읽을 수 있는 형식으로 제공합니다. 일반적인 웹사이트 구조는 아래와 같이 되어 있습니다.

(포탈에 제출하는 이유는 내 블로그나 웹사이트 업데이트를 빠르게 알릴 수 있기 때문입니다.)

채널 제목
http://example.com
채널 설명

    <!-- 채널 추가 정보 -->
    <language>ko-kr</language>
    <pubDate>Sat, 07 Sep 2024 12:00:00 GMT</pubDate>
    <lastBuildDate>Sat, 07 Sep 2024 12:30:00 GMT</lastBuildDate>

    <!-- 아이템(콘텐츠) 목록 -->
    <item>
        <!-- 개별 아이템 정보 -->
    </item>

    <item>
        <!-- 또 다른 아이템 -->
    </item>
</channel>

RSS에는 아래 정보들이 반드시 들어가야 합니다

  1. 정확한 날짜 형식 (RFC 822 준수)
  2. 고유 GUID (중복 아이템 방지)
  3. 적절한 인코딩 (UTF-8 권장)
  4. 자기참조 링크 (atom:link rel="self")

RSS와 관련한 복잡한 이야기는 여기까지 하고 이제 구글 블로거 (블로그스팟) 이야기로 들어가 보겠습니다.

구글 블로거 RSS 구조 (블로그스팟)

일반적으로 블로그스팟의 기본 RSS 주소는 다음과 같은 형식입니다:

  • https://{블로그주소}.blogspot.com/feeds/posts/default?alt=rss
  • https://{블로그주소}.blogspot.com/feeds/posts/default
  • https://{블로그주소}.blogspot.com/atom.xml

특수한 경우를 제외하고는 현재 블로그스팟은 개인도메인 (2차 도메인)을 포함해서 모두 feeds/posts/default?alt=rss와 sitemap.xml을 쓰고 있습니다. https://{블로그주소}.blogspot.com/feeds/posts/default?alt=rss를 검색해서 404 오류가 뜨면 RSS나 사이트맵에 문제가 있는 것입니다.

(※ 사이트맵 RSS 관리는 빙 웹사이트 도구에서 확인하시는 것이 훨씬 간단하고 이해가 쉽습니다.)

빙 웹사이트 도구 RSS - 사이트맵 상태 확인
빙 웹사이트 도구 RSS - 사이트맵 상태 확인 

구글 블로거 RSS 일반 HTTP 404 오류 원인과 해결

404에러가 난다는 이야기 즉 404 Not Found는 HTTP 상태 코드로, 클라이언트(사용자)가 요청한 리소스(페이지, 파일, 이미지 등)를 서버에서 찾을 수 없을 때 반환되는 오류입니다.

사용자 요청 → 서버 검색 → 리소스 없음 → 404 응답

만약 구글 블로그스팟 (일반 웹사이트나 티스토리 등 블로거 포함)해서 갑자기 RSS나 사이트맵에 404 오류가 뜬다면 아래를 확인해 보세요.

1. 사용자 지정 도메인(예: www.example.com)을 사용하는 경우, 기본 블로그스팟 주소와 RSS 주소가 다를 수 있습니다.

해결법: 사용자 지정 도메인을 사용하더라도 원래의 *.blogspot.com 주소로 RSS에 접근해 보세요.

2. RSS 피드 공개 설정 확인

블로그 설정 → 콘텐츠 → 피드 공유에서 전체 또는 요약으로 설정되어 있는지 확인하세요. "없음"으로 설정된 경우 RSS 피드가 비공개되어 404 오류가 발생할 수 있습니다.

3. 블로그 자체의 공개 여부 확인

블로그가 비공개(특정 사용자만 접근 가능)로 설정된 경우 RSS도 접근이 불가능합니다. 설정 → 권한에서 블로그 공개 여부를 확인하세요.

4. 피드 리더기나 서비스 문제

다른 RSS 리더(예: Feedly, Inoreader)에서 동일한 오류가 발생하는지 확인하세요. 만약 구글 서치콘솔에서 문제를 일으킨다면 빙 웹사이트 도구에서 동일한 오류가 뜨는지 확인하시면 됩니다. 다른 블로그의 RSS는 정상적으로 접근되는지 확인하여 본인의 환경 문제인지 판단하세요.

5. 임시 서버 문제 : Google 서버의 일시적인 문제일 수 있습니다. 몇 시간 후 다시 시도해 보세요.

6. 채널을 생성한지 얼마되지 않았을 경우나 자주 업데이트를 하지 않은 채널의 경우에 일시적으로 오류가 생길 수 있습니다. 이런 경우에는 글을 1~2개 발행하고 나서 다시 확인해 보세요. 만약 1~5번가지 이상이 없는데 갑자기 RSS 오류나 사이트맵 오류가 생겼다면 이 경우일 가능성이 큽니다. 이때 HTML 편집 또는 F12나 페이지에 들어가서 컨트롤 CTRL + U로 확인해보세요. 

<!-- Feed -->

<link rel="alternate" type="application/atom+xml" title="블로그타이틀 - Atom" href="https://*내 블로그 주소*/feeds/posts/default" />

<link rel="alternate" type="application/rss+xml" title="블로그타이틀 - RSS" href="https://*내 블로그 주소*/feeds/posts/default?alt=rss" />

<link rel="service.post" type="application/atom+xml" title="블로그타이틀 - Atom" href="https://www.blogger.com/feeds/7011196126804717522/posts/default" />

이런 식으로 RSS와 사이트맵이 있는데도 불구하고 봇이 못 읽는 경우에는 일시적인 현상입니다. 포스팅을 1~2개 발행하고 다시 확인하면 RSS나 사이트맵이 재생성 되면서 404 오류가 사라집니다. 

구글 서치콘솔 RSS & 사이트맵이 등록 안되면

사실 구글 봇이나 네이버 봇 (예티), 빙 봇, 다음 봇 등 모든 포탈 봇들은 굳이 등록을 하지 않아도 스스로 찾아서 확인을 합니다. 문제는 바로 HTTP 오류 404로 페이지가 없음이 뜨는 경우인데 이때는 페이지가 없으니 인식을 할 수가 없습니다.

RSS나 사이트맵이 등록이 안되거나 갱신이 안된다는 이야기는 구글 봇이 다녀가지 않는다는 이야기로 이후 새롭게 발행하는 신규 포스팅이나 웹페이지들이 등록되기 어려워질 수 있습니다. 물론 트래픽이 확보된 채널이라면 문제가 거의 없지만 새롭게 만든 블로그 채널이나 웹사이트, 홈페이지 등은 SEO에 손해를 보는 문제가 될 수 있으니 이상 여부를 꼭 체크해보시길 바랍니다.

도움 되셨기를 바랍니다. 구글 SEO에 대해서 이해가 잘 안 되시는 분은 아래 유튜브 동영상을 참고해서 보시길 추천합니다. 

애드센스 블로그 운영의 필수 구글 SEO에 대한 이해
애드센스 블로그 운영의 필수 구글 SEO에 대한 이해
내 사진

핫한 뉴스와 소식들을 전해드립니다 작성

댓글 없음

아래의 댓글 입력을 클릭한 후 익명으로 댓글을 달아 주셔도 됩니다. 글 내용에 관한 질문도 환영합니다. 모든 댓글은 관리자의 승인을 받아야 보여집니다. 댓글을 달고 기다려 주세요.