안녕하세요, 레오입니다.
어제 스킨을 적용했으니 오늘은 스킨의 내용물을 탐구해보려고 했습니다만, 그 전에 해야할 것이 있었습니다. 바로 네이버나 구글에 제 글이 검색 가능하도록 설정하는 일이지요.
유입 경로 확인
제가 티스토리에 글을 쓴다고 해서 다 되는 것이 아니었습니다. 감사하게도 벌써 꽤 많은 분들이 제 캄보디아 글을 읽고 가셨습니다. 그런데 이상하게도 검색 유입 경로는 가장 흔히 쓰는 구글, 네이버가 아닌 다음이 대부분이었습니다.
알고보니 구글, 네이버에 뭔가 작업을 해줘야만 검색이 가능하다고 합니다. 티스토리는 카카오/다음에서 운영하기 때문에 자동으로 등록해주는 것 같은데, 아무래도 검색 회사가 다르다보니 따로 등록해줘야 하나봅니다.
실제로 제가 올린 글들 중 가장 첫 글인 '2023_① 캄보디아 입국 및 생활 후기'를 네이버, 구글, 다음에 검색했을 때, 다음에서만 검색이 되는 것을 확인했습니다.
구글 서치콘솔이 뭐지?
구글에서 표출되도록 하려면, 'Google Search Console'에 제 블로그 URL을 등록해줘야한다고 합니다. 이게 뭐지? 궁금해서 찾아보니
네, 요약하자면 ① 구글에서 제 사이트를 찾을 수 있게 수집해주고, ② 인덱싱(순서대로 배열하는 것) 문제를 찾아주고 새로운 컨텐츠들에 대해 재 인덱싱을 해주고, ③ 제 사이트의 구글 연관 정보들을 보여주고(얼마나 많이 검색 됐는지, 어떤 쿼리를 수행 했을 때 사이트가 검색 되는지, 얼마나 많이 클릭했는지 등등), 아 더 이상은 무의미해서 그만 적겠습니다. 어쨌든 여기서 핵심은 저 위에 빨갛게 표시한 부분처럼, 서치 콘솔에 등록을 해야만 구글에서 제 사이트를 검색할 수 있도록 해준다고 합니다.
구글 서치콘솔에 블로그 등록
자, 이제 무조건 블로그를 등록해야 한다는 걸 알았으니 해보겠습니다.
① '티스토리 블로그 관리 페이지 > 플러그인' 화면에서 '구글 서치콘솔' 클릭
② '계정 연결하기' 버튼 클릭
③ 구글 계정으로 로그인하기, 이미 로그인 되어있으면 계정 선택
④ 모든 항목 체크 후 '계속' 버튼 클릭
⑤ 적용 버튼 클릭
RSS 및 사이트맵 등록
이렇게 구글 서치콘솔에 등록까지 완료하였는데, 다른 선배님들의 블로그들을 보니 뭔가 더 해야한다고 합니다. 그 작업이 바로 구글 서치콘솔에 블로그의 RSS와 사이트맵을 등록하는 것입니다. RSS랑 사이트맵이란 무엇인지, 그리고 등록은 왜 해야할까요? 제 호기심은 조사하는 걸 참지 못했습니다.
1. RSS란?
일단 잘 모르겠으니 위키피디아랑 수많은 블로그들을 탐방했습니다.
여러 글들을 읽은 바, 제가 이해한 바로는 RSS는 빈번하게 업데이트가 발생하는 컨텐츠들(뉴스 등)을 사용자들에게 보내주기 위한 표준 데이터 형식입니다. 뉴스, 블로그 등의 컨텐츠를 RSS 형식으로 변환하여 어디론가 보내는 것이죠. RSS만의 양식이 있는데, 이 양식은 XML 형식을 따르고 있습니다. XML은 Markup Language의 일종으로, 아래와 같이 태그를 사용해서 표현합니다. 대표적으로, 여러분이 지금 보고 있는 제 블로그 화면도 Markup Language 중의 하나인 HTML로 구성되어있죠.
<이름> 레오 </이름>
<성별> 남자 </성별>
일반적인 RSS를 사용하기 위해서는 RSS Feed와 RSS Reader 두 가지가 필요합니다. 컨텐츠 제공자(뉴스, 블로그 작성자 등)가 RSS Feed에 구독을 하면, 사용자는 RSS Reader에서 컨텐츠 제공자가 업로드한 글들을 자동으로 제공받습니다. 일단 지금까지 제 감상은 대충 채널 변경이 불가능한 라디오나 방송과 같습니다. 제가 직접 찾기보다는 그냥 컨텐츠 제공자가 제공하는 컨텐츠들만 보는 거죠. 어쩌면 계속 컨텐츠가 바뀌는 유튜브 알고리즘이라고도 생각할 수 있겠네요.
다만 이게 왜 검색엔진과 상관이 있는건지 궁금해서 나무위키도 살펴보았습니다.
RSS 기술 자체는 쇠퇴하고 있는 듯 한데, 여기서 눈에 띄는 점은 '내부적으로 컨텐츠를 퍼블리싱하는 기술의 하나로는 여전히 많이 사용된다'는 문구입니다. 아마 구글, 네이버와 같은 검색 엔진이 검색하는 과정에서 RSS 기술을 계속 사용하고 있는 것으로 보입니다.
티스토리의 RSS를 보는 방법이 블로그 url 뒤에 '/rss'를 붙이는 거였습니다. 제 블로그라면 'https://jake8440.tistory.com/rss'가 되겠죠. 이 주소에 접속해보겠습니다.
워매, 제가 작성한 블로그들의 글들이 나옵니다. XML 형식으로 되어있고, 이 파일을 RSS Feed에 주면, 그 RSS의 Reader에서 인식을 할 수 있겠습니다.
2. 사이트맵이란?
구글의 검색 센터에서 사이트맵이 무엇인지 찾아봤습니다. 사이트맵은 '사이트에 있는 페이지, 동영상 및 기타 파일과 그 관계에 관한 정보를 제공하는 파일'이라고 합니다. Google과 같은 검색엔진에서는 이 사이트맵 파일을 읽고 더 효율적으로 크롤링 할 수 있다고 합니다.
사이트맵이란 무엇인가요? | Google 검색 센터 | 문서 | Google Developers
사이트맵은 Google에서 사이트를 더 지능적으로 크롤링할 수 있도록 정보를 제공합니다. 사이트맵의 작동 방식을 알아보고 필요한지 결정하세요.
developers.google.com
음.. 이 설명만 봐서는 정확하게 모르겠습니다. 아무래도 사이트맵 파일을 직접 봐야 알 수 있을 것 같습니다. 티스토리의 사이트맵을 등록하는 url이 블로그 url 뒤에 /sitemap.xml을 붙인 거였는데, 티스토리에서 자동으로 sitemap 파일을 생성해주는 것 같습니다. 한 번 입력해볼까요? 'https://jake8440.tistory.com/sitemap.xml'
이렇게 직접 파일을 보니 대충 알 것 같네요. 아마도 제 블로그의 URL들과 블로그 내 글들의 최종 수정 일자를 XML 형태로 제공하고 있습니다. 구글 검색 엔진이 이 XML 정보를 읽고 바뀔 때마다 빠르게 업데이트를 시켜주는 듯 합니다. 예를 들어 저 lastmod를 데이터베이스에 등록해두었다가, 바뀌었다고 판단되면 바로 웹 사이트를 다운로드 하는 거죠. 정확한 원리는 모르겠지만, 사이트맵은 검색 엔진의 내용을 빠르게 업데이트를 하기 위해서 필요한 것 같습니다.
3. RSS와 Sitemap을 등록해야 하는 이유
아래 구글 검색 센터의 글들을 보면 Sitemap와 RSS를 등록하는 것이 좋다고 적혀있습니다.
Best practices for XML sitemaps and RSS/Atom feeds | Google Search Central Blog | Google Developers
Send feedback Best practices for XML sitemaps and RSS/Atom feeds Stay organized with collections Save and categorize content based on your preferences. Thursday, October 16, 2014 Submitting sitemaps can be an important part of optimizing websites. Sitemaps
developers.google.com
Using RSS/Atom feeds to discover new URLs | Google Search Central Blog | Google Developers
Send feedback Using RSS/Atom feeds to discover new URLs Stay organized with collections Save and categorize content based on your preferences. It's been a while since we published this blog post. Some of the information may be outdated (for example, some i
developers.google.com
위 글에서 빨간 부분이 말하길, 최적화된 크롤링을 위해서는 XML sitemap과 RSS/Atom 피드를 사용하는 걸 권장한다고 합니다. Atom이라는 새로운 단어가 나왔는데, RSS를 대체하기 위한 새로운 형식이라고 합니다. 그 뒤 설명을 보자면,
'XML sitemap은 구글에 제 사이트의 모든 페이지에 대한 정보를 제공해주고, RSS/Atom은 제 사이트의 모든 업데이트를 제공하여 구글의 index에 제 웹사이트가 계속 최신화 되게끔 한다'
고 합니다. 그러므로 Sitemap과 RSS 등록을 해두는 것이 블로그를 검색 엔진에 표출시키는데 유리하며, 자세한 구조는 구글 검색 엔진의 기밀일테니 이 정도만 알면 될 것 같습니다.
4. 등록하기
호기심 하나로 인해 등록하기 전에 검색한다고 최소 한 시간을 검색 및 이해에 소비했습니다. 이제 RSS와 sitemap을 구글 서치콘솔에 등록 해보겠습니다.
① 구글 서치콘솔 바로가기
'블로그관리 > 플러그인' 화면에서 아까 등록한 구글 서치콘솔을 다시 한 번 클릭합니다. 그러면 아까와 다르게 블로그가 등록이 되어있고, '바로가기' 글자가 표시가 됩니다. 이 글자를 눌러 구글 서치콘솔에 접속합니다.
② 구글 서치콘솔 좌측의 'Sitemaps'를 클릭합니다.
③ RSS 주소 등록
Sitemap은 이미 자동으로 등록이 되어있습니다. RSS 주소만 등록하도록 하겠습니다.
'새 사이트맵 추가'의 URL에 'rss'만 입력 후 '제출' 버튼을 누르면 됩니다.
글을 마치며
이렇게 구글의 서치콘솔에 등록 완료하였습니다. 아마 곧 제 글이 구글에서 검색이 되겠죠? 구글 서치콘솔 등록까지는 쉽게 이해했는데, sitemap과 RSS의 개념을 잘 몰라 한 번 파헤쳐 봤습니다. 제 나름대로 이해한 거라 틀린 부분이 있을 수 있으니 이해하기 위해 참고만 해주세요. 저처럼 궁금하신 분들께 도움이 되면 좋겠습니다. 내일은 네이버 검색엔진에 등록 해보겠습니다.
감사합니다.