본문 바로가기
▒ " 띠리리링~"

오늘 전화를 한통받았습니다.

정확히 기억이 나진 않지만 "인터넷 진흥원"인가...?? 라고 하더군요.


님께서.. 운영하는 사이트에 등록된 보험청구서라는 첨부파일에서 주민등록번호가 노출되고 있어요 

현재 구글검색에 노출되에 있으니 해당 게시물을 삭제처리하시는 것이 좋을것 같습니다. 


제가 운영하는 사이트에서 제 주민등록번호가 구글검색에 노출되고 있다고 하더군요..
처음에는 보이스피싱인가 의심을 했는데... (나라에서 이런것도 해주네요.. 고맙게도..)
정말  구글에서 검색을 해보니.. 
헉!!!!!!!!!!!!!  
다음에 다치면 또 써 먹으려고 별 생각없이 올려놨던 보험청구서 문서가.... 떡하니.. 
아무런 제제 없이 다운로드가 되어버리고 있다는... 
그 사이트는 내가 비공개로, 개인적인 목적으로 사용하고 있는  사이트인데...
그리고 구글뿐만아니라 어떤 검색엔진에도 검색 등록을 하지 않았는데..
버젓이.............. 위풍당당하게....................
내 주민등록 번호를 뿌리고 있더군요.. (뭐.. 따지고 보면 내 실수라.. 어디가서 하소연도 못하고 ...... --; )
깜짝 놀랐습니다. 
그래서 부랴부랴 구글 검색 사이트에서 재가 개인적으로 운영하는 사이트의 크롤링을 제거 처리했습니다.
 
혹시나 저와같은 경우의 님들이 계실것 같아 
구글 크롤링에서 해당사이트를 제외하는 방법을 소개해 드릴까 합니다.
 

구글검색에서 내 사이트 크롤링하지 않게 요청하는 방법!!!


먼저 구글에 회원가입을 해야 합니다. 
구글의 회원가입은 주민번호를 수집하지 않으므로 다소나마 안심할 수 있습니다.


1. 먼저 우상단에 있는 로그인을 통해 로그인을 하셔야 합니다.


 

 

2. 동일 위치에 있는 "계정 설정" 메뉴를 클릭해서 들어갑니다.


3. 계정설정을 클릭해서 들어가면 아래와 같은 메뉴가 나오는데..
    하단의 "웹마스터 도구" 버튼을 클릭 합니다. 


4. 웹마스터 도구 화면에 들어오면 "사이트추가" 버튼이 있습니다.     


5. 아래의 그림처럼 빈공간에 구글 검색에서 제외하고자 하는 사이트의 URL을 등록합니다.
    "http://"는 입력할 필요없이 도메인명만 입력하면 됩니다. 



6. 사이트를 등록하면 진짜 그 사이트가 당사자가 운영하는 사이트가 맞는지 확인하기 위해..
    인증파일을(html파일)을 하나 다운받을 수 있게 합니다.
    아래의 "이 HTML확인파일"을 클릭하면 html 문서를 다운받을 수 있습니다.
    이 문서를 해당 서버의 root디렉토리에 FTP를 이용하여 복사를 합니다.

 

7. 업로드한 문서를 웹브라우저를 통해 확인을 합니다.
   위의 이미지에 보시면 3번 항목이 있는데 그 URL을 클릭하셔도 됩니다.
   해당 html을 확인하고 위의 이미지 중 4번 항목처럼 "확인"버튼을 클릭하시면 등록이 됩니다.

 

8. 이제 관리사이트를 등록했으니..
   해당 사이트를 크롤링(검색수집)하는 것을 제외하는 작업과 기존에 수집되어있는 정보를 제거하는 작업 해야 합니다.
   좌측 메뉴 중 "사이트구성 > 크롤러 액세스"라는 메뉴가 있습니다.
   해당 메뉴를 클릭하세요.


 

9. 크롤러 액세스를 클릭하여 나온 화면중 2번째 탭에 있는 "robots.txt생성"을 선택합니다.
   그리고 아래처럼 "모두 차단..."의 라디오박스를 체크하고 가장 하단에 있는 "다운로드" 버튼을 클릭하면...
   "robots.txt" 라는 파일을 다운받을 수 있습니다.
   해당 파일을 아까와 동일하게.... 사이트의 root폴더에 넣습니다.




이것으로써 구글 크롤러로 부터 해당 사이트의 검색을 피할 수 있습니다. 

 

 

구글에 현재 수집되어있는 정보에 대해 삭제 요청하는 방법


사이트의 크롤링을 막았다 하더라도 기존에 수집되어져 있던 정보는 그대로 있습니다.
기존에 수집되어져 있는 정보를 삭제하시려면 아래와 같은 작업을 더해야 합니다.


1. 3번째 탭인 "URL 제거"로 이동하여 "새로운 삭제 요청" 버틍을 클릭합니다.


2. 아까 URL등록하는것처럼 이번에도 URL을 입력하고 "계속" 버튼을 클릭합니다.


 

3. 삭제 요청에 대해 확인차 물어보는데.. "요청 제출" 버튼을 누르시면 됩니다. 



 
4. 아래와같이 리스트가 표시되며 상태를 보시면 현재 "보류"로 되어 있습니다.
    보류면 아직 삭제된것은 아니고 나중에 크롤러가 다시 사이트에 방문했을 때 해당 내역을 삭제한다고 합니다.
    저는 대략 반나절이 지나닌까 삭제가 되더군요.



5. 삭제가 완료되면.. 아래와 같이 상태가 "완료됨"으로 나옵니다.
   그리고 구글 검색에서 검색을 하면 검색결과가 나오지 않는 것을 확인할 수 있습니다.



 

네이트(nate)가 개인정보를 노출됐네, 농협에서 개인정보가 노출됐네.. 말이 많지만...
자기 스스로가 개인정보를 보호하는것도 더할나위없이 중요하다고 생각합니다.
 


JOS39 블로그

여행과 맛집 그리고 일상에 대해 나만 몰랐던 이야기들..