今回はWebサイトをGoogleで検索されないようにする方法をご紹介します。
目次
Googleで検索される仕組み
はじめにGoogleで検索される仕組みについてご紹介します。
WebサイトがGoogleで検索されるようになるにはおおまかに次の3つの段階があります。
- クロール
クローラーと呼ばれるプログラムがウェブ上で見つけたページからテキストや画像、動画などを取得します。GoogleのクローラーはGooglebotと言われます。 - インデックス登録
取得したページ上の情報をGoogleの場合はインデックスと言われるデータベースに保存します。GoogleのデータベースはGoogleインデックスと言われます。 - 検索結果の表示
ユーザーがGoogleで検索するとそのキーワードに適した情報をGoogleインデックスから検索結果に表示します。
WebサイトをGoogleで検索されないようにするには「インデックス登録」させないようにする設定が必要です。
WebサイトをGoogleで検索されないようにする方法
WebサイトをGoogleで検索されないようにするには次の3つのいずれかの設定を行います。
Webサイトにパスワードで閲覧制限を設ける
Webサイトにパスワードで閲覧制限を設けることでクローラーがそのWebサイトへアクセスできなくなります。
その結果、インデックス登録が行われないので検索結果にも表示されなくなります。
Webサイトにパスワードで閲覧制限を設ける方法は以下の記事よりご覧ください。
Webページにnoindexタグを設定する
HTMLのhead内にnoindexタグ(metaタグ)を追加するとそのWebページをGoogleで検索されないようにすることができます。
<meta name="robots" content="noindex">
noindexタグに対応している検索エンジンは、インデックスから当該Webページを削除するため、結果的に検索に表示されないようになります。
なお、noindexタグに対応していない検索エンジンにおいてはこれまでどおり検索されてしまうようです。
また、検索に表示させたくないWebページのすべてに設定する必要があります。
robots.txtでWebサイトのクロールを制限する
robots.txtにWebサイト全体のクロールを制限するルールを記載することで、WebサイトをGoogleで検索されないようにすることができます。
User-agent: *
Disallow: /
なお、Webサイトを検索されないようにするためを目的としてのrobots.txtの利用は、次のような理由からあまり推奨できないようです。
- 検索エンジンによってrobots.txtの解釈が異なり、こちらが意図したとおり検索エンジンが動作しない可能性がある。
- robots.txtで制限をかけたWebページが被リンクされており、かつリンク元のページがインデックス登録されていると、Googleにおいては制限をかけたWebページをインデックスに登録する可能性がある。
まとめ
今回はWebサイトをGoogleで検索されないようにする方法をご紹介しました。
3つの方法があるようですが、「Webサイトにパスワードで閲覧制限を設ける」方法が最も確実かと思います。
弊社ではWebサイトの制作や保守業務を承っております。
WordPressも対応していますのでぜひお気軽にご相談ください。