この記事は約9分で読めます。
本文は約5129文字です
ハッキングで感染!怪しいインデックススパムを最短で削除した方法

サイトがハッキングされて、自分のサイトの検索結果に存在しないページが表示される、いわゆる検索ハイジャックの被害にあったことはありますか?
サイトが改ざんされて検索結果が汚染されることを、海外では『Japanese Keyword Hack』とか『 Japanese SEO Spam』と呼ばれています。
- 検索ハイジャックとは?
自分のサイトに存在しない怪しげなECサイトのページがインデックスされ、自分のサイトの検索結果として表示される状態です。
その検索結果をクリックすると怪しげなECサイトへリダイレクトされます。
サイトがハッキングされて、改竄されることで検索ハイジャックが発生します。
サイトの改竄を修正して対策しても、Googleにインデックスされたページはなかなか削除されません。
また、中古ドメインを購入してサーチコンソールに登録したら、前のサイトがハッキング被害にあっており、大量にスパムがインデックスされている場合もあります。
こんな疑問にお答えします!
- なぜスパムインデックスはなかなか削除されないのか?
- URLの『削除ツール』を一括指定したい
- XMLサイトマップを使って不要なインデックスを速やかに削除したい
- 404(Not Found)を返してもインデックスがなかなか消えない
- 中古ドメインを購入したらインデックススパムに感染していた
なぜスパムインデックスは削除されないのか?
Googleはクロールしたページが404になっているとインデックスから削除すると言われています。
それを理由に、スパムのインデックスはページが404になっていれば自然と削除されるはずです。
しかし、実際には不要なインデックスはなかなか削除されません。
不思議なことに、スパムインデックスは一瞬で登録されますが、インデックス削除はものすごい遅いのです。
Googleが再クロールを行わないと404であることを認識してくれないのですが、そもそもサイトにページが存在せず、サイトマップにもそのURLが存在しないため、Googleがなかなかクロールしてくれないためです。
実は、Googleは404ページであってもGoogleのインデックスをすぐに削除しません。
クロールする頻度を下げるだけです。
Googleは404をページ削除とは扱わず、『一時的にアクセスできないページ』というステータスにしているためです。
スパムインデックス削除のベストプラクティスは?
スパムインデックスを削除して『検索結果』と『Googleのインデックス』を元の状態戻すためには2つのステップが必要です。
『検索結果』と『Googleのインデックス』を元の状態戻す2つのステップ
- 検索結果をもとに戻す
- URL削除ツールでスパムインデックスのURL削除依頼を出す
- Googleのインデックスをもとに戻す
- スパムインデックスのURLのサイトマップを作成して登録
- 存在しないページは410を返すようにプラグインを導入
- サーチコンソールでカバレッジが減少していくことを監視
(一気にインデックスが削除されるのではなく、ゆっくりと削除されていく)
①『削除ツール』を使って不要な検索結果を削除する
- 削除ツールを使う
- 1URLつづ指定
- プレフィックスで一括指定
- 有料Chromeアドオンを使う
1つづつ削除URLをブロックする
Googleには検索結果から不要なページを削除する『削除ツール』があります。それを利用すれば良さそうです。しかし数が多いと現実的に難しいです。
なぜなら、削除ツールは1URLづつの指定となっており、ファイルなどで一括指定できないのです。
そうなると、インデックスが1万件とかを超えているとお手上げになります。
特定のプレフィックスで始まる URL をブロックする
スパムインデックスに規則性がある場合は、前方プレフィックスを使えば、効率よくURLを指定できます。
- [このプレフィックスで始まる URL をすべて削除] を選択します。
- これにより、指定したプレフィックスで始まるすべての URL(www が付くものと付かないものの両方)がブロックされます。次に例を示します。
- プロパティ:
example.com
- ブロックするパス:
foods/
- 一致する URL:
http://example.com/foods/pizza
https://www.example.com/foods/bread?type=whole_wheat
http/https www.example.com/foods/pasta/spaghetti/bologonese.html
- プロパティ:
- サイト全体をブロックするには、パスを空白にします。
『削除ツール』をCSVファイルで一括指定して自動化
URL削除依頼を手動でポチポチやっていても拉致があきません。面倒な作業を自動化してくれるChrome拡張を作った素晴らしい人がいますので、その拡張機能をご紹介します。
- WebMaster Tools – Bulk URL Removalとは?
- CSV型式で削除URLを一括指定し自動化
Bulk URL Removal拡張機能は、削除するすべてのURLを含むCSVファイルを作成し、URL削除ツールの削除を自動化します。
- CSVの形式
削除するURLはカバレッジのURL一覧から取得できます。
以下のURLを参考にして、CSV形式のファイルを作成します。
https://github.com/noitcudni/google-search-console-bulk-url-removal/#csv-format
- 使い方
緑のゴミ箱アイコンをクリックしてCSVファイルをアップロードし、一括削除ジョブを開始します。
②不要なインデックスをXMLサイトマップで削除する方法
不要なインデックスを高速に削除する方法として、XMLサイトマップを使う方法があります。
スパムインデックスのURLをXMLサイトマップに登録し、Googleのクロールを促し、404であることを知らせます。
インデックスされているURLをCSVでダウンロード
Google サーチコンソールのカバレッジを確認します。
[有効]だけを選び、インデックスされているものだけにします。
その後、インデックスされている全てのURLの情報をファイルでダウンロードします。
インデックスから削除したいURLのみをCSVに残します
インデックスされている全てのURLの情報には、インデックススパムと本物のURLが混ざっていると思います。
混ざっていても問題ないと思いますが、CSVから本物のURLは削除しておきます。
XMLファイルに変換します
URL一覧をXMLサイトマップ型式に変換してくれるオンラインサービスがあります。
このツールを使うと、削除したいURLだけが含まれるXMLサイトマップファイルを簡単に作ることができます。
CSVファイルには削除対象のURLしかありませんので、URL部分だけをコピーして、ツールに貼り付ければXMLファイルに変換できます。
XMLファイルをサーバーにアップロードします
XMLファイルをサーバーにアップロードして、パブリックにアクセスできるようにします。
公開ディレクトリの直下にアップロードすれば大丈夫です。
XMLサイトマップをサーチコンソールに登録します
Googleサーチコンソールのサイトマップを開き、アップロードしたXMLファイル名を指定します。
これで、サイトに存在しないURLをGoogleが知ることができ、クロールし、404であることを伝えることが可能になりました。
あとは、カバレッジが減っていくことを期待して待つことになります。
③ 410ステータスを返してページ削除を伝える
存在しないページが404(Not found)を返してもなかなか削除されないことがあるので、410(Gone)を返すようにするとインデックスの削除が早まるようです。
WordPressの場合は、プラグインを使うと簡単です。
- プラグインをインストールして有効化
- プラグインの設定画面から削除したいURLをコピペ(①)
- Add entries to 410 listをクリック(②)すれば大丈夫です。


④サーチコンソールでカバレッジが減少していくことを監視
サーチコンソールのインデックス状況を確認します。
Googleがクロールしてくれれば、存在しないページは404(410)となって、徐々にインデックスは減少していきます。
中古ドメインがインデックススパムに感染していた
中古ドメインを購入してGoogle サーチコンソールに登録してしばらくたつと、サイトのページ数より極端に大きなカバレッジが現れるドメインがあります。
そういうドメインは検索ハイジャックに感染し、インデックススパムが大量にインデックスされていたのだと思います。
スパム感染したドメインが、ドメインが期限切れとなるとGoogleはサイトにアクセスできなくなるので検索結果には表示されなくなります。
しかし、ドメインが放出され、次にドメインを有効化すると、スパムインデックスがそのまま復活します。
つまり、ドメインが無効になってもGoogle内部のインデックスは一括削除されず、緩やかに減っていくようなのです。
その場合は、そのまま中古ドメインを使ってもいいことは一つもありません。
この記事でご紹介した対策で不要なインデックスをキレイに削除しましょう。
まとめ
検索ハイジャックされたサイトやドメインには、大量のごみのGoogleインデックスが存在することになり、サイトの評価が激落ちします。
その結果、新規作成した自分のページがインデックスされなくなります。
速やかに、不要なインデックスを削除するには削除ツールを使って一括削除したあと、削除用のXMLサイトマップを使うのが恒久対策になると思います。
コメント