お問い合わせ

ハッキングで感染!怪しいインデックススパムを最短で削除した方法

この記事は約9分で読めます。
本文は約5447文字です

サイトがハッキングされて、自分のサイトの検索結果に存在しないページが表示される、いわゆる検索ハイジャックの被害にあったことはありますか?

サイトが改ざんされて検索結果が汚染されることを、海外では『Japanese Keyword Hack』とか『 Japanese SEO Spam』と呼ばれています。

検索ハイジャックとは?

自分のサイトに存在しない怪しげなECサイトのページがインデックスされ、自分のサイトの検索結果として表示される状態です。

その検索結果をクリックすると怪しげなECサイトへリダイレクトされます。

サイトがハッキングされて、改竄されることで検索ハイジャックが発生します。

サイトの改竄を修正して対策しても、Googleインデックスされたページはなかなか削除されません。

また、中古ドメインを購入してサーチコンソールに登録したら、前のサイトがハッキング被害にあっており、大量にスパムがインデックスされている場合もあります。

こんな疑問にお答えします!

  • なぜスパムインデックスはなかなか削除されないのか?
  • URLの『削除ツール』を一括指定したい
  • XMLサイトマップを使って不要なインデックスを速やかに削除したい
  • 404(Not Found)を返してもインデックスがなかなか消えない
  • 中古ドメインを購入したらインデックススパムに感染していた

マルウェア駆除はどうしたらよい?

スパムインデックスが大量にある場合は、間違いなくマルウェアに感染しています。

まず、マルウェア駆除を行いましょう。

ハッキングされたサイトの復旧を自分で行う

ハッキングされたサイトの復旧はプロに頼む

サーバーの知識やマルウェア感染からの復旧についての知見が無い場合は、マルウェア駆除を行っても高い確率で再発します。

自分で頑張るよりもプロに頼むのが最善です。

有料ですが、その代わりにすぐに復旧してもらえますので、ストレスフリーな状態になれるのが魅力です。

なぜスパムインデックスは削除されないのか?

マルウェア感染したサイトをクリーンな状態にして、ページが存在しない状態(404エラーが表示される)になったとします。

しかし、不要なインデックスはなかなか削除されません。

Googleはクロールしたページが404になっているとインデックスから削除すると言われています。

スパムのインデックスはページが404ですから自然と削除されるはずです。

しかし、スパムインデックスは一瞬で登録されますが、インデックス削除はものすごい遅いのです。

Googleが再クロールを行わないと404であることを認識してくれないのですが、そもそもサイトにページが存在せず、サイトマップにもそのURLが存在しないため、Googleがなかなかクロールしてくれないためです。

実は、Googleは404ページであってもGoogleのインデックスをすぐに削除しません。
クロールする頻度を下げるだけです
Googleは404をページ削除とは扱わず、『一時的にアクセスできないページ』というステータスにしているためです。

スパムインデックス削除のベストプラクティスは?

スパムインデックスを削除して『検索結果』と『Googleのインデックス』を元の状態戻すためには2つのステップが必要です。

『検索結果』と『Googleのインデックス』を元の状態戻す2つのステップ

  1. 検索結果をもとに戻す
    • URL削除ツールでスパムインデックスのURL削除依頼を出す
  2. Googleのインデックスをもとに戻す
    • スパムインデックスのURLのサイトマップを作成して登録
    • 存在しないページは410を返すようにプラグインを導入
    • サーチコンソールでカバレッジが減少していくことを監視
      (一気にインデックスが削除されるのではなく、ゆっくりと削除されていく)

①『削除ツール』を使って不要な検索結果を削除する

  • 削除ツールを使う
    • 1URLつづ指定
    • プレフィックスで一括指定
    • 有料Chromeアドオンを使う

1つづつ削除URLをブロックする

Googleには検索結果から不要なページを削除する『削除ツール』があります。それを利用すれば良さそうです。しかし数が多いと現実的に難しいです。

なぜなら、削除ツールは1URLづつの指定となっており、ファイルなどで一括指定できないのです。

そうなると、インデックスが1万件とかを超えているとお手上げになります。

特定のプレフィックスで始まる URL をブロックする

スパムインデックスに規則性がある場合は、前方プレフィックスを使えば、効率よくURLを指定できます。

  • [このプレフィックスで始まる URL をすべて削除] を選択します。
  • これにより、指定したプレフィックスで始まるすべての URL(www が付くものと付かないものの両方)がブロックされます。次に例を示します。
    • プロパティ: example.com
    • ブロックするパス: foods/
    • 一致する URL:
      • http://example.com/foods/pizza
      • https://www.example.com/foods/bread?type=whole_wheat
      • http/https www.example.com/foods/pasta/spaghetti/bologonese.html
  • サイト全体をブロックするには、パスを空白にします。

『削除ツール』をCSVファイルで一括指定して自動化

URL削除依頼を手動でポチポチやっていても拉致があきません。面倒な作業を自動化してくれるChrome拡張を作った素晴らしい人がいますので、その拡張機能をご紹介します。

有料サブスクリプションのアドオンですので、インストールしただけでは使えません。

WebMaster Tools – Bulk URL Removalとは?
CSV型式で削除URLを一括指定し自動化

Bulk URL Removal拡張機能は、削除するすべてのURLを含むCSVファイルを作成し、URL削除ツールの削除を自動化します。

CSVの形式

削除するURLはカバレッジのURL一覧から取得できます。

以下のURLを参考にして、CSV形式のファイルを作成します。

https://github.com/noitcudni/google-search-console-bulk-url-removal/#csv-format

使い方

緑のゴミ箱アイコンをクリックしてCSVファイルをアップロードし、一括削除ジョブを開始します。

②不要なインデックスをXMLサイトマップで削除する方法

不要なインデックスを高速に削除する方法として、XMLサイトマップを使う方法があります。

スパムインデックスのURLをXMLサイトマップに登録し、Googleのクロールを促し、404であることを知らせます。

STEP

インデックスされているURLをCSVでダウンロード

Google サーチコンソールのカバレッジを確認します。

[有効]だけを選び、インデックスされているものだけにします。

その後、インデックスされている全てのURLの情報をファイルでダウンロードします。

STEP

インデックスから削除したいURLのみをCSVに残します

インデックスされている全てのURLの情報には、インデックススパムと本物のURLが混ざっていると思います。

混ざっていても問題ないと思いますが、CSVから本物のURLは削除しておきます。

STEP

XMLファイルに変換します

URL一覧をXMLサイトマップ型式に変換してくれるオンラインサービスがあります。

このツールを使うと、削除したいURLだけが含まれるXMLサイトマップファイルを簡単に作ることができます。

CSVファイルには削除対象のURLしかありませんので、URL部分だけをコピーして、ツールに貼り付ければXMLファイルに変換できます。

STEP

XMLファイルをサーバーにアップロードします

XMLファイルをサーバーにアップロードして、パブリックにアクセスできるようにします。

公開ディレクトリの直下にアップロードすれば大丈夫です。

STEP

XMLサイトマップをサーチコンソールに登録します

Googleサーチコンソールのサイトマップを開き、アップロードしたXMLファイル名を指定します。

これで、サイトに存在しないURLをGoogleが知ることができ、クロールし、404であることを伝えることが可能になりました。

あとは、カバレッジが減っていくことを期待して待つことになります。

③ 410ステータスを返してページ削除を伝える

存在しないページが404(Not found)を返してもなかなか削除されないことがあるので、410(Gone)を返すようにするとインデックスの削除が早まるようです。

WordPressの場合は、プラグインを使うと簡単です。

WordPress.org 日本語
410 for WordPress A plugin that sends HTTP 410 (Gone) responses to requests for articles that no longer exist on your blog.
  • プラグインをインストールして有効化
  • プラグインの設定画面から削除したいURLをコピペ(①)
  • Add entries to 410 listをクリック(②)すれば大丈夫です。
410 for WordPressの設定画面のリンク
410 for WordPressの設定画面

④サーチコンソールでカバレッジが減少していくことを監視

サーチコンソールのインデックス状況を確認します。

Googleがクロールしてくれれば、存在しないページは404(410)となって、徐々にインデックスは減少していきます。

中古ドメインがインデックススパムに感染していた

中古ドメインを購入してGoogle サーチコンソールに登録してしばらくたつと、サイトのページ数より極端に大きなカバレッジが現れるドメインがあります。

そういうドメインは検索ハイジャックに感染し、インデックススパムが大量にインデックスされていたのだと思います。

スパム感染したドメインが、ドメインが期限切れとなるとGoogleはサイトにアクセスできなくなるので検索結果には表示されなくなります。

しかし、ドメインが放出され、次にドメインを有効化すると、スパムインデックスがそのまま復活します。

つまり、ドメインが無効になってもGoogle内部のインデックスは一括削除されず、緩やかに減っていくようなのです。

その場合は、そのまま中古ドメインを使ってもいいことは一つもありません。

この記事でご紹介した対策で不要なインデックスをキレイに削除しましょう。

まとめ

検索ハイジャックされたサイトやドメインには、大量のごみのGoogleインデックスが存在することになり、サイトの評価が激落ちします。

その結果、新規作成した自分のページがインデックスされなくなります。

速やかに、不要なインデックスを削除するには削除ツールを使って一括削除したあと、削除用のXMLサイトマップを使うのが恒久対策になると思います。

よくある質問

なぜスパムインデックスはなかなか削除されないのか?

ページが存在しなくても、GoogleがそのURLをクロールしてくれないので404だと気が付きません。放置しておいても削除される速度はとても遅いです。

URLの『削除ツール』を一括指定したい

サーチコンソールからインデックス一覧をダウンロードし、CSVファイルを作成後、Chromeの拡張機能を使うと一括削除が可能です。

XMLサイトマップを使って不要なインデックスを速やかに削除したい

存在しないURLのXMLサイトマップを用意して、サーチコンソールに登録すれば存在しないURLへGoogleのクロールを促すことができます。

404(Not found)なのにインデックスがなかなか消えない

404だとGoogleが再度確認に来る可能性が残りますので、410(Gone)をhttpステータスとして返す方がインデックスが早く消えるようです。Wordpressの場合は、プラグインを使うのが簡単です。

記事が役に立ったらシェアしてね!
コメントを閉じる

コメント

コメントする

コメントは日本語で入力してください。(スパム対策)

目次