Googleサーチコンソールをチェックしていると、突然1日だけ起きる表示回数(アクセス件数)の急増が起こることがあります。
いったい何が起こっているのでしょうか?
実は「リファラスパム」の可能性を疑うことが必要かもしれません。
異常なアクセス急増場合の解析方法と原因のチェック方法について解説します。
★本記事は、2019年7月2日に投稿した内容をリライトし再投稿しています。
急激なアクセス数の増加をチェックする
急激なアクセス数の確認は「Googleサーチコンソール」と「Googleアナリティクス」を利用しました。
該当するブログは新規開設2カ月目で新規ドメインです。
Googleサーチコンソールでアクセス数を確認
Googleサーチコンソールでは、1日の表示回数は平均約50回で推移していました。
ところが956回と約20倍に急増していました。尚、クリック数は、平常の範囲でした。
国別のデータ
日本700回、米国65回、ウクライナ34回、イギリス・インド18回、カナダ17回 一桁は43か国に及んでいる。
Googleアナリティクスでアクセス数を確認
Googleアナリティクスでは1日ずれて、トラフィックチャネルの「direct」が52回と異常に多くなっています。
国別では、アメリカが60回と異常に多いです。
アクセス数急増のデータ分析
Googleサーチコンソールで確認された「日本からの表示回数700回」とGoogleアナリティクスで確認された「アメリカからのアクセス65回」を分けて分析します。
理由は、Googleサーチコンソールが、サイトに流入直前のデータであり、Googleアナリティクスは、流入後の閲覧データなので分けて分析するためです。
日本からのアクセス分析
アクセス元の国は、サーチコンソールでは「日本700回」となっています。
日本700回表示の内訳
パソコン:545回(クリック6回)
モバイル:152回(クリック2回)
タブレット:3回
ランディングページ
トップページ:0回
記事ページ:1~71回 全ページにランディング
クエリ―:475ワード
アナリティクスには、日本の700に値するデータありません。
米国からのアクセス分析
Googleアナリティクスで確認された米国からのアクセスは65回となっています。
Googleアナリティクスのデータ
トラフィックチャネル:organic.search20 direct52
参照元/メディア:direct/(non)52 Google/organic17
地域>地域:unitedstates 50 直帰率100%,セッション1,セッション時間0
集客>チャネル:ユーザー51 新規ユーサー50 直帰率100% 平均セッション時間0
参照元:無し
ランディングページ:個々の記事全般
ブラウザ:(not set)50
サービスプロバイダ:Google llc
ユーザー:50 新規ユーザー:50セッション:50 直帰率100% ページセッション1 ページセッション時間0
アナリティクスではアメリカが50で各記事のページにランディングし、そのページだけ滞在時間0で直帰しています。
プロバイダはGoogle.llcです。
これらのデータから「リファラスパム」が疑われます。
リファラスパムの疑いか?
ろもそもリファラスパムとはどんなものなのか、簡単に説明します。
一般的なReferral(リファラ)
Referral(リファラ)は、他のホームページに設置されたリンクから流入があった場合にカウントされます。
一般的にはどこかでサイトが紹介され付随してリンクが設置されそこから流入するのが一般的なReferralです。
スパム目的の Referral(リファラ)
スパム目的のリファラは、一般的なリンクとは違います。
リファラスパムは、「アクセス解析でリファラ情報を見ていたサイト管理者」をスパムページに誘導するために行われるものと考えられます。
突然に知らないReferralがあれば、管理者はリンク元の URLをクリックして調べる確率は高く、それを狙ったのがリファラスパムです。
リファラスパムの目安
リファラスパムの目安を5つ挙げてみました。
- ホスト名が「(not set)」であること。
- 直帰率が高すぎる(100%)、もしくは低すぎる
- 1 セッションあたりの PV数が1に近い(サイト内回遊なし)
- 滞在時間が0に近い
- 海外サイトからの流入である
時にはウィルス感染等あらゆるリスクが想定されます。
リファラスパムの疑いがある時はリンクを踏まないのが鉄則です。
Direct trafficにスパムはあるのか?
アメリカからのアクセスは「direct/(non)」で、「リファラ」ではありませんが、スパムでしょうか?
ダイレクトトラフィックにもスパムが紛れ込んでいる可能性があります。
リファラスパムを確認する場合にリファラトラフィックだけを見がちです。
しかし、実はダイレクトトラフィックにもスパムが潜んでいる場合があります。
一般的にダイレクトトラフィックは、参照元を経由せずに流入があった場合に発生します。
以下の流入に分類されます。
- ブラウザのブックマークからの流入
- ブラウザでURLを直接入力して流入
- RSS (Feedly, Livedoor Readerなど)から流入
- メール (Gmail, Hotmailなど)から流入
- スマートフォンアプリから流入
このようにダイレクトトラフィックは、参照元を経由しないで流入します。
スパムではホスト名が(not set)なのはなぜか?
ウェブサイトへ直接アクセスせず、Google Analyticsのサーバーへ直接ニセの訪問データを送っているためだととの見方があります。
ニセの訪問データをGoogle Analyticsサーバーへ送り、あたかもサイトからアクセスがあったように見せかけているというのです。
なのでそのデータはホストを通っていないので(not set)になっているのです。
分析の結論
日本からの表示回数700件は、良く分かりません。
初めTwitterやSNSからの拡散によるものかと推測しましたが、デバイス・OSに見当たりませんでした。
PCで545回、モバイルで152の表示回数に関しては、表示されただけでクリックされていません。
よってGoogleアナリティクスでは流入がないため、データが見当たらなかったと思われます。
表示だけをさせてサイトに入り込まないスパムはあるのでしょうか。
アメリカからのdirectは、スパムの可能性
アメリカからのdirectで52回でサイトに流入したのは、directtrafficからの流入にみせかけたスパムの可能性が高いです。
リファラースパムの確認に目が行っている間に、directtrafficから流入したスパムです。
スパムの根拠
- ホスト名が「(not set)」であること。
- 直帰率が高すぎる、もしくは低すぎる
- 1 セッションあたりの PV数が1に近い(ほとんど回遊していない)
- 滞在時間が0に近い
- 海外サイトからの流入である
ニセの訪問データをGoogle Analyticsサーバーへ送ります。
そして、あたかもサイトからアクセスがあったように見せかけてホストを通過したいないため(not set)になっています。
リファラスパムのまとめ
これらのスパムは、まず「なにかデータがおかしいぞ?」とユーザーに目を向けさせます。
次に、ユーザーが解析ツールで事実を確認する手順の中に「密かに悪意のあるリンク」を作ります。
その先にスイッチを紛れ込ませ、ウィルス等の感染をさせるのではないかと推測します。
事実、おかしな流入元がどこからなのか確認するため、そのURLをクリックて感染という事が報告されています。
スパムはどんどん進化していると思われす。
常に新しい情報を確認するとともに、フィルターを使うなど安全にサイトを運営しましょう。