Googleが更新したスパムアップデートの本質とはなんでしょうか?
今回は2024年3月の行われた、スパムアップデートについて、詳しく解説します。
また、スパムアップデートと同時に行われた、コアアップデートとの関係、どのように違うのか、その目的はどこにあるのかなど、重要なポイントをまとめています。
これからユーザーに有益はコンテンツを作成する上で、ぜひ、参考にしてください。
スパムアップデートとコアアップデートの違いは?
そもそも、スパムアップデートとコアアップデートは、なにがちがうのでしょうか?
Googleが年数回行う「コアアップデート」と、スパムポリシーに基づいて行われる「スパムアップデート」があります。
2024年3月のコアアップデートでは、2つのアップデートが同時に行われました。(*別記事あり)
では、スパムアップデートとコアアップデートは、どのように違うのでしょうか?
コアアップデートとは?
コアアップデートでは、複数のコアシステムを更新します。
その中でも、特にサイト運営者に影響を及ぼすのがランキングシステム。
Google検索に携わっているのが「コア ランキング システム」で、複数のコアシステムのひとつです。
コア ランキングシステムが担当している仕事は次の通りです。
Googleのランキングシステムは、世界中にある数千億に及ぶWebページやコンテンツから、ユーザーにとって検索意図に最も関連性が高く、有益で品質の高い順に結果を瞬時に表示する仕事をします。
このシステムは、ぼくたちの検索結果に直接的に影響するため、「コア ランキング システム」が、どのような構成になっているのか説明します。
Googleを調べてみると、一部ではあるものの、つぎの19のシステムを紹介しています。
- BERT Bidirectional Encoder Representations from Transformers
- 災害情報システム Crisis information systems
- 重複除去システム Deduplication systems
- 完全一致ドメイン システム Exact match domain system
- フレッシュネス システム Freshness systems
- ヘルプフル コンテンツ システム Helpful content system
- リンク分析システムと PageRank Link analysis systems and PageRank
- ローカル ニュース システム Local news systems
- MUM Multitask Unified Model
- ニューラル マッチング Neural matching(*参考記事あり)
- オリジナル コンテンツ システム Original content systems
- 削除ベースの降格システム Removal-based demotion systems
- パッセージ ランキング システム Passage ranking system
- RankBrain
- 信頼できる情報システム Reliable information systems
- レビュー システム Reviews system
- サイト多様性システム Site diversity system
- スパム検出システム Spam detection systems
- 廃止されたシステム Retired systems
各システムの内容は、Google 検索ランキング システムのご紹介 からご覧になれます。
一部とはいえ、多くのシステムによって、検索結果にランキングされていることが分かります。
ここでは、紹介する程度にして、詳しくは、改めてGoogleコアアップデートの記事でご紹介します。
スパムアップデートとは?
スパムアップデートは、スパムポリシーの更新に基づいて、アップデートされます。
Google のスパムに関するスパムポリシーとは「Google の検索結果の品質に、悪影響を及ぼすおそれがある行為」に対応し、ユーザーを保護し、検索結果の品質を高めることを目的としています。
スパムポリシーを構成しているシステムは以下の16項目です。
- クローキング Cloaking
- 誘導ページ Doorways
- 期限切れのドメインの不正使用 Expired domain abuse
- ハッキングされたコンテンツ Hacked content
- 隠しテキストと隠しリンク Hidden text and links
- キーワードの乱用 Keyword stuffing
- リンクスパム Link spam
- 機械生成トラフィック Machine-generated traffic
- マルウェアや悪意のある動作 Malware and malicious behaviors
- 誤解を招く機能 Misleading functionality
- 大量生成されたコンテンツの不正使用 Scaled content abuse
- 無断複製されたコンテンツ Scraped content
- 不正なリダイレクト Sneaky redirects
- サイトの評判の不正使用 Site reputation abuse
- 内容の薄いアフィリエイト ページ Thin affiliate pages
- ユーザー生成スパム User-generated spam
パッセージ ランキング システム Retired systems
この他に、過去に発表された、以下の3つのランキングシステムも含まれます。
- ハミングバード Hummingbird
- パンダシステム Panda system
- ペンギンシステム Penguin system
ランキングの降格や削除につながる可能性のあるその他の行為
ランキングに影響する以下の行為についても、検討されます。
- 法律に基づく削除
- 個人情報の削除
- ポリシーの回避
- 詐欺や不正行為
「スパムポリシー」については、Googleの以下のサイトからご覧になれます。
- Google 日本語サイトhttps://developers.google.com/search/docs/essentials/spam-policies?hl=ja
- Google 英語サイトhttps://developers.google.com/search/docs/essentials/spam-policies?hl=en
ランキングシステムの更新「コアアップデート」と、スパムポリシーの更新「スパムアップデート」とは、このように違いがあります。
2024年3月「スパムアップデート」で行われた3つの追加更新
2024年3月5日にリリースされた「スパムアップデート」は、3月20日9:03AMに完了したと報告しています。時間は太平洋標準時で、3月の日本との時差17時間。(日本では17時間後)
スパムポリシーの変更点
Googleが、「2024年3月のコア アップデートとスパムに関する新しいポリシーについてウェブ クリエイターが知っておくべきこと」(➤こちら)として公開しています。
本日新たに発表したのは、日増しに増えている悪質なスパム行為である、期限切れのドメインの不正使用、大量生成されたコンテンツの不正使用、サイトの評判の不正使用に対処するための 3 つのポリシーです。
つまり、2024年3月のスパムポリシーの更新では、以下の3つの不正使用について追加したことが公開されています。
- 期限切れドメインの不正使用 Expired domain abuse
- 大量生成されたコンテンツの不正使用 Scaled content abuse
- サイト評価の不正使用 Site reputation abuse
3つの項目を順番に説明します。
1.期限切れドメインの不正使用 Expired domain abuse
期限切れのドメイン名を主に検索ランキングを操作する目的で購入し、ユーザーにとってほとんどまたはまったく価値がないコンテンツをホストするために再利用することです。
引用:Google
Googleでは「期限切れドメインの不正使用」では、次の事例を挙げています。
医療サイトとして以前使用されていたドメインを購入して、以前の所有者によるそのドメインの評判に基づき、検索で上位に掲載されることを期待して、低品質のカジノ関連のコンテンツをホストするために再利用するといった行為がこれにあたります。
この事例の様に使われる「期限切れのドメインの不正使用」は、うっかりなどの過失行為ではなく、故意に使用される手段です。
目的が「低品質のコンテンツを故意に検索の上位に掲載させるという行為」のために、過去のドメイン評価を利用するなどをGoogleはスパム行為と見なします。
その他の事例を引用します。
・以前は政府機関が運営していたサイトで、現在はアフィリエイトコンテンツが掲載されている
引用:Google
・かつては非営利の医療チャリティ団体が運営していたサイトで、現在は営利の医療製品が販売されている
・かつては小学校のサイトだったものが、現在はカジノ関連のコンテンツで使われている
ただし、以前に他人名義だったドメインで期限切れになったのを、再取得して有益なコンテンツを作成することはスパムではありません。
3.大量生成されたコンテンツの不正使用 Scaled content abuse
「大量生成されたコンテンツの不正使用」(英語では Scaled content abuse)について説明します。
Scaled content abuse(大量生成されたコンテンツの不正使用)とは、検索順位を操作することを主な目的として、ユーザーには役に立たないページを大量に生成することです。
引用:Google
通常、ユーザーにほとんど価値を提供しない、オリジナルではないコンテンツの大量作成に重点が置かれます。
Googleでは、次の事例を紹介しています。
引用:Google
- 生成 AI ツールまたはその他の同様のツールを使用して、ユーザーにとっての価値を付加することなく大量のページを生成すること
- フィード、検索結果、その他のコンテンツをスクレイピングして、ユーザーにとってほとんど価値がない大量のページを生成すること(類義語生成、翻訳、その他の難読化手法などを使用)
- 複数のウェブページからのコンテンツを、価値を加えることなくつなぎ合わせたり組み合わせたりすること
- コンテンツを大量生成したことを隠す目的で複数のサイトを作成すること
- 検索キーワードは含んでいるものの、閲覧者にとってほとんどまたはまったく意味がないコンテンツのページを大量に作成すること
特に最近の傾向として「生成AI」の影響を重視しているようです。
生成AIの利用をすることを問題視しているのではなく、生成AIを使って、ユーザーに有益と言えない低品質のコンテンツを多量に作ることで、検索順位を操作する行為をスパムとしています。
つまり、Scaled content abuse は、どのように作成されたかは問題にしていません。
Googleがスパムとしているのは、「検索からのトラフィックを集めることを主目的」にしていることで、しかも、ユーザーに有益と言えないコンテンツを大量生成させる行為です。
最近検索上位を狙う目的で増えている生成AIによる自動コンテンツ作成ツール。これを利用して、短時間で数十記事をアップする手法などが該当するのかもしれません。
ぼくもテストで生成AIでSEOを加味した数記事を作成してみましたが、検索上位にはならない体験をしています。
参考記事を紹介します。
3.サイト評価の不正使用 Site reputation abuse
「サイト評価の不正使用」(英語で Site reputation abuse)について説明します。
まず、Googleが公開しているポリシーを引用します。
サイトの評判の不正使用とは、ファーストパーティの監督や関与がほとんどまたはまったくない状態で、サードパーティのページを公開することを指します。その目的はファーストパーティのサイトのランキング シグナルを利用して検索ランキングを操作することです。
引用:Google
サイト評価の不正使用に関する記述は、すこし理解しにくいと思われます。
そこで、Googleから事例を1つ引用して説明します。
「最高のカジノ」に関するサードパーティ ページが医療サイトでホストされている。このページは検索ランキングの操作を主な目的として作成されており、ホストしている医療サイトはほとんどまたはまったく関与していない
例えばこの記事例では、「最高のカジノ」のキーワード検索順位を上位にあげる目的で、ほとんど関係のない「医療系サイト」で記事が公開されているイメージです。しかも、医療系サイトの管理者は、そのことに全く気付いていないし、関与していない場合などです。
この場合、医療系サイトはサイト評価が高く、検索ランキングが上位表示されていれば、「最高のカジノ」がそこに無断で公開されることで、医療系サイトのランキング評価の恩恵を受け、検索上位に躍り出るという仕組みのスパム。
評価の高いサイトが評価の低いサイトに不正使用されていると言えます。
2024年3月スパムアップデートの考察
今回スパムアップデートで追加された3つのポリシーで、どんなことが強化されたのでしょうか?
- 期限切れドメインの不正使用 Expired domain abuse
- 大量生成されたコンテンツの不正使用 Scaled content abuse
- サイト評価の不正使用 Site reputation abuse
3つのポリシーに共通していることは、故意の検索ランキング操作で、その結果、ユーザーには恩恵がなく、単にランキングを上げるだけの操作だといえます。
例えば、ブログ記事を作成するときに、ユーザーの検索意図、それに応えるコンテンツ内容を作ります。
それには、ユーザーが満足できる「E-E-A-T」、Experience(経験)、Expertise(専門性)、Authoritativeness(権威性)、Trust(信頼)を網羅したコンテンツが必須です。
しかし、ぼくも生成AIで記事を作ってみましたが、5,000字の記事にかかる時間は約3~5分。
もし、記事の設計から人間が行うと5時間はかかる内容ですが、AIなら数分で完成します。
時々、AIが提案してくる視点については、驚くこともあり、逆に学べるメリットもあります。
問題は、AIを使ったことではなく、単に検索ランキングを上げて、トラフィックを増やすだけの目的でコンテンツを毎日量産することです。
これによりユーザーが満足できるコンテンツならOKですが、それは望めないと感じます。
Googleでは、この点も重要な判断として強化していることを感じます。
少し前なら、AIを使った記事でも上位に上がったことはありますが、現在は、そう簡単にはいかないことを実感しています。
今回、相当な検索ランキングの変動もあり、天国と地獄のさほどあったかもしれません。
GoogleのAIがどれ位、世界中に増加している、数千億のコンテンツを評価するのか、期待したいとおもいます。