Googleを検索した結果がランキングで表示される仕組みはどうなっているのでしょうか?
ブログを運営していると、検索順位を上位にしたい方も多いはずですね!
しかし、Googleがどのように検索結果をランキングしているのか、知ることは難しいようです。
そこで、今回はGoogleが公開している資料を分析して、検索結果ランキングが表示されるまでの仕組みをわかりやすくまとめました。
Googleが意図している「検索順位」について詳しく知ることができます。
Googleが検索結果を自動的に生成する仕組み
世界中に存在する数千億に及ぶWebコンテンツ等を、Googleはどのように検索結果を瞬時に生成するのでしょうか?
しかも、自動的に生成する仕組みは、人間にはとうていマネのできない処理といえます。
Googleは必要な情報を見つけるサポートが目的
Googleが公開している「結果を自動的に生成する仕組み」を読むと、その意図を理解することができます。
世界には入手可能な情報が膨大に存在するため、情報分類のサポートがなければ必要な情報を見つけるのはほぼ不可能です。Google のランキング システムはそのために設計されています。
引用:Google 結果を自動的に生成する仕組み
Googleは、インデックス登録した天文学的ともいえる数千億のコンテンツ等を分類して、しかもユーザーにとって「最も関連性の高い有用な結果」を瞬時に提示してくれます。
つまり、ユーザーが必要な情報を、膨大なWebページから見つけるためにサポートするのが目的と言えます。
検索結果の判断にかかわる5つの重要な要因
クエリ(キーワード)で検索されると、ユーザーに最も有用な情報を結果として返します。
では、どのような要因をもとに判断して、ユーザーに結果を返すのでしょうか?
Googleの検索アルゴリズムは、①要因、⓶検索クエリの単語、③ページの関連性や有用性、④ソースの専門性、⑤ユーザーの位置情報や設定、等を基に検討して判断しています。
しかも、要因については、クエリ(キーワード)の性質によって異なると説明しています。
一部を引用すると、以下の通りです。
各要因に適用される重み付けはクエリの性質によって異なります。たとえば、最新のニュース トピックに関するクエリに回答する場合は、言葉の定義に関するクエリに回答する場合よりも、コンテンツの鮮度が大きな役割を果たします。
引用:Google
検索結果の判断となる主な要因には、次の5つがあると説明しています。
- 検索クエリの意味
- コンテンツの関連性
- コンテンツの質
- ウェブサイトのユーザビリティー
- コンテキストと設定
主な5つの要因を順番に説明します。
(1)検索クエリの意味
Googleでの「検索クエリ」とは検索キーワードのことです。
検索クエリ(キーワード)の背後にどんな意図があるか?
ユーザーがあるキーワードを使って検索したときに、ユーザーはどんな情報を探しているのかを理解する必要があります。
しかも、検索ボックスに入力された少数の単語から、検索の背後にあるユーザーの意図をGoogleは理解しなければなりません。ユーザーに関連性の高い結果を返すためです。
関連性の高い結果を返すには、ユーザーがどんな情報を探しているか、つまり検索クエリの背後にどんな意図があるかをまず理解する必要があります。
そのため、検索クエリと最も有益なコンテンツとの「マッチングの程度」を把握するための言語モデルを構築しています。
具体的には、次の事例を紹介しています。
たとえば、「ノートパソコンの明るさを変える」という検索に対して、メーカー側の記述が「ノートパソコンの明るさの調整」となっているような場合です。Google のシステムは、単語と意図がつながっていることを理解して、適切なコンテンツを提示します。
引用:Google
5年年以上の歳月をかけて開発され、さまざまな言語の検索の 30% 以上で大きな成果を上げていると説明しています。
情報のタイプを把握する
「情報のタイプ」を把握する試みも行われます。
例えば「料理」や「絵」などで検索された場合、Googleはユーザーに対して「レシピ」や「画像」をを返すことが最も検索意図に一致する可能性があると判断します。
また、ドイツ語で検索された場合は、ほとんどの検索結果がドイツ語で表示されることも同様です。
特定のエリアを認識する
Googleのシステムは、特定の地域を対象として検索されたクエリであることも認識できます。
例えば「ピザ」で検索すると、近くのピザデリバリー店に関する結果が表示されるのはこのためです。
急上昇中のクエリに対しては最新情報を選ぶ
急上昇中のキーワード(トレンド)が検索された場合のいは、最新情報が有益であると判断します。
その結果、古いページよりも新しページが上位に表示されることになります。
(2)コンテンツの関連性
Googleは、検索クエリ(キーワード)の検索意図に関連する可能性のある情報が、コンテンツ(記含まれているかいるかを評価します。
システムは次に、コンテンツを分析して、求められている内容に関連する可能性のある情報が含まれているか評価します。
引用:Google
これは、検索クエリと同じキーワードが、タイトルや見出し、本文など含まれていると、関連性が高い可能性があると分析します。
着目されるのはキーワードばかりではなく、「検索クエリと関連しているか」についても分析します。
検索と返された結果のやり取りを機械学習させることで、関連性はさらに正しく推定できるようになります。
分かりやすい事例がGoogleに紹介されています。
たとえば、「犬」で検索する場合、必要なのは「犬」という単語が何百回も出現するページではありません。それを踏まえて、検索アルゴリズムでは、「犬」というキーワード以外で関連性の高いコンテンツ(犬の画像や動画、犬種のリストなど)がページに含まれているかどうかを評価しています。
引用:Google
なお、Google のシステムは、コンテンツの主観的概念(視点や政治的な偏向)を分析するようには設計されていません。
(3)コンテンツの質
Googleは、最も役立ちそうな「関連性のあるコンテンツ」を優先しようとします。
そのために、インデックスされたどのコンテンツが「専門性、権威性、信頼性」を示しているか判定します。
Googleは、判定するために役立つシグナルを特定します。
その事例として、著名なWebサイトにリンクされていたり、言及が含まれていることが、Googleのシステムに把握されると信頼性が高いと評価されることがあります。
(4)ウェブサイトのユーザビリティ
コンテンツのユーザビリティも考慮されています。
インデックスされたコンテンツに大きな差がない場合には、どう判定されるのでしょうか?
Googleは、ユーザーにとってアクセス性が高いコンテンツを評価する可能性があります。
そのため、ページエクスペリエンスは重要となります。
つまり、コンテンツがモバイル フレンドリーであれば、モバイルデバイスユーザーにとって読みやすいと評価されることです。
コンテンツの読み込み速度をも確認します。
(5)コンテキストと設定
検索したユーザーの、その時点での、現在地、過去の検索履歴、検索設定などの情報はすべて、関連性が高い検索結果を提供するために役立っています。
説明を要約すると、「検索したユーザーが暮らしている地域に関連するコンテンツを提供する」ということです。
例えは「football」で検索しても、シカゴなら「アメリカンフットボール」に関する結果が、ロンドンなら「サッカー」に関する検索結果が表示されることです。
Googleが検索結果をランキングする19のシステム
Google検索に携わっているのが「コア ランキング システム」で、複数のコアシステムのひとつです。
コア ランキングシステムが担当している仕事は次の通りです。
Googleのランキングシステムは、世界中にある数千億に及ぶWebページやコンテンツから、ユーザーにとって検索意図に最も関連性が高く、有益で品質の高い順に結果を瞬時に表示する仕事をします。
このシステムは、ぼくたちの検索結果に直接的に影響するため、「コア ランキング システム」が、どのような構成になっているのか説明します。
Googleを調べてみると、一部ではあるものの、次の19のシステムを紹介しています。
- BERT Bidirectional Encoder Representations from Transformers
- 災害情報システム Crisis information systems
- 重複除去システム Deduplication systems
- 完全一致ドメイン システム Exact match domain system
- フレッシュネス システム Freshness systems
- ヘルプフル コンテンツ システム Helpful content system
- リンク分析システムと PageRank Link analysis systems and PageRank
- ローカル ニュース システム Local news systems
- MUM Multitask Unified Model
- ニューラル マッチング Neural matching(*参考記事あり)
- オリジナル コンテンツ システム Original content systems
- 削除ベースの降格システム Removal-based demotion systems
- パッセージ ランキング システム Passage ranking system
- RankBrain
- 信頼できる情報システム Reliable information systems
- レビュー システム Reviews system
- サイト多様性システム Site diversity system
- スパム検出システム Spam detection systems
- 廃止されたシステム Retired systems
一部とはいえ、多くのシステムによって、検索結果がランキングされていることが分かります。
では、順番にGoogleコアアップデートの19のシステムを紹介します。
Google検索ランキングシステムの解説
Googleは、自動ランキング システムを使用して、インデックスに登録された数千億のウェブページ等から、最も関連性の高い、有益な結果を一瞬で表示することが可能です。
検索クエリに対して検索結果を生成する「コア ランキング システム」とはどんな構成なのか紹介します。
それでは19のシステムを順を追って説明します。
(1)BERT
Bidirectional Encoder Representations from Transformers(BERT)は、Google が使用する AI システムです。
単語が組み合わされることで、様々な意味や意図が表現されます。
BERTは、これらの意味や意図を理解できるようにするAIシステムです。
(2)災害情報システム
以下の様な、あらゆる危機発生時に有用でタイムリーな情報を提供するシステムです。
- 個人の危機的状況
- 自然災害
- その他の広範囲に及ぶ危機的状況
ユーザーから個人の危機にかかわる検索クエリが入力されると、Googleはホットラインや信頼できる組織が提供するコンテンツを表示する仕組みになっています。
自然災害時や広範囲に影響が及ぶ危機的状況下では、SOS 緊急情報システムにより地方自治体、国家機関、国際機関からの最新情報が表示されます。
(3)重複除去システム
互いに非常に似通ったコンテンツがある場合、最も関連性の高い結果のみが表示され、有益性の低い重複内容は除去されます。
コンテンツの掲載情報が強調スニペットになった場合、検索結果の 1 ページ目で表示され、それ以降に表示されることはありません。その結果、ユーザーは関連情報を見つけやすくなります。
(4)完全一致ドメイン システム
ドメイン名に含まれる単語を、コンテンツが検索に関連しているかどうかを判断するための多くの要素の一つとみなしています。
一方で意図的に、特定の検索キーワードと完全一致することを目的に付けられタドメインの場合、完全一致ドメイン システムは、そのドメインのコンテンツを過度に評価しません。
(5)フレッシュネス システム
ユーザーが、より鮮度の高いコンテンツを期待して検索した場合、鮮度の高いコンテンツが上位に表示されるようになっています。
事例として、「地震」で検索した場合、平時なら地震に対する備えや支援などに関する情報を返し、地震が発生直後ならニュース記事や鮮度の高いコンテンツを上位に掲載するようにしています。
投稿してから時間が経過したコンテンツは、リライトで新鮮にすることも重要です。
(6)ヘルプフル コンテンツ システム
人間が人間のために作成した、独自性の高い有益なコンテンツが検索結果で表示されるために設計されたシステムです。
検索エンジンのトラフィックを集めることを主な目的として作成されたコンテンツは対象となりません。
つまり、SEOファーストでトラフィック増加を狙い、キーワードを詰め込んだコンテンツは評価され肉と言えます。
(7)リンク分析システムと PageRank
サイト内のページ間で張られる相互リンクを理解しすます。
その結果、ページの内容と検索クエリに対して「最も有益な情報を提供するページを判断」しています。
その一つ「PageRank 」は、サービス開始した当初から使用されているコア ランキング システムの一つです。
(8)ローカル ニュース システム
トップニュース、ローカル ニュースなどの機能を通じて、関連性の高い地域のニュース情報を特定して表示するためのシステムを導入しています。
(9)MUM
Multitask Unified Model(MUM)は、言語の理解と生成の両方の機能を持つ AI システムです。
今は検索のランキング全般には使用されていませんが、COVID-19(新型コロナウイルス感染症)ワクチン情報の検索の改善や、強調スニペットのコールアウト表示の改善など、特定の用途で使用されています。
引用:Google
(10)ニューラル マッチング
ニューラル マッチングは、検索クエリやページのコンセプトを理解、それらを相互に関連付けるための AI システムです。
(11)オリジナル コンテンツ システム
独自性の高いコンテンツが優先して上位表示されるシステムです。
単に引用したものよりも、オリジナルで書き上げた方が、検索結果で上位に表示され、目立つようになります。
(12)削除ベースの降格システム
特定の種類のコンテンツを削除できるポリシーを設けています。
事例としては、著作権侵害で特定のサイトのコンテンツ削除通知がGoogleに届いた場合、同サイトの残りのコンテンツを検索結果の順位を下げることができます。
(13)パッセージ ランキング システム
ウェブページの個々のセクション(パッセージ)を特定して、ページが検索にどの程度関連しているかをよりよく理解するために使用する AI システムです。
(14)RankBrain
単語とコンセプトの関連を理解するための AI システムです。
検索に使われた単語が、すべて正確に含まれていなくても、関連するコンテンツが表示できるようになります。
(15)信頼できる情報システム
「権威性の高いページを表示」、「質の低いコンテンツの順位を下げる」など、可能な限り最も信頼性の高い情報を表示するシステムです。
(16)レビュー システム
質の高い「レビューコンテンツ」を高く評価じます。
質の高いレビューコンテンツとは、「洞察に満ちた分析結果」や「独自の調査情報を提供」するコンテンツのことです。また、特定の深い知識を持つ専門家や愛好者が書いたコンテンツも含みます。
(17)サイト多様性システム
検索結果の上位に「同じサイトから 2 つ以上のウェブページが表示されない」ためのシステムです。
特定のサイトだけが、検索上位表示を独占しないようにするものです。
ただし、例外として特に関連性が高いと判断された場合は 2 つ以上表示されることもあります。
(18)スパム検出システム
「スパムポリシー」に違反するコンテンツや行為に対処するために、SpamBrain などのさまざまなスパム検出システムを導入しています。
(19)廃止されたシステム
以下で紹介する過去のシステムは、後継のシステムの一部として組み込まれている場合、コア ランキング システムの一部になった倍があります。
Hummingbird
2013年8月、ランキングシステム全体に加えられました。
Panda システム
高品質で独自性の高いコンテンツを表示するために設計されたシステムです。2011年「Panda」で登場し、2015年にGoogle のコアランキングシステムの一部に取り入れられました。
Penguin システム
リンクスパム対策で設計されたシステムです。2012年「Penguin Update」で登場し、2016年Googleのコア ランキングシステムに組み込まれました。
Googleの検索結果で上位表示されるには?
ここまで説明した通り、Googleのコアランキングシステムは、ユーザーにとって、独自性の高いコンテンツが表示されるように開発されています。
さらに、ユーザーが満足できるエクスペリエンスと評価されるためのシステムです。
ここが、Googleが最も重視しているコアランキングシステムのポイントではないでしょうか。
「コアランキングシステム」はページレベルで機能する
Googleのコアランキングシステムは、基本的に個々の「ページレベル」で評価するように設計されています。
つまり、有用でないコンテンツが含まれていても、有用なコンテンツが評価され、上位表示されると説明しています。
しかし、かなり多量の有用でないコンテンツがある場合は、サイトの他のコンテンツが上位に表示されなくなることも否定していません。
その場合、有用でないコンテンツを削除すれば、他の有用なコンテンツは上位表示につながる可能性があるともアナウンスしています。
有用でないコンテンツを削除した効果は、いつ出るのでしょうか?
Googleのアルゴリズムアップデートは、多数のシステムが複合して機能していることは説明しました。
これらのアップデートは定期的に行われていて、改善した内容が掲載ランキングに反映されるまでの期間は決まっていないとしています。
ランキングの変更はさまざまな要因により、常に発生する可能性があります。Google では定期的にコア ランキング システムをアップデートしています。オープンウェブのコンテンツが変更されると、Google のシステムはそれを処理します。そのため、改善内容が掲載順位に反映されるまでの期間について決まったタイムラインはありません。
引用:Google
検索上位表示されるコンテンツを作成するポイント
クエリ(キーワード)で検索されると、ユーザーに最も有用な情報を結果として返すことは説明しました。
つまり、ユーザーに最も有益なコンテンツにすることで、SEOは重要ですが、しかし、上位表示にとっては第一とは言えません。
Googleが説明しているように、「人間が人間のために作成した、独自性の高い有益なコンテンツ」が評価されることから、ユーザーがコンテンツに満足できる品質の高さをもって作成することが重要です。
ただし、コンテンツ作成にAIを利用することを否定しているわけではありません。生成AIが利用されたとしても、重要なのは、ユーザーにとって有益なコンテンツかどうかです。
Googleのランキングシステムを分かりやすく解説(まとめ)
Googleを検索した結果がランキングで表示される仕組みはご理解いただけたでしょうか?
ブログ運営で検索順位が上位に評価されるための、ポイントを紹介しました。
人間が人間のために、ユーザーにとって有益で、オリジナリティのあるコンテンツを作ることこそ、その目的を達成できると思います。
多少の単語のミスや、関連した言葉でも、すでにAIは検索意図を理解しているようです。