この記事はAhrefs公式ブログの日本語訳です。
原文:How Search Engines Work
(著者:Joshua Hardwick / 原文の最終更新日:September 1, 2022)
※フルスピード註:この記事は2021年9月1日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。
検索エンジンは、ウェブ・クローラーを使って何十億ものページをクロールすることで機能します。スパイダーやボットとも呼ばれるクローラーは、ウェブをナビゲートし、リンクをたどって新しいページを見つけます。これらのページは、検索エンジンが検索結果を取得するためのインデックスに追加されます。
検索エンジンがどのように機能するかを理解することは、SEOを行う上で非常に重要です。
結局のところ、その仕組みを知らなければ、何かを最適化することは難しいでしょう。
下記は、このガイドで学ぶことです。
内容
1.検索エンジンの基本
2.検索エンジンのインデックスの作り方
3.検索エンジンがページをランク付けする方法
4.検索エンジンが結果をパーソナライズする方法
パート1
検索エンジンの基本
まず、検索エンジンとは何か、なぜ存在するのか、そしてどのように収益を上げるのかを探ることから始めましょう。
検索エンジンとは何か?
検索エンジンは、ウェブコンテンツの検索可能なデータベースです。
主に2つの部分から構成されています:
- 検索インデックス:ウェブページに関する情報のデジタルライブラリー。
- 検索アルゴリズム:検索インデックスからの結果のマッチングを任務とするコンピュータプログラム。
検索エンジンの目的は何か?
どの検索エンジンも、ユーザーにとって最適で最も関連性の高い結果を提供することを目指しています。それが市場シェアを獲得する一因でもあります。
検索エンジンはどうやってお金を稼ぐのか?
検索エンジンには2種類の検索結果があります:
- 検索インデックスからのオーガニック結果:表示にお金を支払うことはできません。
- 広告主からの有料結果:あなたもここに表示されるために支払うことができます。
誰かが有料検索結果をクリックするたびに、広告主は検索エンジンに料金を支払います。これはペイ・パー・クリック(PPC)広告と呼ばれており、市場シェアの重要性がここに関わってきます。ユーザーが増えるほど広告のクリックも増え、それにより収益も増加します。
パート2
検索エンジンがインデックスを構築する方法
各検索エンジンは、自身の独自の方法で検索インデックスを構築しています。以下は、Googleが採用しているプロセスの簡単な説明です。
それを詳しく見てみましょう。
URL
すべては既知のURLリストから始まります。GoogleはこれらのURLを発見するためにさまざまな方法を使用しますが、最も一般的なのは次の3つです:
- 被リンク:Googleは数千億ものページインデックスを持っています。[2]誰かが既知のページから新しいページへのリンクを貼ることで、Googleはその新しいページを見つけることができます。
- サイトマップ:サイトマップは、あなたのサイト上で重要なページやファイルをGoogleに伝えるものです[3]。
- URLの送信:Google Search Consoleを使用して、サイト所有者が個々のURLのクロールをリクエストできるようになっています。
クローリング
クローリングとは、スパイダーと呼ばれるコンピュータボットが、既知のURLを訪問してそのページをダウンロードする作業です。GoogleのクローラーはGooglebotです[4]。
処理とレンダリング
処理は、クロールされたページから重要な情報を理解し抽出する作業です。そのためにはページをレンダリング(表示)する必要があります。ページのコードを実行し、ユーザーにとってどのように見えるかを理解します。
このプロセスの詳細はGoogle社外には知られていませんが、私たちが知る必要のあることは、リンクを抽出し、コンテンツをインデックスに保存するという点です。
インデックス作成
インデックス作成は、クロールされたページから処理された情報を検索インデックスに追加する作業です。
検索インデックスとは、ユーザーが検索を行う際に利用されるもので、GoogleやBingなどの主要検索エンジンに登録されることが非常に重要です。インデックスに登録されていない限り、ユーザーはあなたを見つけることができません。
ご存知でしたか?
Googleは検索エンジン市場の91.43%を占めています。ほとんどの人がGoogleを利用しているため、他の検索エンジンよりも多くのトラフィックを受けることができる[5]。
パート3
検索エンジンがページをランク付けする仕組み
コンテンツの発見、クロール、インデックス作成は、パズルの最初の部分に過ぎません。検索エンジンが実際に検索結果をランキング付けするためには、検索アルゴリズムが必要です。これが検索アルゴリズムの役割です。
検索アルゴリズムとは何か?
検索アルゴリズムは、インデックスから関連性のある結果を見つけ出し、それらをランク付けするための計算式です。Googleはアルゴリズムに多くの要素を組み込んでいます。
主なGoogleランキング要因
Googleはすべてのランキング要因を公開していませんが、いくつかの重要な要因は明らかです。そのうちのいくつかを見てみましょう。
被リンク
被リンクとは、あるウェブサイトのページから別のウェブサイトへのリンクのことである。Googleの最も強力なランキング要因の1つです[6]。10億以上のページを対象とした調査で、リンクドメインとオーガニックトラフィックの間に強い相関関係が見られたのはおそらくこのためでしょう[7]。
しかし、量がすべてではない。質も重要です。少数の高品質被リンクを持つページは、多くの低品質な被リンクを持つページよりも上位になることが多いです。
ご存知でしたか?
あなたのウェブサイトへの被リンクは、Ahrefsで無料でチェックできます。
Ahrefsウェブマスターツールの無料アカウントに登録し、サイトエクスプローラーにドメインを入力し、被リンクレポートにアクセスします。
私たちのクローラーはウェブ上で5番目にアクティブなので[8]、あなたの被リンクのかなり詳細なビューをここで見ることができます。
関連性
連性とは、特定の検索結果が検索者にとって役立つかどうかを指します。Googleはこの判断をするためにさまざまな方法を用います。基本的なレベルでは、検索クエリと同じキーワードを含むページを見つけ出します。さらに、他のユーザーがその検索結果を有用だと感じているかどうかを判断するために、ユーザーの相互作用データも調べます[9]。
新鮮さ
新鮮さはクエリに依存するランキング要素です。新鮮な検索結果を求める検索では、より協力になります[9]。たとえば、”new netflix series” のような検索では、最新の結果が表示されますが、”how to solve a rubik’s cube” の検索では、新しい情報よりも信頼性のある情報が重視されます。
ページスピード
ページスピードはデスクトップでもモバイルでもランキング要因です[10][11]が、ポジティブなランキング要因というよりはネガティブなランキング要因です。というのも、光速のページにポジティブな影響を与えるよりも、最も遅いページにネガティブな影響を与えるからです。
ご存知でしたか?
ページスピードはAhrefsで無料でチェックできます。
無料のAhrefsウェブマスターツールアカウントにサインアップし、Ahrefsのサイト監査でウェブサイトをクロールし、パフォーマンスレポートにアクセスします。一般的に、赤が少ないほど良いとされています。
モバイルフレンドリー
Googleが2019年にモバイルファーストインデックスに切り替えて以来、モバイルでの利便性はモバイルとデスクトップでのランキング要因となっています[12]。
パート4
検索エンジンが結果をパーソナライズする方法
Googleは、ユーザーごとに検索結果を調整します。そのため、位置情報、言語、検索履歴などの情報を利用しています[9]。
位置情報
Googleは、検索結果をパーソナライズするために、あなたの位置情報を使用します。そのため、「イタリアンレストラン」の検索結果はすべて、地元のレストラン、または地元のレストランに関するものなのです。Googleは、あなたがランチのために地球の裏側まで飛んでいく可能性が低いことを知っているのです。
言語
Googleは、スペインのユーザーに英語の検索結果を表示しても意味がないことを知っています。そのため、異なる言語を話すユーザーに対して、ローカライズされたバージョンのコンテンツを(利用可能であれば)表示するのです。
検索履歴
Googleは、よりパーソナライズされた検索体験を提供するために、あなたがしたことや行った場所を保存します[13]。
まとめ
- サーチエンジンは、インデックスとアルゴリズムという2つの主要部分から構成されている。
- インデックスを構築するために、既知のページをクロールし、リンクをたどって新しいページを見つける。
- 検索アルゴリズムの目的は、最適で最も関連性の高い結果を返すことである。
- 検索結果の質は市場シェアを築く上で重要である。
- オーガニック結果に関するGoogleのランキング要因をすべて把握している人はいない。
- 主なランキング要因には、被リンク、関連性、鮮度が含まれる。
- Googleは、あなたの場所、言語、検索履歴に基づいて結果をパーソナライズする。
参考文献
- 「JavaScriptのSEOの基本を理解する」.Google. 2022年8月16日取得
- 「情報の整理 – Google検索の仕組み」. Google.2022年8月16日取得
- 「サイトマップについて」 Google.2022年8月16日取得
- 「Googlebot」.Google.2022年8月16日取得
- 「世界の検索エンジン市場シェア」 Statcounter.2022年8月16日取得
- 「Google Q&A+ #3月」. YouTube.2022年8月16日取得
- 「90.63%のコンテンツはGoogleからトラフィックを得られない。残りの9.37%に入るには」?Ahrefs.2020年1月31日。2022年8月16日取得
- 「CloudFlare Radar」 CloudFlare.2022年8月16日取得
- 「検索結果のランキング – Google検索の仕組み」 Google.2022年8月16日取得
- 「ウェブ検索ランキングでサイトの速度を使用する」Google. 2022年8月16日取得
- 「モバイル検索ランキングでページ速度を使用する」Google. 2022年8月16日取得
- 「モバイルファーストインデックスのベストプラクティス」 Google. 2022年8月16日取得
- 「ウェブとアプリのアクティビティの検索と制御」 Google. 2022年8月16日取得
記事を書いた人
Joshua Hardwick
Ahrefsのコンテンツ責任者(わかりやすく言うと、私たちが公開するすべてのブログ記事が素晴らしいことを保証する責任者です)。
コメント