Googleの検索アルゴリズム内部資料リークについて、SEO専門家たちは大胆な推測を展開している

SEO

この記事はAhrefs公式ブログの日本語訳です。
原文:Google Documents Leaked & SEOs Are Making Some Wild Assumptions
(著者:Patrick Stox / 原文の最終更新日:May 30, 2024)
※フルスピード註:この記事は2024年5月30日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。

最近起こったGoogleの検索アルゴリズム内部資料のリークについては、おそらく皆さんも聞いたことがあるでしょう。この情報は、あらゆる主要サイトやソーシャルメディアで取り上げられています。

Googleの検索アルゴリズム内部資料のリークはどこから?

私の理解では、yoshi-code-bot と呼ばれるボットが2024年3月13日、GithubのContent API Warehouseに、関連する資料を漏洩しました。以前に他のリポジトリに表示された可能性もありますが、最初に発見されたのはこれです。

これらはErfan Azimi 氏によって発見され、Rand Fishkin氏に共有され、Rand Fishkin氏はMike King氏と共有しました。漏洩した資料は、2024年5月7日に削除されました。

調査結果をSEOコミュニティと共有してくださった関係者全員に感謝します。

Googleの対応

資料が本物かどうかについては議論がありましたが、多くの内部システムについて言及されており、内部文書へのリンクもあるため、間違いなく本物のようです。

Google の広報担当者はSearch Engine Landに対して次のような声明を発表しました。

私たちは、脈絡がない、時代遅れ、あるいは不完全な情報に基づいて、検索について不正確な推測をしないよう注意します。私たちは検索がどのように機能し、私たちのシステムがどのような要素を重視するかについて、広範な情報を共有しています。

SEO専門家は、自身の経験と偏見に基づいて物事を解釈している

多くのSEO専門家は、ランキング要因が漏洩したと言っています。コードや重み付けは見たことがなく、説明とストレージ情報と思われるものだけが表示されています。資料に書かれている説明文のいずれかに、ランキング要因に使われる項目と書かれていない限り、SEO専門家が、これらすべてについてランキング要因に使用されると考えるのは危険だと思います。

機能や情報が保存されているからといって、それがランキングアルゴリズムに使用されるわけではありません。たとえば、Ahrefs社の検索エンジンYep.comでは、クロール、インデックス作成、ランキング、パーソナライゼーション、テスト、フィードバックに使用される可能性のある、あらゆるものが保存されています。この中には、まだ使用していないが、将来使用する可能性のあるものも多数保存しています。

より可能性が高いのは、SEO専門家が自分の意見や偏見に有利な仮定を立てていることです。

私も同じです。十分な背景や知識を持っていないかもしれませんし、解釈に影響を与える固有の偏見があるかもしれませんが、私はできる限り公平であるように努めています。私が間違っていたとしても、それは何か新しいことを学べるということであり、良いことです。SEO専門家は物事を異なる方法で解釈できますし、実際にそうしています。

Gael Breton はこう述べました:

私は長年SEOに携わってきたので、長年にわたって多くのSEO神話が生み出されるのを見てきました。そして、その多くを誰が始めたのか、そして彼らが何を誤解していたのかを指摘することができます。このリークによって、今後10年以上にわたって対処しなければならない、たくさんの新しい神話が生まれる可能性があります。

私の意見になりますが、誤解されている、あるいは、本来は導き出されるべきでない結論が導き出されている、いくつかの事柄を見てみましょう。

Webサイトの権威性について

Googleには、(Ahrefsで定義している)DRのようなランキングに使用するサイト権威スコアがある、と言いたいところですが、その部分は具体的には圧縮された品質指標に関するもので、品質について語っています。

DR は、Googleが必ずしも使用するものではなく、 PageRankの高いページが多数ある場合に発生する効果であると私は考えています。内部で相互にリンクしている PageRank の高いページが多数あるということは、より強力なページが作成される可能性が高くなることを意味します。

  • PageRank は Google が品質と呼ぶものの一部であると信じますか?→はい。
  • それがすべてだと思いますか?→いいえ。
  • Site Authority(サイト権威) は DR に似たものなのでしょうか?→おそらくそうでしょう。全体像に当てはまります。
  • それを証明したり、ランキングに使用されていることを証明できますか?→いいえ(Googleではないこの視点からは)証明できません。

Google が米国司法省に提出した証言の一部から、品質は評価者による情報満足度(IS)スコアで測定されることが多いとわかりました。これはランキングに直接使用されるわけではありませんが、フィードバック、テスト、モデルの微調整に使用されます。

品質評価者がEEATの概念を持っていることはわかっていますが、これも Google が使用しているものではありません。Google は EEAT に沿ったシグナルを使用しています。

Google が言及している EEAT シグナルの一部は次のとおりです。

  • PageRank
  • 権威あるサイトでの言及
  • サイトクエリ。これは,「site:http://ahrefs.com EEAT」または「ahrefs EEAT」のようなWebサイトを指定した検索を指します。

では、ある種のPageRankスコアをドメインレベルに外挿し、Site Authority(サイト権威)と呼んでいるものが、Googleによって使用され、品質シグナルを構成する一部になっているのでしょうか?もっともらしいですが、このリークはそれを証明するものではありません。

品質スコアに関して私が見た、Googleの特許を3つ思い出します。そのうちの 1 つは、サイト クエリの上記のシグナルと一致しています。

特許を取得しているからといって、必ずしもそれが使用されているわけではないことを指摘しておきます。サイトクエリに関する特許の一部は Navneet Panda によって作成されました。品質に関連する Panda アルゴリズムの名前の由来は誰だと思いますか? このアルゴリズムが使用されている可能性は高いと思います。

その他は、n-gram の使用に関するもので、新しい Web サイトの品質スコアを計算するためのものと、サイトでの滞在時間に関するもののようでした。

フルスピード注:関連記事

この項目で参照されている記事の翻訳版は次の通りです:

サンドボックス(Sandbox)について

これも誤解されていると思います。このドキュメントには hostAge というフィールドがあり、サンドボックスについて言及していますが、具体的には「配信時に新しいスパムをサンドボックス化する」ために使用されると書かれています。

私にとって、これはSEO専門家が考えるような、新しいサイトが順位付けされないサンドボックスの存在を証明するものではありません。私にとっては、スパム対策のように思えます。

クリック数について

クリックはランキング要因に使用されますか?→はい、そして、いいえです。

Google がクリックをパーソナライゼーション、タイムリーなイベント、テスト、フィードバックなどに使用していることはわかっています。Google には、navBoost を含むクリック データでトレーニングされたモデルがいくつもあることもわかっています。

しかし、クリックデータに直接アクセスしてランキング要因に使用されているのでしょうか? 私が見たものには、それを裏付けるものはありませんでした。

問題は、SEO専門家がこれを、CTR がランキング要因であると解釈していることです。Navboostは、どのページや機能がクリックされるかを予測するために作られています。また、DOJの裁判でわかったように、返される結果の数を減らすためにも使用されます。

私の知る限り、結果の順序を変更するために個々のページのクリックデータを考慮したり、個々の結果をクリックする人が増えればランキングが上がる、ということを裏付けるものは何もありません。

もしそうなら、証明するのは簡単なはずです。何度も試みられてきました。私は何年も前にTorネットワークを使って試しました。友人のRuss Jones氏(ご冥福をお祈りします)はレジデンシャルプロキシ(住宅用プロキシ)を使って試していました。

私はこれの成功したバージョンを見たことはありませんし、人々は何年もの間、さまざまなサイトでクリックを購入し、取引してきました。私はあなたを落胆させようとしているわけではありません。自分でテストして、うまくいくのであれば、研究を発表してください。

数年前のカンファレンスで Rand Fishkin 氏が行った検索と結果のクリックに関するテストでは、Google がトレンドイベントのクリックデータを使用しており、クリックされている結果が何であれ、それをブーストしていることが示されました。実験後、結果はすぐに正常に戻りました。通常のランキングに使用するのと同じではありません。

著者情報について

Google が著者とナレッジグラフ内のエンティティを一致させ、それを Google ニュースで使用することはわかっています。

これらのドキュメントには著者情報がかなり含まれているようですが、一部のSEO専門家が推測しているように、ランキングに使用されていることを裏付けるものは何もありません。

Googleは、私たちに嘘をついていたのでしょうか?

私が心から反対しているのは、SEO専門家Google Search Advocatesに腹を立て、彼らを嘘つき呼ばわりしていることです。彼らはただ仕事をしているだけのいい人たちです。

もし彼らが間違ったことを言ったとしたら、それは彼らが知らないか、誤った情報を与えられたか、または悪用を防ぐために何かを難読化するように指示されたためである可能性が高いと言えます。彼らは、SEOコミュニティが現在彼らに与えているような憎しみを受けるに値しません。彼らが私たちと情報を共有してくれるだけでも幸運なことです。

彼らの言ったことが間違っていると思うなら、それを証明するためにテストを実行してください。または、私に実行してほしいテストがある場合は、お知らせください。今回リークされた資料に記載されているだけでは、ランキング要因に使用されていることの証明にはなりません。

まとめ

他のSEO専門家の解釈について、同意することも同意しないこともありますが、分析を共有してくれるすべての人を尊敬しています。自分自身や自分の考えを世間の厳しい審査にさらすのは簡単なことではありません。

また、これらのフィールドがランキングに使用されると明記されていない限り、その情報は他の目的にも簡単に使用される可能性があることも繰り返し述べておきたいと思います。Google の 14,000 のランキング要因に関する投稿は絶対に必要ありません。

特定の事柄について私の考えを知りたい場合は、XまたはLinkedInでメッセージを送ってください。

著者プロフィール

Patrick Stox
Patrick Stox は、Ahrefs のプロダクトアドバイザー、テクニカル SEO、ブランド アンバサダーです。2021 Web Almanac の SEO 章の主執筆者であり、2022 SEO 章のレビュアーです。また、Ahrefs の SEO Book For Beginners の共著者でもあり、The Art of SEO 4th Edition のテクニカル レビュー エディターでもありました。Raleigh SEO Meetup (米国で最も成功している SEO Meetup)、Beer and SEO Meetup、Raleigh SEO Conference など、いくつかのグループの主催者であり、Technical SEO Slack グループを運営し、Reddit の /r/TechSEO のモデレーターを務めています。

ブログ X Facebook Linked in

  • ・Google検索で上位表示されたい
  • ・Webサイトへのアクセスを増加させたい
  • ・お問い合わせのCVを向上、改善したい
  • ・自社でSEO施策をしていたが、効果がなかなか現れない

Ahrefsのオフィシャル紹介パートナーであるフルスピードは、上記のようにWebサイト改善をしたいと思っている方に向けて、SEOコンサルティングサービスを提供しています。

数多くのWebサイトの改善に従事しているコンサルタントが、お客様のWebサイトを調査し、改善方法をご提案いたします。

お気軽にご相談ください!

SEO
シェアする
AhrefsJapanをフォローする
Ahrefsブログ- 使えるSEO情報をお届け | SEOの被リンク分析・競合調査ツール
WP Twitter Auto Publish Powered By : XYZScripts.com
タイトルとURLをコピーしました