この記事はAhrefs公式ブログの日本語訳です。
原文:I Thought Google Was Biased, But The Data Shows They’re Not
(著者:Patrick Stox / 原文の最終更新日:November 5, 2020)
※フルスピード註:この記事は2020年11月5日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。
最近、Googleの最高経営責任者(CEO)サンダー・ピチャイ氏は、Googleのアルゴリズムにおける潜在的な偏りについて議会で証言するよう呼び出された。Googleが偏見で告発されるのはこれが初めてではなく、おそらくこれが最後ではない。Googleは偏見はないと主張しているが、多くの保守派はGoogleには偏見があると主張している。
検索エンジン最適化 (SEO)に関する専門知識 と Ahrefs の膨大なデータを利用して、人気のある保守党とリベラルのニュース サイトのデータを調べて、Google からのバイアスを特定できるかどうかを確認したいと考えました。Ahrefs について詳しくない方のために説明すると、Ahrefs は Web に関する大量のデータを扱うトップ SEO ツールの 1 つです。
方法論
Googleは毎年、ランキングアルゴリズムに何百もの微調整を加えています。これらのほとんどは小さいため気付かれませんが、検索結果の大部分に影響を与える大きな「コア」アップデートが時々存在します。Google はこれらの更新日を私たちに教えてくれるので、これらの更新の前後で有名なリベラル派および保守派のニュース サイトへのオーガニック トラフィックを調査することでバイアスを検出できると考えました。
たとえば、2015 年以降の Fox News への推定オーガニック検索トラフィックは次のとおりです。各線は Google コア アップデートを表します。
Fox News のトラフィック グラフに重ねられた Google コア アップデート
ただし、このデータを 1 つの Web サイトで調べても多くのことは分からないため、保守党と自由党のトップ ニュース サイトについても同じことを行いました。これらはAllSides Media Bias Ratings (左右のバイアス評価)から抜粋しました。これらの Web サイトのリストは次のとおりです。
保守系ニュースサイト:
- ニューヨークポスト
- 最後の避難所
- ドラッジレポート
- 連邦主義者
- オレンジ郡登録簿
- 大紀元
- ワシントン・タイムズ
- キリスト教放送ネットワーク
- ナショナルレビュー
- 町役場
- マーク・レビン・ショー
- ラッシュ・リンボー・ショー
- ブライトバート
- ニュースマックス
- 国益
- ゲートウェイの評論家
- レッドステート
- PJメディア
- ワシントン審査官
- フォックス・ニュース
- クリスチャントゥデイ
- ゼロヘッジ
- デイリーコーラー
- ザブレイズ
- デイリーワイヤー
リベラル系ニュースサイト:
- ヴォックス
- 米国のニュース&ワールドレポート
- ワシントン・ポスト
- CNN
- 喧騒
- NBCニュース
- ハリウッドレポーター
- ロサンゼルス・タイムズ
- ヤフーニュース
- アルジャジーラ
- 転がる石
- ハフポスト
- ザ・ヴァージ
- ニューヨークタイムズ
- ABCニュース
- 時間
- CBSローカル
- 保護者
- ブルームバーグ
- NPR
- CBSニュース
- アトランティック
- ポリティコ
- ユニビジョン
結果に到達する前に、Ahrefs データについて少し説明する必要があります。私たちは何億もの検索用語と大量のクリックストリーム データを持っています。当社はこのデータを使用して、ユーザーが検索するさまざまなクエリ、検索結果内で Web サイトが占める位置、ユーザーがクリックする場所をすべて調べて、オーガニック トラフィックを推定します。コア アップデートについては、Google コア アップデートの開始時のトラフィックと 14 日後のトラフィックを調査することにしました。これは、Google が変更をさまざまなデータセンターに展開する時間を与えるためです。また、データに変更を反映する時間も得られます。
私たちのデータは、取引量が 12 か月にわたって平均されるという意味で正規化されているため、主に季節性を考慮する必要がありますが、選挙は毎年ではないため例外です。また、新しい記事や検索トピックが早い段階で表示されることはありませんが、後で人気のある検索や関連するクリックストリーム データを取得する必要があります。
結果
2015 年から現在まで、Google コア アップデート期間中の各カテゴリのトップ ニュース サイトの平均トラフィックは減少しています。
保守的な総トラフィック減少率: -2.65%
自由主義的な総トラフィック減少率: -1.78%
50 の Web サイトのトラフィックを考慮し、6 年間の期間を考慮すると、これらの数字は実際には非常に似ており、統計的に有意ではありません。2016 年の前回選挙までは、両方のカテゴリーへの影響はほぼ同等でした。2020 年の選挙に向けて、前年あたりの結果を見ると、両方のカテゴリーで影響がほぼ同等であり、最新の更新は保守党の Web サイトの方が優れていることがわかります。
個々のデータ ポイントを見ると、保守党と自由党の両方のニュース サイトで、これらの Google コア アップデートのたびにプラスの影響とマイナスの影響が見られました。以下の各箱ひげ図は、各カテゴリのトップ Web サイトを表しています。繰り返しになりますが、すべての更新には両方のカテゴリで勝者と敗者が存在します。通常、サイトがコア更新で勝つか負けるかは、他の何よりもサイトの品質に関係します。
このデータから Google の検索結果に偏りがないと結論付けることはできませんが、過去 6 年間、Google コア アップデート中に新たな偏りが導入されたことはないと言えます。
トラフィックの偏りはありますか?
私たちが注目したことの 1 つは、リベラル派の Web サイトが保守派の Web サイトよりも確実に多くのトラフィックを獲得しているということです。
ここで問題は、なぜそうなるのかということです。これは、キーワード データ セットよりも前の潜在的なバイアスを示していますか? トラフィックの違いを説明できるかどうか考えてみましょう。
内容量
インデックスされたページ数を見ると、自由党のニュースソースは保守党のニュースソースの 8 倍以上のページがインデックスされています。実際、このグラフは上記のトラフィック シェアのグラフとほぼ同じです。その結果、一般的に、自由党のトップ ニュース サイトは、保守党のトップ ニュース サイトよりもさまざまな項目でランクインする可能性が高くなります。
ブランドトラフィックと非ブランドトラフィック
CNN と Fox News のブランド トラフィックはほぼ同じです。これは、同数の人々が特にオーガニック検索でそれらを探していることを意味します。ただし、ブランド トラフィックが CNN のトラフィック全体に占める割合は低くなります。これは、単にコンテンツが多いためと考えられます。CNN はインデックスされたページ数が Fox News の最大 2.5 倍であるため、さまざまな項目でランク付けされる可能性が高くなります。
トラフィックの違いに関するその他の説明
Google の検索データだけでは、なぜリベラル派のサイトが保守派のサイトよりもトラフィックが多いのかを明確に判断するのは困難です。保守派はGoogleをあまり使わない傾向にあるのかもしれない。保守派はGoogleよりもテレビ、アプリ、ソーシャルメディアから多くのニュースを入手している可能性もある。これらはすべて真実である可能性がありますが、追加のデータがなければ、これらの記述は確認できず、単なる推測にすぎません。
偏見を探すもっと方法があったはず
クエリの具体的な例を見てみると、バイアスの例と思われるものが見つかったはずです。個々の例を使用する場合の問題は、分析を行う人による固有のバイアスがあることです。データは複雑なので、サイトとコンテンツが特定のクエリに関連しているかどうかを判断する適切な方法が必要です。残念ながら、これは難しく、非常に主観的であるため、このルートを追求しないことを選択しました。
他の Web サイトからこれらのニュース サイトへのリンク データやリンクを調べることもできたでしょう。繰り返しになりますが、ページ数が多く人気があり上位の Web サイトには、自然にリンクが多くなる傾向があるため、このデータに偏りがあることに疑いの余地はありません。私たちはこれをバックリンク増加調査ですでに証明しました。
Google がオートコンプリート システムを介して提案する検索語の具体的な例を確認することもできましたが、これらの結果から多くの否定的な語句が削除されていることはすでにわかっています。繰り返しますが、これにはすでに偏りがあり、ここで悪意のある偏りを証明するのは困難です。
まとめ
何事にも固有の偏見が存在します。私たちのデータによると、過去数年間、Google コア アップデートに何らかの偏りが見られなかったことが示されていますが、Google のシステムの他の部分に偏りがないと自信を持って言うことはまだできません。
著者プロフィール
このデータについて質問がありますか? Twitter で私に連絡してください。
Patrick Stox
Patrick Stox は、Ahrefs のプロダクト アドバイザー、テクニカル SEO、およびブランド アンバサダーです。彼は、Raleigh SEO Meetup、Raleigh SEO Conference、Beer & SEO Meetup、Findability Conference の主催者であり、/r/TechSEO のモデレーターでもあります。
コメント