孤児のページを見つけて修正する方法(正しい方法)

SEO

この記事はAhrefs公式ブログの日本語訳です。
原文:How to Find and Fix Orphan Pages (The Right Way)
(著者:Kayle Larkin / 原文の最終更新日:April 4, 2022)
※フルスピード註:この記事は2022年4月4日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。

疑いを持たない SEO が長い歴史を持つ Web サイトに取り組み始めると、流砂が待っています。

数世代前の代理店によって散らばった技術的なサイトのエラーの穴は、SEO の取り組みと進歩を遅らせ、妨げています。

そして、あなたがそれをクリーンアップする任務を負っている場合、簡単な解決策を見つけることがあなたの最優先の仕事です。

したがって、基本的なサイト監査から始めて、いくつかの孤立したページが表示される場合があります。おそらく、孤立ページはサイトにとって悪いということを聞いたことがあるでしょうが、孤立ページが何であるか、そしてそれを修正する方法は完全には理解していません。

この記事では、次のことを学びます

孤立ページとは何ですか?

孤立ページとは、Web サイトの他の場所からの内部リンクがないため、検索エンジンが発見するのが難しいページです。

検索エンジン クローラーはサイトマップ ファイルまたは外部バックリンクからしかページを検出できず、ユーザーは URL を知っている場合にのみページにアクセスできるため、これらの URL はすり抜けてしまう傾向があります。

孤立ページの原因は何ですか?

通常、孤立ページは偶然に発生し、さまざまな理由で発生します。最も一般的な原因は、サイトの移行、ナビゲーションの変更、サイトの再設計、在庫切れの製品、テスト、または開発ページのプロセスがないことです。

プロモーションや有料広告のランディング ページや、そのページをユーザー ジャーニーの一部にしたくない場合など、孤立ページは意図的に作成される場合もあります。

孤立したページが SEO に悪いのはなぜですか?

検索エンジンは、新しいコンテンツを発見し、ページの重要性を理解するためにリンクを使用するため、孤立したページを見つけるのが困難です。

Google のコメントは次のとおりです。

Google はクローラーと呼ばれる自動プログラムを使用してウェブを検索し、新しいページまたは更新されたページを探します。[…] 私たちはさまざまな方法でページを見つけますが、主な方法は、すでに知っているページからリンクをたどることです。

たとえば、新しい Web ページを公開し、サイトの他の場所からそのページへのリンクを忘れたとします。ページがサイトマップになく、バックリンクがない場合、Google はそのページを検索したりインデックスに登録したりすることはできません。それは、Web クローラーがその存在を認識していないためです。

さらに悪いことに、ページは PageRank を受け取ることができません。

「PageRank」という用語を聞いたことがないのであれば、それは大変なことです。

一般に、PageRank は、ページが獲得した「投票」数を数えることによってページの重要性を理解する Google の方法です。PageRank の仕組みと SEO への影響について詳しくは、こちらをご覧ください。

孤立したページを見つける方法

サイト上の孤立したページを見つけるには、クロール可能な URL (Google が検索できるもの) のリストと、サイト上でアクセスしている URL のリストを比較する必要があります。

かなり技術的に聞こえるかもしれませんが、がっかりしないでください。使い慣れたツールを使用して、孤立したページを見つける方法を 3 つの簡単な手順に分けて説明しました。

1. クロール可能な URL を見つける

クロール可能なすべての URL のリストを収集するために使用できるツールは数多くあります。Ahrefs のSite Auditを使用することにします。これは、Ahrefs ウェブマスター ツール アカウントを使用すると完全に無料であり、さらに多くの URL を検索するためのソースとして外部バックリンクを使用するオプションがあるためです。

その方法は次のとおりです。

  1. 「サイト監査」に進みます。
  2. 「+ 新しいプロジェクト」をクリックします
  3. 手順 3 までプロンプトに従います。[URL ソース]タブをクリックし、 デフォルト設定に加えて URL ソースとして[バックリンク]をオンにします。
  4. [続行]をクリックし、指示に従ってセットアップを完了し、クロールを実行します。

バックリンク データは、Ahrefs のリンク インデックスからの URL を混合に組み込むため、孤立したページを見つけるのに役立ちます。

ページに内部リンクがない場合、基本的なクローラーはそのページを見つけることができません。

ただし、ページにバックリンクがある場合、Ahrefs はサイト上の URL を検索し、クロールで内部リンクが見つからなかったことを認識するため、そのページは孤立ページである必要があります。

サイト監査が完了したら、すべての内部ページをページ エクスプローラーからエクスポートして保存します。これはステップ 3 で使用します。

続ける前に…

Site Audit はサイトマップとバックリンクの両方を URL ソースとして使用するため、追加の作業を行わずに孤立したページを適切に検出します。これらを表示するには、[ページ エクスプローラー]に移動し、[リンク]をクリックして、[孤立ページ]を選択します。

ただし、ここにはバックリンクまたはサイトマップ経由で見つかった孤立したページのみが表示されます。サイトマップに含まれておらず、バックリンクもない孤立したページがある場合、Ahrefs はそれらを見つけることができません。

これが自分に当てはまると思われ、孤立したページについてもう少し詳しく知りたい場合は、読み続けてください。

2. ヒットした URL を検索する

次のステップでは、サイトでヒットしたすべての URL のリストを取得します。

これを行う方法は数多くありますが、アクセスできる限り多くのデータ ソースを使用することが常に最善です。

アクセス権がある場合、ログ ファイルはサーバー側のデータであり、より正確であるため、適切に機能します。これらへのアクセスの詳細については、サーバーのセットアップ方法に依存するため、ここでは説明しません。

ただし、このルートを選択する場合は、一般的なサーバー タイプに関する 3 つの公式ガイドを参照してください。

プロセスは基本的に誰にとっても同じであるため、この記事では Google Analytics (GA4) と Google Search Console を使用します。

Google Analytics (GA4) でヒットした URL を見つける方法は次のとおりです。

  1. データスタジオ アカウントにログインします。
  2. 新しい空のレポートを開始します。
  3. Google Analytics を データソースとして接続します。
  4. 分析しているアカウントを選択し、[GA4 プロパティ]を選択します。
  5. 基本的なテーブルをレポートに追加します。
  6. データ ソースを手順 4 で作成した GA4 プロパティに設定します。
  7. 寸法をページパスに設定します。
  8. メトリクスをViewsに設定します。
  9. ビューで 降順に並べ替えます
  10. デフォルトの日付範囲をサイトに GA4 がインストールされる前に設定します。

テーブルから結果をエクスポートするには、右上隅にある 3 つの縦の点をクリックし、[エクスポート] をクリックします。すぐに再度必要になるため、「date_GA_URLs_people_are_hitting_brandname」などの分かりやすい名前を付けて保存します。

完全なページ URL ではなくページ パスをエクスポートしたため、スプレッドシート内のすべてのセルの先頭にドメインを追加する必要があります。これはGoogleスプレッドシートで十分簡単です。CSV を空のシートにインポートし、左側に新しい列を挿入し、次の数式をセル A1 に貼り付けるだけです (example.com を実際のドメインに置き換えてください)。

=IFERROR(ARRAYFORMULA(IF(ISBLANK(B:B),"",IF(B:B="Page Path","",IF(B:B="(not set)","","https://example.com" & B:B)))))

複数の URL ソースが常に最適であるため、Google Search Console (GSC) からもデータを取得します。

GSC ではエクスポートを最初の 1,000 URL に制限していますが、Google データスタジオにはさらに多くの URL を取得できるちょっとした巧妙なトリックがあります。

その方法は次のとおりです。

  1. データポータル レポートを再度開きます。
  2. 新しいページを開始します (コマンド + M)。
  3. [リソース]  > [追加されたデータ ソースの管理]を開きます
  4. 「データソースの追加」をクリックします。
  5. サーチコンソールを選択します
  6. 分析しているサイト > URL インプレッション > Webを選択します。
  7. 基本的なテーブルをレポートに追加します。
  8. ディメンションを[ランディング ページ]に設定します。
  9. 指標をインプレッションに設定します。
  10. ページあたりの行数を 5,000 に拡張します。
  11. 少なくとも過去 3 か月を表示するには、日付範囲を編集します。
  12. テーブルから結果をエクスポートします。

すぐに再度必要になるため、シートに「date GSC_URLs_people_are_hitting_brandname」などのわかりやすい名前を付けます。

次に、人々がさまざまなソースからアクセスしているすべての URL を 1 つのスプレッドシートに結合し、重複を削除してデータをクリーンアップします。

3. 2 つの URL ソースを相互参照する

あなたはホームストレッチにいます!最後のステップは、クロール可能な URL (Ahrefs のSite Auditから) とヒットのある URL (GA および GSC から) を相互参照することです。これを行うには、空の Google スプレッドシートを作成し、3 つのタブを作成します。クロール、ヒット、相互参照の ラベルを付けます。

最初のシートで、 Ahrefs のSite Auditからクロール可能な URL をすべてクロールし、コピーして貼り付けます

これらを見つけるには、手順 1 でエクスポートした CSV を開き、incomingAllLinks が 0 に等しい結果をフィルターします。これらは孤立したページなので、「クロール」タブに含めると相互参照時に不正確な結果が生じるため、これは非常に重要です。

代わりに、これらの URL をコピーして「ヒット」タブに追加する必要があります。

次に、Ahrefs エクスポートから残りの URL をコピーして、Google スプレッドシートのクロールタブに貼り付けます。

2 番目のシートで、を押し、手順 2 のすべての URL をコピーして貼り付けます。これらは、Google Analytics、Google Search Console、またはサイト ログ ファイルを使用して見つけたページです。これには、ユーザーが訪問した Web ページが含まれます。

3 番目のシート「相互参照」で、最初のセルに次の関数を入力します。

=UNIQUE(FILTER(hits!A:A, ISNA(MATCH (hits!A:A, crawl!A:A, 0))))

Enter キーを押します。この関数は、分析を容易にするために、孤立したページをすべて自動的に取得します。

孤立したページを修正する方法

マーケティング担当者は、すべての孤立したページに単純に内部リンクを追加するという間違いを犯すことがよくあります。

このアプローチの主な問題は、クイック フィックスをすべてのページに適用できるからといって、そうすべきであるとは限らないことです。

PPC ランディング ページのように、孤立したページには意図的に作成されたものもありますが、テスト ページのように単に削除できるものもあります。

壊れていないものやプラスの影響を与える可能性が低いものを修復するためにリソースを無駄にしたくありません。

この問題を解決するには、次のデシジョン ツリーを使用します。

ここでの考え方は、各孤立ページについて批判的に考えて、インデックスを作成しない、削除、マージ/統合、または単純に内部リンクを追加することが最善の解決策であるかどうかを判断することです。

たとえば、サイトの移行中にページが失われ、そのページが訪問者にとって何の価値も提供しない場合、おそらくそのページを削除することが最善の選択肢となります。ただし、ページにバックリンクがある場合は、バックリンクの公平性を維持するために URL を別の関連ページにリダイレクトすることも価値があるかもしれません。ヒント

Ahrefs のバッチ分析ツールを使用すると、孤立ページのバックリンクを一括で (一度に最大 200 URL) チェックすることが簡単にできます。「相互参照」シートから URL を貼り付け、「分析」をクリックするだけです。

孤立したページを修正するための 4 つの戦略を見てみましょう。

内部リンク

サイト訪問者にとって価値のある孤立ページは、訪問者や検索エンジンが見つけやすくするために、サイトの内部リンク構造に組み込む必要があります。

たとえば、サイトの移行または再設計中に記事が忘れられたとします。Google が間もなく (再) クロールすることがわかっている関連ページから内部リンクする必要があります。

Ahrefs でこれを行う簡単な方法は次のとおりです。

  1. サイト監査に移動
  2. サイトの最新のクロールを開く
  3. [ツール] > [ページ エクスプローラーを開く] をクリックします。
  4. ページのテキスト内の単語または語句を検索します
  5. 結果をオーガニックトラフィック別に並べ替えます。

これにより、オーガニック トラフィックを獲得するページでコンテキストに応じた内部リンクの機会が見つかります。つまり、Google が遅かれ早かれページを再クロールして、変更を確認する可能性が高いことを意味します。

詳細:ページ エクスプローラーの使用方法

インデックスなし

広告のランディング ページなど、意図的に内部リンクされていない孤立したページは、オーガニック検索結果に表示されないように noindex する必要があります。

ほとんどの SEO プラグインでは、これをボックスにチェックを入れるだけで簡単に行えますが、これをコピーしてページの <head> セクションに貼り付けることで手動で行うこともできます。

<meta name="robots" content="noindex" />サイドノート。これらのページが robots.txt 内で引き続きクロール可能であることを確認してください。そうしないと、検索エンジンは noindex ディレクティブを認識できません。 

マージ/統合

別のページと同じまたは類似したコンテンツを持つ孤立したページはマージする必要があります。これは、コンテンツを統合し、孤立した URL を他のページにリダイレクトすることを意味します。

たとえば、同じ商品に対して 2 つの商品リストがあるとします。そのうちの 1 つは孤立したページです。もう一方はそうではありません。孤立したページをリダイレクトする前に、孤立したページから固有の貴重な情報を取得し、それを他のページに追加する必要があります。

消去

訪問者に何の価値も提供せず、他の目的 (有料トラフィック キャンペーンなど) も提供しない孤立したページは削除する必要があります。

たとえば、未使用の CMS テーマ ページを削除できます。これにより 404 ページが生成され、時間が経つと自然に検索結果から除外されます。サイドノート。ページにバックリンクがある場合、削除後にリンクの公平性を維持するために、URL を別の関連ページにリダイレクトすることができます。 

孤立したページを防ぐ方法

ご覧のとおり、孤立したページの監査には時間がかかります。したがって、一度作業を行ったら、将来的には孤立したページが発生するのを防ぎたいと考えます。考慮すべきポリシーと手順をいくつか示します。

サイト移行の計画を立てる

Web サイトの移行を行う場合は、常に計​​画を立てて積極的に行ってください。301 リダイレクトを使用して古いページを新しいバージョンにリダイレクトすることで、Web サイト上のリンク切れや混乱を避けることができます。

成功のためにサイト構造をセットアップする

新しいページに手動で内部リンクする必要がある場合、必ずいくつかのページを見逃してしまい、孤立したページができてしまいます。このため、内部リンクを処理するサイト構造を選択する必要があります。

ほとんどの種類の CMS は、これをすぐに実行します。たとえば、新しいブログ投稿を公開するたびに、WordPress はブログのホームページとアーカイブから内部リンクを追加します。

ただし、カスタム ソリューションを使用している場合は、適切なサイト構造に必要なコードが配置されていることを確認する必要があります。

詳細: ウェブサイトの構造: SEO 基盤を構築する方法

生産終了した製品を適切に削除する

電子商取引サイトを運営している場合は、製造中止となった製品を (その製品を指すすべての内部リンクとともに) カタログから削除し、ステータス コード 404 または 410 を設定する必要があります。そのような製品への内部リンクの削除に失敗すると、次のような問題が発生する一般的な原因になります。孤立したページ。

ページに優れたバックリンクがあり、製品の更新または改良されたバージョンがある場合は、バックリンクの公平性を維持するためにページを維持することを検討することをお勧めします。

これを行うには、新しいデザイン機能の紹介や新しい製品ページへのリンクなど、製品が入手できなくなった理由を説明するページ コンテンツを更新します。

こうすることで、ユーザーはまったく無関係なページや 404 にアクセスすることがなくなります。

定期的なサイト監査の実行

監査を毎月実行することで、亀裂をすり抜ける可能性のある偶発的な孤立ページを常に把握できます。Ahrefs のSite Auditのスケジュール機能を使用すると、これを簡単に行うことができます。

まとめ

孤立したページのエラーを何行も見て、難しい専門用語を理解しようとするのは、恐ろしいことです。

孤立したページを見つけて修正するには時間がかかりますが、骨の折れる作業である必要はありません。Ahrefs のSite Auditと孤立ページのフローチャートを使用すると、プロセスを合理化できます。

質問がありますか? Twitter で私に連絡してください。


著者プロフィール


質問がありますか? Twitter で私に連絡してください。

kayle-larkin-1.png

Kayle Larkin
データドリブンSEMストラテジスト。分析を理解しやすく、すべてのビジネス オーナーがアクセスできるようにすることに専念しています。

  • ・Google検索で上位表示されたい
  • ・Webサイトへのアクセスを増加させたい
  • ・お問い合わせのCVを向上、改善したい
  • ・自社でSEO施策をしていたが、効果がなかなか現れない

Ahrefsのオフィシャル紹介パートナーであるフルスピードは、上記のようにWebサイト改善をしたいと思っている方に向けて、SEOコンサルティングサービスを提供しています。

数多くのWebサイトの改善に従事しているコンサルタントが、お客様のWebサイトを調査し、改善方法をご提案いたします。

お気軽にご相談ください!

SEO
シェアする
AhrefsJapanをフォローする
Ahrefsブログ- 使えるSEO情報をお届け | SEOの被リンク分析・競合調査ツール

コメント

WP Twitter Auto Publish Powered By : XYZScripts.com
タイトルとURLをコピーしました