この記事はAhrefs公式ブログの日本語訳です。
原文:URL Parameters: A Complete Guide for SEOs
(著者:Patrick Stox / 原文の最終更新日:Nov 29, 2022)
※フルスピード註:この記事は2022年11月29日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。
URLパラメータまたはクエリ文字列は、URLのクエスチョンマーク(?)以降に付けられる部分で、データをURLと一緒に送信するために使用されます。アクティブなパラメータとしてページの内容を変更する場合と、主にトラッキング目的で使用されるパラメータとして、内容を変更しない場合があります。
これらはキーと値のペアで構成され、キーは送信されるデータを示し、値はそのデータの識別子などを示します。一つのペアでは?key=valueのように表されますが、複数のペアがある場合は?key=value&key2=value2のようにアンパサンド(&)で区切られることもあります。
このガイドでは、URLパラメータについて知っておくべきことを説明します。
パラメータの使用方法
前述したように、パラメータにはアクティブなものとパッシブなものがあります。それぞれの例を見てみましょう。
アクティブパラメーター
アクティブなパラメーターは、ページの内容を何らかの方法で変更します。
フィルター:特定のコンテンツをページに残し、他のコンテンツを削除するためのものです。例えば、Eコマースのファセットナビゲーションで使用されることがあります。
?color=yellow
並べ替え: 価格や評価など、コンテンツを特定の方法で並べ替えるためのものです。
?sort=highest_rated
ページ分割:コンテンツを関連する複数のページに分割するためのものです。
?p=2
翻訳する:コンテンツの言語を変更するためのものです。
?lang=de
検索: ユーザーがウェブサイト内で情報を検索するためのものです。
私たちの検索エンジンyep.comでは、クエリに「q」というキーを使い、ユーザーの検索クエリに関する情報が含まれます。
?q=ahrefs
パッシブ・パラメーター
パッシブなパラメーターは、コンテンツ自体を変更しません。一般的にはトラッキングの目的で使用されます。以下にそれぞれの例を示します。
アフィリエイトID: 販売や登録がどこから来たかを追跡するための識別子を渡します。
?id=ahrefs
広告タグ:広告キャンペーンを追跡するためのタグです。
?utm_source=newsletter
セッションID: 特定のユーザーを識別するためのIDです。最近のウェブサイトでは、セッションIDを使用してユーザーを追跡することは一般的ではありません。
?sessionid=12345
ビデオのタイムスタンプ:指定されたタイムスタンプの位置に動画をジャンプするためのものです。
?t=135
SEOへの影響
URLパラメータは、特に複数のパラメータが使用される場合、SEOに関連するさまざまな問題を引き起こす可能性があります。以下に、遭遇する可能性のある問題のいくつかをご紹介します。
パッシブ・パラメータは、重複コンテンツの問題を引き起こす可能性があります。通常、クロールされることを希望し、各ページにはメインバージョンへの正規バージョン(canonical)を設定する必要があります。
これらのパラメータを完全にブロックしたい場合は、robots.txtを使用する場合もありますが、それはクロール予算に問題がある場合に限られます。後で詳しく説明します。
Googleは、正規化というプロセスを通じて、インデックスするページのバージョンを選択し、リンクなどのシグナルはそのインデックスされたバージョンに集約されます。
アクティブ・パラメータは、ほぼ重複したコンテンツや、他のコンテンツと非常に類似したコンテンツを含むページを作成する可能性があります。また、まったく別のコンテンツになることもあります。パラメータが実際にどのように使用されているのかを確認する必要があります。
内部リンク
内部リンクとは、ウェブサイト内のあるページから別のページへのリンクのことです。しかし、受動的なパラメータ(トラッキング目的で使用されるパラメータ)を内部リンクに使用することは避けるべきです。
この方法は、まだ大規模なサイトでは一般的なやり方ですが、私はそれを古くて時代遅れの方法であり、避けるべきだと強調したいと思います。
ほとんどのアナリティクスシステムには、イベントトラッキング機能があり、URLにパラメータを追加せずにデータを記録することができます。
通常、内部リンクにアクティブなパラメータを使用することは問題ありません。
ハイハイ
URLパスとパラメータの組み合わせが多すぎると、クロールに問題が生じる可能性があります。パスの順序を一貫させ、パラメータを追加できないようなパスを持つようにしましょう。
サイト監査の Structure ExplorerツールのDepthレポートを使えば、簡単に無限パスの可能性を見つけることができます。通常、ウェブサイトが9レベル以上のパスを持つことは珍しいため、これは無限パスやその他の問題が存在する可能性を示す重要な指標となります。
Googleはクロール時に無限パスや特定のパターンを検出すると、調整を行います。有益でないと判断されるURLや重複の多いURLのクロールを制限しようとします。
国際化
国際的なウェブサイトでは、URLパラメータが使用されることがあります。
これらはロケール固有のオプションとしてURLに含まれます。しかし、Googleさえもこれを推奨していません。さらに複雑な問題が発生し、うまくいかなくなる可能性があります。また、Google Search ConsoleではこれらのURLをジオターゲットすることはできません。
電子商取引
eコマースでは、トラッキングからページネーション、ファセットナビゲーションまで、パラメータの使用が一般的です。これらのトピックは非常に複雑なので、理解を深めるためにリンク先のブログ記事を一読することをおすすめします。
JavaScript
特にトラッキングに使用されるようなパッシブ・パラメーターとしてフラグメントの識別子を使うのは一般的には良いアイデアではありませんが、特定のケースでは不要なパラメータを置き換えるためにこの方法を使用しても問題ありません。ただし、問題があるため、私はおすすめしません。
問題は、#の後ろはサーバーに無視されることで、多くのシステムは#を使ったパラメーターを認識しないか、認識できません。
さらに、#はすでに指定されたユースケースを持っており、それはページ内の特定の部分にスクロールすることです。これはクライアント側で行われ、JavaScriptの開発者は異なるコンテンツを持つページへの「ルーティング」にも使用することができます。
監査
あなたのウェブサイトでどのようなパラメータが使用されているかをチェックすることは良いアイデアです。サイト監査のPage Explorerツールを使用して、URLにクエスチョンマーク(?)を含むページを検索できます。
高度なフィルタを使用して、複数のパラメータを持つページを検索したり、パラメータを除外して検索を開始したりすることができます。
パラメータがどのように機能しているかを確認するために、いくつかのページをチェックしてみることをおすすめします。
重複レポートでは、完全な重複または類似した重複をチェックすることもできます。このビジュアルを使用すると、同じページや似たようなページの複数のバージョンが存在するかどうか、そしてそれらが適切なcanonicalタグを持っているかどうかを簡単に確認できます。各クラスタをクリックして詳細情報を表示することもできます。
コンテンツツリーマップビューを複製し、クラスターを表示します。
また、「Bulk export(一括エクスポート)」機能を使用すると、重複するコンテンツを一度にエクスポートすることができます。このオプションは、より大規模なデータセットの場合に便利です。
パラメータの制御
かつては、GoogleはGoogle Search ConsoleにURLパラメータツールを提供しており、ページのコンテンツに基づいて異なるパラメータの扱い方を選択することができました。しかし、2022年初めにこのツールは非推奨となりました。以下はGoogleのコメントです:
2009年にウェブマスターツールの前身であるSearch ConsoleにURLパラメータツールが導入された当時、インターネットは現在よりも混乱している状態でした。SessionIDパラメータは非常に一般的であり、CMSはパラメータの整理に苦労し、ブラウザはリンクを壊すことがよくありました。URLパラメータツールにより、サイトオーナーは特定のパラメータがサイトのコンテンツにどのように影響するかを指定することで、Googleがサイトをどのようにクロールするかを細かく制御することができるようになりました。
長年にわたり、Googleはサイトにとって有用なパラメータと役に立たないパラメータを推測する能力を向上させました。実際、現在、URLパラメータツールで指定されているパラメータのうち、クロールに有用なものはわずか1%程度です。GoogleとSearch Consoleのユーザーの両方にとって、このツールはほとんど価値がないため、URLパラメータツールは1ヶ月で廃止されます。
言及されていませんが、このツールによって問題を抱えたユーザーもいるかもしれません。私は過去に、コンテンツが変更されないと設定したにもかかわらず、実際に変更されたというケースを目撃しました。結果として、そのサイトから数十万ページがインデックスから削除されてしまいました。おっと!
Googleがクロールを行い、パラメータを処理する方法を見つけることもできますが、あなた自身でも制御する方法があります。さまざまな選択肢を検討してみましょう。
正規タグ
canonicalタグは、選択したURLへのシグナルを統合するために役立ちますが、ページの追加バージョンはクロールする必要があります。先に述べたように、Googleはパターンを認識するにつれて調整を行う可能性があり、これらのcanonical化されたURLは時間が経つにつれてクロールされなくなる可能性があります。
通常、これがデフォルトの選択肢です。しかし、サイトに問題があり、パラメータが制御できない場合は、他のオプションを検討することもあります。
インデックスなし
noindex メタrobotsタグは、ページをインデックスから削除します。ただし、ページはクロールする必要があります。ただし、繰り返しになりますが、時間が経つにつれてクロールの頻度が減る可能性があります。他のページにシグナルを統合する必要がある場合は、noindexの使用を避けるべきです。
robots.txtでブロックする
obots.txtでパラメータをブロックすることは、そのページがまだインデックスされる可能性があることを意味します。ただし、通常の検索結果には表示されにくいです。
問題は、これらのページがクロールされず、シグナルが統合されないことです。シグナルを統合したい場合は、パラメータをブロックするのを避けましょう。
サイト監査
サイト監査でプロジェクトを設定する際、クロール設定に「URLパラメータを削除」というトグルがあり、これを使うとパラメータ付きのURLを無視することができます。
また、クロールの設定で、パターンマッチングを使ってパラメータ化されたURLを除外することもできる。
興味深い事実として、クロールのクレジットは正規化されたバージョンのページのみがカウントされます。つまり、パラメータの異なるバージョンのページはクロールのクレジットには含まれません。
最終的な感想
まとめると、URLパラメータはさまざまな使い方があり、サイトに問題を引き起こす可能性があるかもしれませんが、そうでない場合もあります。すべては具体的な状況によります。
著者プロフィール
Patrick Stox
Ahrefsのプロダクトアドバイザー、テクニカルSEO、ブランドアンバサダー。Raleigh SEO Meetup、Raleigh SEO Conference、Beer & SEO Meetup、Findability Conferenceのオーガナイザー、/r/TechSEOのモデレーター。