この記事はAhrefs公式ブログの日本語訳です。
原文:How to Search Through the Source Code of the Entire Website
(著者:Nick Churick / 原文の最終更新日:March 13, 2024)
※フルスピード註:この記事は2024年3月13日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。
無料のAhrefs ウェブマスターツールの一部としても利用可能なAhrefs サイト監査を使用すると、 Web サイトのクロールされたすべてのページで生の HTML コードまたは JS レンダリングされたコードを検索できます。
この機能は、分析タグを検証したり、特定のスクリプトやスタイルシートを呼び出すページを識別したり、ページ コードへの不要な挿入を検出したり、競合他社のテクノロジーを調査したりする必要がある場合に特に役立ちます。
JavaScript を利用した Web サイトの時代では、ページ コードが 2 つの形式で存在できることを理解することが重要です。
生データ (ソース) : ページ上の JavaScript が実行される前の HTML コード。これは、ブラウザの「ページ ソースの表示」機能を使用すると表示されます。
レンダリング: JavaScript によって変更/生成された後の最終的な HTML コード。ブラウザの「検査」モードで表示されます。
ソースバージョンとレンダリングされたバージョンは大幅に異なる可能性があるため、ページ コードの正しいバージョンを検索していることを確認することが重要です。
ページのレンダリングされたコードを検索する方法
ウェブサイト上のすべてのページの JS レンダリングされた HTML コードを検索する必要がある場合は、サイト監査または Ahrefs ウェブマスターツール でクロールを実行します。クロール設定で「JavaScript を実行」オプションが有効になっていることを確認します。
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-695.png?resize=1024%2C864&ssl=1)
クロールが完了したら、ページ エクスプローラーに移動して、詳細フィルターにアクセスします。ドロップダウン メニューから「ページ ソース」を選択し、「含む」を選択します。次に、検索する特定のコード部分を入力します。
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-696-1.jpg?resize=1024%2C565&ssl=1)
上記の例では、埋め込みテーブルを含むブログのすべてのページを検索します。
ページの生のHTMLを検索する方法
生の HTML (ソース HTML とも呼ばれます) を検索するには、いくつかの追加アクションが必要です。
1. クロール設定でJavaScriptレンダリングを無効にする
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-696.png?resize=1024%2C868&ssl=1)
2. クローラーによるすべてのページの検出可能性を確認します。
これは、ページ コンテンツ (内部リンクを含む) が JavaScript 経由で生成される Web サイトにとって非常に重要です。Ahrefsサイト監査 ボットは、生の HTML コード経由ですべてのページを自動的に検出するわけではないためです。
そのため、サイト監査ツールに「シード」と呼ばれる入力 URL のリストを提供する必要があります。
最も簡単な方法は、サイトマップが「URL ソース」で使用されていることを確認することです。それが不可能な場合は、カスタム URL リストを使用します。
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-697.png?resize=1024%2C836&ssl=1)
クロールが完了したら、高度なフィルターを使用して、クロールされたすべてのページのソース コードを検索します。
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-698.png?resize=1024%2C383&ssl=1)
著者プロフィール
![](https://i0.wp.com/ahrefs.jp/blog/wp-content/uploads/2024/05/image-695-1.jpg?resize=187%2C225&ssl=1)
Nick Churick
Nick は当社の製品マーケティング担当者の 1 人ですが、偶然にも非常に優れたライターでもあります。つまり、彼は現在、当社のブログの定期的な寄稿者です。