この記事はAhrefs公式ブログの日本語訳です。
原文:How To Optimize PDFs For SEO, But You Should Make Pages Instead
(著者:Patrick Stox、Reviewed by Joshua Hardwick / 原文の最終更新日:Aug 22, 2023)
※フルスピード註:この記事は2023年8月22日時点の記載をもとに翻訳しています。
Google は 2001 年に初めて PDF のインデックス作成を開始しました。PDFのファイル形式は、政府、学術界、ビジネス環境で一般的に使用されています。
PDF は互換性と一貫性の点で優れています。ほぼすべてのデバイスで動作し、常に同じ外観を維持します。ただし、Web 用に新しいコンテンツを作成している場合は、PDF ではなく Web ページの使用を検討する必要があります。
それでも PDF を最適化したい場合に向けてその方法を説明します。お勧めはしませんが、この記事で紹介します。
Google による PDF の扱い方
PDF は、 Google 検索結果に PDF タグとともに表示されます。

PDF は HTML に変換され、HTML としてインデックスが作成されます。テキストの画像が含まれる PDF の場合、Google は光学式文字認識 (OCR) テクノロジーを使用してテキストの画像をテキストに変換します。PDF 内の画像も画像検索結果にインデックスされます。
PDF が重複している場合、Google は PDF よりも Web ページを選択します。同じコンテンツのページと PDF がある場合、Google はコンテンツのページ バージョンを重複クラスタのリードバージョンとして優先する傾向があります。これは、シグナルがページのバージョンに統合され、それが検索結果に表示されるバージョンになることを意味します。※フルスピード注:重複コンテンツの翻訳版はこちら。
別のページに埋め込まれた PDF を Google がインデックスするかどうかはわかりません。多くの人は、PDF のクリックを追跡するためにこれを実行したいと考えています。もっと良い方法がありますので、この記事の後半で説明します。
「object」タグと <iframe> を使用して、 PDF を Web ページに埋め込むテストをいくつか実行しました。少なくとも、Google Search ConsoleのURL検査ツールでは、スクリーンショットやレンダリングされたHTMLのコンテンツは表示されませんでした。ただし、これは URL 検査ツールの単なる癖である可能性があります。通常、HTML 以外の他のタイプのコンテンツでは機能しません。
PDF を処理するレンダラーの部分が検査テストで実行されず、Google が実際に埋め込まれた PDF にインデックスを付ける可能性もありますが、信頼する前にさらにテストしたいと考えています。

PDF が SEO に適さない理由
Google は PDF をインデックスに登録し、場合によってはランキングしますが、この形式は Web ページと比べていくつか欠点があります。
- モバイルフレンドリーではありません:PDF は、デバイス間で一貫した外観になるように作成されています。つまり、モバイル対応の PDF などというものは存在しないのです。
- ナビゲーションの欠如:ほとんどの PDF にはナビゲーション要素が含まれていないため、他のコンテンツを探索することがより困難になります。
- 一部の SEO 属性が欠如しています:PDF ファイルには多くの SEO 要素の同等のバージョンがありますが、nofollow、UGC、スポンサー付きなどの個々のリンク属性など、欠落している要素も多数あります。※フルスピード注:nofollowの翻訳版はこちら。
- 頻繁にクロールされない可能性があります:PDF はめったに変更されないため、より頻繁に更新されるページに比べてクロールの頻度が低くなる傾向があります。
- 追跡がさらに困難となります:ほとんどの一般的なトラッカーは Web ページ上で JavaScript を実行し、PDF ファイルでは機能しません。
とはいえ、コンテンツに PDF 形式を使わざるを得ない状況があることは承知しています。その場合は、この記事を読み続けて PDF を検索用に最適化する方法を学んでください。
PDF を SEO 向けに最適化する方法
HTML で見慣れているオンページ SEO要素のほとんどは、PDF にも同等のバージョンがあり、これまでと同じ方法で使用されます。多くはアクセシビリティ上の理由からそうなっています。それでは、SEO のために PDF を最適化するいくつかの方法について説明します。※フルスピード注:オンページSEOビギナーズガイドの翻訳版はこちら。
1. 良いコンテンツを書く
Google の企業使命は、世界中の情報を整理することです。たとえそれが Web ページでなくても、優れたコンテンツ は優れたコンテンツとみなされます。技術文書やホワイトペーパーなど、PDF には多くの優れたコンテンツが含まれているのを見てきました。Web 上にある最良の情報の一部は、 PDF に埋もれているのです。※フルスピード注:優れたコンテンツの翻訳版はこちら。
2. 最適化されたタイトルを追加する
Web ページにtitle タグがあるのと同じように、PDF にもタイトルがあります。多くの検索エンジンは、検索結果でドキュメントを説明するためにタイトルを使用することに注意してください。PDF にタイトルがない場合、代わりにファイル名がSERPに表示されます 。※フルスピード注:titleタグの翻訳版とSERPの翻訳版はこちら。
Adobe Acrobat Pro で PDF タイトルを編集する方法は次のとおりです。

3. 最適化された説明を追加する
Web ページのメタ ディスクリプションと同様 、これはランキング要素ではありません が、検索結果に表示されるテキストを制御する手段となります。※フルスピード注:メタディスクリプションの翻訳版とランキング要素の翻訳版はこちら。
- 「ファイル」>「プロパティ」をクリックしてください。
- 「追加のメタデータ」をクリックします。
- ディスクリプションを編集します。

4. 関連するファイル名を使う
PDF のファイル名はURLの一部になります。これは検索結果に表示される URL に影響を与え、ランキング要因の小さな要素となります。※フルスピード注:SEOフレンドリーなURL作成の翻訳版はこちら。
- 「ファイル」>「名前を付けて保存」をクリックします。
- ファイル名を編集してください。

5. 画像の alt 属性を含める
検索エンジンが画像の内容を理解しやすくするために、 PDF 内の画像に代替テキストを追加できます。※フルスピード注:altテキストの翻訳版はこちら。
- 左側のサイドバーの「タグ」アイコンをクリックします。
- ドキュメント階層で代替テキストを追加する画像を見つけます。
- 画像を右クリックします。
- 「プロパティ」をクリックします。
- 関連する代替テキストをボックスに追加します。

6. 見出しを使用する
Web ページの見出しタグ (H1 ~ H6) と同様に、PDF 内の特定テキストを見出しとして指定できます。
- 左側のサイドバーの「タグ」アイコンをクリックします。
- ドキュメント階層内で編集するテキストを見つけます。
- タグを右クリックします。
- 「プロパティ」をクリックします。
- ドロップダウンから、関連する見出しレベルを選択します。

7. リンクを含める
他のページと同様に、PDFの内部リンクと外部リンクもランキングに影響します。リンクはPageRankを渡し 、そのアンカーテキストが文脈を追加します。PDF へのリンクと PDF から他のページへのリンクを含めることで、行き止まりを作るのではなく、PageRank がサイト内を流れるようになります。※フルスピード注:内部リンクの翻訳版とPageRankの翻訳版はこちら。
一部の PDF には大量のリンクが含まれています。ラリー・ペイジはかつて 「ノーベル賞受賞者は1万の異なる論文から引用されていることが判明した」と語りました。
以下のスクリーンショットから、 GDPR 文書を確認してください。823 の参照ドメインから 77,000 のリンクがありますが、リンクアウトはまったくありません。これは機会を逃していると言え、この PDF からWebサイトにある他のページに内部リンクを追加すれば、それらのページの順位が向上する可能性があります。

Google のこの例の方が優れています。同社の SEO スターターガイド PDF には、754 の参照ドメインからの 337,000 個のリンクが含まれており、PDF から(Google の他のページへ)リンクアウトすることでその値を他のページにうまく渡しています。


PDF にリンクを追加するには、以下の手順を行ってください:
- 右側のサイドバーにある「PDF を編集」ボタンをクリックします。
- [編集] メニューの[リンク]ドロップダウンをクリックします。
- 「Web またはドキュメント リンクの追加/編集」をクリックします。
- リンクしたいテキストの周りに長方形を描きます。
- リンク タイプを非表示の長方形 に設定します。
- Web ページを開く ようにリンク アクションを設定します。
- URLを追加してください。

注釈:上記のスクリーンショットと手順は Acrobat Pro DC のものであり、使用するソフトウェアによって異なる場合があります。
PDF ビューを追跡する方法
前述したように、PDF は追跡がより困難です。このため、多くのマーケティング チームは、PDF をゲートするか、ユーザーがフォームに記入した後でのみ PDF を利用できるようにする傾向があります。これを行うことで、パフォーマンスの追跡から見込み顧客の発掘へと焦点を移します。ただし、PDF を追跡するためのオプションがいくつかあります。
イベント追跡
PDF リンクのクリックを追跡し、分析システムに送信できます。これにより、ユーザーが PDF ファイルをクリックしてダウンロードまたは開いた回数を確認できます。これらの設定方法については、こちらをご覧ください。
埋め込む
JavaScript または iframe を使用して PDF をページに埋め込む場合は、ページ自体の分析データを使用するだけで済みます。
中間追跡スクリプト
これは複雑なソリューションですが、ユーザーを PDF に送信する前に分析システムにデータを送信する中間追跡スクリプトを介して PDF クリックを送信することができます。ここで一例を見つけることができます。
サーバーログ
PDF ファイルはサーバーに保存されるため、ファイルへのアクセス要求はログ ファイルに記録されます。
サードパーティデータ
PDF は分析システムで追跡されることはほとんどないため、場合によっては、Google Search Console や Ahrefs などの別のソースから得た最良のデータが得られます。Ahrefs では、競合他社のどの PDF が最もオーガニック トラフィックを獲得しているかに関するデータも提供できます。ドメインをサイトエクスプローラーに貼り付け、トップ ページレポートに移動して 、次の内容を含む URL を検索するだけです。
.pdf

まとめ
ほとんどの場合、新しいコンテンツは PDF ではなく Web ページとして作成する必要があることをご理解いただけたと思います。しかし、古い PDF についてはどうすればよいでしょうか? PDF を最適化するか、ページに変更する必要がありますか?
典型的な SEO のやり方では、「状況次第」で行いきます。これを行うのに正しい方法も間違った方法もないと思います。自分にとってより簡単なことをしましょう。どちらの方法でもプラスの効果が見られるはずですが、労力とリソースに応じて、PDF を最適化するか、PDF をページに変更するか、代わりに別のことを行うことが解決策になる可能性があります。
ご質問がありますか? Twitterでお知らせください。
著者プロフィール

Patrick Stox
Patrick Stox は、Ahrefs のプロダクト アドバイザー、テクニカル SEO、およびブランド アンバサダーです。彼は、Raleigh SEO Meetup、Raleigh SEO Conference、Beer & SEO Meetup、Findability Conference の主催者であり、/r/TechSEO のモデレーターでもあります。
コメント