この記事はAhrefs公式ブログの日本語訳です。
原文:What Is Semantic Search? How It Impacts SEO
(著者:Michal Pecánek, Joshua Hardwick/ 原文の最終更新日:June 11, 2020)
※フルスピード註:この記事は2020年6月11日時点の記載をもとに翻訳しています。Ahrefs公式ブログの記事は今後追記・再公開されることがありますことをご了承ください。
最近のグーグルは、あなたが投げかけるほとんどの質問に対応できることに気づいていますか?
このクエリの結果を見てください:
ヨーダの名前を出していないにもかかわらず、Googleは私たちが誰について話しているのか、彼について何を知りたいのかを理解していました。
これはセマンティック検索なしには不可能です。
この記事で、下記を学べます:
セマンティック検索とは何か?
セマンティック検索とは、最新の検索エンジンが、最も関連性の高い検索結果を提供するために使う情報検索プロセスのことです。従来のキーワードマッチングではなく、検索クエリの裏にある意味に注目します。
この用語は、言語学の一分野である意味論から由来しています。
なぜセマンティック検索が重要なのか?
セマンティック検索にはたくさんの要素が関わっていますが、セマンティック検索の基本原理やその必要性、そしてその影響は簡単に理解できます。
- ユーザーはしばしば、希望するコンテンツと同じ言語を使用しない
- 多くの検索は意図せず曖昧になる
- 語彙の階層とエンティティの関係を理解する必要性
- 個人の興味や傾向を反映させる必要性
ユーザーはしばしば、希望するコンテンツと同じ言語を使用しない。
さらに困ったことに、時には適切な方法で検索クエリを表現するのが難しいことがあります。
たとえば、ラジオで初めて聞く曲があったとしましょう。その曲が気に入った場合、歌詞をランダムに検索してついにその曲を見つけることができたとします。
さらに複雑なのは、Googleに入力する方法と、SiriやAlexa、Googleアシスタントなどに話しかける方法を比較することです。こうした声での入力は、実際の会話のようにキーワードを使うものです。
同じアイデアを伝えるためには、さまざまな方法がありますが、検索エンジンはこれらすべてに対応する必要があります。検索エンジンは、インデックスに格納されたコンテンツと検索クエリの両方を、その意味に基づいてマッチさせる必要があるのです。
最初は難しく聞こえるかもしれませんが、これは始まりに過ぎません。
多くの検索は意図せず曖昧になる
英単語のおよそ40%は「多義語」と言って、2つ以上の異なる意味を持っています。この多義語の問題こそ、セマンティック検索が解決しようとしている最も重要な課題です。
例えば、「python」というキーワードの月間検索回数はアメリカだけで533,000回もあります。
もし私が「パイソン」を検索するとしたら、おそらくプログラミング言語を指すでしょう。しかし、技術業界以外の人は、実際のヘビか伝説的なイギリスのコメディ劇団を想像するかもしれません。
ここで問題なのは、単語が文脈なしに明確な意味を持つことはほとんどないということです。多義語に加えて、同じ名詞が形容詞や動詞にもなることもありますし、その逆もあります。そして、それが文字通りの意味だけに収まることはほとんどありません。推測される意味(皮肉を込める)を考えると、さらに興味深くなります。
言葉の意味には文脈が鍵であり、これが次の2つのポイントに繋がってきます。
語彙の階層とエンティティの関係を理解する必要性
次の検索クエリとトップの検索結果を見てみましょう:
実に興味深いですね。Googleがこのクエリを理解するために必要な情報は、以下の通りです:
- 「パートナー」とは、妻、ガールフレンド、夫、ボーイフレンド、配偶者を指す言葉だと認識すること。
- オビ=ワンが複数の映画やシリーズに登場し、さまざまな俳優が演じていることを理解してほしい。
- 関連性をつくる。
- オビ=ワンの曖昧さを反映した方法で検索結果を表示する。
2010年以前にこの検索をしたら、どんな検索結果が出るのか想像もつきません。
それでは、少し視点を変えてコンセプトを説明しましょう。
言葉の階層は単語同士の関係を示します。例えば、”partner”(パートナー)という単語は、”wife”(妻)、”boyfriend”(ボーイフレンド)、”spouse”(配偶者)などの上位にあたる言葉(上位語)です。
先ほど述べた通り、私たちの検索クエリは、正確な表現が一致しないことが多いです。このような場合、「手頃な価格」が「格安」や「中級」、「リーズナブル」といった中間の意味であることを理解することが重要です。
この例では、エンティティとは映画やシリーズに登場するキャラクター(オビ=ワン)、特定の役割を果たす人々(俳優)、そしてそれらに関連する人々(パートナー)を指します。エンティティは一般的には明確に識別できる対象や概念であり、多くの場合、人々や場所、物などを指します。
個人の興味や傾向を反映させる必要性
「パイソン」という例に戻ってみましょう。このキーワードで検索すると、確かにプログラミング言語に関連する結果がすべて表示されます。
個人情報の扱い方がどんなに嫌でも、少なくとも検索エンジンにとっては役立ちます。Googleは、限られたデータを検索履歴と組み合わせて使用し、より正確で個別に合わせた検索結果を提供します。
これは広く知られています。どのようなサービスでも検索バーに入力すると、地域に合わせた結果が表示されます。
しかし、より魅力的なのは、動的に変化する検索意図に基づいて一時的に検索結果を調整できるGoogleの能力です。
例えば、コロナウイルスは新しい言葉ではありません。昔からあるウイルスのグループ名です。しかし、皆さんもご存知の通り、2020年初めに検索意図が急激に変わりました。人々は特定のコロナウイルス株(SARS-CoV-2)に関する情報を探し始め、それに応じて検索結果も調整する必要がありました。
上の「コロナウイルス」の検索順位履歴を見ればわかるように、現在の検索結果トップ5はいずれも2020年以前にランクインしていないことがわかります。
クリスマスやブラックフライデーなどの大規模なセールイベントの際、電子商取引業界でも同じような傾向が見られます。この期間中の検索意図は非常に取引志向的ですが、人々は通常、比較やレビューを見ることを好むことがあります。
セマンティック検索の仕組みに一役買っているGoogleのテクノロジーとは?
Googleは、自然言語と検索意図を理解する能力をさらに向上させるアルゴリズムの更新と技術を継続的に発表しています。
2020年のセマンティック検索を実現する4つの重要なマイルストーンがあります。
ナレッジグラフ
2012年にリリースされたグーグルのナレッジグラフは、エンティティやそれらの関係性に基づく知識ベースです。
こんな感じだが、代わりに50億の実体が含まれています:
つまり、キーワードに基づく検索から、意味に基づく検索へと移行し、これを実現する技術なのです。
ナレッジグラフに情報を提供する方法は主に2つあります:
- 構造化データ(詳細は後述)
- テキストからのエンティティ抽出
2点目については、検索エンジンが自然言語を理解する必要があります。
そこで、以下の3つのアルゴリズムアップデートが登場します。
ハミングバード
2013年、グーグルはより良い検索結果を返すためにハミングバードと呼ばれる検索アルゴリズムを発表しました。これは特に複雑な検索クエリに役立つものでした。
ハミングバードは、個々のキーワードよりも検索クエリの意味を重視した、最初の大規模なアップデートでした。これは、キーワードではなく、トピックについて書くための必要なきっかけとなりました。
ランクブレイン
もし以前に「Latent Semantic Indexing(LSI)」や「LSIキーワード」という言葉に触れたことがあるなら、それは忘れてください。Googleは、LSIが解決しようとした問題を「RankBrain」というアルゴリズムで解決しています。
そして、その問題については以前にも説明しました。それは、検索クエリで使われる言葉と求めるコンテンツとのズレに関するものでした。
GoogleのRankBrainは、LSIよりも進んだテクノロジーを備えています。簡単に言えば、RankBrainは洗練された機械学習アルゴリズムによって、馴染みのない単語やフレーズでもその意味を理解することができます。
全検索クエリの15%が新規クエリであることを考えれば、これは非常に大きな進化です。
RankBrainは独立した検索アルゴリズムではなく、ハミングバードのアップグレードと考えることができます。RankBrainは最強のランキングシグナルの1つだが、最適化するために積極的にできることは、検索意図を満たすことです。
バート
BERT(Bidirectional Encoder Representations from Transformers)は、セマンティック検索の仕組みに対する最新の大きなアップグレードです。2019年末以降、全クエリの約10%に影響する。
ご心配なく。私もBERTが何の略かを思い出すのにかなり時間がかかりました。
知っておくべきことは、BERTは長くて複雑な文章やクエリの理解を向上させるということです。言葉の文脈をよりよく理解しようとするため、曖昧さやニュアンスの違いに対処するためのソリューションです。
また、BERTそのものを最適化するために何かをすることはできないが、それが何を意味し、何をするのかを簡単に知っておくことは良いことです。
セマンティック検索にSEOを適応させる方法
すでに記事の随所にヒントを散りばめてきました。では、再現可能なものを紹介しましょう。
- キーワードではなく、トピックをターゲットにする
- 検索意図の評価
- セマンティックHTMLの使用
- スキーマ・マークアップを使用する
- ナレッジグラフのエンティティになるためのブランド構築
- リンクによる関連性の構築
1.キーワードではなく、トピックをターゲットにする
昔のSEOでは、同じトピックについて、少し異なるキーワードをターゲットにした別々のコンテンツで上位にランクインすることができた:
- オープン・グラフ・タグ
- オープン・グラフ・メタ・タグ
- メタタグ
- オープン・グラフ・タグ
- オープングラフとは
- フェイスブック・オープングラフ・タグ
それはもはや事実ではないです。Googleは現在、これらの検索がほとんど同じ意味であることを理解し、それらすべてに対してほとんど同じページをランク付けしている。
コンテンツを作成する際には、このことを念頭に置いてください。もはや1つのキーワードでランクインすることが目的ではなく、トピックを深く掘り下げて、Googleがあなたのページを多くの類似キーワードやロングテールキーワードでランクインさせることが目的なのです。
例えば、オープングラフのメタタグに関する私たちの記事は、何百ものキーワードで上位にランクインしています。これらの多くは、同じものを検索する他の方法ですが、”og:title”、”og url”、”og:image “のようなサブトピックもあります。
私たちがこれらのキーワードでランクインできたのは、ひとつのキーワードについてだけでなく、トピックについて深く掘り下げた記事を書いたからです。
そのトピックについて上位表示されているページのこのレポートを見ることは、どのようなサブトピックについて書くべきかを理解する良い方法である。例えば、アスパラガスの栽培について記事を書きたいとします。「アスパラガスの栽培」で上位表示されているページをAhrefsのサイトエクスプローラーに入力して、オーガニックキーワードレポートを確認すると、他のキーワードの中でもこれらのキーワードで上位表示されていることがわかります:
- アスパラガスを植える深さ
- アスパラガスの栽培条件
- アスパラガスの植え付け時期
- アスパラガスを植えるのに最適な場所
- アスパラガスの収穫方法
- アスパラガスの世話の仕方
これらは、できるだけ多くの自然なトラフィックを獲得するために、詳細な記事を作成する際に考慮すべき内容です。
しかし、注意が必要です。特定のトピックを対象にすると言っても、そのトピックに関わる全ての側面を網羅する必要はありませんし、あまりに深く掘り下げる必要もありません。
ここでこの記事を例に挙げてみましょう。私は自然言語処理について何十時間も研究して、セマンティック検索の技術的な部分にまで踏み込むこともできました。しかしそうしなかったのは、ほとんどの人がそのような詳細には興味がないからです。
そこで次のポイントです。
2.検索意図の評価
検索意図に沿わない特定のトピックに関するコンテンツを公開することはできます。
あなたがマーケティングデータのオタクで、「SEOレポート 」というトピックを発信する機会があるとしましょう。もちろん、最高のSEOレポートを作成するために必要な情報を共有したいと考えるでしょう。例えば、「クエリの活用で最高のSEOレポートを作成しよう」というアイデアが浮かぶかもしれません。
それは確かに、最終的に最高のSEOレポートにつながるコンテンツの一部かもしれません。しかし、このトピックを検索しているほとんどの人は、Googleシートの多くの機能に精通しているわけではありません。彼らは単に、仕事を効果的に進めるためのツールを求めているのです。
そのため、新しいコンテンツのアウトラインを考え始める前に、検索意図を推測するためにランキング上位のページを見てみよう。
おすすめ記事: 検索者の意図:最適化すべき「ランキング要因」の見落とし
3.セマンティックHTMLの使用
セマンティック検索に進む前に、私たちはセマンティック・ウェブへのシフトが必要でした。WWWの当初のコンセプトは、明確な意味を持たない標準化された相互リンクされた文書と解釈することができます。今となっては、意味が必要であることは明らかです。
そして、すべては基本的なHTMLから始まります。
次のHTML要素を比較してください:
セマンティックHTMLは、機械がナビゲーションブロック、ヘッダー、フッター、テーブル、またはビデオを認識できるように、コードに意味を追加します。
HTML5は最もセマンティックな要素を提供し、ほとんどのモダンなCMSテーマはすでにこれらを活用しています。もしテーマがそれをサポートしていない場合は、通常プラグインを使って追加することができます。
しかし、セマンティックHTMLにはまだ限界があります。例えば、「これはテーブルです」と言っても、実際のコンテンツの意味は伝わりません。そこでスキーママークアップが登場します。
4.スキーマ・マークアップを使う
スキーマ・マークアップは、ページをマークアップする追加的な方法です。構造化データとも呼ばれ、ウェブのための共通のセマンティックなフレームワークと言えます。
Schema.orgの語彙には、プロパティに関連付けられた何百ものタイプが含まれています。これらを使って、複雑なアルゴリズムを使わずにGoogleが理解しやすい方法でコンテンツをマークアップすることができます。
例えば、グーグルはこのように構造化されたコンテンツから意味を抽出することが容易になる:
cooking time: 20 minutes
calories: 80
…このような自然言語からよりも:
It will take 20 minutes to make the pancakes. Even better, these are low-calorie pancakes—around 80 per serving.
そのため、ユーザーがパンケーキを焼くのにかかる時間やカロリーを知りたいとき、グーグルは最適な方法で情報を提供することができます。
さらに読む
5.ナレッジグラフのエンティティになるためにブランドを構築する
前述のセクションで既にエンティティについて説明したため、ナレッジグラフに関する私たちの記事をご覧ください。
セマンティック検索にSEOを適用する際のヒントの中でも、これを実現するのは最も難しい部分です。なぜなら、これはブランド構築と他のヒントを結びつけて長期的な結果をもたらすものだからです
6.リンクを通じて関連性を高める
リンクは歴史的に、関連性の最初の指標の一つとされました。文書Aが文書Bにリンクしていれば、それらは関連性があると見なされました。
自然なアンカーテキストを使った関連ページからの内部リンクも外部リンクも、Googleがコンテンツを処理する前であっても、あなたのコンテンツが何について書かれているのかを把握するのに役立ちます。
さらに読む
最終的な感想
セマンティック検索は、コンテンツの世界を変えました。ユーザーはより関連性の高い、価値あるコンテンツにアクセスできるようになり、コンテンツ制作者はそのような価値あるコンテンツを作成する意欲が高まりました。
高度な技術とアルゴリズムが関与しているにもかかわらず、セマンティック検索の原則を理解することは容易です。これにより、必要な変更を行い、将来のSEO戦略に備える準備が整うでしょう。
セマンティック検索に関するご質問やご意見はありますか?ツイッターでご連絡ください。
セマンティック検索に関する技術的なことをもっと知りたければ、ドーン・アンダーソンをフォローし、彼女のプレゼンテーションをチェックしてみてください。
記事を書いた人
Michal Pecánek
6年以上の経験を持つSaaS SEOコンサルタント。フリーランスになる前は、AhrefsのSEO & マーケティングエデュケーターとして、ブログのコンテンツ作成やゲストライターのチーム管理を行っていました。
コメント