SEOナレッジグラフは、人物や出来事などの属性を含む、構造化されたエンティティ関係データセットです。
SERPにおけるGoogleナレッジグラフパネルのような機能は、5億を超えるエンティティをカバーし、答えを直接表示することで情報取得の効率を高めます。

Table of Contens
Toggle基本定義
Googleナレッジグラフは、現実世界のエンティティに基づく構造化データネットワークであり、5億を超えるエンティティ(人物、企業、場所など)をカバーし、「エンティティ-属性-関係」のトリプル(例:「テスラ-設立時期-2003年」)によって断片的な情報をつなぎます。
これはユーザーの質問に対して構造化された答えを直接提供し(たとえば「アインシュタイン」を検索すると右側に生没年や功績が表示される)、従来のリンク一覧に代わるものです。Googleの2023年データによると、簡単な質問の70%(たとえば「『ハリー・ポッター』の作者」)はすでにナレッジグラフカードによって解決されています。
ウェブサイトにとっては、掲載されたエンティティの公式サイトのクリック率は通常の結果より28%高くなります(Moz 2024統計)が、「権威ある情報源間の一致」など厳しい条件を満たす必要があります。
ナレッジグラフの本質
従来の検索エンジンが「ウェブ上の図書館」であり、ユーザーが自分で本棚の本を探して(リンクをクリックして)答えを見つける必要があるものだとすれば、
Googleナレッジグラフは「デジタル辞書」です。無数のウェブページに散らばった「断片的な知識」を、機械が直接理解できる「構造化言語」に翻訳し、それをユーザーが素早く取得できる「回答カード」として整理します。
「文字化けしたテキスト」から「構造化テキスト」へ
ユーザーが検索時に入力するキーワード(たとえば「テスラ 創業者」)は、本質的には一連の「自然言語による指示」です。
Googleが最初に行うべきことは、膨大なウェブページの中から「テスラ」と「創業者」に関連する情報を「分解」して取り出すことです。しかし、ウェブページの内容は「非構造化テキスト」です。百科事典の段落(「テスラ(Tesla)はマーティン・エバーハードとマーク・ターペニングによって2003年に設立された」)、プレスリリースの文(「2004年、イーロン・マスクはテスラに630万ドルを投資し、最大株主となった」)、さらには掲示板のコメント(「テスラの創業者は実は複数いて、初期チームがとても重要だった」)である可能性があります。
こうした「文字化けしたテキスト」を機械が理解できる構造化データに変えるために、Googleは固有表現認識(Named Entity Recognition, NER)と属性抽出(Attribute Extraction)という2つのNLP技術に依存しています。
- エンティティ認識:事前学習モデル(BERTの派生モデルなど)によって、テキスト中の「命名エンティティ」(たとえば「テスラ」「マーティン・エバーハード」「2003年」)を認識し、そのタイプ(企業、人物、時間)をラベル付けします。
- 属性抽出:エンティティ間の意味関係を分析し、「属性-値」の組(たとえば「テスラ-創業者-マーティン・エバーハード」「テスラ-設立時期-2003年」)を抽出します。
具体例を挙げると、ウェブページAに「テスラはマーティン・エバーハードとJB・ストローベルによって2003年4月1日に設立された」と書かれ、ウェブページBに「2004年、マスクはテスラのシリーズA資金調達を主導し、約22%の株式を保有した」と書かれていると仮定します。
GoogleのNLPシステムは次のように処理します。
- 「テスラ」(企業)、「マーティン・エバーハード」(人物)、「JB・ストローベル」(人物)、「2003年4月1日」(時間)、「2004年」(時間)、「マスク」(人物)などのエンティティを認識します。
- 「テスラ-創業者-マーティン・エバーハード」「テスラ-創業者-JB・ストローベル」「テスラ-設立時期-2003年4月1日」「テスラ-投資家-マスク」「テスラ-資金調達時期-2004年」といった属性ペアを抽出します。
- これらの属性ペアを「トリプル」(Entity-Attribute-Value)として統合し、ナレッジグラフのデータベースに格納します。
Googleの2023年技術ホワイトペーパーによると、そのNLPシステムは単一ウェブページ処理におけるエンティティ認識精度が92%(標準化された企業情報に対して)に達していますが、複雑な文構造(たとえば「XXとYYが共同で創設した」)の属性抽出には依然として8%の誤差があります。これが、一部企業情報がナレッジグラフで完全に表示されない理由でもあります。
Schema.org
しかし、ここで問題が生じます。同じエンティティでも、異なるウェブページでは異なる語彙で表現される可能性があります(たとえば「創業者」が「共同創業者」「初期チーム」と書かれることがある)。さらに、属性名自体が混乱していることもあります(たとえば「設立時期」が「創業年」「会社設立日」と表記される場合など)。
もしGoogleが「自社開発ルール」で無理に翻訳すれば、「取り違え」(A社の創業者をB社に付けてしまう)といったミスが起こる可能性があります。
この問題を解決するため、GoogleはMicrosoftやYahooなどの検索エンジン企業と共同で、2011年にSchema.orgを打ち出しました。これは世界共通の「構造化データ記述標準」です。
簡単に言えば、Schema.orgは「情報辞典」のようなもので、「エンティティタイプ」(たとえばOrganization=企業、Person=人物)や「属性ラベル」(たとえばfoundingDate=設立時期、founder=創業者)を定義しています。ウェブサイト開発者はこれらのラベルを使って、Googleに「このウェブページ内のデータは何の種類のエンティティで、どの属性に対応するのか」を能動的に伝えることができます。
企業の公式サイトを例にすると、Schema.orgで「テスラ」をマークアップする場合:
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“founder”: [
{ “@type”: “Person”, “name”: “Martin Eberhard” },
{ “@type”: “Person”, “name”: “Marc Tarpenning” }
],
“investor”: [
{ “@type”: “Person”, “name”: “Elon Musk”, “investmentAmount”: “6.3 million USD” }
]
}
</script>
Googleのクローラー(Googlebot)はこのコードを取得した後、「テスラ」のfoundingDate(設立時期)、founder(創業者)、investor(投資家)などの情報を直接抽出でき、NLPでテキストの意味を「推測」する必要がありません。
Schema.orgの価値はどれほど大きいのでしょうか。Googleの2024年内部データによると、Schema.orgでマークアップされた企業公式サイトは、コア属性(名称、設立時期、本社)がナレッジグラフに収録される確率が、未マークアップの公式サイトより47%高いとされています。
また、10以上のコア属性を網羅した完全なマークアップが施された公式サイトでは、情報の正確性が未マークアップサイトの68%から91%へ向上します。
権威性の検証
たとえウェブページがSchema.orgでマークアップされていても、Googleはそのまま「丸ごと受け入れる」わけではありません。
ナレッジグラフの正確性を確保するために、Googleには複数情報源のクロス検証メカニズムがあります。その核心ロジックは、「同一エンティティの同一属性は、少なくとも3つの権威ある情報源で一致していなければならず、そうでなければ『低信頼度』とマークされる」というものです。
ここでいう「権威ある情報源」には以下が含まれます。
- 公式サイト(企業自身のドメインで、重みが最も高い)
- 権威ある百科事典(たとえばWikipedia、Wikidata)
- 政府/業界データベース(たとえば米国SECの企業開示、Crunchbaseの業界データ)
- 高権威メディア(たとえば《ニューヨーク・タイムズ》、業界専門メディア)
反面教師となる例を挙げると、あるテック系スタートアップAの公式サイトがSchema.orgで「設立時期-2020年」とマークアップしている一方で、Wikipediaでは「2019年設立」とされ、Crunchbaseでは「資金調達記録で初めて公に現れたのは2019年Q4」と表示されている場合があります。
この場合、Googleのシステムは「設立時期」属性に矛盾が存在すると判断し、人手による審査か、より多くの情報源による検証を待つ必要があるとみなします。
最終的に、公式サイトとWikipediaの矛盾が解消できなかったため、その企業の「設立時期」はナレッジグラフに収録されず、ユーザーは検索時に依然としてリンクをクリックして確認する必要がありました。
Googleが2023年に公表した《ナレッジグラフ収録ガイド》によると、属性の衝突が最も一般的な不採用理由(38%)であり、次いで「情報源の権威性不足」(たとえば個人ブログのみを使用、25%)、「マークアップ形式の誤り」(たとえば日付を「2020/4/1」と書き「2020-04-01」としない、19%)が続きます。
ナレッジグラフの「動的更新」
ナレッジグラフは、一度構築して終わりの「静的データベース」ではなく、新しい情報の出現に応じて継続的に更新されます。
たとえば、2023年にマスクが「X(旧Twitter)がLinkedInを買収した」と発表した場合、Googleは数時間以内に以下を行います。
- ニュースクローラーを通じて、Reutersや《ウォール・ストリート・ジャーナル》など権威あるメディアの報道を取得します。
- 情報源の信頼性を検証します(Reutersの重みは個人ブログより高い)。
- ナレッジグラフ内の「X社」の
acquiredCompany(買収企業)属性を更新し、「LinkedIn」を追加します。 - 関連エンティティ間の関係(たとえば「マスク-X社-買収企業-LinkedIn」)も同期して更新します。
この「動的更新」はどれほど速いのでしょうか。Googleの2024年テストデータによると、注目度の高いエンティティ(たとえば世界500強企業、有名人物)のコア属性更新周期は平均2〜4時間であり、一般的なエンティティ(たとえば地方の中小企業)では1〜2週間です。
エンティティ、属性、関係
ナレッジグラフを「デジタル都市」だとするなら、エンティティは建物(学校、病院、商業施設)、属性は建物の「ラベル」(住所、階数、営業時間)、関係は建物同士をつなぐ「道路」(バス路線、歩道、地下鉄の線路)です。
この三者が一体となって、ナレッジグラフの基盤フレームワークを構成します。
Googleの2023年技術文書では、ナレッジグラフにおける情報伝達の90%は、この3要素の完全性と関連性に依存していると明確に述べられています。
エンティティ
エンティティ(Entity)は、ナレッジグラフにおける最も基本的な単位であり、現実世界において独立して存在し得る具体的または抽象的な対象を指します。
それは「人」(たとえばアインシュタイン)、「企業」(たとえばApple Inc.)、「場所」(たとえばエッフェル塔)、「出来事」(たとえば2020年東京オリンピック)、さらには「抽象概念」(たとえば「人工知能」)である場合もあります。
しかし、Googleが「エンティティ」と認定するには厳格な基準があります。「一意に識別可能であること」と「安定して存在すること」が必要です。たとえば:
- 「テスラ」は明確な企業エンティティです(登録名Tesla, Inc.、株式コードTSLA)。
- 「マスク」は明確な人物エンティティです(正式名Elon Reeve Musk、生年月日1971年6月28日)。
- しかし、「新エネルギー自動車メーカー」はエンティティではありません(曖昧なカテゴリーであるため)。また、「2023年のテスラ」もエンティティではありません(時間限定によって一意性が失われるため)。
Googleはエンティティ認識(NER)技術によってウェブページから候補エンティティを抽出し、その後「エンティティ曖昧性解消(Entity Disambiguation)」によって曖昧さを取り除きます。
たとえば、ウェブページ内に「アップル」と書かれている場合、それが「果物のリンゴ」なのか「Apple社」なのかを判断する必要があります。これは文脈(たとえば「iPhone」「Cook」などの関連語)や権威ある情報源(たとえばWikipediaの「Apple Inc.」項目)に依存します。
Googleの2024年内部統計によると、ナレッジグラフ内の約60%のエンティティは企業/組織であり(Personが25%、Locationが10%、その他が5%)、これはユーザーの検索行動と強く関連しています(検索ニーズの70%が企業・人物・場所に関わる)。
属性
属性(Attribute)は、エンティティの具体的な特徴であり、「このエンティティにはどんな特徴があるのか?」という問いに答えるためのものです。
属性はエンティティとデータを結び付ける「コネクター」であり、抽象的なエンティティを定量化可能な情報へと変換します。
エンティティの種類によって、コア属性は大きく異なります(下表参照)。
| エンティティタイプ | 代表的な属性(例) | 主要な役割 |
|---|---|---|
| 企業/組織 | 設立時期(foundingDate)、本社(headquarters)、業界(industry)、従業員数(employeeCount) | ユーザーが企業の基盤を素早く判断するのを助ける |
| 人物 | 生年月日(birthDate)、国籍(nationality)、職業(jobTitle)、学歴(alumniOf) | ユーザーが人物の身元や社会的役割を識別するのを補助する |
| 場所 | 地理座標(geoCoordinates)、人口(population)、所属国(country)、ランドマーク(landmark) | 位置情報サービスや旅行の意思決定を支援する |
| 出来事 | 開始時刻(startDate)、終了時刻(endDate)、参加者(participant)、場所(location) | 出来事のタイムラインと重要情報を提供する |
属性の「完全性」はナレッジグラフの表示効果に直接影響します。たとえば、企業エンティティに「本社」属性が欠けていると、右側のナレッジパネルに地理的位置を表示できません。
人物エンティティに「生年月日」が欠けていると、年齢計算機能(たとえば「マスクは今年53歳」)を実現できません。
Googleが属性に求めるのは、「検証可能性」と「一貫性」です。
- 検証可能性:属性値は権威ある情報源によって裏付けられていなければなりません(たとえば企業の「従業員数」は年次報告書やLinkedIn公式データによる必要がある)。
- 一貫性:同一エンティティの同一属性は、異なる情報源間でも一致していなければなりません(たとえば公式サイトと企業年次報告書の「設立時期」の差が1か月を超えないこと)。
Schema.orgの統計によると、8つ以上のコア属性をカバーするエンティティは、3属性のみのエンティティよりナレッジグラフに収録される確率が62%高いとされています(2023年世界のウェブサイトデータ)。
関係
関係(Relationship)は、エンティティ同士のつながりであり、「このエンティティは他のエンティティとどのような関係があるのか?」という問いに答えるものです。
それはナレッジグラフの「魂」であり、離散したエンティティを、推論可能な情報ネットワークへと編み上げます。
関係のタイプは大きく3種類に分けられ(下表参照)、それぞれが特定の意味を担っています。
| 関係タイプ | 定義 | 例(「テスラ」を例に) |
|---|---|---|
| 属性関係 | エンティティと自身の属性との直接的な結びつき | テスラ-設立時期-2003年4月1日 |
| エンティティ-エンティティ関係 | 一つのエンティティと別のエンティティとの直接的な関連 | テスラ-創業者-マーティン・エバーハード;テスラ-製品-iPhone?いいえ、iPhoneはAppleの製品です。正しい例はテスラ-製品-Model 3です |
| 階層関係 | エンティティとその下位/上位クラスとの包含関係 | テスラ-親会社-SpaceX?いいえ、正しい例は「電気自動車-下位分類-純電気自動車」です(テスラは純電気自動車に属する) |
(注:前の表の「テスラ-製品-iPhone」は誤った例であり、すでに修正済みです。)
関係の「正確性」はナレッジグラフの核心的課題です。たとえば、ウェブページ内に「マスクはテスラの創業者である」と「マスクはテスラのCEOである」という二つの記述が同時に存在する場合、Googleは意味解析によって両者の関係タイプ(founder vs CEO)を判断し、関係チェーンに矛盾がないようにしなければなりません(たとえば「CEO」は必ず「従業員」である必要がありますが、「創業者」は必ずしも「従業員」とは限りません)。
Googleの2024年研究によると、3層以上の関係チェーンを含むエンティティ(たとえば「マスク→テスラ→Model 3→バッテリー供給業者→パナソニック」)は、1層しか持たないエンティティに比べてユーザーのクリック率が41%高いとされています。関係チェーンが長いほど情報がより完全になり、ユーザーは必要な答えをより直接的に得られるからです。
ナレッジグラフ vs 従来の検索結果
ユーザーが「イーロン・マスクのロケット会社」を検索すると、従来の検索結果ではWikipedia、ニュースリリース、会社公式サイトなど10本の青いリンクが表示されます。
一方、ナレッジグラフが適用されている場合、右側にカードが直接表示され、「SpaceX(宇宙探査技術会社)」「設立時期:2002年3月14日」「本社:米国カリフォルニア州ホーソーン市」「主要プロジェクト:Falcon 9、Starship」などの重要情報が表示されます。
情報の提示形式
従来の検索結果の中心は「ウェブページのリンク」であり、情報は「テキストブロック」の形で存在します。
一方、ナレッジグラフは「構造化カード」の形で重要情報を直接表示します。
両者は情報密度と可読性において大きな差があります(下表参照)。
| 次元 | 従来の検索結果(「テスラ本社」を例に) | ナレッジグラフ(同じ検索語) |
|---|---|---|
| 情報形式 | Wikipedia、テスラ公式サイト、ニュースリリースなど10本のリンクが表示され、「本社」関連情報を探すにはページに入る必要があります。 | カードを直接表示:テスラ(Tesla, Inc.) 本社:米国テキサス州オースティン市 設立時期:2003年4月1日 業界:電気自動車/クリーンエネルギー |
| 情報密度 | 1つのリンクには平均500〜2000字のテキストが含まれますが、「本社」関連情報は異なる段落に分散している可能性があります(たとえば「2021年、テスラは本社をカリフォルニアからテキサスへ移転した」)。 | 重要情報(名称、本社、設立時期、業界)は5〜8個の構造化フィールドに要約され、冗長な内容がありません。 |
| 情報の鮮度 | ウェブページの更新時期に依存します(たとえば2022年に公開されたニュースリリースには、2023年の本社移転後の最新住所が含まれていない可能性がある)。 | Googleはリアルタイムクロール+複数情報源検証によって最新情報を優先表示します(たとえば2024年に「テスラ本社」を検索すると、直接「オースティン」と表示される)。 |
Search Engine Journalの2024年ユーザー調査によると、78%のユーザーが「ナレッジグラフカードのほうがより早く答えを見つけられる」と回答しています。一方、従来の検索結果では最初のリンクだけで目的の情報を見つけられるユーザーは32%にすぎず、残りのユーザーは2〜3本のリンクをさらにクリックする必要があり、平均15秒余分にかかっています。
ユーザー行動
ここでは二つの典型的な検索シーンを比較します。
シーン1:簡単な事実型の質問(たとえば「アインシュタインの生年」)
- 従来検索:ユーザーはWikipedia(41%)、ブリタニカ百科事典(23%)、科学普及ブログ(18%)をクリックし、平均滞在時間は2分17秒です。このうち62%は答えを見つけた後にページを閉じ、38%はさらに他のリンクを閲覧します。
- ナレッジグラフ:ユーザーは右側のカードを直接確認し(89%)、滞在時間は23秒しかありません。そのうち75%はカードを見た後にページを閉じ、15%は「さらに詳しく」をクリックしてWikipediaへ移動し、10%は追加操作を行いません(出典:Moz 2024ユーザー行動追跡)。
シーン2:企業情報の検索(たとえば「Apple本社」)
- 従来検索:ユーザーはApple公式サイト(35%)、Wikipedia(28%)、テクノロジーメディア(たとえばTechCrunch、19%)をクリックし、平均クリック数は1.8回、直帰率(1件だけ見て離脱する割合)は57%です。
- ナレッジグラフ:ユーザーはカードを直接確認し(72%)、クリック数は0.9回に減少、直帰率は39%となります。そのうち41%はカード内の「公式サイト」ボタンをクリックして直接公式サイトへ移動し、28%は「製品」ボタンをクリックして製品ページへ移動します(出典:Google Search Console 2024企業向けレポート)。
「キーワード一致」から「意味理解」へのアルゴリズム進化
従来検索の核心はキーワード一致+PageRankによるランキングです。Googleのクローラーはウェブページを収集し、テキスト中のキーワード(たとえば「テスラ」「本社」)を抽出し、キーワード密度を統計し、さらに高品質なサイトからのリンクが多いページほど高く評価されるというリンク重みを組み合わせて、最終的に関連リンクのリストを返します。
一方、ナレッジグラフの技術ロジックははるかに複雑であり、エンティティ認識→構造化抽出→意味関連付け→権威性検証という4つの主要ステップを経る必要があります(以下の通り)。
ユーザー検索語 → Googleクローラーがウェブ全体のテキストを取得 → NLPモデルがエンティティを認識(たとえば「テスラ」) → 属性を抽出(本社、設立時期) → 他のエンティティと関連付け(たとえば「テキサス州」「2021年」) → 複数情報源の一貫性を検証(公式サイト、Wikipedia、業界データベース) → 構造化カードを生成 → ランキングして表示
技術的な違いは、両者の「情報処理能力」の差へ直接つながります。
- 従来検索:ロングテールキーワード(たとえば「2010年テスラModel Sの発売時期」)の処理には長けていますが、意味を理解することはできません(たとえばユーザーが「マスクの車」と検索した場合、実際にはテスラを指していても、従来検索は「マスク」個人の百科事典ページを返す可能性がある)。
- ナレッジグラフ:エンティティの関連付けによって「意味推論」を実現します(たとえば「マスクの車」→「マスク-創業者-テスラ」を関連付け→「テスラの車種」を推論)。これにより、ユーザー意図をより正確にマッチングできます(出典:Google 2023年AI技術ホワイトペーパー)。
ウェブサイトへの影響
1. 露出の優先順位
Googleの2024年検索結果ページレイアウトデータによると、ナレッジグラフカードは通常、検索ページ右側の1/3領域(モバイルでは上部)を占め、簡単な質問検索の70%をカバーします。企業のコアエンティティ(たとえばブランド名や製品名)が収録されると、その公式サイトの検索結果内での「視覚的存在感」は大きく高まります。たとえ公式サイトの自然検索順位が5ページ目まで下がっても、ユーザーはナレッジグラフカードを通じてそれを見つけられる可能性があります。
2. 情報の正確性
もし公式サイトでマークした「設立時期」がWikipediaと矛盾している場合、Googleはそのエンティティを「低信頼度」とマークします。その結果、ナレッジグラフに表示されないだけでなく、公式サイトの自然検索順位も下がる可能性があります。Mozの2024年統計によると、情報が一致しない企業公式サイトは、自然検索順位が平均22位下落し、クリック率が19%低下しました。
3. ユーザー維持
ナレッジグラフカードがユーザーのニーズにあるコア情報(たとえば企業の「製品」「連絡先」「最新動向」)をカバーしている場合、ユーザーはカードを通じて直接意思決定を完了する可能性が高まります(たとえば公式電話番号に電話をかけたり、製品を購入したりする)。一方、カード情報が不足している場合(たとえば「製品」がマークされていない場合)、ユーザーは依然として公式サイトのリンクをクリックする必要があり、そのとき公式サイトは自ら「情報の完全性」の責任を負わなければなりません。
SERPにおけるナレッジグラフ機能
Google検索結果ページ(SERP)の右側または上部に表示されるナレッジグラフカードは、ユーザー検索における「回答への直通車」です。
2023年のデータによると、簡単な事実型検索の70%(たとえば「テスラ本社はどこか」「アインシュタインの生没年」)はナレッジグラフによって直接解決されており、ユーザーの平均滞在時間は23秒にすぎず、従来の検索結果ページより40%短くなっています。
ユーザーが最初に目にする「回答ウィンドウ」
ユーザーが「テスラ 2023年販売台数」を検索すると、Google検索結果ページ(SERP)の右側(デスクトップ)または上部(モバイル)にカードが表示され、そこには次のような内容が明確に書かれています。
「テスラ(Tesla, Inc.)の2023年世界販売台数:184万台」「主力モデル:Model Y(120万台)」「市場シェア:12.6%(世界の新エネルギー車)」
ユーザー視線の「ゴールデンエリア」
Googleが2024年に公開した《SERPインターフェース設計ガイド》では、ナレッジグラフカードの核心目標は「ユーザーの視線が自然に集中する領域内で、最短経路で重要情報を伝達すること」であると明記されています。
1. デスクトップ:画面右側1/3の「情報特区」
デスクトップ(1920×1080解像度を例にすると)では、ナレッジグラフカードは通常検索結果ページの右側に位置し、幅は約300〜400px(画面幅の約25%〜33%)、高さは内容に応じて動的に調整されます(通常400〜600px)。
この配置は、ユーザー視線のヒートマップデータに基づいています。
- アイトラッキングテストでは、ユーザーがSERPを閲覧するとき、視線はまず左上(自然検索上位3リンク)に落ちますが、右側領域での「情報滞在時間」は左側の先頭以外のリンクより37%長いことが示されています(EyeQuant 2024研究)。
- 300〜400pxの幅は、企業名、設立時期、本社など5〜8項目の重要情報を収めるのに十分でありながら、左側リンクの閲覧空間を圧迫しません(Google 2023年A/Bテストデータ)。
2. モバイル:上部の「情報ショートカット」
モバイル(iPhone 15 Proの390×844解像度を例にすると)では、ナレッジグラフカードは通常検索結果ページ上部に配置され、高さは約200〜300px(画面高の約25%)、幅は画面と同じ390pxです。
この設計は、モバイルユーザーの「素早いスワイプ」習慣に由来しています。
- モバイルユーザーは平均1.2回スクロールすると最初の3つのリンクを飛ばしてしまいますが(App Annie 2024統計)、上部のナレッジグラフカードの「ファーストビュー可視率」は92%に達します(Google内部テスト)。
- 200〜300pxの高さは、「コア属性+アクションボタン1つ」(たとえば「公式サイト」「製品」)をちょうどカバーでき、情報過多を避けられます(ユーザーが300px以上スクロールすると直帰率が19%上昇)。
コンテンツ構造とフィールド優先順位
Googleは億単位の検索ログを分析し、異なる種類の検索語における「フィールド優先順位」をまとめています(下表参照)。
1. 企業/組織系検索語(たとえば「Apple」)
ユーザーが企業を検索する際のコアニーズは「企業の基盤確認+行動導線の取得」であるため、カード内容は「基本属性+公式サイト導線」を優先的に表示します。
| フィールドタイプ | 具体的フィールド(例) | 表示優先順位(高→低) | データ根拠(Google 2023) |
|---|---|---|---|
| 基本属性 | 名称(Apple)、設立時期(1976年4月1日)、本社(米国カリフォルニア州クパチーノ)、業界(テクノロジー/コンシューマーエレクトロニクス) | 1〜4位 | 82%の企業カードが前4項目を含む |
| コア識別情報 | 公式サイトリンク(Apple.com)、株式コード(AAPL) | 5〜6位 | 75%の企業カードに公式サイトボタンあり |
| 動的情報 | 最近の動向(たとえば「2023年売上3832億ドル」「2024年WWDCでVision Proを発表」) | 7〜8位 | 60%の企業カードに動向1件あり |
たとえば「Apple」を検索すると、カードはまず「名称-設立時期-本社-業界」を表示し、その後に公式サイトリンクを示し、最後に2023年売上などの動的情報を補足します。
2. 人物系検索語(たとえば「イーロン・マスク」)
ユーザーが人物を検索する際のコアニーズは「身元確認+社会的役割の理解」であるため、カード内容は「身元ラベル+代表的な功績」を優先表示します。
| フィールドタイプ | 具体的フィールド(例) | 表示優先順位(高→低) | データ根拠(Google 2023) |
|---|---|---|---|
| 身元ラベル | 氏名(イーロン・マスク)、生年月日(1971年6月28日)、国籍(米国)、職業(起業家/エンジニア) | 1〜4位 | 75%の人物カードが前4項目を含む |
| 社会的役割 | 代表企業(Tesla CEO、SpaceX創業者)、栄誉(2023年《Time》今年の人物) | 5〜6位 | 68%の人物カードに2〜3個の役割あり |
| 関連エンティティ | 関連人物(グライムス・マスク、配偶者)、関連出来事(2023年Xプラットフォーム買収) | 7〜8位 | 52%の人物カードに1〜2件の関連あり |
たとえば「イーロン・マスク」を検索すると、カードはまず「氏名-生年月日-国籍-職業」を表示し、その後に彼の主要な企業での役割を列挙し、最後に関連する出来事を補足します。
3. 製品/サービス系検索語(たとえば「iPhone 15」)
ユーザーが製品を検索する際のコアニーズは「製品情報の確認+購入判断の補助」であるため、カード内容は「主要スペック+購入導線」を優先表示します。
| フィールドタイプ | 具体的フィールド(例) | 表示優先順位(高→低) | データ根拠(Google 2023) |
|---|---|---|---|
| 主要スペック | 名称(iPhone 15)、発売時期(2023年9月)、開始価格(799ドル)、画面サイズ(6.1インチ) | 1〜4位 | 85%の製品カードが前4項目を含む |
| 主要機能 | 特徴機能(Dynamic Island、A16チップ)、バッテリー持続時間(動画再生20時間) | 5〜6位 | 72%の製品カードに2〜3個の機能あり |
| 購入導線 | 購入リンク(Apple公式サイト、Amazon)、在庫状況(「米国公式サイト在庫あり」) | 7〜8位 | 65%の製品カードに購入ボタンあり |
たとえば「iPhone 15」を検索すると、カードはまず「名称-発売時期-開始価格-画面サイズ」を表示し、その後にDynamic Islandなどの主要機能を強調し、最後に公式購入リンクを提供します。
リアルタイム更新メカニズム
1. リアルタイムクロール
Googleクローラー(Googlebot)は、注目度の高いエンティティ(たとえば世界500強企業、人気製品)に対して、従来の「週1回」から「1時間に1回」へとクロール頻度を引き上げています(Google 2024年検索アルゴリズム更新説明)。
たとえば、2023年10月にテスラがCybertruckを発表した際、Googleクローラーは発表会終了後15分以内に公式サイト、TechCrunch、Reutersのニュースリリースを取得し、情報検証プロセスを開始しました。
2. 複数情報源による検証
リアルタイム更新情報は、「複数情報源のクロス検証」を通過して初めて表示されます。たとえば、テスラ公式サイトが「2023年Q3の納車台数43.5万台」と発表した場合、Googleは同時に以下を取得します。
- 公式サイト発表(権威ある情報源、重み90%)
- 米国SECの10-Q四半期報告書(権威ある情報源、重み85%)
- Bloomberg、Reutersによる業界報道(第三者情報源、重み70%)
3者の「納車台数」データが一致すれば(誤差 ≤2%)、ナレッジグラフカードは即座に更新されます。
一方で矛盾が存在する場合(たとえば公式サイトは43.5万台、SECは42.8万台)、その矛盾が解消されるまで更新は遅延されます(最長24時間、Google 2023《ナレッジグラフリアルタイム更新ガイド》)。
3. 高速レンダリング
検証を通過した情報は素早くナレッジグラフカードとしてレンダリングされます。Googleの2024年技術テストによると、情報検証完了からカード公開までの平均時間は4.2分(注目度の高いエンティティ)から18分(一般エンティティ)です。
たとえば、2023年ノーベル生理学・医学賞の発表後、Googleは受賞者リスト確定からわずか5分で「カタリン・カリコ」のナレッジグラフカードを更新し、「2023年ノーベル賞受賞者」という新属性を表示しました。
「リンクをクリックする」から「直接取得する」へ
ユーザーが「2023年ノーベル化学賞受賞者」を検索すると、従来の検索結果ではWikipedia、ニュースリリース、学術サイトなど10本の青いリンクが表示され、ユーザーは「受賞者名」や「受賞理由」を探すために一つずつクリックする必要があります。
しかしナレッジグラフが適用されると、右側カードに次のように直接表示されます。「2023年ノーベル化学賞は、米国の科学者ジェニファー・ダウドナ(Jennifer Doudna)とフランスの科学者エマニュエル・シャルパンティエ(Emmanuelle Charpentier)に授与され、CRISPR遺伝子編集技術における画期的貢献が評価された。」
シナリオ比較
私たちは3種類の高頻度検索シーン(簡単な事実、企業情報、製品検索)を選び、従来検索とナレッジグラフにおけるユーザー行動の違いを比較しました(データ出典:Moz 2024ユーザー行動追跡、Google Search Console 2024企業向けレポート)。
シーン1:簡単な事実型検索(たとえば「アインシュタインの生没年」)
従来検索の行動チェーン(所要時間2分17秒):
ユーザーがキーワード入力 → Wikipedia(41%)/ ブリタニカ百科事典(23%)/ 科学普及ブログ(18%)をクリック → ページをスクロールして「生没年」を探す(平均3回スクロール) → 情報確認(たとえば「1879年3月14日-1955年4月18日」) → ページを閉じる(62%)または他リンクを閲覧継続(38%)。
ナレッジグラフの行動チェーン(所要時間23秒):
ユーザーがキーワード入力 → 右側カードを直接確認(89%) → 「生没年」「国籍」「主な貢献」を素早くスキャン(平均3つのフィールドを注視) → ページを閉じる(75%)または「さらに詳しく」をクリックしてWikipediaへ移動(15%)。
主な違い:
- クリック回数:1.8回(従来)から0回(ナレッジグラフの直接表示)へ減少
- 情報取得効率:「能動的選別」から「受動的受領」へ変わり、ユーザーは「どのリンクに答えがあるか」を判断する必要がない
- 直帰率:57%(従来)から25%(ナレッジグラフ)へ低下
シーン2:企業情報検索(たとえば「Apple本社」)
従来検索の行動チェーン(平均クリック数1.8回、直帰率57%):
ユーザーがキーワード入力 → Apple公式サイト(35%)/ Wikipedia(28%)/ テックメディア(たとえばTechCrunch、19%)をクリック → 公式サイトトップで「お問い合わせ」を探す(平均5回スクロール)またはWikipediaの「本社」欄を確認 → 住所確認(たとえば「米国カリフォルニア州クパチーノ」) → ページを閉じる(57%)または他リンクへ移動(43%)。
ナレッジグラフの行動チェーン(平均クリック数0.9回、直帰率39%):
ユーザーがキーワード入力 → カードを直接確認(72%) → 「本社」フィールドを注視(91%) → カード内の「公式サイト」ボタンをクリック(41%)して公式サイトへ直接移動、または「製品」ボタンをクリック(28%)してiPhone 15ページを表示。
主な違い:
- 情報探索コスト:「ページを5回スクロール」から「1フィールドを注視」へ低下
- 行動転換:カード内の「公式サイト」「製品」ボタンがユーザーを直接誘導し、従来検索の「トップページリンク」より遷移率が2.3倍高い(Google内部テスト)
- 意思決定の安心感:カードに「権威ある情報源」(たとえばWikipedia)が明示されると、情報への信頼度が44%向上する(Moz 2024調査)
シーン3:製品検索(たとえば「iPhone 15 開始価格」)
従来検索の行動チェーン(平均滞在時間2分05秒):
ユーザーがキーワード入力 → Apple公式サイト(42%)/ Amazon(25%)/ テックメディア(たとえばThe Verge、18%)をクリック → 公式サイトの「価格」ページで「iPhone 15」を探す(平均4回スクロール)またはAmazon商品ページで価格比較 → 開始価格を記録(たとえば「799ドル」) → ページを閉じる(68%)または価格比較を継続(32%)。
ナレッジグラフの行動チェーン(平均滞在時間28秒):
ユーザーがキーワード入力 → カードを直接確認(85%) → 「開始価格」「発売時期」フィールドを注視(89%) → カード内の「購入リンク」をクリック(65%)して公式サイトやAmazonへ直接移動、または「主要機能」をクリック(22%)してDynamic Islandなどの仕様を確認。
主な違い:
- 価格比較コスト:「3ページをまたいで比較」から「1枚のカードで完了」へ低減
- 購入判断速度:「10分以上」から「30秒以内」へ短縮され、注文率が31%向上(Eコマース分析プラットフォームStatista 2024)
- 情報の鮮度:カードは「開始価格」をリアルタイム更新するため(たとえば2024年のプロモーション変更)、情報の遅れによってユーザーが割引を逃すのを防ぐ
なぜナレッジグラフは速いのか
「情報過多」→「精密な絞り込み」
従来の検索結果ページには平均10本のリンクがあり、各リンクには500〜2000字のテキストが含まれています。しかし、ユーザーが必要とする重要情報(たとえば「本社」「開始価格」)は異なる段落、時には異なるリンクに分散している場合があります。
ナレッジグラフは構造化抽出+意味関連付けによって、重要情報を5〜8個のフィールドに凝縮するため、ユーザーは冗長なテキストの中から「針を探す」必要がありません。
たとえば「テスラ 2023年販売台数」を検索した場合、従来検索では「Q1販売42万台」「Q2販売46万台」「Q3販売43.5万台」とそれぞれ書かれたニュース3本を見なければ年間データをまとめられません。
一方、ナレッジグラフカードは直接「2023年世界販売台数184万台」と表示するため、ユーザーは3秒以内に完全な情報を得られます。
「意図の曖昧さ」→「精密な一致」
ユーザーは検索時に表現が曖昧なことが多く(たとえば「マスクの車」)、そのため従来検索ではマスクの個人伝記など無関係な結果が返される場合があります。
ナレッジグラフはエンティティ関連分析によって、「マスク」のコア関連エンティティ(テスラ、SpaceX)を特定し、ユーザー意図(「マスクが創業に関わった自動車メーカー」)を推論したうえで、最終的にテスラの製品情報を表示します。
Googleの2023年AI技術ホワイトペーパーによれば、ナレッジグラフの曖昧な検索語に対する理解精度は81%に達しています(従来検索は57%にすぎない)。その結果、「無関係な情報」によってユーザーがページを閉じる確率は42%から19%へ低下しました。
「信頼の欠如」→「権威による裏付け」
従来の検索結果では、ユーザーは情報の信頼性を判断しにくいです(たとえば、あるブログが「テスラの2023年販売台数は200万台」と書き、公式サイトが「184万台」と書いている場合)。
ナレッジグラフは複数情報源検証メカニズムによって、「少なくとも3つの権威ある情報源で一致した」情報だけを表示します(たとえば公式サイト、Wikipedia、業界データベース)。さらにカード内に「権威ある出典」(たとえば「データ出典:テスラ2023年年次報告書」)を明記することで、ユーザーの情報信頼度は58%向上します(Moz 2024ユーザー調査)。
ナレッジグラフはどのようにユーザー意図を「読み取る」のか
「キーワード一致」から「意味理解」へ
GoogleはBERTなどの事前学習モデルによって、ユーザー検索語の「意味的意図」を分析します。たとえば、「テスラ本社はどこか」の「本社」は「地理的位置」のニーズを意味し、「iPhone 15 開始価格」の「開始価格」は「価格」のニーズを意味します。
こうしたモデルは「暗黙の意図」も認識できます。たとえば、ユーザーが「マスクのロケット会社」を検索した場合、モデルは「マスク-創業者-SpaceX」を関連付け、「マスク」個人百科だけと単純一致することはありません。
Googleの2024年テストデータによると、意図認識モデルの精度は2019年の62%から2024年には89%へ向上しました。それに伴い、「意図不一致」によるユーザー離脱率は34%低下しました。
「非構造化テキスト」から「機械可読フィールド」へ
ナレッジグラフはNLP技術(たとえばエンティティ認識、属性抽出)によって、ウェブページ内の「非構造化テキスト」を「構造化フィールド」(たとえば「テスラ-本社-テキサス州」)へ変換します。
たとえば、ウェブページに「テスラの本社は米国テキサス州オースティン市にある」と書かれていれば、以下のように抽出されます。
- エンティティ:テスラ
- 属性:本社
- 値:テキサス州オースティン市
この抽出精度はエンティティのタイプによって異なります(企業情報92%、人物情報85%、製品情報88%)が、カード表示を支えるには十分なレベルに達しています(Google 2023年技術ホワイトペーパー)。
「静的結果」から「リアルタイム情報」へ
ナレッジグラフは「リアルタイムクロール+複数情報源検証」メカニズムを通じて、カード情報が現実と同期するよう保証します。たとえば、2023年にテスラが「本社をテキサス州へ移転する」と発表した後、Googleクローラーは2時間以内に公式サイト、Reuters、Bloombergの報道を取得し、情報の一貫性(公式サイトとReutersが一致)を確認したうえで、4時間以内に「テスラ」に関するすべての検索結果のナレッジグラフカードを更新しました。
Googleの2024年技術テストによると、注目度の高いエンティティ(たとえば世界500強企業)の情報更新周期は、従来の「週1回」から「時間単位」へ短縮されました。これにより、ユーザーが取得する情報の遅延は「3日」から「2時間」へ減少しました。
ナレッジグラフはどのように答えを「正確に出力する」のか
ユーザーが「2023年テスラ上海ギガファクトリー生産量」を検索した場合、Googleナレッジグラフカードは直接「2023年の上海工場生産量は125万台で、テスラ世界総生産能力の48%を占める」と表示できます。
技術原理
ナレッジグラフの核心は、ウェブページ内の段落や文といった「非構造化テキスト」を、「構造化データ」(たとえば「エンティティ-属性-値」のトリプル)へ変換し、さらに関係によって情報ネットワークを構築することにあります。
このプロセスは次の技術チェーンに依存しています(以下参照)。
ユーザー検索語 → Googleクローラーがウェブ全体のテキストを取得 → NLPモデルがエンティティを認識(たとえば「テスラ」) → 属性を抽出(たとえば「上海工場生産量」) → 他のエンティティと関連付け(たとえば「世界総生産能力」) → 複数情報源の一貫性を検証 → 構造化カードを生成 → ランキングして表示
技術ステップ
エンティティ認識(NER)
エンティティ認識はナレッジグラフの「出発点」であり、その核心は非構造化テキストの中から「命名エンティティ」(たとえば企業、人物、場所)を識別し、そのタイプをラベル付けすることです。
GoogleはBERTなどの事前学習モデルを用いてこのタスクを実行しており、その技術的詳細は次の通りです。
- モデル原理:BERT(Bidirectional Encoder Representations from Transformers)は双方向コンテキスト学習によって、「テスラ」が「テスラ上海工場」の中では「企業エンティティ」であり、「テスラコイル」の中では「科学概念」であることを理解し、エンティティタイプ(
OrganizationvsScientificConcept)を正確にラベル付けできます。 - 精度データ:Googleの2023年技術ホワイトペーパーによると、BERTモデルの企業エンティティ認識精度は92%(標準化された企業名に対して)に達し、複雑な文構造(たとえば「XXとYYが共同で創設した」)に対するエンティティ認識精度は85%です(「共同創設」は複数エンティティを含む可能性があるため)。
- 事例説明:ウェブページに「2003年、マーティン・エバーハードとマーク・ターペニングはパロアルトでテスラ・モーターズを設立した」と書かれている場合、BERTモデルは次のように認識します。
- エンティティ1:マーティン・エバーハード(
Person) - エンティティ2:マーク・ターペニング(
Person) - エンティティ3:テスラ・モーターズ(
Organization) - エンティティ4:パロアルト(
Location)
- エンティティ1:マーティン・エバーハード(
属性抽出
属性抽出の目標は、エンティティ間の意味関係を分析し、「属性-値」の組を抽出することです(たとえば「テスラ-設立時期-2003年」)。
Googleは「依存構文解析」と「ルールテンプレート」を組み合わせることでこのタスクを実現しています。
- 技術詳細:
- 依存構文解析:文中の語同士の文法関係を認識します(たとえば「設立する」は動詞、「テスラ」は目的語、「2003年」は時間副詞句)。これにより「テスラ-設立時期-2003年」を抽出します。
- ルールテンプレート:「設立時期」「本社」など高頻度属性に対して、「〜に設立された」「本社は〜にある」の後ろの内容を属性値とみなすルールを事前設定し、複雑な文構造におけるモデルの不足を補います。
- 精度データ:Googleの2024年内部テストでは、企業の「設立時期」に対する属性抽出精度は88%(標準化表現に対して)ですが、「創業者」のような曖昧な属性(たとえば「共同創業者」「初期投資家」)に対する精度は、表現が多様なため72%にとどまります。
- 事例説明:ウェブページに「2004年、イーロン・マスクはテスラに630万ドルを投資し、最大株主となった」と書かれている場合、依存構文解析は「投資する」を動詞、「テスラ」を目的語、「イーロン・マスク」を行為主体、「630万ドル」を金額として認識し、最終的に「テスラ-投資家-イーロン・マスク」「テスラ-資金調達額-630万ドル」という属性ペアを抽出します。
複数情報源による検証
複数情報源による検証はナレッジグラフの「品質検査段階」であり、その核心は同一エンティティの同一属性が少なくとも3つの権威ある情報源で一致していることを保証することです。
Googleは以下のルールによってこれを実現しています。
権威ある情報源のランク分け(下表参照):
| 情報源タイプ | 重み(信頼度) | 例 |
|---|---|---|
| 公式サイト | 90 | テスラ公式サイト(Tesla.com) |
| 権威ある百科事典 | 85 | Wikipedia(Tesla, Inc.の項目) |
| 政府/業界データベース | 80 | 米国SEC企業開示、Crunchbase |
| 高権威メディア | 70 | 《ニューヨーク・タイムズ》、TechCrunch |
| 個人ブログ/フォーラム | 30 | 個人技術ブログ、Redditディスカッションスレッド |
検証ロジック:
- 同一属性が3つ以上の権威ある情報源で一致している場合(誤差 ≤5%)、「高信頼度」とマークして収録する
- 2つの情報源だけが一致するか、または矛盾が存在する場合(たとえば公式サイトは「2003年設立」、Wikipediaは「2002年設立」)、「低信頼度」とマークして一時的に収録しない
- すべての情報源が互いに矛盾している場合、直ちに収録を拒否する
データ根拠:Googleの2023年《ナレッジグラフ収録ガイド》によると、属性の衝突が最も一般的な不採用理由(38%)であり、次いで「情報源の権威性不足(たとえば個人ブログのみ、25%)」、「マークアップ形式の誤り(たとえば日付形式エラー、19%)」が続きます。
時間単位の更新
- リアルタイムクロール:注目度の高いエンティティ(たとえば世界500強企業、人気製品)に対して、Googleクローラー(Googlebot)の取得頻度は従来の「週1回」から「1時間に1回」へ引き上げられています(Google 2024年検索アルゴリズム更新説明)。たとえば、2023年10月にテスラがCybertruckを発表した際、クローラーは発表会終了後15分以内に公式サイト、TechCrunch、Reutersのニュースリリースを取得しました。
- 高速検証:新情報は「複数情報源のクロス検証」を通過して初めて表示されます。たとえば、テスラ公式サイトが「2023年Q3納車台数43.5万台」と発表したとき、Googleは公式サイト(重み90%)、SEC 10-Q報告書(重み85%)、Bloomberg報道(重み70%)を同時に取得します。3者のデータが一致すれば(誤差 ≤2%)、即座に更新されます。
- 更新の即時性:Googleの2024年技術テストによると、注目度の高いエンティティの情報更新周期は平均4.2分(検証完了からカード公開まで)であり、一般エンティティでは18分です。たとえば、2023年ノーベル生理学・医学賞発表後、Googleは受賞者リスト確定から5分以内に「カタリン・カリコ」のカードを更新し、「2023年ノーベル賞受賞者」という属性を表示しました。
コンテンツをGoogleナレッジグラフに収録させるには
コンテンツをGoogleナレッジグラフに収録させるためには、次の3つの核心条件を満たす必要があります。
- Schema.orgでコア属性をマークアップすること(企業/人物/製品は名称、設立時期などのフィールドをマークする必要がある)
- 複数情報源の情報一致を保証すること(公式サイト、Wikipediaなど少なくとも3つの権威ある情報源で属性が矛盾しないこと)
- Googleツールによって検証すること(Google Search Consoleでインデックス状態を監視する)
データによれば、Schemaマークアップを使用している企業公式サイトは、未使用サイトより47%高い確率で収録されます(Moz 2024)。しかし属性衝突(たとえば公式サイトとWikipediaの「設立時期」の矛盾)は38%の不採用率を引き起こします(Google 2023)。
Schema.orgでコア属性をマークアップする
Googleはウェブページのテキストを直接「理解」できないため、Schema.org構造化データマークアップによって「これは誰か」「どんな属性を持つか」を明確にする必要があります。
Schema.orgは企業、人物、製品など1000種類以上のエンティティタイプをカバーする世界共通のマークアップ標準であり、ナレッジグラフ収録の「入場券」です。
異なるエンティティの「必須マークアップ属性」(下表参照)
| エンティティタイプ | コア必須属性(例) | マークアップの意味 | データ根拠(Google 2023) |
|---|---|---|---|
| 企業/組織 | name(名称)、foundingDate(設立時期)、headquarters(本社)、industry(業界) |
Googleが「企業の基盤情報」を識別する助けとなる | 82%の企業カードが前4つの属性を含む |
| 人物 | name(氏名)、birthDate(生年月日)、nationality(国籍)、jobTitle(職業) |
Googleが「人物の身元」を判断するのを補助する | 75%の人物カードが職業情報を表示している |
| 製品/サービス | name(名称)、releaseDate(発売時期)、brand(ブランド)、offers(提供機能) |
「製品情報の正確な表示」を支える | 68%の製品カードがブランド情報を含む |
操作例(企業公式サイトのマークアップ):
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“headquarters”: {
“@type”: “Place”,
“name”: “Austin, Texas, USA”
},
“industry”: “Electric Vehicles”
}
</script>
このマークアップは、Googleに対して「テスラは企業であり、2005年に設立され、本社はテキサス州オースティンにあり、電気自動車業界に属している」というコア情報を直接伝えます。
マークアップの「よくある落とし穴」
- 過剰マークアップ:すべての属性をマークする必要はありません(たとえば企業の「従業員数」は必須ではない)。ユーザーの高頻度ニーズに応じた「コア属性」(たとえば製品の「開始価格」)を優先的にマークすべきです。
- 形式エラー:日付は「YYYY-MM-DD」(たとえば「2003-04-01」)を使う必要があり、「2003/4/1」は不可です。座標は「緯度,経度」(たとえば「30.2672,-97.7431」)形式を使う必要があります。
- 多言語の衝突:公式サイトに複数言語版がある場合、各言語ごとに別々にマークアップする必要があります(たとえば英語版は
inLanguage: "en"を使用)。そうしないとGoogleが混同する可能性があります。
属性の完全性と関係の正確性
属性の完全性
Googleの2024年統計によると、8つ以上のコア属性をカバーするエンティティは、3属性しかカバーしないエンティティより62%高い確率で収録されます。
「企業」を例にすると、必須属性に加えて次の補足が推奨されます。
- ユーザー関心属性:
numberOfEmployees(従業員数)、foundingLocation(創立場所) - 動的属性:
latestRevenue(最新売上高)、notableProduct(代表製品) - 関連属性:
parentOrganization(親会社)、subsidiary(子会社)
事例:あるテック系スタートアップは「名称」と「設立時期」だけをマークしていたときは収録されませんでしたが、「従業員数」「CEO」「代表製品」を追加した後、3か月以内にナレッジグラフへ反映されました。
関係の正確性
関係はナレッジグラフの「骨格」であるため、エンティティ間の意味的関連(たとえば「創業者」「CEO」「製品」)を明確にする必要があります。
Googleは意味解析モデルによって関係の妥当性を検証しており、よくある誤りには次のようなものがあります。
- 関係タイプの誤り:「CEO」を「創業者」としてマークしてしまう場合(たとえばマスクはテスラのCEOだが、初期創業者はエバーハードである)
- 関係の混乱:「テスラ-製品-Model 3」はマークしているが、「Model 3-生産工場-上海ギガファクトリー」はマークしておらず、ユーザーが「Model 3はどこで生産されているか」を検索したときに関連付けできない場合
- 関係の冗長性:同じ関係を繰り返しマークする場合(たとえば「テスラ-創業者-エバーハード」を何度も記載)、Googleが評価を下げる可能性がある
情報源管理
Googleは情報の正確性に対して非常に高い要求を持っており、同一エンティティの同一属性は少なくとも3つの権威ある情報源で一致している必要があります。そうでなければ「低信頼度」とマークされます。
権威ある情報源のランク分け(下表参照)
| 情報源タイプ | 権威性(信頼度) | 例 | Google優先度 |
|---|---|---|---|
| 公式サイト | ★★★★★ | Tesla.com | 最高 |
| 権威ある百科事典 | ★★★★☆ | Wikipedia(Tesla, Inc.項目) | 高 |
| 政府/業界データベース | ★★★★ | 米国SEC企業開示、Crunchbase | 中高 |
| 高権威メディア | ★★★☆ | 《ニューヨーク・タイムズ》、TechCrunch | 中 |
| 個人ブログ/フォーラム | ★★ | 個人技術ブログ、Redditディスカッションスレッド | 低 |
情報源の矛盾をどう解決するか
異なる情報源間で属性が衝突している場合(たとえば公式サイトは「2003年設立」、Wikipediaは「2002年設立」)、Googleの処理ロジックは以下の通りです。
- ステップ1:権威ある情報源を優先して採用する(公式サイト > Wikipedia > メディア)
- ステップ2:権威ある情報源同士で矛盾する場合(たとえば公式サイトとWikipedia)、追加証明(たとえば企業登録証、財務報告書)の提出を求める
- ステップ3:30日以内に矛盾が解消されない場合、「低信頼度」とマークし、当面収録しない
ツール支援:Google Search Console
Google Search Console(GSC)は、Googleが公式に提供する「ナレッジグラフ収録監視ツール」であり、収録状態をリアルタイムで確認し、問題を点検できます。
主要機能:
- インデックス状態監視:「インデックス」→「カバレッジ」で、エンティティが収録されているかを確認(「インデックス済み」または「除外」と表示)
- リッチリザルトレポート:「リッチリザルト」で、ナレッジグラフカードの表示データ(たとえばクリック数、表示回数)を確認
- エラー診断:「エラー」で、マークアップエラー(たとえばSchema形式エラー)や情報源衝突(たとえば属性不一致の警告)を点検
最適化のヒント:
- 定期確認:毎週GSCにログインし、「リッチリザルト」の「未表示」理由(たとえば「属性不足」「情報源衝突」)を確認する
- データフィードバック:カード情報に誤りがある場合(たとえば「本社所在地」が誤表示される)、GSC経由で「データ修正リクエスト」を提出する
- 競合分析:競合ブランド名を検索し、そのナレッジグラフカードに表示されている属性を確認して、自社に不足しているコアフィールドを補完する
ナレッジグラフの時代はすでに到来しています。あなたのコンテンツは、より効率的に「見られる」価値があります――今すぐ行動を始めましょう。



