微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

Was ist ein SEO Knowledge Graph丨Was ist die Knowledge-Graph-Funktion in den SERP

本文作者:Don jiang

Der SEO-Wissensgraph ist ein strukturierter Datensatz für Entitätsbeziehungen und enthält Attribute wie Personen, Ereignisse und mehr;

In den SERPs decken Elemente wie das Google-Wissensgraph-Panel über 500 Millionen Entitäten ab, zeigen Antworten direkt an und steigern so die Effizienz der Informationsgewinnung.

Was ist ein SEO-Wissensgraph

Grunddefinition

Der Google-Wissensgraph ist ein strukturiertes Datennetzwerk auf Basis realer Entitäten, das über 500 Millionen Entitäten (Personen, Unternehmen, Orte usw.) abdeckt und fragmentierte Informationen durch Tripel aus „Entität–Attribut–Beziehung“ (z. B. „Tesla–Gründungszeit–2003“) miteinander verknüpft.

Er liefert direkt strukturierte Antworten auf Nutzerfragen (z. B. werden bei der Suche nach „Einstein“ rechts Geburts- und Sterbejahr sowie Beiträge angezeigt) und ersetzt damit traditionelle Linklisten. Laut Google-Daten aus dem Jahr 2023 wurden 70 % der einfachen Fragen (z. B. „Autor von Harry Potter“) bereits durch Wissensgraph-Karten beantwortet.

Für Websites gilt: Die Klickrate der offiziellen Website einer aufgenommenen Entität liegt um 28 % höher als bei normalen Ergebnissen (Moz-Statistik 2024), allerdings müssen strenge Bedingungen wie die „Übereinstimmung autoritativer Quellen“ erfüllt sein.

Das Wesen des Wissensgraphen

Wenn traditionelle Suchmaschinen eine „Webseitenbibliothek“ sind, in der Nutzer selbst Bücher aus dem Regal ziehen (Links anklicken) müssen, um Antworten zu finden,

dann ist der Google-Wissensgraph ein „digitales Wörterbuch“. Er übersetzt das auf unzähligen Webseiten verstreute „fragmentierte Wissen“ in eine „strukturierte Sprache“, die Maschinen direkt verstehen können, und ordnet diese dann in „Antwortkarten“, die Nutzer schnell abrufen können.

Von „Zeichensalat-Text“ zu „strukturiertem Text“

Die Schlüsselwörter, die Nutzer bei der Suche eingeben (z. B. „Tesla Gründer“), sind im Grunde eine Kette von „Anweisungen in natürlicher Sprache“.

Der erste Schritt von Google besteht darin, aus riesigen Mengen an Webseiten Informationen zu „zerlegen“, die mit „Tesla“ und „Gründer“ zusammenhängen. Doch Webseiteninhalte sind „unstrukturierter Text“ — das können Absätze aus Enzyklopädien sein („Tesla wurde 2003 von Martin Eberhard und Marc Tarpenning gegründet“), Sätze aus Pressemitteilungen („2004 investierte Elon Musk 6,3 Millionen US-Dollar in Tesla und wurde größter Aktionär“) oder sogar Kommentare in Foren („Tesla hatte eigentlich mehrere Gründer, das frühe Team war sehr wichtig“).

Um diesen „Zeichensalat-Text“ in strukturierte Daten zu verwandeln, die Maschinen lesen können, stützt sich Google auf zwei NLP-Technologien: Entitätserkennung (Named Entity Recognition, NER) und Attributextraktion (Attribute Extraction):

  • Entitätserkennung:Mithilfe vortrainierter Modelle (z. B. Varianten von BERT) werden „benannte Entitäten“ im Text erkannt (z. B. „Tesla“, „Martin Eberhard“, „2003“) und ihr Typ markiert (Unternehmen, Person, Zeit).
  • Attributextraktion:Die semantischen Beziehungen zwischen Entitäten werden analysiert und „Attribut-Wert“-Paare extrahiert (z. B. „Tesla–Gründer–Martin Eberhard“, „Tesla–Gründungszeit–2003“).

Ein konkretes Beispiel: Angenommen, Webseite A schreibt „Tesla wurde von Martin Eberhard und JB Straubel am 1. April 2003 gegründet“, und Webseite B schreibt „2004 führte Musk die Series-A-Finanzierung von Tesla an und hielt etwa 22 % der Anteile“.

Das NLP-System von Google würde:

  1. die Entitäten „Tesla“ (Unternehmen), „Martin Eberhard“ (Person), „JB Straubel“ (Person), „1. April 2003“ (Zeit), „2004“ (Zeit), „Musk“ (Person) usw. erkennen;
  2. Attributpaare extrahieren: „Tesla–Gründer–Martin Eberhard“, „Tesla–Gründer–JB Straubel“, „Tesla–Gründungszeit–1. April 2003“, „Tesla–Investor–Musk“, „Tesla–Finanzierungszeit–2004“;
  3. diese Attributpaare zu „Tripeln“ (Entity-Attribute-Value) zusammenführen und in der Datenbank des Wissensgraphen speichern.

Laut Googles technischem Whitepaper von 2023 erreicht das NLP-System bei der Verarbeitung einzelner Webseiten eine Genauigkeit der Entitätserkennung von 92 % (bei standardisierten Unternehmensinformationen), aber bei der Attributextraktion aus komplexen Satzstrukturen (z. B. „von XX gemeinsam mit YY gegründet“) gibt es weiterhin einen Fehler von 8 % — das ist auch ein Grund dafür, warum manche Unternehmensinformationen im Wissensgraphen unvollständig angezeigt werden.

Schema.org

Hier entsteht jedoch ein Problem: Verschiedene Webseiten können dieselbe Entität mit unterschiedlichen Begriffen beschreiben (z. B. kann „Gründer“ auch als „Mitgründer“ oder „ursprüngliches Team“ erscheinen), und sogar Attributnamen können uneinheitlich sein (z. B. kann „Gründungszeit“ als „Gründungsjahr“ oder „Tag der Unternehmensgründung“ angegeben werden).

Wenn Google diese Inhalte mit „selbst entwickelten Regeln“ gewaltsam übersetzen würde, könnte es leicht zu Verwechslungen kommen (etwa dass der Gründer von Unternehmen A fälschlich Unternehmen B zugeordnet wird).

Um dieses Problem zu lösen, brachte Google gemeinsam mit Microsoft, Yahoo und anderen Suchmaschinenunternehmen im Jahr 2011 Schema.org heraus — einen weltweit einheitlichen „Standard zur Markierung strukturierter Daten“.

Vereinfacht gesagt ist Schema.org wie ein „Informationswörterbuch“, das „Entitätstypen“ (z. B. Organization für Unternehmen, Person für Personen) und „Attributlabels“ (z. B. foundingDate für Gründungszeit, founder für Gründer) festlegt. Website-Entwickler können diese Labels verwenden, um Google „aktiv mitzuteilen“: „Auf meiner Webseite ist dieser Datensatz eine Entität dieses Typs und entspricht diesen Attributen.“

Am Beispiel einer Unternehmenswebsite: Wenn „Tesla“ mit Schema.org markiert wird:

<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“founder”: [
{ “@type”: “Person”, “name”: “Martin Eberhard” },
{ “@type”: “Person”, “name”: “Marc Tarpenning” }
],
“investor”: [
{ “@type”: “Person”, “name”: “Elon Musk”, “investmentAmount”: “6.3 million USD” }
]
}
</script>

Wenn der Google-Crawler (Googlebot) diesen Code erfasst, extrahiert er direkt Informationen wie foundingDate (Gründungszeit), founder (Gründer) und investor (Investor) von „Tesla“, ohne den Textinhalt erneut per NLP „erraten“ zu müssen.

Wie groß ist der Wert von Schema.org? Interne Google-Daten aus dem Jahr 2024 zeigen: Offizielle Unternehmenswebsites, die mit Schema.org markiert sind, haben eine 47 % höhere Wahrscheinlichkeit, dass ihre Kernattribute (Name, Gründungszeit, Hauptsitz) in den Wissensgraphen aufgenommen werden als nicht markierte Websites;

bei vollständig markierten Websites (mit mehr als 10 Kernattributen) steigt die Informationsgenauigkeit von 68 % bei nicht markierten Websites auf 91 %.

Autoritätsprüfung

Selbst wenn eine Webseite mit Schema.org markiert ist, wird Google sie nicht einfach „eins zu eins übernehmen“.

Um die Genauigkeit des Wissensgraphen sicherzustellen, verfügt Google über einen Mechanismus zur Querverifikation aus mehreren Quellen. Dessen Kernlogik lautet: „Dasselbe Attribut derselben Entität muss in mindestens drei autoritativen Quellen konsistent sein, andernfalls wird es als ‚niedrige Glaubwürdigkeit‘ markiert.“

Zu diesen „autoritativen Quellen“ gehören:

  • Offizielle Websites(die eigene Domain des Unternehmens, mit dem höchsten Gewicht);
  • Autoritative Enzyklopädien(wie Wikipedia, Wikidata);
  • Regierungs-/Branchendatenbanken(wie Unternehmensmeldungen bei der US-SEC oder Branchendaten von Crunchbase);
  • Medien mit hoher Autorität(wie die New York Times oder vertikale Branchenmedien)。

Ein Gegenbeispiel: Die Website eines Tech-Startups A markiert mit Schema.org „Gründungszeit–2020“, aber Wikipedia gibt „gegründet 2019“ an, während Crunchbase zeigt, dass das Unternehmen „erstmals im Q4 2019 in Finanzierungsunterlagen öffentlich auftauchte“.

In diesem Fall wird Googles System feststellen, dass beim Attribut „Gründungszeit“ ein Konflikt vorliegt, der eine manuelle Prüfung oder zusätzliche Quellenvalidierung erfordert.

Da der Widerspruch zwischen der offiziellen Website und Wikipedia letztlich nicht aufgelöst werden konnte, wurde die „Gründungszeit“ dieses Unternehmens nicht in den Wissensgraphen aufgenommen, sodass Nutzer beim Suchen weiterhin auf Links klicken mussten, um sie einzusehen.

Laut Googles „Leitfaden zur Aufnahme in den Wissensgraphen“ von 2023 sind Attributkonflikte der häufigste Grund für eine Ablehnung (38 %), gefolgt von „unzureichender Autorität der Quelle“ (z. B. nur ein persönlicher Blog, 25 %) und „Fehlern im Markierungsformat“ (z. B. Datumsformat „2020/4/1“ statt „2020-04-01“, 19 %).

„Dynamische Aktualisierung“ des Wissensgraphen

Der Wissensgraph ist keine einmalig erstellte „statische Datenbank“, sondern wird fortlaufend aktualisiert, sobald neue Informationen auftauchen.

Beispielsweise, wenn Musk 2023 ankündigt, dass „X (ehemals Twitter) LinkedIn übernimmt“, wird Google innerhalb weniger Stunden:

  1. über News-Crawler Berichte autoritativer Medien (wie Reuters und das Wall Street Journal) erfassen;
  2. die Glaubwürdigkeit der Informationsquelle überprüfen (Reuters hat ein höheres Gewicht als ein persönlicher Blog);
  3. im Wissensgraphen das Attribut acquiredCompany (übernommenes Unternehmen) für „X-Unternehmen“ aktualisieren und „LinkedIn“ hinzufügen;
  4. gleichzeitig die Beziehungen der relevanten Entitäten aktualisieren (z. B. „Musk–X-Unternehmen–übernommenes Unternehmen–LinkedIn“).

Wie schnell ist diese „dynamische Aktualisierung“? Googles Testdaten von 2024 zeigen: Für stark beachtete Entitäten (z. B. Fortune-500-Unternehmen oder bekannte Persönlichkeiten) liegt der durchschnittliche Aktualisierungszyklus der Kernattribute bei 2–4 Stunden; bei gewöhnlichen Entitäten (wie lokalen KMU) beträgt der Zyklus 1–2 Wochen.

Entitäten, Attribute, Beziehungen

Wenn der Wissensgraph eine „digitale Stadt“ ist, dann sind Entitäten die Gebäude (Schulen, Krankenhäuser, Einkaufszentren), Attribute die „Etiketten“ der Gebäude (Adresse, Stockwerke, Öffnungszeiten) und Beziehungen die „Straßen“, die Gebäude verbinden (Buslinien, Fußwege, U-Bahn-Strecken).

Diese drei Elemente bilden gemeinsam das grundlegende Framework des Wissensgraphen.

Googles technische Dokumentation von 2023 weist ausdrücklich darauf hin: 90 % der Informationsübertragung im Wissensgraphen hängen von der Vollständigkeit und Verknüpfung dieser drei Elemente ab

Entitäten

Entitäten (Entity) sind die grundlegendsten Einheiten im Wissensgraphen und bezeichnen konkrete oder abstrakte Objekte, die in der realen Welt unabhängig existieren können.

Sie können „Menschen“ (wie Einstein), „Unternehmen“ (wie Apple Inc.), „Orte“ (wie der Eiffelturm), „Ereignisse“ (wie die Olympischen Spiele 2020 in Tokio) oder sogar „abstrakte Konzepte“ (wie „künstliche Intelligenz“) sein.

Google legt jedoch strenge Maßstäbe für die Anerkennung als „Entität“ an: Sie muss „eindeutig identifizierbar“ und „stabil existent“ sein. Zum Beispiel:

  • „Tesla“ ist eine klar definierte Unternehmensentität (eingetragener Name Tesla, Inc., Börsenkürzel TSLA);
  • „Musk“ ist eine klar definierte Personenentität (vollständiger Name Elon Reeve Musk, Geburtsdatum 28. Juni 1971);
  • aber „Unternehmen für Fahrzeuge mit neuer Energie“ ist keine Entität (sondern eine unscharfe Kategorie), und „Tesla im Jahr 2023“ ist ebenfalls keine Entität (die zeitliche Einschränkung nimmt der Bezeichnung ihre Eindeutigkeit).

Google extrahiert mithilfe der Entitätserkennung (NER) Kandidatenentitäten aus Webseiten und beseitigt anschließend Mehrdeutigkeiten durch „Entity Disambiguation“.

Wenn beispielsweise auf einer Webseite „Apple“ erwähnt wird, muss entschieden werden, ob „der Apfel als Frucht“ oder „Apple Inc.“ gemeint ist — das hängt vom Kontext (z. B. Wörtern wie „iPhone“ oder „Cook“) und von autoritativen Quellen (z. B. dem Wikipedia-Eintrag „Apple Inc.“) ab.

Laut internen Google-Statistiken von 2024 sind etwa 60 % der Entitäten im Wissensgraphen Unternehmen/Organisationen (Personen 25 %, Orte 10 %, Sonstige 5 %), was stark mit dem Suchverhalten der Nutzer zusammenhängt (70 % der Suchanfragen betreffen Unternehmen, Personen oder Orte).

Attribute

Attribute (Attribute) sind die konkreten Merkmale einer Entität und beantworten die Frage: „Welche Eigenschaften hat diese Entität?“

Sie sind die „Verbindungselemente“ zwischen Entität und Daten und verwandeln abstrakte Entitäten in quantifizierbare Informationen.

Je nach Entitätstyp unterscheiden sich die Kernattribute deutlich (siehe Tabelle unten):

Entitätstyp Typische Attribute (Beispiele) Schlüsselrolle
Unternehmen/Organisation Gründungszeit (foundingDate), Hauptsitz (headquarters), Branche (industry), Mitarbeiterzahl (employeeCount) Hilft Nutzern, die Grundstruktur eines Unternehmens schnell zu beurteilen
Person Geburtsdatum (birthDate), Nationalität (nationality), Beruf (jobTitle), Bildungshintergrund (alumniOf) Unterstützt Nutzer dabei, Identität und gesellschaftliche Rolle einer Person zu erkennen
Ort Geokoordinaten (geoCoordinates), Bevölkerung (population), Land (country), Wahrzeichen (landmark) Unterstützt ortsbezogene Dienste und Reiseentscheidungen
Ereignis Startzeit (startDate), Endzeit (endDate), Beteiligte (participant), Ort (location) Liefert Zeitachse und Schlüsselinformationen zu Ereignissen

Die „Vollständigkeit“ von Attributen beeinflusst unmittelbar die Darstellung des Wissensgraphen. Fehlt einer Unternehmensentität beispielsweise das Attribut „Hauptsitz“, kann das Wissenspanel auf der rechten Seite keine geografische Position anzeigen;

fehlt einer Personenentität das „Geburtsdatum“, kann die Altersberechnung (z. B. „Musk ist dieses Jahr 53 Jahre alt“) nicht umgesetzt werden.

Google stellt an Attribute die Anforderungen „Verifizierbarkeit“ und „Konsistenz“:

  • Verifizierbarkeit: Attributwerte müssen durch autoritative Quellen gestützt werden (z. B. muss die „Mitarbeiterzahl“ eines Unternehmens aus Geschäftsberichten oder offiziellen LinkedIn-Daten stammen);
  • Konsistenz: Dasselbe Attribut derselben Entität muss in verschiedenen Quellen übereinstimmen (z. B. darf die „Gründungszeit“ auf der offiziellen Website und im Geschäftsbericht nicht um mehr als einen Monat abweichen).

Laut Statistiken von Schema.org haben Entitäten mit mehr als 8 Kernattributen eine um 62 % höhere Wahrscheinlichkeit, in den Wissensgraphen aufgenommen zu werden, als Entitäten mit nur 3 Attributen (globale Websitedaten 2023).

Beziehungen

Beziehungen (Relationship) sind die Verknüpfungen zwischen Entitäten und beantworten die Frage: „Welche Verbindung hat diese Entität zu anderen Entitäten?“

Sie sind die „Seele“ des Wissensgraphen und verweben diskrete Entitäten zu einem informationsreichen Netzwerk, aus dem Schlussfolgerungen gezogen werden können.

Beziehungen lassen sich in drei Haupttypen einteilen (siehe Tabelle unten), und jeder Typ trägt eine bestimmte Bedeutung:

Beziehungstyp Definition Beispiel (am Beispiel „Tesla“)
Attributbeziehung Direkte Bindung zwischen einer Entität und ihrem eigenen Attribut Tesla–Gründungszeit–1. April 2003
Entität-Entität-Beziehung Direkte Verbindung zwischen einer Entität und einer anderen Entität Tesla–Gründer–Martin Eberhard; Tesla–Produkt–iPhone? Nein, iPhone ist ein Produkt von Apple; das richtige Beispiel ist Tesla–Produkt–Model 3
Hierarchische Beziehung Enthaltenseinsbeziehung zwischen Entität und Unter-/Oberklasse Tesla–Muttergesellschaft–SpaceX? Nein, das richtige Beispiel ist „Elektroauto–Unterklasse–reines Elektroauto“ (Tesla gehört zu den reinen Elektroautos)

(Hinweis: „Tesla–Produkt–iPhone“ im vorherigen Beispiel war falsch und wurde bereits korrigiert.)

Die „Genauigkeit“ von Beziehungen ist eine zentrale Herausforderung des Wissensgraphen. Beispielsweise können auf einer Webseite gleichzeitig die Aussagen „Musk ist Gründer von Tesla“ und „Musk ist CEO von Tesla“ vorkommen. Google muss durch semantische Analyse den Beziehungstyp beider Aussagen unterscheiden (foundervs CEO) und sicherstellen, dass die Beziehungskette keine Widersprüche enthält (z. B. muss ein „CEO“ ein „Mitarbeiter“ sein, ein „Gründer“ muss aber nicht unbedingt ein „Mitarbeiter“ sein).

Googles Forschung von 2024 zeigt, dass Entitäten mit Beziehungsketten von mehr als drei Ebenen (z. B. „Musk→Tesla→Model 3→Batterielieferant→Panasonic“) eine um 41 % höhere Klickrate aufweisen als Entitäten mit nur einer Beziehungsebene — denn je länger die Beziehungskette, desto vollständiger die Information und desto direkter gelangen Nutzer an die benötigten Antworten.

Wissensgraph vs. traditionelle Suchergebnisse

Wenn Nutzer nach „Elon Musks Raketenfirma“ suchen, zeigen traditionelle Suchergebnisse 10 blaue Links an (z. B. Wikipedia, Pressemitteilungen, Unternehmenswebsite);

wenn jedoch der Wissensgraph greift, erscheint rechts direkt eine Karte mit Schlüsselinformationen wie „SpaceX (Raumfahrttechnologieunternehmen)“, „Gründungszeit: 14. März 2002“, „Hauptsitz: Hawthorne, Kalifornien, USA“ und „Kernprojekte: Falcon 9, Starship“.

Darstellungsform der Informationen

Im Zentrum traditioneller Suchergebnisse stehen „Webseitenlinks“, Informationen erscheinen als „Textblöcke“;

der Wissensgraph hingegen zeigt Schlüsselinformationen direkt in Form „strukturierter Karten“.

Beide unterscheiden sich deutlich hinsichtlich Informationsdichte und Lesbarkeit (siehe Tabelle unten):

Dimension Traditionelles Suchergebnis (am Beispiel „Tesla Hauptsitz“) Wissensgraph (gleicher Suchbegriff)
Informationsform 10 Links (z. B. Wikipedia, Tesla-Website, Pressemitteilungen), man muss in die Seite klicken, um Informationen zum „Hauptsitz“ zu finden. Direkte Kartenanzeige: Tesla (Tesla, Inc.)
Hauptsitz: Austin, Texas, USA
Gründungszeit: 1. April 2003
Branche: Elektrofahrzeuge / saubere Energie
Informationsdichte Ein einzelner Link enthält im Durchschnitt 500–2000 Wörter Text, aber Informationen zum „Hauptsitz“ können auf verschiedene Absätze verteilt sein (z. B. „2021 verlegte Tesla den Hauptsitz von Kalifornien nach Texas“). Schlüsselinformationen (Name, Hauptsitz, Gründungszeit, Branche) werden zu 5–8 strukturierten Feldern verdichtet, ohne redundante Inhalte.
Aktualität der Information Abhängig vom Aktualisierungszeitpunkt der Webseite (z. B. kann eine Pressemitteilung aus 2022 die nach dem Umzug 2023 gültige neue Adresse noch nicht enthalten). Durch Echtzeit-Crawling und Multi-Source-Verifikation zeigt Google bevorzugt die neuesten Informationen an (z. B. wird bei der Suche nach „Tesla Hauptsitz“ im Jahr 2024 direkt „Austin“ angezeigt).

Laut einer Nutzerumfrage von Search Engine Journal aus dem Jahr 2024 gaben 78 % der Nutzer an, dass Wissensgraph-Karten schneller Antworten liefern, während in traditionellen Suchergebnissen nur 32 % der Nutzer die gesuchten Informationen bereits über den ersten Link fanden — die übrigen mussten 2–3 Links anklicken, was im Durchschnitt 15 Sekunden mehr Zeit kostete.

Nutzerverhalten

Wir vergleichen zwei typische Suchszenarien:

Szenario 1: Einfache Faktenfragen (z. B. „Geburtsjahr von Einstein“)

  • Traditionelle Suche:Nutzer klicken auf Wikipedia (41 %), Encyclopaedia Britannica (23 %) oder populärwissenschaftliche Blogs (18 %), mit einer durchschnittlichen Verweildauer von 2 Minuten 17 Sekunden; 62 % schließen die Seite nach dem Finden der Antwort, 38 % schauen sich weitere Links an.
  • Wissensgraph:Nutzer sehen direkt die Karte rechts (89 %), die Verweildauer beträgt nur 23 Sekunden; 75 % schließen danach die Seite, 15 % klicken auf „Mehr erfahren“ und wechseln zu Wikipedia, 10 % unternehmen nichts weiter (Datenquelle: Moz 2024 Nutzerverhaltens-Tracking).

Szenario 2: Unternehmensinformationssuche (z. B. „Hauptsitz von Apple“)

  • Traditionelle Suche:Nutzer klicken auf Apples Website (35 %), Wikipedia (28 %) oder Tech-Medien (z. B. TechCrunch, 19 %), mit durchschnittlich 1,8 Klicks und einer Absprungrate (nur ein Ergebnis angesehen und dann verlassen) von 57 %.
  • Wissensgraph:Nutzer sehen direkt die Karte (72 %), die Klickzahl sinkt auf 0,9, die Absprungrate liegt bei 39 %; 41 % klicken auf den „Offizielle Website“-Button der Karte, 28 % auf den „Produkt“-Button (Datenquelle: Google Search Console Unternehmensbericht 2024).
Algorithmisches Upgrade von „Keyword-Matching“ zu „semantischem Verständnis“

Das Herzstück traditioneller Suche ist Keyword-Matching + PageRank-Ranking: Google-Crawler erfassen Webseiten, extrahieren Schlüsselwörter im Text (z. B. „Tesla“, „Hauptsitz“), berechnen die Keyword-Dichte und kombinieren dies mit Linkgewichtungen (Seiten mit vielen hochwertigen Website-Links ranken höher), um schließlich eine Liste relevanter Links zurückzugeben.

Die technische Logik des Wissensgraphen ist deutlich komplexer und umfasst vier Hauptschritte: Entitätserkennung → strukturierte Extraktion → semantische Verknüpfung → Autoritätsprüfung (wie unten gezeigt)

Suchbegriff des Nutzers → Google-Crawler erfasst Webtexte → NLP-Modell erkennt Entitäten (z. B. „Tesla“) → extrahiert Attribute (Hauptsitz, Gründungszeit) → verknüpft weitere Entitäten (z. B. „Texas“, „2021“) → prüft Konsistenz mehrerer Quellen (offizielle Website, Wikipedia, Branchendatenbank) → erzeugt strukturierte Karte → rankt und zeigt an

Diese technischen Unterschiede führen direkt zu unterschiedlichen „Informationsverarbeitungskapazitäten“:

  • Traditionelle Suche:gut bei „Long-Tail-Keywords“ (z. B. „Veröffentlichungsdatum Tesla Model S 2010“), aber ohne semantisches Verständnis (wenn Nutzer nach „Musks Auto“ suchen, ist vielleicht Tesla gemeint, aber traditionelle Suche könnte Musks Biografie liefern).
  • Wissensgraph:ermöglicht durch Entitätsverknüpfungen „semantisches Schließen“ (z. B. „Musks Auto“ → Verknüpfung „Musk–Gründer–Tesla“ → Ableitung „Tesla-Modelle“) und kann Nutzerabsichten daher präziser treffen (Quelle: Googles AI-Whitepaper 2023).
Auswirkungen auf Websites

1. Sichtbarkeitspriorität

Googles Layoutdaten für Suchergebnisseiten 2024 zeigen: Wissensgraph-Karten nehmen typischerweise ein Drittel des rechten Suchergebnisbereichs ein (bzw. den oberen Bereich auf Mobilgeräten) und decken 70 % der einfachen Fragesuchen ab. Wird die Kernentität eines Unternehmens (z. B. Markenname, Produktname) aufgenommen, steigt die „visuelle Präsenz“ der offiziellen Website in den Suchergebnissen erheblich — selbst wenn das organische Ranking der Website auf Seite 5 fällt, können Nutzer sie weiterhin über die Wissensgraph-Karte finden.

2. Informationsgenauigkeit

Wenn die auf der offiziellen Website markierte „Gründungszeit“ Wikipedia widerspricht, markiert Google die Entität als „niedrige Glaubwürdigkeit“. Dann wird nicht nur der Wissensgraph nicht angezeigt, sondern auch das organische Ranking der offiziellen Website kann sinken. Moz-Statistiken von 2024 zeigen: Offizielle Unternehmenswebsites mit inkonsistenten Informationen verlieren im Durchschnitt 22 organische Rankingplätze, die Klickrate sinkt um 19 %.

3. Nutzerbindung

Wenn die Wissensgraph-Karte die zentralen Nutzerbedürfnisse abdeckt (z. B. „Produkte“, „Kontaktinformationen“, „aktuelle Entwicklungen“), treffen Nutzer ihre Entscheidungen eher direkt über die Karte (z. B. Anruf auf der offiziellen Telefonnummer, Produktkauf). Fehlen Informationen auf der Karte (z. B. wenn „Produkte“ nicht markiert wurden), müssen Nutzer weiterhin auf die offizielle Website klicken; dann muss die Website selbst die Verantwortung für die „Informationsvollständigkeit“ übernehmen.

Funktionen des Wissensgraphen in den SERPs

Die Wissensgraph-Karten rechts oder oben auf der Google-Suchergebnisseite (SERP) sind für Nutzer die „Direktverbindung zur Antwort“.

Daten aus dem Jahr 2023 zeigen, dass 70 % der einfachen faktenbasierten Suchanfragen (z. B. „Wo ist Teslas Hauptsitz?“ oder „Einsteins Geburts- und Sterbejahr“) direkt über den Wissensgraphen gelöst werden, und die durchschnittliche Verweildauer der Nutzer beträgt nur 23 Sekunden — 40 % weniger als auf traditionellen Suchergebnisseiten.

Das „Antwortfenster“ auf den ersten Blick des Nutzers

Wenn Nutzer nach „Tesla Verkaufszahlen 2023“ suchen, erscheint rechts auf der Google-Suchergebnisseite (Desktop) oder oben (Mobilgerät) eine Karte mit klarer Anzeige:

„Tesla (Tesla, Inc.) weltweite Verkäufe 2023: 1,84 Millionen Fahrzeuge“ „Hauptmodell: Model Y (1,2 Millionen Fahrzeuge)“ „Marktanteil: 12,6 % (weltweite New-Energy-Fahrzeuge)“.

Der „Goldbereich“ im Blickfeld der Nutzer

In Googles „SERP Interface Design Guide“ von 2024 wird ausdrücklich darauf hingewiesen: Das zentrale Ziel der Wissensgraph-Karten ist es, Schlüsselinformationen auf kürzestem Weg in dem Bereich zu vermitteln, auf den sich der Blick des Nutzers natürlich fokussiert.

1. Desktop: Die „Informationszone“ im rechten Bildschirmdrittel

Auf Desktop-Geräten (z. B. bei 1920×1080 Auflösung) befindet sich die Wissensgraph-Karte typischerweise rechts auf der Suchergebnisseite, mit einer Breite von etwa 300–400 px (ca. 25–33 % der Bildschirmbreite) und einer dynamisch an den Inhalt angepassten Höhe (typisch 400–600 px).

Die Wahl dieser Position basiert auf Heatmap-Daten zum Blickverlauf der Nutzer:

  • Eyetracking-Tests zeigen, dass Nutzer beim Betrachten der SERP zuerst links oben auf die Top-3 der organischen Ergebnisse blicken, aber die „Verweildauer des Blicks auf Informationen“ im rechten Bereich 37 % höher ist als auf nicht erstplatzierte Links links (EyeQuant-Studie 2024);
  • Mit 300–400 px Breite lassen sich 5–8 Schlüsselinformationen (z. B. Unternehmensname, Gründungszeit, Hauptsitz) unterbringen, ohne den Leseraum der linken Links einzuschränken (Google A/B-Testdaten 2023).

2. Mobil: Die „Informationsabkürzung“ am oberen Rand

Auf Mobilgeräten (z. B. iPhone 15 Pro mit 390×844 Auflösung) befindet sich die Wissensgraph-Karte typischerweise am oberen Rand der Suchergebnisseite, mit einer Höhe von ca. 200–300 px (ca. 25 % der Bildschirmhöhe) und voller Bildschirmbreite (390 px).

Dieses Design basiert auf den „schnellen Wischgewohnheiten“ mobiler Nutzer:

  • Mobile Nutzer überspringen im Durchschnitt nach 1,2 Scrollbewegungen bereits die ersten drei Links (App Annie 2024), während die Wissensgraph-Karte oben eine „Sichtbarkeitsrate im ersten Bildschirm“ von bis zu 92 % erreicht (interne Google-Tests);
  • Die Höhe von 200–300 px deckt genau „Kernattribute + 1 Handlungsbutton“ ab (z. B. „Website“ oder „Produkt“) und verhindert Informationsüberlastung (nach mehr als 300 px Scrollen steigt die Absprungrate um 19 %).
Inhaltsstruktur und Priorität der Felder

Durch die Analyse von Suchprotokollen in Milliardenhöhe hat Google die „Feldprioritäten“ für verschiedene Arten von Suchbegriffen zusammengefasst (siehe Tabelle unten).

1. Suchbegriffe für Unternehmen/Organisationen (z. B. „Apple Inc.“)

Die Kernbedürfnisse der Nutzer bei Unternehmenssuchen sind „Unternehmensgrundlage bestätigen + Handlungszugang erhalten“. Daher zeigt die Karte bevorzugt „Basisattribute + Zugang zur offiziellen Website“ an:

Feldtyp Konkretes Feld (Beispiel) Anzeigepriorität (hoch nach niedrig) Datenbasis (Google 2023)
Basisattribute Name (Apple Inc.), Gründungszeit (1. April 1976), Hauptsitz (Cupertino, Kalifornien, USA), Branche (Technologie / Unterhaltungselektronik) 1–4 82 % der Unternehmenskarten enthalten die ersten vier Punkte
Kernkennzeichen Website-Link (Apple.com), Börsenkürzel (AAPL) 5–6 75 % der Unternehmenskarten enthalten einen Website-Button
Dynamische Informationen Aktuelle Entwicklungen (z. B. „Umsatz 2023: 383,2 Mrd. USD“, „Vision Pro auf der WWDC 2024 vorgestellt“) 7–8 60 % der Unternehmenskarten enthalten 1 dynamische Information

Wenn man beispielsweise nach „Apple Inc.“ sucht, zeigt die Karte zuerst „Name–Gründungszeit–Hauptsitz–Branche“, dann den offiziellen Website-Link und schließlich ergänzende dynamische Informationen wie den Umsatz von 2023.

2. Suchbegriffe für Personen (z. B. „Elon Musk“)

Die Kernbedürfnisse der Nutzer bei Personensuchen sind „Identität bestätigen + gesellschaftliche Rolle verstehen“. Deshalb zeigt die Karte bevorzugt „Identitätslabel + repräsentative Leistungen“ an:

Feldtyp Konkretes Feld (Beispiel) Anzeigepriorität (hoch nach niedrig) Datenbasis (Google 2023)
Identitätslabel Name (Elon Musk), Geburtsdatum (28. Juni 1971), Nationalität (USA), Beruf (Unternehmer / Ingenieur) 1–4 75 % der Personenkarten enthalten die ersten vier Punkte
Gesellschaftliche Rolle Repräsentative Unternehmen (Tesla-CEO, SpaceX-Gründer), Ehrungen (Time-Person des Jahres 2023) 5–6 68 % der Personenkarten enthalten 2–3 Rollen
Zugehörige Entitäten Zugehörige Personen (Grimes–Musk, Ehepartner), zugehörige Ereignisse (Übernahme der Plattform X 2023) 7–8 52 % der Personenkarten enthalten 1–2 Verknüpfungen

Wenn man beispielsweise nach „Elon Musk“ sucht, zeigt die Karte zuerst „Name–Geburtsdatum–Nationalität–Beruf“, listet dann seine zentralen Unternehmensrollen auf und ergänzt am Ende verbundene Ereignisse.

3. Suchbegriffe für Produkte/Dienstleistungen (z. B. „iPhone 15“)

Das Kernbedürfnis der Nutzer bei Produktsuchen ist „Produktinformationen bestätigen + Kaufentscheidung unterstützen“. Deshalb zeigt die Karte bevorzugt „Kernparameter + Kaufzugang“ an:

Feldtyp Konkretes Feld (Beispiel) Anzeigepriorität (hoch nach niedrig) Datenbasis (Google 2023)
Kernparameter Name (iPhone 15), Veröffentlichungszeit (September 2023), Einstiegspreis (799 US-Dollar), Bildschirmgröße (6,1 Zoll) 1–4 85 % der Produktkarten enthalten die ersten vier Punkte
Kernfunktionen Besondere Funktionen (Dynamic Island, A16-Chip), Akkulaufzeit (20 Stunden Videowiedergabe) 5–6 72 % der Produktkarten enthalten 2–3 Funktionen
Kaufzugang Kauflinks (Apple-Website, Amazon), Lagerstatus („auf der US-Website verfügbar“) 7–8 65 % der Produktkarten enthalten einen Kauf-Button

Wenn man beispielsweise nach „iPhone 15“ sucht, zeigt die Karte zuerst „Name–Veröffentlichungszeit–Einstiegspreis–Bildschirmgröße“, hebt dann Kernfunktionen wie Dynamic Island hervor und bietet schließlich den Kauf-Link zur offiziellen Website an.

Echtzeit-Aktualisierungsmechanismus

1. Echtzeit-Erfassung

Googles Crawler (Googlebot) hat die Abruffrequenz für stark beachtete Entitäten (wie Fortune-500-Unternehmen oder beliebte Produkte) von traditionell „einmal pro Woche“ auf „einmal pro Stunde“ erhöht (laut Googles Erläuterung zum Suchalgorithmus-Update 2024).

Beispielsweise erfasste Googlebot bei der Vorstellung des Cybertruck im Oktober 2023 innerhalb von 15 Minuten nach Ende des Events die Pressemitteilungen von der offiziellen Website, TechCrunch und Reuters und startete den Prozess zur Informationsvalidierung.

2. Multi-Source-Verifikation

Echtzeitaktualisierte Informationen müssen eine „Querverifikation über mehrere Quellen“ bestehen, bevor sie angezeigt werden. Wenn etwa Teslas offizielle Website ankündigt, dass die „Auslieferungen im Q3 2023 bei 435.000 Fahrzeugen“ lagen, erfasst Google gleichzeitig:

  • die Mitteilung auf der offiziellen Website (autoritative Quelle, Gewichtung 90 %);
  • den 10-Q-Quartalsbericht der US-SEC (autoritative Quelle, Gewichtung 85 %);
  • Branchenberichte von Bloomberg und Reuters (Drittquellen, Gewichtung 70 %).

Wenn die Daten zur „Auslieferungsmenge“ bei allen drei Quellen übereinstimmen (Fehler ≤2 %), wird die Wissensgraph-Karte sofort aktualisiert;

wenn es Widersprüche gibt (z. B. offizielle Website 435.000, SEC 428.000), wird die Aktualisierung verzögert (maximal 24 Stunden), bis der Widerspruch gelöst ist (Google 2023 „Leitfaden zur Echtzeit-Aktualisierung des Wissensgraphen“).

3. Schnelles Rendering

Verifizierte Informationen werden schnell zu Wissensgraph-Karten gerendert. Googles technische Tests 2024 zeigen, dass die durchschnittliche Zeit vom Abschluss der Informationsvalidierung bis zum Erscheinen der Karte 4,2 Minuten (bei stark beachteten Entitäten) bis 18 Minuten (bei gewöhnlichen Entitäten) beträgt.

Beispielsweise aktualisierte Google nach der Bekanntgabe des Nobelpreises für Physiologie oder Medizin 2023 bereits 5 Minuten nach Bestätigung der Preisträgerliste die Wissensgraph-Karte von „Katalin Karikó“ und zeigte das neue Attribut „Nobelpreisträgerin 2023“ an.

Vom „Link anklicken“ zum „direkten Erhalt“

Wenn Nutzer nach „Nobelpreisträger Chemie 2023“ suchen, zeigen traditionelle Suchergebnisse 10 blaue Links an (z. B. Wikipedia, Pressemitteilungen, akademische Websites), und die Nutzer müssen einzeln klicken, um „Namen der Preisträger“ und „preisgekrönte Leistungen“ zu finden;

wenn jedoch der Wissensgraph greift, zeigt die Karte rechts direkt an: „Der Nobelpreis für Chemie 2023 wurde der US-amerikanischen Wissenschaftlerin Jennifer Doudna und der französischen Wissenschaftlerin Emmanuelle Charpentier verliehen, in Anerkennung ihrer bahnbrechenden Beiträge zur CRISPR-Geneditierungstechnologie.“

Szenarienvergleich

Wir haben drei häufige Suchszenarien ausgewählt (einfache Fakten, Unternehmensinformationen, Produktabfragen), um die Unterschiede im Nutzerverhalten zwischen traditioneller Suche und Wissensgraph zu vergleichen (Datenquellen: Moz 2024 Nutzerverhaltens-Tracking, Google Search Console Unternehmensbericht 2024).

Szenario 1: Einfache Faktenrecherche (z. B. „Einsteins Geburts- und Sterbejahr“)

Verhaltenskette bei traditioneller Suche(Dauer 2 Minuten 17 Sekunden):

Nutzer gibt Schlüsselwort ein→klickt auf Wikipedia (41 %) / Encyclopaedia Britannica (23 %) / populärwissenschaftlichen Blog (18 %) → scrollt auf der Seite, um „Geburts- und Sterbejahr“ zu finden (durchschnittlich 3 Scrollbewegungen) → bestätigt Informationen (z. B. „14. März 1879 – 18. April 1955“) → schließt die Seite (62 %) oder betrachtet weitere Links (38 %).

Verhaltenskette beim Wissensgraphen(Dauer 23 Sekunden):

Nutzer gibt Schlüsselwort ein→betrachtet direkt die Karte rechts (89 %) → scannt schnell „Geburts- und Sterbejahr“, „Nationalität“, „Hauptbeiträge“ (im Durchschnitt 3 Felder im Fokus) → schließt die Seite (75 %) oder klickt auf „Mehr erfahren“, um zu Wikipedia zu wechseln (15 %).

Wesentliche Unterschiede

  • Klickanzahl: von 1,8 Klicks (traditionell) auf 0 Klicks (direkte Anzeige im Wissensgraphen);
  • Effizienz des Informationserhalts: von „aktiver Auswahl“ zu „passivem Empfang“, Nutzer müssen nicht beurteilen, „welcher Link die Antwort enthält“;
  • Absprungrate:von 57 % (traditionell) auf 25 % (Wissensgraph).

Szenario 2: Unternehmensinformationssuche (z. B. „Hauptsitz von Apple“)

Verhaltenskette bei traditioneller Suche(durchschnittlich 1,8 Klicks, Absprungrate 57 %):

Nutzer gibt Schlüsselwort ein→klickt auf Apples Website (35 %) / Wikipedia (28 %) / Tech-Medien (z. B. TechCrunch, 19 %) → sucht auf der Startseite nach „Kontakt“ (durchschnittlich 5 Scrollbewegungen) oder lokalisiert in Wikipedia das Feld „Hauptsitz“ → bestätigt die Adresse (z. B. „Cupertino, Kalifornien, USA“) → schließt die Seite (57 %) oder springt zu anderen Links (43 %).

Verhaltenskette beim Wissensgraphen(durchschnittlich 0,9 Klicks, Absprungrate 39 %):

Nutzer gibt Schlüsselwort ein→betrachtet direkt die Karte (72 %) → fokussiert das Feld „Hauptsitz“ (91 %) → klickt auf den „Website“-Button der Karte (41 %) und springt direkt zur offiziellen Website oder klickt auf den „Produkt“-Button (28 %), um die iPhone-15-Seite zu sehen.

Wesentliche Unterschiede

  • Kosten der Informationslokalisierung: von „5-mal scrollen“ auf „1 Feld fokussieren“ reduziert;
  • Handlungskonversion: Die Buttons „Website“ und „Produkt“ auf der Karte führen den Nutzer direkt weiter; die Klickweiterleitung ist 2,3-mal höher als beim „Homepage-Link“ der traditionellen Suche (interne Google-Tests);
  • Entscheidungssicherheit: Wenn die Karte „autoritative Quellen“ (z. B. Wikipedia) ausweist, steigt das Vertrauen der Nutzer in die Information um 44 % (Moz-Studie 2024).

Szenario 3: Produktrecherche (z. B. „iPhone 15 Einstiegspreis“)

Verhaltenskette bei traditioneller Suche(durchschnittliche Verweildauer 2 Minuten 05 Sekunden):

Nutzer gibt Schlüsselwort ein→klickt auf Apples Website (42 %) / Amazon (25 %) / Tech-Medien (z. B. The Verge, 18 %) → sucht auf der Preis-Seite der offiziellen Website nach „iPhone 15“ (durchschnittlich 4 Scrollbewegungen) oder vergleicht Preise auf der Amazon-Produktseite → notiert den Einstiegspreis (z. B. „799 US-Dollar“) → schließt die Seite (68 %) oder vergleicht weiter (32 %).

Verhaltenskette beim Wissensgraphen(durchschnittliche Verweildauer 28 Sekunden):

Nutzer gibt Schlüsselwort ein→betrachtet direkt die Karte (85 %) → fokussiert die Felder „Einstiegspreis“ und „Veröffentlichungszeit“ (89 %) → klickt auf den „Kauflink“ auf der Karte (65 %) und springt direkt zur offiziellen Website oder zu Amazon oder klickt auf „Kernfunktionen“ (22 %), um Parameter wie Dynamic Island anzusehen.

Wesentliche Unterschiede

  • Preisvergleichskosten: von „über 3 Seiten hinweg vergleichen“ zu „mit 1 Karte abschließen“;
  • Geschwindigkeit der Kaufentscheidung: von „über 10 Minuten“ auf „unter 30 Sekunden“ verkürzt; die Bestellrate der Nutzer steigt um 31 % (E-Commerce-Datenanalyseplattform Statista 2024);
  • Informationsaktualität: Die Karte aktualisiert den „Einstiegspreis“ in Echtzeit (z. B. bei Änderungen von Aktionen 2024), sodass Nutzer wegen verzögerter Informationen keine Angebote verpassen.
Warum der Wissensgraph schneller ist

„Informationsüberlastung“ → „präzise Auswahl“

Traditionelle Suchergebnisseiten enthalten im Durchschnitt 10 Links, jeder Link 500–2000 Wörter Text, aber die Schlüsselinformationen, die Nutzer benötigen (wie „Hauptsitz“ oder „Einstiegspreis“), können auf verschiedene Absätze oder sogar verschiedene Links verteilt sein.

Der Wissensgraph verdichtet durch strukturierte Extraktion + semantische Verknüpfung Schlüsselinformationen auf 5–8 Felder, sodass Nutzer nicht mehr „die Nadel im Heuhaufen“ suchen müssen.

Wenn man beispielsweise nach „Tesla Verkäufe 2023“ sucht, muss man bei traditioneller Suche 3 Pressemitteilungen ansehen (mit Angaben wie „Q1 420.000“, „Q2 460.000“, „Q3 435.000“), um die Jahresdaten zusammenzufassen;

die Wissensgraph-Karte zeigt dagegen direkt „1,84 Millionen weltweite Verkäufe 2023“, sodass Nutzer in 3 Sekunden vollständige Informationen erhalten.

„Unklare Absicht“ → „präzises Matching“

Da Nutzer ihre Suchanfragen oft ungenau formulieren (wie „Musks Auto“), liefert die traditionelle Suche leicht irrelevante Ergebnisse (wie Musks persönliche Biografie).

Der Wissensgraph erkennt mithilfe von Entitätsverknüpfungsanalyse die Kernentitäten, die mit „Musk“ verbunden sind (Tesla, SpaceX), und leitet daraus die Nutzerabsicht ab („Automobilunternehmen, an dessen Gründung Musk beteiligt war“), um schließlich die Produktinformationen von Tesla anzuzeigen.

Googles AI-Whitepaper 2023 zeigt: Der Wissensgraph erreicht bei der Interpretation unklarer Suchbegriffe eine Genauigkeit von 81 % (die traditionelle Suche nur 57 %), und die Wahrscheinlichkeit, dass Nutzer wegen „irrelevanter Informationen“ die Seite schließen, sinkt von 42 % auf 19 %.

„Vertrauensmangel“ → „autoritative Bestätigung“

In traditionellen Suchergebnissen fällt es Nutzern schwer, die Glaubwürdigkeit von Informationen einzuschätzen (z. B. schreibt ein Blog „Tesla verkaufte 2023 zwei Millionen Fahrzeuge“, während die offizielle Website „1,84 Millionen“ angibt).

Der Wissensgraph verwendet einen Multi-Source-Verifikationsmechanismus und zeigt nur Informationen an, die „in mindestens drei autoritativen Quellen übereinstimmen“ (z. B. offizielle Website, Wikipedia, Branchendatenbanken), und markiert auf der Karte „autoritative Quellen“ (z. B. „Daten aus Teslas Geschäftsbericht 2023“), wodurch das Vertrauen der Nutzer in die Information um 58 % steigt (Moz-Nutzerstudie 2024).

Wie der Wissensgraph die Nutzerabsicht „versteht“

Von „Keyword-Matching“ zu „semantischem Verständnis“

Google analysiert mithilfe vortrainierter Modelle wie BERT die „semantische Absicht“ von Suchbegriffen der Nutzer (z. B. ist „Hauptsitz“ in „Wo ist Teslas Hauptsitz?“ ein Bedürfnis nach „geografischer Lage“, während „Einstiegspreis“ in „iPhone 15 Einstiegspreis“ ein Bedürfnis nach „Preis“ ist).

Solche Modelle können auch „implizite Absichten“ erkennen — etwa wenn Nutzer nach „Musks Raketenfirma“ suchen, verknüpft das Modell „Musk–Gründer–SpaceX“, statt nur Musks Biografie zu matchen.

Googles Testdaten aus 2024 zeigen: Die Genauigkeit der Absichtserkennungsmodelle stieg von 62 % im Jahr 2019 auf 89 % im Jahr 2024, während die Wahrscheinlichkeit, dass Nutzer wegen „nicht passender Absicht“ abspringen, um 34 % sank.

Von „unstrukturiertem Text“ zu „maschinenlesbaren Feldern“

Der Wissensgraph nutzt NLP-Technologien (z. B. Entitätserkennung und Attributextraktion), um „unstrukturierten Text“ auf Webseiten in „strukturierte Felder“ umzuwandeln (z. B. „Tesla–Hauptsitz–Texas“).

Zum Beispiel wird der Satz „Teslas Hauptsitz befindet sich in Austin, Texas, USA“ extrahiert als:

  • Entität: Tesla
  • Attribut: Hauptsitz
  • Wert: Austin, Texas

Die Genauigkeit dieser Extraktion variiert je nach Entitätstyp (Unternehmensinformationen 92 %, Personeninformationen 85 %, Produktinformationen 88 %), reicht aber bereits aus, um die Kartenanzeige zu stützen (Googles technisches Whitepaper 2023).

Von „statischen Ergebnissen“ zu „Echtzeitinformationen“

Durch „Echtzeit-Crawling + Multi-Source-Verifikation“ stellt der Wissensgraph sicher, dass Karteninformationen synchron mit der Realität bleiben. Als Tesla 2023 ankündigte, den Hauptsitz nach Texas zu verlegen, erfasste Google-Crawler innerhalb von 2 Stunden Berichte von der offiziellen Website, Reuters und Bloomberg, validierte die Konsistenz der Information (offizielle Website und Reuters stimmten überein) und aktualisierte innerhalb von 4 Stunden die Wissensgraph-Karten aller „Tesla“-Suchergebnisse.

Googles technische Tests 2024 zeigen: Der Aktualisierungszyklus für Informationen stark beachteter Entitäten (z. B. Fortune-500-Unternehmen) wurde von traditionell „einmal pro Woche“ auf „stundenweise“ verkürzt, wodurch die Informationsverzögerung für Nutzer von „3 Tagen“ auf „2 Stunden“ sank.

Wie der Wissensgraph Antworten „präzise ausgibt“

Wenn Nutzer nach „Produktion der Tesla Gigafactory Shanghai 2023“ suchen, kann die Google-Wissensgraph-Karte direkt anzeigen: „Die Produktion des Werks in Shanghai betrug 2023 1,25 Millionen Fahrzeuge und machte 48 % von Teslas weltweiter Gesamtkapazität aus.“

Technisches Prinzip

Das Herzstück des Wissensgraphen besteht darin, „unstrukturierten Text“ (z. B. Absätze und Sätze auf Webseiten) in „strukturierte Daten“ (z. B. Tripel aus „Entität–Attribut–Wert“) umzuwandeln und daraus über Beziehungen ein Informationsnetzwerk aufzubauen.

Dieser Prozess hängt von folgender technischen Kette ab (siehe unten):

Suchbegriff des Nutzers → Google-Crawler erfasst Webtexte → NLP-Modell erkennt Entitäten (z. B. „Tesla“) → extrahiert Attribute (z. B. „Produktion des Werks Shanghai“) → verknüpft weitere Entitäten (z. B. „weltweite Gesamtkapazität“) → validiert Konsistenz mehrerer Quellen → erzeugt strukturierte Karte → rankt und zeigt an

Technische Schritte

Entitätserkennung (NER)

Die Entitätserkennung ist der „Ausgangspunkt“ des Wissensgraphen. Ihr Kern besteht darin, „benannte Entitäten“ (wie Unternehmen, Personen, Orte) aus unstrukturiertem Text zu erkennen und ihren Typ zu markieren.

Google nutzt dafür vortrainierte Modelle wie BERT; die technischen Details sind folgende:

  • Modellprinzip:BERT (Bidirectional Encoder Representations from Transformers) kann durch bidirektionales Kontextlernen verstehen, dass „Tesla“ in „Tesla-Werk Shanghai“ eine „Unternehmensentität“ ist, in „Tesla-Spule“ aber ein „wissenschaftliches Konzept“, und so den Entitätstyp präzise markieren (Organizationvs ScientificConcept).
  • Genauigkeitsdaten:Googles technisches Whitepaper 2023 zeigt, dass das BERT-Modell bei Unternehmensentitäten eine Erkennungsgenauigkeit von 92 % erreicht (für standardisierte Unternehmensnamen), bei komplexen Satzmustern (wie „von XX gemeinsam mit YY gegründet“) beträgt die Erkennungsgenauigkeit 85 % (da „gemeinsam gegründet“ mehrere Entitäten betreffen kann).
  • Fallbeispiel:Im Satz „2003 gründeten Martin Eberhard und Marc Tarpenning in Palo Alto die Tesla Motor Company“ erkennt das BERT-Modell:
    • Entität 1:Martin Eberhard(Person
    • Entität 2:Marc Tarpenning(Person
    • Entität 3:Tesla Motor Company(Organization
    • Entität 4:Palo Alto(Location

Attributextraktion

Das Ziel der Attributextraktion ist es, die semantischen Beziehungen zwischen Entitäten zu analysieren und „Attribut-Wert“-Paare zu extrahieren (z. B. „Tesla–Gründungszeit–2003“).

Google erledigt dies durch die Kombination von „Abhängigkeitsanalyse“ und „Regelvorlagen“:

  • Technische Details
    • Abhängigkeitsanalyse:Sie erkennt grammatische Beziehungen zwischen Wörtern in einem Satz (z. B. ist „gründen“ ein Verb, „Tesla“ das Objekt und „2003“ eine Zeitangabe), und extrahiert so „Tesla–Gründungszeit–2003“.
    • Regelvorlagen:Für häufige Attribute (wie „Gründungszeit“ oder „Hauptsitz“) werden Regeln vordefiniert, etwa dass Inhalte nach „gegründet in“ oder „Hauptsitz befindet sich in“ als Attributwerte gelten; so werden Modellschwächen bei komplexen Satzmustern ausgeglichen.
  • Genauigkeitsdaten:Interne Google-Tests von 2024 zeigen, dass die Attributextraktion für die „Gründungszeit“ eines Unternehmens eine Genauigkeit von 88 % erreicht (bei standardisierten Formulierungen), bei unscharfen Attributen wie „Gründer“ (z. B. „Mitgründer“, „Erstinvestor“) aber nur 72 % (wegen der Vielfalt an Formulierungen).
  • Fallbeispiel:Im Satz „2004 investierte Elon Musk 6,3 Millionen US-Dollar in Tesla und wurde größter Aktionär“ erkennt die Abhängigkeitsanalyse „investieren“ als Verb, „Tesla“ als Objekt, „Elon Musk“ als Handelnden und „6,3 Millionen US-Dollar“ als Betrag. Abschließend werden die Attributpaare „Tesla–Investor–Elon Musk“ und „Tesla–Finanzierungsbetrag–6,3 Millionen US-Dollar“ extrahiert.

Multi-Source-Verifikation

Die Multi-Source-Verifikation ist der „Qualitätsprüfungsabschnitt“ des Wissensgraphen. Ihr Kern besteht darin, sicherzustellen, dass dasselbe Attribut derselben Entität in mindestens drei autoritativen Quellen übereinstimmt.

Google setzt dies anhand folgender Regeln um:

Klassifizierung autoritativer Quellen(siehe Tabelle unten):

Quellentyp Gewichtung (Glaubwürdigkeit) Beispiel
Offizielle Website 90 Tesla-Website (Tesla.com)
Autoritative Enzyklopädie 85 Wikipedia (Eintrag Tesla, Inc.)
Regierungs-/Branchendatenbank 80 Unternehmensmeldungen bei der US-SEC, Crunchbase
Medien mit hoher Autorität 70 New York Times, TechCrunch
Persönlicher Blog / Forum 30 Persönlicher Tech-Blog, Reddit-Diskussionsbeitrag

Verifikationslogik

  • Wenn dasselbe Attribut in drei oder mehr autoritativen Quellen übereinstimmt (Fehler ≤5 %), wird es als „hohe Glaubwürdigkeit“ markiert und aufgenommen;
  • wenn nur zwei Quellen übereinstimmen oder Widersprüche bestehen (z. B. offizielle Website „gegründet 2003“, Wikipedia „gegründet 2002“), wird es als „niedrige Glaubwürdigkeit“ markiert und vorerst nicht aufgenommen;
  • wenn alle Quellen widersprüchlich sind, wird die Aufnahme direkt abgelehnt.

Datenbasis:Googles „Leitfaden zur Aufnahme in den Wissensgraphen“ von 2023 zeigt, dass Attributkonflikte der häufigste Grund für eine Ablehnung sind (38 %), gefolgt von „unzureichender Autorität der Quelle (z. B. nur persönliche Blogs, 25 %)“ und „Fehlern im Markierungsformat (z. B. Datumsfehler, 19 %)“.

Aktualisierung auf Stundenebene

  • Echtzeit-Erfassung:Für stark beachtete Entitäten (wie Fortune-500-Unternehmen oder beliebte Produkte) wurde die Abruffrequenz von Googlebot von traditionell „einmal pro Woche“ auf „einmal pro Stunde“ erhöht (laut Googles Erläuterung zum Suchalgorithmus-Update 2024). Beispielsweise erfasste der Crawler bei der Vorstellung des Cybertruck im Oktober 2023 innerhalb von 15 Minuten nach Veranstaltungsende die Pressemitteilungen von der offiziellen Website, TechCrunch und Reuters.
  • Schnelle Verifikation:Neue Informationen müssen eine „Querverifikation aus mehreren Quellen“ bestehen, bevor sie angezeigt werden. Wenn die offizielle Tesla-Website z. B. „435.000 Auslieferungen im Q3 2023“ ankündigt, erfasst Google gleichzeitig die offizielle Website (Gewichtung 90 %), den SEC-10-Q-Bericht (85 %) und einen Bloomberg-Bericht (70 %). Stimmen alle drei überein (Fehler ≤2 %), erfolgt sofort eine Aktualisierung.
  • Aktualität der Updates:Googles technische Tests 2024 zeigen, dass der Informationsaktualisierungszyklus stark beachteter Entitäten durchschnittlich 4,2 Minuten beträgt (vom Abschluss der Verifikation bis zur Veröffentlichung der Karte), bei gewöhnlichen Entitäten 18 Minuten. So aktualisierte Google nach der Bekanntgabe des Nobelpreises für Physiologie oder Medizin 2023 bereits 5 Minuten nach Bestätigung der Liste die Karte von „Katalin Karikó“ und zeigte das Attribut „Nobelpreisträgerin 2023“ an.

Wie Inhalte in den Google-Wissensgraphen aufgenommen werden

Damit Inhalte in den Google-Wissensgraphen aufgenommen werden, müssen drei zentrale Bedingungen erfüllt sein:

  • Kernattribute mit Schema.org markieren(Unternehmen / Personen / Produkte müssen Felder wie Name, Gründungszeit usw. markieren)
  • Konsistenz zwischen mehreren Quellen sicherstellen(Mindestens drei autoritative Quellen wie offizielle Website und Wikipedia dürfen keine Attributkonflikte aufweisen)
  • Mit Google-Tools verifizieren(Indexierungsstatus mit Google Search Console überwachen)

Daten zeigen, dass die Aufnahmewahrscheinlichkeit offizieller Unternehmenswebsites mit Schema-Markierung um 47 % höher ist als ohne Markierung (Moz 2024), aber Attributkonflikte (wie Widersprüche bei der „Gründungszeit“ zwischen offizieller Website und Wikipedia) führen zu einer Ablehnungsquote von 38 % (Google 2023).

Kernattribute mit Schema.org markieren

Google kann den Text auf Webseiten nicht direkt „verstehen“ und benötigt daher strukturierte Datenmarkierungen mit Schema.org, um klar zu erkennen, „wer das ist“ und „welche Attribute vorhanden sind“.

Schema.org ist ein weltweit einheitlicher Markierungsstandard, der über 1000 Entitätstypen wie Unternehmen, Personen und Produkte abdeckt und die „Eintrittskarte“ für die Aufnahme in den Wissensgraphen ist.

„Pflichtattribute“ verschiedener Entitäten (siehe Tabelle unten)

Entitätstyp Zentrale Pflichtattribute (Beispiele) Bedeutung der Markierung Datenbasis (Google 2023)
Unternehmen/Organisation name(Name)、foundingDate(Gründungszeit)、headquarters(Hauptsitz)、industry(Branche) Hilft Google, die „Grundstruktur des Unternehmens“ zu erkennen 82 % der Unternehmenskarten enthalten die ersten vier Attribute
Person name(Name)、birthDate(Geburtsdatum)、nationality(Nationalität)、jobTitle(Beruf) Unterstützt Google bei der Bestimmung der „Personenidentität“ 75 % der Personenkarten kennzeichnen Berufsangaben
Produkt/Dienstleistung name(Name)、releaseDate(Veröffentlichungszeit)、brand(Marke)、offers(angebotene Funktionen) Unterstützt die „präzise Anzeige von Produktinformationen“ 68 % der Produktkarten enthalten Markeninformationen

Praxisbeispiel(Markierung auf einer offiziellen Unternehmenswebsite):

<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“headquarters”: {
“@type”: “Place”,
“name”: “Austin, Texas, USA”
},
“industry”: “Electric Vehicles”
}
</script>

Diese Markierung übermittelt Google direkt die Kernaussage: „Tesla ist ein Unternehmen, wurde 2005 gegründet, hat seinen Hauptsitz in Austin, Texas, und gehört zur Elektrofahrzeugbranche.“

„Häufige Missverständnisse“ bei der Markierung

  • Übermäßige Markierung:Es ist nicht nötig, alle Attribute zu markieren (z. B. ist die „Mitarbeiterzahl“ bei Unternehmen kein Pflichtfeld); vorrangig sollten „Kernattribute“ mit hoher Nutzerrelevanz markiert werden (z. B. der „Einstiegspreis“ eines Produkts);
  • Formatfehler:Datumsangaben müssen im Format „YYYY-MM-DD“ erfolgen (z. B. „2003-04-01“), nicht „2003/4/1“; Koordinaten müssen im Format „Breitengrad,Längengrad“ angegeben werden (z. B. „30.2672,-97.7431“);
  • Mehrsprachige Konflikte:Wenn eine offizielle Website mehrere Sprachversionen enthält, muss für jede Sprache separat markiert werden (z. B. in der englischen Version mit inLanguage: "en"), um Verwechslungen durch Google zu vermeiden.

Attributvollständigkeit und Beziehungsgenauigkeit

Attributvollständigkeit

Googles Statistik aus dem Jahr 2024 zeigt: Entitäten mit mehr als 8 Kernattributen haben eine um 62 % höhere Aufnahmewahrscheinlichkeit als Entitäten mit nur 3 Attributen.

Am Beispiel „Unternehmen“ wird empfohlen, zusätzlich zu den Pflichtattributen Folgendes zu ergänzen:

  • Nutzerrelevante Attribute: numberOfEmployees(Mitarbeiterzahl)、foundingLocation(Gründungsort);
  • Dynamische Attribute: latestRevenue(jüngster Umsatz)、notableProduct(Starprodukt);
  • Verknüpfte Attribute: parentOrganization(Muttergesellschaft)、subsidiary(Tochtergesellschaft)。

Fallbeispiel:Ein Tech-Startup markierte nur „Name“ und „Gründungszeit“ und wurde nicht aufgenommen; nachdem „Mitarbeiterzahl“, „CEO“ und „Starprodukt“ ergänzt wurden, wurde es innerhalb von 3 Monaten im Wissensgraphen erfasst.

Beziehungsgenauigkeit

Beziehungen sind das „Skelett“ des Wissensgraphen und müssen die semantischen Verknüpfungen zwischen Entitäten klar darstellen (z. B. „Gründer“, „CEO“, „Produkt“).

Google prüft die Plausibilität von Beziehungen mit semantischen Analysemodellen; häufige Fehler sind:

  • Falscher Beziehungstyp:„CEO“ wird als „Gründer“ markiert (z. B. ist Musk CEO von Tesla, aber der frühe Gründer war Eberhard);
  • Verworrene Beziehungen:„Tesla–Produkt–Model 3“ wird markiert, aber nicht „Model 3–Produktionswerk–Gigafactory Shanghai“ (bei der Suche „Wo wird Model 3 produziert?“ kann keine Verknüpfung hergestellt werden);
  • Redundante Beziehungen:Dieselbe Beziehung wird mehrfach markiert (z. B. „Tesla–Gründer–Eberhard“ mehrfach), was zu einer Abwertung durch Google führen kann.

Quellenmanagement

Google stellt extrem hohe Anforderungen an die Genauigkeit von Informationen. Dasselbe Attribut derselben Entität muss in mindestens drei autoritativen Quellen konsistent sein, andernfalls wird es als „niedrige Glaubwürdigkeit“ markiert.

Klassifizierung autoritativer Quellen (siehe Tabelle unten)

Quellentyp Autorität (Glaubwürdigkeit) Beispiel Google-Priorität
Offizielle Website ★★★★★ Tesla.com Höchste
Autoritative Enzyklopädie ★★★★☆ Wikipedia(Eintrag Tesla, Inc.) Hoch
Regierungs-/Branchendatenbank ★★★★ Unternehmensmeldungen bei der US-SEC, Crunchbase Mittel-hoch
Medien mit hoher Autorität ★★★☆ New York Times, TechCrunch Mittel
Persönlicher Blog / Forum ★★ Persönlicher Tech-Blog, Reddit-Diskussionsbeitrag Niedrig

Wie lassen sich Quellenkonflikte lösen?

Wenn Attribute aus verschiedenen Quellen widersprüchlich sind (z. B. offizielle Website: „2003 gegründet“, Wikipedia: „2002 gegründet“), geht Google folgendermaßen vor:

  • Schritt 1:Autoritative Quellen werden bevorzugt berücksichtigt (offizielle Website > Wikipedia > Medien);
  • Schritt 2:Wenn autoritative Quellen untereinander widersprüchlich sind (z. B. offizielle Website und Wikipedia), werden „ergänzende Nachweise“ verlangt (z. B. Unternehmensregistrierungsurkunden, Finanzberichte);
  • Schritt 3:Wenn der Widerspruch innerhalb von 30 Tagen nicht gelöst wird, wird die Information als „niedrige Glaubwürdigkeit“ markiert und vorerst nicht aufgenommen.

Tool-Unterstützung: Google Search Console

Die Google Search Console(GSC)ist das offizielle „Überwachungstool für die Aufnahme in den Wissensgraphen“ von Google, mit dem der Aufnahmestatus in Echtzeit eingesehen und Probleme überprüft werden können.

Wichtige Funktionen:

  • Überwachung des Indexstatus:Unter „Indexierung“ → „Abdeckung“ kann geprüft werden, ob eine Entität aufgenommen wurde (Anzeige „Indexiert“ oder „Ausgeschlossen“);
  • Bericht zu erweiterten Ergebnissen:Unter „Erweiterte Ergebnisse“ lassen sich die Anzeigedaten der Wissensgraph-Karten einsehen (z. B. Klicks, Impressionen);
  • Fehlerdiagnose:Unter „Fehler“ können Markierungsfehler (z. B. Schema-Formatfehler) und Quellenkonflikte (z. B. Hinweise auf inkonsistente Attribute) überprüft werden.

Optimierungstipps:

  • Regelmäßige Prüfung:Wöchentlich in die GSC einloggen und die Gründe für „nicht angezeigt“ in den „Erweiterten Ergebnissen“ prüfen (z. B. „fehlende Attribute“, „Quellenkonflikte“);
  • Datenfeedback:Wenn Karteninformationen fehlerhaft sind (z. B. falscher „Hauptsitzstandort“), über die GSC eine „Datenkorrekturanfrage“ einreichen;
  • Wettbewerbsanalyse:Nach Markennamen von Wettbewerbern suchen, die angezeigten Attribute in deren Wissensgraph-Karten prüfen und die eigenen fehlenden Kernfelder ergänzen.

Das Zeitalter des Wissensgraphen ist bereits angebrochen. Ihre Inhalte verdienen es, effizienter „gesehen“ zu werden — beginnen Sie jetzt zu handeln.

滚动至顶部