Themen / Knowledge Graph

Was ist ein Knowledge Graph einfach erklärt?

Kurz gesagtEin Knowledge Graph (Wissensgraph) ist eine Sammlung von Wissen, in der nicht Dinge isoliert gespeichert sind, sondern ihre Verbindungen. Knoten stehen für Entitäten — Menschen, Orte, Begriffe —, Kanten für die Beziehungen zwischen ihnen. Statt „Berlin“ und „Deutschland“ getrennt abzulegen, hält der Graph fest: Berlin ist die Hauptstadt von Deutschland. Suchmaschinen und KI-Systeme nutzen diese Verbindungen, um Fragen zu beantworten und Zusammenhänge zu verstehen.

Was ist ein Knowledge Graph genau?

Ein Knowledge Graph ist ein Wissensspeicher, der als Graph aufgebaut ist: eine Menge von Knoten und den Verbindungen dazwischen. Die Knoten sind Entitäten — ein Mensch, eine Stadt, eine Firma, ein Ereignis, ein Begriff. Die Verbindungen, die Kanten, sagen, wie diese Entitäten zueinander stehen. „Marie Curie“ hat eine Kante „erhielt“ zu „Nobelpreis“, und eine Kante „geboren in“ zu „Warschau“. Das Wissen steckt nicht in den einzelnen Knoten, sondern in genau diesen benannten Verbindungen.

Der Unterschied zu einer normalen Tabelle ist groß. Eine Tabelle speichert Werte in Zeilen und Spalten und weiß nichts darüber, wie diese Werte zusammenhängen. Ein Graph speichert von vornherein die Beziehung mit. Du fragst ihn nicht „Zeig mir Zeile 47“, sondern „Was ist mit Marie Curie verbunden — und worüber?“. Damit lässt sich das Wissen entlanglaufen, von Entität zu Entität, über die Kanten hinweg.

Genau hier triff das Modell den Kern: Ein Knowledge Graph ist die technische Form genau jener Vorstellung, mit der wir Situationen ohnehin betrachten — als Netzwerk aus Entitäten und Relationen. Was sonst eine Denkweise bleibt, wird hier zu einer Datenstruktur, die ein Computer durchlaufen kann. Der Graph ist nicht das Wissen selbst, sondern eine Landkarte der Verbindungen, die das Wissen tragen.

Wie ist ein Knowledge Graph aufgebaut?

Im Inneren besteht ein Knowledge Graph aus winzigen Aussagen, oft Tripel genannt: Subjekt, Beziehung, Objekt. „Berlin — ist Hauptstadt von — Deutschland.“ Jedes Tripel ist für sich klein und überprüfbar, doch tausende davon ergeben zusammen ein dichtes Netz. Du legst also nicht große Texte ab, sondern viele kleine, klare Verbindungen, die sich gegenseitig stützen.

Damit der Graph nicht beliebig wird, gibt es meist ein Schema oder eine Ontologie — eine Vereinbarung darüber, welche Arten von Entitäten und welche Arten von Kanten erlaubt sind. So weiß das System, dass „geboren in“ einen Menschen mit einem Ort verbindet und nicht zwei Zahlen. Dieses Schema ist der ruhige Rahmen, der die vielen Verbindungen vergleichbar hält.

Im Bild des Modells lässt sich der Graph beliebig zoomen. Ein Knoten „Deutschland“ ist von außen eine einzige Entität; gehst du hinein, zerfällt er selbst wieder in Entitäten und Relationen — Bundesländer, Städte, Gesetze. Diese fraktale Schachtelung ist kein Zufall, sondern das Grundprinzip: Jede Entität besteht aus weiteren Entitäten und Relationen. Ein guter Knowledge Graph nutzt genau das, indem er Wissen auf der passenden Ebene zusammenfasst, statt alles flach nebeneinanderzulegen.

Wofür braucht man Knowledge Graphs?

Der bekannteste Knowledge Graph läuft in deiner Suchmaschine. Suchst du nach „Albert Einstein“, erscheint rechts ein kompakter Kasten mit Geburtsdatum, Werken und verwandten Personen. Diese Infobox stammt aus einem Graphen, der weiß, dass Einstein eine Person ist, welche Relationen er hat und welche Entitäten daran hängen. Die Suchmaschine versteht so „Einstein“ nicht als Zeichenkette, sondern als Knoten mit Nachbarn.

Auch außerhalb der Suche sind Graphen verbreitet. Unternehmen verbinden Kunden, Produkte und Bestellungen, um Empfehlungen zu geben. Banken legen Konten und Überweisungen als Graph an, um auffällige Muster zu finden. In der IT-Sicherheit lassen sich Geräte, Nutzer und Zugriffe als Netzwerk darstellen — ein ungewöhnlicher Pfad zwischen Knoten fällt dann eher auf als eine einzelne Zeile in einem Log.

Der gemeinsame Nenner ist immer derselbe: Sobald die Frage lautet „Wie hängt das zusammen?“ statt „Welcher Wert steht hier?“, spielt ein Graph seine Stärke aus. Er macht die Verbindungen selbst zum durchsuchbaren Gegenstand. Das ist der Punkt, an dem aus gespeicherten Daten ableitbares Wissen wird.

Was hat ein Knowledge Graph mit KI und LLMs zu tun?

Große Sprachmodelle wie ChatGPT lernen Sprache aus riesigen Textmengen. Sie sind stark im Formulieren, haben aber ein Problem: Sie können Dinge erfinden, weil sie kein festes, geprüftes Wissen besitzen, sondern Wahrscheinlichkeiten für das nächste Wort. Ein Knowledge Graph bringt genau das mit, was dem Modell fehlt — klare, überprüfbare Verbindungen zwischen Entitäten.

Deshalb werden beide oft kombiniert. Das Sprachmodell formuliert flüssig und versteht die Frage, der Graph liefert die belastbaren Fakten dazu. Bevor das Modell antwortet, schlägt es im Graphen nach, welche Relationen eine Entität wirklich hat, und stützt seine Antwort darauf. So sinkt die Gefahr, dass es Zusammenhänge frei zusammenreimt. Das Sprachmodell liefert die Sprache, der Graph das Gerüst.

Im Bild des Modells ergänzen sich hier zwei Netzwerke. Das Sprachmodell hat unzählige Verbindungen gelernt, doch viele davon sind unscharf und nicht nachvollziehbar. Der Graph hält dagegen ausgewählte Relationen sauber benannt fest. Lenkst du die Frage erst durch den Graphen, wird eine geprüfte Verbindung aktiv, bevor das Modell zu raten beginnt — Energie auf die belastbare Stelle gelenkt, nicht auf die plausibelste.

Wo liegt der Unterschied zu einer normalen Datenbank?

Eine klassische Datenbank denkt in Tabellen. Willst du wissen, welche Kollegen über drei Ecken mit einer Person zusammenarbeiten, musst du mehrere Tabellen mühsam verknüpfen, und mit jeder Ecke wird die Abfrage langsamer. Ein Knowledge Graph denkt von vornherein in Verbindungen: Du folgst einfach den Kanten, Schritt für Schritt, von Knoten zu Knoten. Solche Pfad-Fragen sind genau seine Stärke.

Daneben steht die Vektordatenbank, die für KI-Systeme wichtig ist. Sie speichert Inhalte nach Ähnlichkeit und findet, was sich thematisch nahe ist — aber sie kennt keine benannten Beziehungen. Sie weiß, dass zwei Texte ähnlich klingen, nicht, dass der eine den anderen widerlegt. Der Graph kann genau das, weil seine Kanten eine klare Bedeutung tragen. Oft setzt man beide nebeneinander ein.

Es geht also nicht um besser oder schlechter, sondern um die passende Sicht. Eine Tabelle ist ideal, wenn du saubere, gleichförmige Werte zählst. Ein Graph ist ideal, wenn die Verbindungen selbst die eigentliche Frage sind. Welches Netzwerk du betrachtest, entscheidest du nach der Frage, die du stellst — nicht umgekehrt.

Wo stoßen Knowledge Graphs an ihre Grenzen?

Ein Knowledge Graph ist nur so gut wie die Verbindungen, die jemand hineingelegt hat. Fehlt eine Kante, kennt der Graph die Beziehung schlicht nicht — und ein fehlendes Wissen sieht für ihn genauso aus wie ein nicht vorhandenes. Das Modell nennt eine solche noch nie aktivierte Verbindung leer: Sie könnte bestehen, ist aber nie hergestellt worden. Genau dort liegen oft die interessanten Antworten, die der Graph noch nicht geben kann.

Dazu kommt der Aufwand. Wissen sauber in Entitäten und benannte Relationen zu zerlegen, ist Arbeit, und die Welt ändert sich ständig. Ein Graph, der nicht gepflegt wird, veraltet leise: Eine Firma wird umbenannt, ein Amt wechselt, und die alte Kante stimmt nicht mehr. Auch die Frage, wie man Mehrdeutigkeit abbildet — gibt es zwei Personen gleichen Namens? —, bleibt anspruchsvoll.

Deshalb ist ein Knowledge Graph ein Werkzeug, kein Orakel. Er macht Verbindungen sichtbar und durchsuchbar, aber er denkt nicht für dich und garantiert keine Wahrheit. Sein Wert liegt darin, dass er das Netz aus Entitäten und Relationen ordnet, das du ohnehin im Kopf hast — sauberer, größer und für eine Maschine begehbar. Mehr will er nicht sein, und das ist schon viel.

So sieht das mit dem Modell aus

Stell dir vor, du tippst „Wer hat Harry Potter geschrieben?“ in eine Suchmaschine. Ohne Graph wäre „Harry Potter“ nur eine Zeichenkette, die irgendwo in Texten vorkommt. Mit Graph ist „Harry Potter“ ein Knoten — eine Entität vom Typ Buchreihe. An ihm hängt eine Kante „geschrieben von“, die zu einem anderen Knoten führt: „J. K. Rowling“. Die Antwort steckt nicht in einem Text, sondern in dieser einen benannten Verbindung.

Betrachte das als kleines Netzwerk. „Harry Potter“ ist über „geschrieben von“ mit „J. K. Rowling“ verbunden, über „spielt in“ mit „Hogwarts“, über „Genre“ mit „Fantasy“. Stellst du eine Folgefrage — „Was hat dieselbe Autorin noch geschrieben?“ —, läuft die Maschine einfach die Kanten ab: von „Harry Potter“ zu „J. K. Rowling“ und von dort über alle „geschrieben von“-Kanten zurück zu weiteren Büchern. Kein neuer Text wird gelesen, es wird nur dem Netz gefolgt.

Genau hier zeigt sich das Modell in Reinform. Die Entitäten sind die Knoten, die benannten Beziehungen die aktiven Relationen, und eine Frage aktiviert jeweils den Pfad, der sie beantwortet. Fehlt eine Kante — etwa zu einem Buch, das noch niemand eingetragen hat —, bleibt diese Relation leer, und der Graph schweigt an dieser Stelle. So wird sichtbar, dass sein Wissen nichts anderes ist als ein gepflegtes Netz aus Verbindungen.

Häufige Fragen

Was ist ein Knowledge Graph in einfachen Worten?

Ein Knowledge Graph ist eine Sammlung von Wissen, die nicht einzelne Dinge speichert, sondern ihre Verbindungen. Jede Entität — eine Person, ein Ort, ein Begriff — ist ein Knoten, und jede Beziehung zwischen ihnen ist eine Kante. Statt „Berlin“ und „Deutschland“ getrennt abzulegen, hält der Graph fest: Berlin ist die Hauptstadt von Deutschland. Aus vielen solchen kleinen Verbindungen entsteht ein durchsuchbares Netz, das Suchmaschinen und KI-Systeme nutzen, um Zusammenhänge zu verstehen.

Wofür nutzt Google einen Knowledge Graph?

Google nutzt seinen Knowledge Graph, um Suchanfragen besser zu verstehen und kompakte Infoboxen anzuzeigen. Suchst du nach einer Person, erscheint rechts ein Kasten mit Geburtsdatum, Beruf und verwandten Personen — diese Angaben stammen aus dem Graphen. Dadurch behandelt die Suchmaschine „Einstein“ nicht als bloße Zeichenkette, sondern als Knoten mit bekannten Beziehungen. So kann sie auch Fragen beantworten, deren Antwort nirgends wörtlich auf einer Seite steht, sondern sich aus den Verbindungen ergibt.

Was ist der Unterschied zwischen Knowledge Graph und Datenbank?

Eine klassische Datenbank speichert Werte in Tabellen und weiß wenig darüber, wie sie zusammenhängen — Beziehungen muss man über mühsame Verknüpfungen rekonstruieren. Ein Knowledge Graph speichert die Beziehungen von vornherein als benannte Kanten zwischen Knoten. Dadurch beantwortet er Fragen wie „Wie hängen diese beiden Dinge zusammen?“ direkt, indem er den Verbindungen folgt. Für gleichförmige Massendaten bleibt die Tabelle ideal, für vernetzte Fragen der Graph.

Wie helfen Knowledge Graphs gegen KI-Halluzinationen?

Sprachmodelle erzeugen Text nach Wahrscheinlichkeit und können Fakten erfinden, weil sie kein geprüftes Wissen besitzen. Ein Knowledge Graph liefert genau dieses geprüfte Wissen in Form klarer, benannter Verbindungen. Schlägt das Modell vor der Antwort im Graphen nach, welche Relationen eine Entität wirklich hat, stützt es seine Aussage auf belastbare Fakten statt auf bloße Plausibilität. Das senkt die Gefahr, dass es Zusammenhänge frei zusammenreimt, auch wenn es keine vollständige Garantie ist.

Ist ein Knowledge Graph dasselbe wie eine Vektordatenbank?

Nein, beide arbeiten unterschiedlich. Eine Vektordatenbank speichert Inhalte nach Ähnlichkeit und findet, was sich thematisch nahe ist — sie weiß, dass zwei Texte ähnlich klingen, aber nicht, wie sie inhaltlich zueinander stehen. Ein Knowledge Graph speichert benannte Beziehungen mit klarer Bedeutung, etwa „ist Hauptstadt von“ oder „widerspricht“. In KI-Systemen setzt man oft beide zusammen ein: die Vektordatenbank fürs Finden ähnlicher Inhalte, den Graphen für präzise, nachvollziehbare Verbindungen.

Wie erstellt man einen Knowledge Graph?

Man beginnt mit einem Schema oder einer Ontologie, das festlegt, welche Arten von Entitäten und Beziehungen es geben soll. Dann zerlegt man Wissen in kleine Aussagen, sogenannte Tripel aus Subjekt, Beziehung und Objekt — etwa „Berlin — ist Hauptstadt von — Deutschland“. Diese Tripel können von Hand, aus bestehenden Datenbanken oder automatisch aus Texten gewonnen werden. Wichtig ist die Pflege: Ein Graph veraltet, wenn niemand neue Verbindungen ergänzt und falsch gewordene korrigiert.

Weiterdenken

Begriffe dazu: Entität, Relation, Netzwerkebene, Zoom-in / Zoom-out, Die drei Zustände: leer, aktiv, passiv

Zuletzt aktualisiert: 2026-07-01