Wie funktionieren Vektordatenbanken?

Was ist eine Vektordatenbank?

Eine Vektordatenbank ist ein Datenbanksystem, das auf das Speichern und Durchsuchen von Vektoren spezialisiert ist — also von langen Zahlenreihen, die oft hunderte oder tausende Werte umfassen. Jeder dieser Vektoren steht für ein Stück Inhalt: einen Satz, ein Dokument, ein Bild, eine Audiodatei. Statt den Inhalt selbst zu durchsuchen, durchsucht die Datenbank seine numerische Darstellung.

Der Grund dafür ist die Art von Frage, die solche Systeme beantworten sollen. Eine klassische Datenbank ist gut darin, exakte Treffer zu finden: alle Kunden mit Postleitzahl 10115, alle Bestellungen vom Dienstag. Eine Vektordatenbank ist dagegen darauf ausgelegt, Ähnliches zu finden — Texte, die dasselbe meinen, auch wenn kein einziges Wort übereinstimmt. Sie sucht nach Bedeutung, nicht nach Buchstaben.

Betrachte es als Netzwerk. Jeder gespeicherte Inhalt ist eine Entität, und seine Position im Raum hält fest, zu welchen anderen Entitäten er in enger Relation steht. Eine Suchanfrage ist selbst nur ein weiterer Punkt in diesem Raum — und die Datenbank gibt zurück, was am nächsten liegt, also wozu die stärksten Relationen bestehen.

Was ist ein Embedding — Bedeutung als Position im Raum?

Der Schlüssel zu allem ist das Embedding. Ein Embedding ist eine Technik aus der Sprachverarbeitung und dem maschinellen Lernen, die einen Inhalt in einen Vektor übersetzt: Ein Modell liest einen Text und gibt eine feste Zahlenreihe aus, die seine Bedeutung kodiert. „Hund“ und „Welpe“ erhalten dabei sehr ähnliche Vektoren, „Hund“ und „Aktienkurs“ sehr verschiedene.

Bedeutung wird hier also zu Nähe. Jeder Wert im Vektor beschreibt eine Richtung im Raum, und die Gesamtposition fasst zusammen, worauf der Inhalt antwortet, womit er zusammenhängt, wovon er sich abgrenzt. Das ist im Kern eine Relation, in Zahlen gegossen: Zwei Inhalte stehen einander nah, weil das Modell zwischen ihnen viele gemeinsame Bezüge gelernt hat.

Genau deshalb ist ein Embedding mehr als ein Stichwort-Index. Es trägt nicht nur, welche Wörter vorkommen, sondern in welcher Beziehung die Inhalte zueinander stehen. Die Datenbank erbt diese Relationen: Wer den Raum durchsucht, durchsucht ein bereits gelerntes Netz aus Nähe und Distanz.

Wie funktioniert die Ähnlichkeitssuche?

Eine Suche beginnt damit, dass auch deine Anfrage zu einem Vektor wird. Du tippst eine Frage, dasselbe Embedding-Modell wandelt sie in einen Punkt um, und die Datenbank sucht nun die gespeicherten Punkte, die diesem am nächsten liegen. „Am nächsten“ wird gemessen — meist als Winkel zwischen den Vektoren (Kosinus-Ähnlichkeit) oder als geometrischer Abstand. Diese Aufgabe heißt Nächste-Nachbarn-Suche.

Im Modell gesprochen aktiviert die Anfrage die nächstgelegenen Relationen. Dein Frage-Punkt schickt sozusagen ein Signal in den Raum, und es erreicht zuerst die Inhalte, zu denen die kürzesten Verbindungen bestehen. Nicht der exakt passende Eintrag wird zurückgegeben, sondern die Nachbarschaft, die deiner Frage am ähnlichsten ist — die Relationen, die gerade aktiv werden.

Bei Millionen oder Milliarden Vektoren wäre es zu langsam, jeden einzeln zu vergleichen. Deshalb nutzen Vektordatenbanken näherungsweise Verfahren (Approximate Nearest Neighbor), die den Raum vorab in eine Struktur aus Nähe-Beziehungen ordnen — etwa als Graph eng benachbarter Punkte. Die Suche springt dann von Nachbar zu Nachbar, statt alles abzuklappern. Sie tauscht ein winziges Stück Genauigkeit gegen sehr viel Geschwindigkeit.

Was haben Vektordatenbanken mit KI, RAG und LLMs zu tun?

Vektordatenbanken sind populär geworden, weil sie ein Problem großer Sprachmodelle (LLMs) lösen. Ein LLM kennt nur, was in seinen Trainingsdaten stand, und es kann sich Dinge ausdenken, die plausibel klingen, aber falsch sind. Es hat kein verlässliches Gedächtnis für deine konkreten Dokumente. Genau hier setzt die Datenbank an: Sie liefert dem Modell im richtigen Moment die passenden Inhalte nach.

Dieses Zusammenspiel heißt Retrieval-Augmented Generation, kurz RAG. Deine Dokumente werden in Vektoren übersetzt und gespeichert. Stellst du eine Frage, sucht die Vektordatenbank die ähnlichsten Textstücke, und diese werden dem LLM zusammen mit deiner Frage mitgegeben. Das Modell antwortet dann nicht aus dem Gedächtnis, sondern auf Basis der gerade gefundenen, belegbaren Stellen.

Im Netzwerk gedacht erweitert RAG die aktiven Relationen des Modells um genau die, die deine Frage gerade braucht. Das LLM bleibt der sprachgewandte Knoten, die Vektordatenbank ist sein Anschluss an aktuelles, überprüfbares Wissen. Beide zusammen sind stärker als jeder für sich: Sprache vom einen, verankerte Inhalte vom anderen.

Wie unterscheidet sich das von klassischer Datenbank und Knowledge Graph?

Eine klassische, relationale Datenbank arbeitet mit exakten Werten in Tabellen und festen Spalten. Sie ist unschlagbar, wenn die Frage präzise ist und eine eindeutige Antwort hat. Aber sie versteht keine Bedeutung: Wer nach „günstigem Laptop“ sucht, findet keinen Eintrag, der nur „preiswertes Notebook“ enthält. Übereinstimmen muss das Wort, nicht der Sinn.

Ein Knowledge Graph speichert Wissen als ausdrückliche, benannte Beziehungen: „Berlin ist Hauptstadt von Deutschland“, „Insulin senkt den Blutzucker“. Hier sind die Relationen klar definiert und nachvollziehbar — man kann ihnen folgen wie Wegen auf einer Karte. Der Preis ist, dass jemand diese Relationen anlegen oder ableiten muss; der Graph kennt nur, was ausdrücklich verbunden wurde.

Die Vektordatenbank liegt dazwischen. Ihre Relationen sind nicht benannt, sondern gelernt: Nähe im Raum heißt „bedeutet etwas Ähnliches“, ohne dass jemand das je hingeschrieben hat. Das macht sie flexibel und unscharf zugleich. In der Praxis ergänzen sich die drei oft — exakte Filter aus der relationalen Welt, explizite Fakten aus dem Graphen, weiche Bedeutungsnähe aus dem Vektorraum.

Wo liegen die Grenzen von Vektordatenbanken?

Eine Vektordatenbank ist nur so gut wie die Embeddings, die sie speichert. Übersetzt das Modell Inhalte schlecht in Vektoren, liegen unähnliche Dinge nah beieinander und ähnliche weit auseinander — die Suche gibt dann plausibel aussehende, aber falsche Nachbarn zurück. Wechselt man das Embedding-Modell, muss in der Regel der gesamte Bestand neu übersetzt werden, denn alte und neue Vektoren leben nicht im selben Raum.

Nähe ist außerdem nicht dasselbe wie Wahrheit. Die Datenbank findet, was ähnlich ist, nicht was richtig ist. Sie kann zwei sich widersprechende Texte gleich nah an deine Frage rücken und beide ausliefern. Und weil die meisten Systeme näherungsweise suchen, kann der wirklich beste Treffer gelegentlich durchrutschen. Für harte, exakte Bedingungen — ein bestimmtes Datum, eine genaue Zahl — bleibt eine klassische Filterung nötig.

Im Modell heißt das: Eine aktive Relation ist noch keine richtige Relation. Nähe zeigt nur, dass eine Verbindung besteht, nicht ob sie trägt. Eine Vektordatenbank ist deshalb ein starkes Werkzeug, um relevante Anschlüsse zu finden — aber kein Beweis dafür, dass das Gefundene stimmt. Das Prüfen bleibt deine Aufgabe.

So sieht das mit dem Modell aus

Stell dir vor, du baust einen Assistenten für die Handbücher deiner Firma. Jemand tippt: „Wie tausche ich den Akku im Außengerät?“ In den Dokumenten steht aber nirgends genau dieser Satz — dort heißt es „Batteriewechsel an der Außeneinheit“. Eine Stichwortsuche würde scheitern, weil kaum ein Wort übereinstimmt. Die Bedeutung ist dieselbe, die Buchstaben sind es nicht.

Betrachte es als Raum aus Punkten. Jeder Handbuch-Abschnitt ist als Vektor gespeichert, also als Position, die seine Bedeutung festhält. Deine Frage wird vom selben Modell ebenfalls zu einem Punkt. Weil „Akku tauschen“ und „Batteriewechsel“ für das Modell fast dasselbe meinen, liegen die beiden Punkte dicht beieinander — die Relation zwischen Frage und richtigem Abschnitt ist kurz, auch ohne gemeinsame Wörter.

Die Suche aktiviert nun die nächstgelegenen Relationen: Sie holt die drei, vier Abschnitte, die deinem Frage-Punkt am nächsten liegen, und reicht sie an ein Sprachmodell weiter. Das formuliert daraus eine Antwort — gestützt auf genau die Stellen, die es gerade gefunden hat. Du änderst nicht die Frage und nicht die Dokumente; du nutzt, dass Bedeutung im Raum als Nähe abgelegt ist, und lässt die passende Relation aktiv werden.

Häufige Fragen

Was ist der Unterschied zwischen einer Vektordatenbank und einer normalen Datenbank?

Eine normale, relationale Datenbank speichert exakte Werte in Tabellen und sucht nach genauen Übereinstimmungen — etwa nach einer Kundennummer oder einem Datum. Eine Vektordatenbank speichert stattdessen Embeddings, also Zahlenreihen, die die Bedeutung von Inhalten festhalten, und sucht nach Ähnlichkeit statt nach exakten Treffern. Damit findet sie Texte, die dasselbe meinen, auch wenn kein einziges Wort übereinstimmt. Beide Typen schließen sich nicht aus: In der Praxis kombiniert man oft exakte Filter aus der klassischen Datenbank mit der Bedeutungssuche aus dem Vektorraum.

Was ist ein Embedding einfach erklärt?

Ein Embedding ist die Übersetzung eines Inhalts in eine lange Zahlenreihe, einen Vektor, der seine Bedeutung als Position in einem Raum festhält. Ein trainiertes Modell liest dazu einen Text und gibt diese Zahlen aus. Inhalte mit ähnlicher Bedeutung erhalten ähnliche Vektoren und liegen im Raum nah beieinander, sehr verschiedene Inhalte liegen weit auseinander. So wird aus Bedeutung eine messbare Nähe. Genau diese Nähe nutzt eine Vektordatenbank, um Ähnliches zu finden, ohne dass die Wörter übereinstimmen müssen.

Wofür braucht man Vektordatenbanken bei KI?

Sie geben großen Sprachmodellen ein durchsuchbares Gedächtnis für konkrete Inhalte. Ein Sprachmodell kennt nur seine Trainingsdaten und kann sich Dinge ausdenken, die falsch sind. Speichert man Dokumente als Vektoren, kann das System zu jeder Frage die ähnlichsten Textstücke heraussuchen und dem Modell mitgeben. Dieses Verfahren heißt Retrieval-Augmented Generation (RAG). Das Modell antwortet dann nicht aus dem Gedächtnis, sondern auf Basis belegbarer, gerade gefundener Stellen — das macht Antworten aktueller und nachvollziehbarer. Auch semantische Suche, Empfehlungen und Bildsuche bauen auf Vektordatenbanken auf.

Was ist Ähnlichkeitssuche oder Nächste-Nachbarn-Suche?

Ähnlichkeitssuche bedeutet, zu einem gegebenen Punkt die nächstgelegenen Punkte in einem Raum zu finden — formal die Nächste-Nachbarn-Suche. In einer Vektordatenbank wird deine Anfrage zu einem Vektor, und das System sucht die gespeicherten Vektoren mit dem geringsten Abstand oder dem kleinsten Winkel dazu. Bei sehr vielen Daten wäre der Vergleich mit jedem einzelnen Vektor zu langsam, deshalb nutzt man näherungsweise Verfahren (Approximate Nearest Neighbor), die den Raum vorab in eine Struktur aus Nähe-Beziehungen ordnen. Das tauscht ein wenig Genauigkeit gegen viel Geschwindigkeit.

Was ist der Unterschied zwischen Vektordatenbank und Knowledge Graph?

Ein Knowledge Graph speichert Wissen als ausdrücklich benannte Beziehungen, etwa „Berlin ist Hauptstadt von Deutschland“ — die Relationen sind klar definiert und nachvollziehbar, müssen aber von jemandem angelegt werden. Eine Vektordatenbank speichert Inhalte als Vektoren, deren Nähe gelernte, nicht benannte Ähnlichkeit ausdrückt: Zwei Punkte liegen nah beieinander, weil ein Modell viele gemeinsame Bezüge gelernt hat, ohne dass diese je notiert wurden. Der Graph ist präzise und prüfbar, der Vektorraum flexibel und unscharf. Oft kombiniert man beide, um exakte Fakten und weiche Bedeutungsnähe zusammenzubringen.

Was sind die Grenzen von Vektordatenbanken?

Eine Vektordatenbank ist nur so gut wie ihre Embeddings: Übersetzt das Modell Inhalte schlecht, landen unähnliche Dinge nah beieinander, und die Suche liefert plausibel wirkende, aber falsche Treffer. Nähe ist außerdem nicht Wahrheit — das System findet, was ähnlich ist, nicht was richtig ist, und kann auch widersprüchliche Texte ausliefern. Weil meist näherungsweise gesucht wird, kann der beste Treffer gelegentlich durchrutschen, und für exakte Bedingungen wie ein bestimmtes Datum bleibt klassische Filterung nötig. Eine Vektordatenbank findet relevante Anschlüsse, beweist aber nicht, dass das Gefundene stimmt.

Weiterdenken

Begriffe dazu: Entität, Relation, Die drei Zustände: leer, aktiv, passiv, Netzwerkebene, Zoom-in / Zoom-out, Die sechs Blickwinkel

Zuletzt aktualisiert: 2026-07-01