RAG-System: Firmenwissen KI-fähig, lokal, DSGVO-konform

Der Inhalt zusammengefasst:

Ein RAG-System verbindet ein Sprachmodell mit dem eigenen Firmenwissen - aus einem allgemeinen Chatbot wird ein Assistent, der die Geschäftsrealität kennt und seine Quellen nennt.
Der eigentliche Hebel ist die Datensouveränität: Lokal betriebene Modelle halten das Firmenwissen im Haus und machen Datenschutz-by-Design möglich - so auch die Datenschutzkonferenz in ihrer Orientierungshilfe von 2025.
RAG beseitigt weder Halluzinationen noch die Notwendigkeit sauberer Daten und klarer Zugriffsrechte - der Erfolg entscheidet sich an der Datenqualität, nicht an der Modellgröße.

Ein gängiges Sprachmodell beantwortet Fragen zur Weltgeschichte, formuliert Anschreiben und erklärt Steuerrecht im Allgemeinen. Was es nicht kennt, ist Ihr Unternehmen: Ihre Preisliste von letzter Woche, Ihre Wartungshandbücher, die Sonderklauseln in Ihren Lieferverträgen. Genau an dieser Stelle setzt ein RAG-System an. Es koppelt ein Sprachmodell an Ihren eigenen Wissensbestand, sodass die KI nicht mehr allgemein antwortet, sondern mit konkretem Bezug auf Ihre Dokumente – und dabei nennt, woher die Antwort stammt.

Was ein RAG-System ist

Stellt eine Mitarbeiterin eine Frage, durchsucht das System zuerst die eigenen Unterlagen des Unternehmens nach den passenden Textstellen und reicht diese zusammen mit der Frage an das Sprachmodell weiter. Die Antwort entsteht damit aus Ihren Quellen, nicht aus dem allgemeinen Training des Modells. Dieses Verfahren nennt die Fachwelt Retrieval Augmented Generation, kurz RAG.

Die Datenschutzkonferenz, der Zusammenschluss der unabhängigen Datenschutzbehörden von Bund und Ländern, beschreibt RAG als KI-Technologie, bei der große Sprachmodelle durch gezielten Zugriff auf unternehmens- oder behördeneigene Wissensquellen ergänzt werden, um kontextspezifische Antworten zu liefern. Der praktische Nutzen laut Behörde: höhere Genauigkeit, bessere Nachvollziehbarkeit und weniger der für Sprachmodelle typischen frei erfundenen Antworten – im Fachjargon „Halluzinationen“.

Der entscheidende Punkt ist nicht die Technik, sondern das Ergebnis im Arbeitsalltag. Aus einem generischen Chatbot, der plausibel klingt, wird ein Assistent, der Ihre Realität kennt und seine Aussagen mit einer Quelle belegt.

Der Quellennachweis

Ein klassischer Chatbot produziert eine Antwort und überlässt es Ihnen, ob Sie ihr glauben. Bei einer Frage zum richtigen Wartungsintervall einer Maschine oder zur Kündigungsfrist in einem Rahmenvertrag ist das zu wenig. Ein RAG-System verweist auf das konkrete Dokument, aus dem es schöpft. Wer die Antwort prüfen will, klickt auf die Quelle statt im Netzlaufwerk zu suchen.

Damit verschiebt sich die Rolle der KI vom Orakel zum Nachschlagewerk, das mitdenkt. Das ist für ein mittelständisches Unternehmen der eigentlich relevante Fortschritt – nicht die Frage, welches Modell gerade die meisten Parameter hat.

Wichtig: Datensouveränität

Für die meisten Unternehmer steht jedoch eine Frage ganz vorn: Wo landen meine Daten? Und sobald Verträge, Personalunterlagen oder Konstruktionspläne in einen Cloud-Chatbot wandern, ist das eine berechtigte Sorge.

Die gute Nachricht: RAG-Systeme können eigenständig entwickelt, betrieben und kontrolliert werden und damit Datenschutz von Beginn an in die Architektur einbauen. Also „Datenschutz-by-Design“. Vor allem aber: Sie ermöglichen den Einsatz kleinerer und auch lokal betriebener Modelle. Damit lässt sich ein System betreiben, ohne personenbezogene Daten an Dritte wie etwa große Cloud-Konzerne zu übermitteln. Die Behörde sieht darin einen wichtigen Beitrag zur digitalen Souveränität.

Meike Kamp, Berliner Beauftragte für Datenschutz und Informationsfreiheit und 2025 Vorsitzende der Datenschutzkonferenz, bringt die Bedingung dafür auf den Punkt:

„RAG-Systeme können Unternehmen und Behörden dabei unterstützen, die Vorteile moderner KI zu nutzen und zugleich die damit einhergehenden Risiken für die Rechte und Freiheiten von betroffenen Personen zu vermindern. Entscheidend ist jedoch, dass ihr Einsatz von Anfang an datenschutzkonform gestaltet wird.“

Mit anderen Worten: Die Technik gibt Ihnen die Möglichkeit, die Kontrolle zu behalten. Ob Sie es tatsächlich tun, entscheidet sich an der Umsetzung.

Lokal oder in der Cloud

Beim Aufbau eines RAG-Systems stehen im Wesentlichen zwei Wege offen.

Der erste Weg ist der vollständig lokale Betrieb auf eigener Hardware. Offen verfügbare Sprachmodelle laufen dabei auf einem Server im eigenen Haus, kein Dokument verlässt das Unternehmen. Das ist die Maximalvariante an Kontrolle. Sie erfordert eine Investition in Hardware und Betreuung, und die lokal lauffähigen Modelle sind in der Regel kleiner als die großen Cloud-Modelle. Für viele interne Anwendungsfälle reicht diese Leistung jedoch vollkommen aus.
Der zweite Weg nutzt einen Cloud-Dienst mit einem Rechenzentrum innerhalb der EU. Das bringt mehr Modellleistung und weniger eigenen Betriebsaufwand, bedeutet aber, dass die Daten das Haus verlassen und bei einem Anbieter verarbeitet werden – in einem vertraglich und örtlich abgesteckten Rahmen, aber eben außerhalb.

Eine wichtige Einschränkung gehört zur ehrlichen Betrachtung dazu: Lokal betrieben heißt nicht automatisch rechtssicher. Die Datenschutzkonferenz stellt klar, dass die datenschutzrechtliche Bewertung der einzelnen Verarbeitungen im Einzelfall zu erfolgen hat. Ein Server im eigenen Keller entbindet niemanden davon, sauber zu prüfen, welche Daten zu welchem Zweck verarbeitet werden.

Wo ein RAG-System wirkt

Der Nutzen wird konkret, sobald man auf die wiederkehrenden Suchvorgänge in einem Betrieb schaut. Vier Felder zeigen sich in der Praxis besonders deutlich.

Im Kundenservice findet ein Mitarbeiter in Sekunden die richtige Antwort aus Handbüchern, früheren Servicefällen und technischen Hinweisen, statt drei Kollegen zu fragen oder Ordner zu durchsuchen.
Im Angebots- und Vertriebsalltag lassen sich Anfragen mit aktuellen Produktdaten, Konditionen und Spezifikationen beantworten, ohne dass jemand die jeweils gültige Version manuell heraussucht.
In Vertragswesen und Compliance durchsucht das System Verträge und Richtlinien nach Klauseln, Fristen oder Risiken – eine Arbeit, die sonst Stunden bindet.
Und beim Onboarding richten neue Mitarbeitende ihre Fragen an einen internen Assistenten, statt eingearbeitete Kollegen aus ihrer eigentlichen Arbeit zu holen.

Alle Beispiele haben eines gemeinsam: Es geht darum, vorhandenes Wissen schneller verfügbar zu machen.

Wo die Grenzen liegen

Die Datenschutzkonferenz weist ausdrücklich darauf hin, dass RAG die grundlegenden Probleme eines rechtswidrig trainierten Sprachmodells nicht beseitigt. Auch Transparenz, Zweckbindung und die Wahrung der Rechte betroffener Personen über das gesamte System hinweg bleiben anspruchsvoll und müssen aktiv gestaltet werden.

Drei Punkte entscheiden in der Praxis über Erfolg oder Enttäuschung. Die Berechtigungssteuerung: Wer im Vertrieb arbeitet, darf über eine generierte Antwort nicht indirekt an Personalakten gelangen. Die Zugriffsrechte aus den vorhandenen Systemen müssen bis in die Suche durchgereicht werden. Zweitens die Datenqualität: Aufgeräumte, eindeutige und aktuelle Dokumente liefern bessere Antworten als jedes größere Modell auf einer chaotischen Ablage. Drittens die Erwartung an die Antworten: RAG reduziert erfundene Aussagen deutlich, beseitigt sie aber nicht vollständig. Eine Kontrollinstanz bei kritischen Auskünften bleibt notwendig.

Der Erfolg eines RAG-Systems entscheidet sich an der Datenqualität und den Zugriffsrechten – nicht an der Größe des Modells.

Wie Sie anfangen können

Der häufigste Fehler ist der Versuch, das gesamte Unternehmenswissen auf einmal abzubilden. Ein tragfähiger Einstieg sieht anders aus.

Wählen Sie zuerst einen einzigen, klar umrissenen Anwendungsfall mit hohem Suchaufwand – etwa die technische Dokumentation im Service oder die Angebotsunterlagen im Vertrieb. Räumen Sie dann den dazugehörigen Datenbestand auf, sodass nur eindeutige und aktuelle Dokumente in das System gelangen. Testen Sie im dritten Schritt zunächst klein und denken Sie die Zugriffsrechte von Anfang an mit, nicht erst beim Ausrollen. Und messen Sie die Antwortqualität an echten Fragen aus dem Arbeitsalltag, bevor Sie den Assistenten auf die ganze Abteilung loslassen.

Wer so vorgeht, hat in wenigen Wochen einen produktiven Assistenten auf Basis der eigenen Daten – mit überschaubarem Risiko und einem Ergebnis, das sich beurteilen lässt.

Update: Das passende LLM für RAG

Jedes RAG-System ist nur so gut wie seine Eingangsdaten. Um die beste Leistung herauszuholen bietet sich aktuell Mistral OCR 4 an, das aktuell leistungsstärkste Dokumentenerkennungs-System am Markt. Es liest nicht nur Text aus PDFs, sondern versteht die Struktur: Überschriften, Tabellen, Formeln, Signaturen. 170 Sprachen. Und das Entscheidende: Es läuft self-hosted auf Ihrer Infrastruktur. Ihre Verträge, Handbücher und Datenblätter verlassen nie Ihren Server. Das Ergebnis: Ihre KI antwortet nicht nur richtig, sie kann auch sagen woher sie es weiß, mit Seitenzahl und Dokumentenname.

Die eigentliche Arbeit liegt im sauberen Aufräumen der eigenen Wissensquellen, im Festlegen der Zugriffsrechte und in der Auswahl des richtigen Einstiegsfalls. Wie aus einzelnen KI-Werkzeugen ein zusammenhängender Nutzen entsteht, haben wir im Beitrag zur KI-Orchestrierung beschrieben.

Wenn Sie Unterstützung bei Aufbau eines RAG-System brauchen, sprechen Sie uns gerne an.

0 Comments

Über diesen Artikel

Aktualisiert: 25. Juni 2026
Veröffentlicht: 29. Mai 2026
Lesezeit: 6 Minuten
Leser: 222
Kommentare: 0 Comments
Autor: Joerg Martin
Von Menschen erstellt
Datenschutz, KI

Kontakt

Coworking Salzburg2023-10-10

Dieser Artikel ist äußerst nützlich und informativ! Ich würde gerne mehr über die rechtlichen Aspekte der Werbeanbringung an Immobilien in Österreich lesen.
weiterlesenschließen

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Monika Esterl2021-03-17

Danke für Ihren Artikel zum Thema Installation von Werbeanlagen. Es trifft sich gut, denn mein Bruder möchte eine Werbeanlage an seiner Immobilie installieren und fragte, was er dabei beachten sollte. Ich werde ihm weiterleiten, dass man bereits genehmigte Werbeanlagen nicht nach eigenem Gutdünken verändern sollte.
weiterlesenschließen

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Klaus Brenner2023-04-05

Sehr geehrte Damen und Herren.
Frage: benötige ich als Mit-Aussteller auf der Messe Therapie-Leipzig 4-6. Mai 2023 ein Brandschutzzertifikat B1.
Auf der Messe zeige ich ein neues Spiel für die Ergotherapie. Auf meiner Webseite unter KUXBALO sehen Sie das Spiel.
Ich habe schon auf vielen Messen, Veranstaltungen Kuxbalo präsentiert, es wurde auch nie ein Brandschutzzertifikat B1 zur Einreichung verlangt.
Ich wäre Ihnen sehr dankbar, wenn Sie mir darüber eine Antwort geben könnten.
Danke
Viele Grüße
Klaus Brenner
weiterlesenschließen

Was bedeutet B1 oder B2 bei Brennbarkeitsklassen?

Was bedeutet B1 oder B2 bei Brennbarkeitsklassen?
Avenida- Therme2020-04-01

Hervorragende Zusammenarbeit, sehr gute Kommunikation und Beratung, kurze Lieferzeiten - Wir sind mit der Ideenfabrik sehr zufrieden!
weiterlesenschließen

IDF Google

Alexander Glaser2026-07-01

Starke Marke, starkes Handwerk: Corporate Design, Webdesign und Werbetechnik aus einer Hand, spürbar professionell umgesetzt. Besonders spannend für mich als Architekt: der Blick von Ideenfabrik auf Corporate Architecture und datengetriebene Raumkonzepte – hier sehe ich echtes Potenzial für Zusammenarbeit. Klare Empfehlung.
weiterlesenschließen

IDF Google

Jörg Bauer2022-05-28

weiterlesenschließen

IDF Google
Alex Finsterbusch2023-11-12

Als Marketingmanagerin weiß ich, wie wichtig ein gut gestalteter Messestand für den Erfolg auf Messen ist. Es geht nicht nur darum, unsere Produkte zu präsentieren, sondern auch darum, die Marke unseres Unternehmens zu repräsentieren. Bei der Planung unseres Messestands arbeitete ich eng mit einem Messebauunternehmen zusammen, um sicherzustellen, dass das Design sowohl funktional als auch optisch ansprechend ist. Die Zusammenarbeit war entscheidend, um ein Design zu entwickeln, das unsere Produkte effektiv präsentiert und gleichzeitig die Werte unseres Unternehmens widerspiegelt. Ich glaube, dass ein gut durchdachter Messestand einen erheblichen Einfluss auf die Wahrnehmung unseres Unternehmens durch Kunden und Geschäftspartner hat.
weiterlesenschließen

Was ist Messebau?

Was ist Messebau?

Shiro2020-04-01

Als Schüler kann ich nur sagen: Super Zusammenarbeit! Das ganze Team war sehr nett, hatte kompetente Leute und hat mir immer weitergeholfen falls ich ein Problem gehabt habe. Sie arbeiten sehr professionell und mit viel Einsatz. Im Praktikum durfte ich viele Sachen lernen und ausprobieren. Ich war und bin sehr froh dass ich mit dem Team zusammenarbeiten konnte. Es hat viel Spaß gemacht! Ein Schülerpraktikum kann ich also nur empfehlen!
weiterlesenschließen

IDF Google

Cleo Schroeder2023-02-17

Hallo! Manchmal wünsche ich mir mehr solcher Artikel. Vielen Dank. Grüße
weiterlesenschließen

Was bedeuten die Pflegesymbole in der Kleidung?

Was bedeuten die Pflegesymbole in der Kleidung?
alexanderriedinger2024-09-12

Der Artikel über die Risiken eines veralteten Onlineshops in Bezug auf die DSGVO ist ein wichtiger Weckruf für alle, die eine Webseite betreiben. Es zeigt, wie teuer es werden kann, wenn man die Anforderungen nicht ernst nimmt. Ich habe kürzlich auf der Seite von Alexanderriedinger nützliche Tipps zu diesem Thema gefunden, die auch die technischen Aspekte beleuchten, wie man seinen Shop sicher und rechtskonform hält. Vielleicht wäre es hilfreich, wenn hier noch mehr praktische Hinweise oder Tools zur Aktualisierung der Shop-Systeme geteilt werden könnten. Danke für die wertvollen Informationen!
weiterlesenschließen

DSGVO: Veralteter Onlineshop führt zu Bußgeld

DSGVO: Veralteter Onlineshop führt zu Bußgeld

Markus2019-05-17

Vielen Dank für einen ausführlichen Beitrag zur Installation von Werbeanlagen an Immobilien. Gut zu wissen, dass jede Werbeanlage genehmigt werden muss. Ich werde auch darauf achten, dass keine Veränderungen zu Werbeanlagen nach der Genehmigung gemacht werden müssen.
weiterlesenschließen

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Rechtliche Grundlagen bei der Installation von Werbeanlagen an Immobilien

Dagmar Brandes2024-02-07

Ist es sinnvoll , ein Gerät zur Erzeugung von Singulett Sauerstoff zur Verbesserung der Raumluft zuhause einzusetzen? ( Privat)
weiterlesenschließen

Wie wirkt Singulett Sauerstoff?

Wie wirkt Singulett Sauerstoff?
B.Kahl2023-04-14

Die Eingrenzung des Begriffes "Wassersäule" allein auf die Eigenschaften von Stoff ist blanker Unsinn. Die Maßeinheit "mmWS" wurde früher oft verwendet, wenn es um Drücke im geringen Bereich. Ein Beispiel dafür wäre die Messung des Zuges in einem Schornstein, wobei "Zug" als negativer Druck zu sehen ist.
Siehe hier: https://de.wikipedia.org/w/index.php?title=MmWS&redirect=no
weiterlesenschließen

Was bedeutet Wassersäule?

Was bedeutet Wassersäule?

Pia2022-12-18

Toll, dass sich das Unternehmen vorstellt. Ich suche tatsächlich schon länger eine Firma für Digitaldrucke in der Gegend. Ich werde mich bei ihnen melden.
weiterlesenschließen

Wer ist die Reklame Scheue?

Wer ist die Reklame Scheue?

Aleksandra Mazur2024-02-04

Sie haben ein einzigartiges Talent für das Schreiben. Dieser Artikel war informativ, ansprechend und wunderschön geschrieben.
weiterlesenschließen

Die Auswirkungen von KI auf das moderne Web

Die Auswirkungen von KI auf das moderne Web

RAG-System: Firmenwissen KI-fähig, lokal, DSGVO-konform