Nutzen Sie diesen Button, um zwischen Hell- und Dunkelmodus zu wechseln.

Retrieval Augmented Generation: Der Schlüssel zu vertrauenswürdiger generativer KI?

Was genau ist RAG? Warum ist es für vertrauenswürdige generative KI wichtig?

Es wird weithin davon ausgegangen, dass generative KI nahezu jede Branche und jeden Anwendungsfall verändern wird. Desweiteren haben Unternehmen im vergangenen Jahr mehr als 20 Milliarden US-Dollar für diese Technologie ausgegeben. Aber setzt sie diese Unternehmen auch neuen Risiken aus, wenn sie nicht strategisch implementiert wird? In unserem Blog erläutern wir, wie die Retrieval Augmented Generation (RAG)-Technik generative KI verbessert und dazu beiträgt, diese Risiken zu mindern und genauere, relevantere und vertrauenswürdigere Ergebnisse zu liefern.

Das ABC von RAG

Retrieval Augmented Generation (RAG) ist eine Technik,  welche die Ausgabe großer Sprachmodelle optimiert, indem es vor der Generierung einer Antwort auf externe Wissensquellen verweist. Es erweitert die Fähigkeiten dieser Modelle auf spezifische Domänen oder interne Wissensbasen, ohne Neutrainierung. Ein kosteneffizienter Ansatz für relevante, präzise und nützliche Ergebnisse. Traditionelle generative KI-Modelle sind auf ihren Trainingsdatensatz beschränkt, was zu Fehlern und veralteten Informationen führen kann - ein Risiko für Unternehmen, die diese Technologie nutzen.

Ein typisches generatives KI-Tool ohne Retrieval Augmented Generation generiert Antworten basierend auf Trainingsdaten, welche es durch diverse Eingaben abspeichert und sich dadurch weiterentwickelt. Diese Methode birgt vier Hauptrisiken, die das Vertrauen des Nutzers in die Ergebnisse der generativen KI beeinflussen:

  • Halluzinationen: Ein generatives KI-Tool kann eine Antwort geben, die zwar plausibel klingt, aber falsch ist und auf gelernten Aufforderungen und Antworten von Nutzern und nicht auf relevanten Daten basiert. Es gibt Beispiele von Anwälten, die generative KI zum Verfassen eines Schriftsatzes einsetzen, jedoch liefert ihr Tool Ergebnisse, die völlig fiktive Fälle zitierten.1
    Journalisten, die mit generativer KI arbeiten, bestätigen diesen Sachverhalt – in einem Fall berichtete Bloomberg, dass ein Tool fälschlicherweise behauptete, es gäbe in einem laufenden militärischen Konflikt einen Waffenstillstand.2
  • Obsolete Daten: Da die Trainingsdatensätze von generativer KI statisch sind, sind die Informationen oft veraltetet oder basieren auf nicht mehr aktuelle Daten. Diese Daten haben ihre Relevanz oder Gültigkeit verloren und werden in der Regel nicht mehr benötigt oder verwendet. Obsolete Daten können beispielsweise veraltete Versionen von Dokumenten, überholte Kundendaten oder abgelaufene Produktinformationen sein.
  • Ungenaue Daten: Wenn die von einem generativen KI-Tool verwendeten Daten nicht aus einer vertrauenswürdigen und lizenzierten Quelle stammen, sind sie möglicherweise nicht genau oder zuverlässig.
  • Black Box: Dieses Merkmal der generativen KI spiegelt den Sachverhalt wider, dass wir nicht sehen könne wie KI eine Antwort bildet, und dass sie gewöhnlich ihre Quellen nicht angibt. Dies führt zu fehlender Transparenz und Nachvollziehbarkeit.

Die Technik der Retrieval Augmented Generation gilt als der beste Weg, um diese Risiken zu überwinden. Dieser Ansatz zwingt das generative KI-Tool, jede Antwort aus maßgeblichen Quellen abzurufen und gibt ebenso die Möglichkeit Zitate widerzugeben. So erhält der Nutzer eine kontextbezogene Antwort, welche auf Grundlage des Quelleninhaltes generiert worden ist.

Für Unternehmen, die generative KI-Lösungen einsetzen, ergeben sich daraus zwei wesentliche Vorteile:

  • Zuverlässigkeit: Die Unternehmen können diese Tools in der Gewissheit nutzen, dass ihre Ergebnisse aus zuverlässigen Originalquellen stammen. Anhand von Zitaten können Verantwortliche in den Unternehmen die Originalquellen lesen, um die Relevanz und Genauigkeit zu überprüfen.
  • Ethik und Compliance: Die Unternehmen können den Stakeholdern gegenüber nachweisen, dass sie generative KI-Lösungen verwenden, die auf originale und genaue Quellen zurückgreifen, die für diese spezielle Nutzung lizenziert sind. So wird der Befürchtung entgegengewirkt, dass gegen die Datenschutzbestimmungen verstoßen wird oder Daten auf unethische Weise gesammelt werden.

3 Gründe wieso RAG der Schlüssel zum Erfolg für die generative KI ist

  1. Glaubwürdige Daten für generative KI priorisieren – Die Verwendung vertrauenswürdiger und lizenzierter Datenquellen ist für den effektiven Einsatz von RAG in der generativen KI unerlässlich. Unternehmen müssen sicherstellen, dass ihre Daten nach ethischen Grundsätzen beschafft wurden und diesen Prozess transparent darstellen, um rechtliche und Reputationsrisiken zu vermeiden. Die Nutzung von Daten ohne Erlaubnis der Rechteinhaber kann zu Konsequenzen führen und sollte vermieden werden.
  2. Eine optimale Bereitstellungsmethode finden – Unternehmen haben bei der Nutzung generativer KI-Lösungen zwei Möglichkeiten: Entweder sie entwickeln ihre eigene Lösung und integrieren exzellente Daten zur Unterstützung ihres RAG-Ansatzes, oder sie nutzen kostengünstig generative KI-Tools von Drittanbietern. Im letzteren Fall sollten die Unternehmen verstehen, wie das Tool Daten verwendet und sammelt, und sich vergewissern, dass der Anbieter vertrauenswürdig ist und die Vorschriften einhält.
  3. Einen ethischen Ansatz von oben nach unten festlegen – Die C-Suite ist verantwortlich für die Art und Weise, wie ein Unternehmen generative KI einsetzt. Indem sie deutlich macht, dass nur zuverlässige und glaubwürdige Daten verwendet werden und das generative KI-Tool einen Retrieval Augmented Generation-Ansatz mit Quellenangabe nutzt, wird das Vertrauen in das Unternehmen gestärkt. 97% der Fachkräfte, die für den LexisNexis® Future of Work Report 2024 befragt wurden, gaben an, dass es wichtig ist, dass KI-Ergebnisse von Menschen überprüft werden. Daher sollten Mitarbeiter geschult werden, diese Technologie zu überwachen und auf mögliche Ungenauigkeiten oder Verstöße zu achten.3

LexisNexis® bietet Daten und Technologie für einen erfolgreichen RAG-Ansatz

Die Effektivität von Retrieval Augmented Generation für generative KI hängt von der Genauigkeit, Vertrauenswürdigkeit und lizenzierten Verwendung der kontextuellen Daten ab. LexisNexis bietet lizenzierte Inhalte und optimierte Technologie zur Unterstützung Ihrer generativen KI- und RAG-Ziele:

  • Daten für generative KI: LexisNexis bietet umfangreiche, mit robusten Metadaten angereicherte Nachrichteninhalte, die für die Integration in Ihre generativen KI-Projekte mit Nexis Data+ bereitstehen. Tausende von Quellen sind bereits für die Verwendung mit generativer KI-Technologie lizenziert und können über die API in Ihre eigenen Tools integriert werden.
  • Generative KI für die Recherche: Nexis+ AI ist eine neue, KI-gestützte Rechercheplattform, die zeitsparende generative KI-Tools mit einer umfangreichen Bibliothek vertrauenswürdiger Quellen kombiniert. Nexis+ AI spart nicht nur Zeit bei zentralen Rechercheaufgaben wie der Analyse von Dokumenten, der Zusammenfassung von Artikeln und der Erstellung von Berichten, sondern setzt auch Retrieval Augmented Generations und Zitate ein, die die für die KI-generierten Inhalte verwendeten Quellen transparent darstellen.

Lawyer Used ChatGPT In Court—And Cited Fake Cases. A Judge Is Considering Sanctions (forbes.com), forbes.com, 08.06.2023
Google and Microsoft Chatbots Falsely Claim Ceasefire in Israel - Bloomberg, bloomberg.com, 11.10.2023

Kontaktieren Sie uns

Email: kontakt@lexisnexis.de
Telefon: +49 211 417435-40