Die Problemstellung: Signalüberlagerung und Aufmerksamkeitsdefizite
Aktuelle wissenschaftliche Untersuchungen belegen, dass Sprachmodelle dazu neigen, entscheidende Fakten zu übersehen, wenn diese in einer Flut von irrelevanten oder veralteten Informationen untergehen. Besonders kritisch ist der Effekt der „Verlorenheit in der Mitte“. Informationen, die weder am Anfang noch am Ende eines Textes stehen, werden vom Modell unzuverlässiger verarbeitet.
Das Hauptproblem liegt in der Vermischung zweier unterschiedlicher Leistungen des künstlichen neuronalen Netzes innerhalb eines einzigen Rechenvorgangs: Der Filterung der aufgabenkritischen Textstellen aus dem Gesamtrauschen sowie der Schlussfolgerung auf Basis der gefundenen Fakten.
Die Aufmerksamkeitsmechanismen aktueller Sprachmodelle liefern bei einem schlechten Verhältnis von Nutzinformation zu Stördaten oftmals unzuverlässige Ergebnisse, so dass die logische Präzision unter der mangelhaften Vorselektion leidet.
Der Lösungsansatz: Die modulare Entkopplung von KI-Systemen
Um die Verarbeitungsqualität zu sichern, lässt sich anstelle eines Universalsystems ein spezialisiertes, ressourcenschonendes Modul vorschalten, das als Filter fungiert und ausschließlich die relevanten Textabschnitte identifiziert. Im Anschluß wird ein leistungsfähiges Sprachmodell für die logische Auswertung der bereits vorselektierten, relevanten Daten eingesetzt.
Strategische Relevanz für den Unternehmenseinsatz
Dieses Architekturmodell bietet mehrere, wesentliche Vorteile für die betriebliche Anwendung. So benötigt dieses Modell keinen Zugriff auf die inneren Rechenvorgänge der Modelle. Damit lassen sich auch geschlossene Programmierschnittstellen externer Anbieter nutzen, ohne die Kontrolle über die Datenaufbereitung zu verlieren.
Das beschriebene Architekturmodell liefert explizite Textbelege für die getroffenen Schlussfolgerungen. Diese Möglichkeit macht die Entscheidungsgrundlage des LLMs für den Menschen nachvollziehbar, kontrollierbar und schafft eine wichtige Grundlage für die Revisionssicherheit durch Quellentransparenz im Sinne des AI Acts.
Die Identifikation von relevanten Informationen folgt der logischen Struktur der Daten, nicht den Eigenheiten eines spezifischen Modells. Einmal optimierte Filterstrategien lassen sich somit direkt auf neue Modellgenerationen übertragen; die technologische Abhängigkeit wird gleichzeitig verringert. Eine beispielhafte Umsetzung findet sich innerhalb der Applikation DookuSense der Open Logic Systems (Open LS).
Fragen zum Thema Informationsextraktion und logischer Schlussfolgerung?
Kontaktieren Sie uns gerne oder buchen Sie unser Seminar zum Thema Data Science und Künstliche Intelligenz