BLOG | BÜRO DES CTO

Generative KI und neue Datentypen beeinflussen die App-Architektur

Lori MacVittie Miniaturbild
Lori MacVittie
Veröffentlicht am 02. April 2024

Bereits 2022 fiel mir ein subtiler Wandel in der App-Architektur auf, der sich auf dem Markt in Diskussionen über neue Protokolle und Daten manifestierte. Dies war nicht allzu überraschend, da, wie ich damals erwähnte, App-Architekturen historisch gesehen alle fünf Jahre neu entstehen und beginnen, die Märkte für App-Bereitstellung und -Sicherheit zu prägen, und etwa fünf Jahre später erlangen sie die dominierende Stellung.

Im Jahr 2023 dachte ich, dass sich dieser Wandel etwa im Jahr 2025 zeigen würde. Aber ich konnte das Aufkommen der generativen KI und ihre explosive Wirkung auf die Entwicklung dieser Architekturen nicht vorhersehen.

Damit will ich nur sagen: Dieser Wandel vollzieht sich schneller und wird dramatische Auswirkungen auf, nun ja, alles haben.

Damit wir uns aber nicht zu sehr in der architektonischen Entwicklung verlieren, sollten wir wirklich verstehen, was sie antreibt: Daten. 

Verschiedene Arten von Daten

Wenn man „Daten“ sagt, hat der Zuhörer normalerweise sofort Bilder von Reihen von Kunden- und Produktdaten im Kopf, die irgendwo in einem riesigen RDBMS gespeichert sind. Okay, vielleicht nicht alle Zuhörer, aber viele Zuhörer tun das. Der Grund hierfür liegt darin, dass das vorherrschende Datenspeicherdesign auf strukturierte, tabellarische Daten ausgerichtet ist. Öffnen Sie eine Tabelle und Sie werden sehen, was ich meine. Es basiert auf Zeilen und Spalten, und bei einem RDBMS ist das eigentlich nicht viel anders.

Wir könnten argumentieren, dass es NoSQL- und Schlüssel-Wert-Datenspeicher, Objektspeicher und ähnliche Datenkonstrukte gibt und sich App-Architekturen daher nicht um tabellarische Daten drehen. Aber seien wir doch ehrlich, das tun sie wirklich. Alle diese anderen Arten von Datenspeichern werden aus guten Gründen verwendet, die meisten dieser Gründe waren jedoch für die Anwendung nebensächlich und änderten daher nicht wesentlich die allgemeinen Architekturprinzipien, die die App-Entwicklung jahrzehntelang bestimmt haben.

Doch die zunehmende Verbreitung von Anwendungen – und Hybridmodelle – führt zu zahlreichen Anforderungen. Wie etwa Beobachtbarkeit und Sicherheit, die die Generierung von Telemetriedaten erfordern. Die Verteilung erfordert eine Möglichkeit, die Beziehungen zwischen verteilten Datenspeichern zu verstehen, was zu Wissensgraphen führt. Und generative KI erfordert Möglichkeiten zur Erweiterung und zum Trainieren von Modellen, was zur Verwendung von Einbettungen führt, die in Vektordatenbanken gespeichert sind.

Dabei handelt es sich um vier sehr unterschiedliche Datentypen, und es ergeben sich neue Möglichkeiten für deren Speicherung und Zugriff. Alle vier werden schnell zu „Standardkomponenten“ moderner Anwendungen, insbesondere jener, die den Einsatz generativer KI erleichtern sollen. 

Figur: Eine grundlegende, umfassende Ansicht einer modernen, KI-gestützten Anwendung
  1. Die Telemetrie führt zu erheblichen Veränderungen auf der operativen Seite der Welt, da wir erkennen, dass spaltenbasierte Formate eine bessere Möglichkeit darstellen , Streaming-Daten in Echtzeit zu übertragen und zu verarbeiten – und genau das sind Telemetriedaten.
  2. Wissensgraphen und Graphentechnologie werden immer beliebter, um verteilte Daten zu föderieren und komplexe Beziehungen zwischen Datenquellen zu verstehen. Diese Technologie ermöglicht uns Protokolle wie GraphQL, die die Art und Weise, wie wir APIs nutzen, um Daten im verteilten Unternehmen zu finden und zu verwalten, grundlegend verändern.
  3. Die zunehmende Nutzung von Retrieval Augmented Generation (RAG)-Techniken für generative KI führt dazu, dass Vektordatenbanken zu einem Teil der Anwendung selbst werden und nicht mehr als Datenspeicher irgendwo tiefer in der Architektur.
  4. Und schließlich dürfen wir generative KI-Daten nicht vergessen. Ein LLM generiert bei jeder Anfrage neue Daten. Dies stellt Sicherheitsleute vor erhebliche Herausforderungen, denn sie müssen herausfinden, wie sie potenzielle Bedrohungen und Probleme in dynamisch generierten, unstrukturierten Daten erkennen können.

Es sind die Daten – mit ihren unterschiedlichen Formaten, Protokollen, Verwendungszwecken und Anwendungen –, die diesen Wandel vorantreiben. Das Ergebnis ist ein Headless-Ansatz , der auf APIs auf eine Art und Weise basiert, die viele Leute noch nie zuvor in Betracht gezogen haben. Das heißt, Geschäftsfunktionen und -kapazitäten werden als APIs bereitgestellt, ohne die traditionelle Präsentationsschicht zu berücksichtigen. Dadurch lässt sich eine größere Bandbreite von Schnittstellen für eine robustere Gruppe von Benutzergeräten entwickeln. APIs machen Daten und Funktionen zugänglich , weshalb sie für die digitale Transformation so wichtig sind. 

Wir sehen diesen Ansatz in vielen modernen Apps, die die Vorteile von Microservices nutzen. Aus diesem Grund sind UI-Frameworks so weit verbreitet (und sorgen im Internet für Debatten). Diese Frameworks werden zum Erstellen einzelner Apps verwendet, die APIs nutzen, um auf Funktionen und Daten zuzugreifen. Sie sind von den Back-End-„Anwendungen“, die sie zur Steuerung von Arbeitsabläufen und zur Wertschöpfung auf dem Markt verwenden, getrennte Einheiten.

All dies führt zu Headless-Architekturen. Dieser Wandel war bereits im Gange, aber die Einführung generativer KI hat die Bedeutung der Daten verdeutlicht und ihn beschleunigt.

Dies wiederum wird tiefgreifende Auswirkungen auf die Bereitstellung und Sicherheit von Apps haben, da neue Bedrohungen und Herausforderungen entstehen, die bewältigt werden müssen, um die Anforderungen von Unternehmen und Benutzern zu erfüllen.