Verstehen und Implementieren von KI-Workflows für optimales Training und Einsatz
Autor: Brian Letort, Head of Data Office and Platform AI, Digital Realty
Künstliche Intelligenz (KI) hat das Potenzial, Geschäftsabläufe zu revolutionieren und den Fortschritt von Innovationen in allen Branchen und auf der ganzen Welt zu verändern.
Über 75 % der jährlichen Gesamtauswirkungen generativer KI werden speziell in den Bereichen Vertrieb, Marketing, Produktforschung und -entwicklung, Softwareentwicklung und Kundenbetrieb auftreten. Diese Chancen können jedoch nur genutzt werden, wenn KI durchdacht und strategisch eingesetzt wird.
Die Implementierung von KI ist ein strukturierter Prozess, bei dem CTOs, CDOs und CIOs gleichermaßen die neuen Technologieanforderungen verstehen, ihre aktuelle Infrastrukturstrategie überdenken und bestehende Systeme bewerten müssen. Damit KI wirklich effektiv ist, müssen IT-Führungskräfte eine Grundlage schaffen, die den Entwicklungs- und Bereitstellungsanforderungen der KI-Modelle von heute und morgen gerecht wird.
Dazu sollten IT-Führungskräfte die Phasen von KI-Workflows gezielt berücksichtigen. Diese Workflows umfassen drei unabhängige Arten der Arbeit mit Daten: Datenaggregation, Training und Inferenz. Zu den Überlegungen gehört, wie jede einzelne davon funktioniert und welche grundlegenden Schlüsselelemente für einen reibungslosen Ablauf erforderlich sind.
Drei Phasen von KI-Workflows und ihre Auswirkungen auf die IT-Infrastruktur
Phase 1: Datenaggregation
KI ist nur so gut wie die Daten, auf denen sie trainiert wird. Die Datenaggregation beginnt mit einem umfassenden Konzept zum Sammeln, Bereinigen, Organisieren und Speichern von Daten, damit diese zum Trainieren und als Informationsquelle für eine KI-Anwendung verwendet werden können.
Damit diese Vorverarbeitungsphase wie vorgesehen funktioniert, sollten IT-Führungskräfte die folgenden bewährten Verfahren befolgen:
- Identifizieren Sie Datenquellen: Große Unternehmen produzieren und sammeln eine Vielzahl von Daten: Daten über Kunden oder Mitarbeiter, Betriebsdaten, Finanzdaten, Netzwerkprotokolle, Intranet-Suchen oder von IoT-Sensoren. Damit KI Informationen und Antworten über ein Unternehmen intelligent erkennen kann, benötigt sie ein umfassendes Bild der Umgebung eines Unternehmens. Der erste Schritt besteht darin, diese Datenquellen zu lokalisieren.
- Sammeln Sie Daten in einem zentralen System: Dann benötigen IT-Führungskräfte ein System, mit dem sie diese Daten aus ihren unterschiedlichen Quellen, Datenbanken und Speicherorten sammeln und in einem zentralen Hub oder Repository zusammenführen können. Dies könnte beispielsweise durch die Einführung eines ERP-Systems (Enterprise Resource Planning) oder eines Data Lake erfolgen, der mit verschiedenen Quellen wie direkten Datenbankverbindungen, APIs (Application Programming Interfaces) oder anderen Quellen verbunden ist.
- Bereinigen und organisieren Sie die Daten: Auch wenn die Daten an einem zentralen Ort gesammelt wurden, sind sie möglicherweise immer noch nicht einheitlich formatiert und kommen als strukturierte (spezifisch und einheitlich aus einer Datenbank), halbstrukturierte (organisiert, aber nicht nach festen Richtlinien) oder als unstrukturierte Daten (verschiedene Datentypen) an. IT-Führungskräfte implementieren am besten bewährte Verfahren für die „Datenhygiene“, die das Überführen von Daten in standardisierte Formate und Namenskonventionen, das Scannen auf Fehler und das Eliminieren veralteter oder doppelter Daten umfassen. Dieser Schritt kann sowohl zeitaufwendig als auch kostspielig sein.
- Etablierung einer Datenverwaltung: Schließlich sollte ein reproduzierbarer Prozess zur Datenverwaltung etabliert werden, der auch regelt, wie die Daten geschützt werden und wer Zugriff darauf hat. Dadurch wird sichergestellt, dass die Datenqualität über einen längeren Zeitraum hinweg konstant bleibt. Angesichts der Größe der gesammelten Daten empfiehlt es sich, die Daten vor Ort zu verarbeiten, um die Auswirkungen der Datengravitation zu verringern.
Phase 2: Training
Obwohl Unternehmen höchstwahrscheinlich nur grundlegende Modelle verwenden werden, die sie mit ihren eigenen Daten ergänzen (anstatt eigene Modelle zu erstellen und zu trainieren), ist es wichtig, diese Stufe in der KI-Entwicklung zu verstehen. Organisierte und bereinigte Datensätze sind eine Voraussetzung für das Training eines KI-Modells für Unternehmen. In der Regel verwendet ein Unternehmen ein grundlegendes Modell, wie das GPT-4-Modell von OpenAI, und trainiert oder „prompt-tuned“ es dann weiter mit internen Daten, sodass das Wissen der KI sowohl allumfassend als auch bereichsspezifisch ist. Dieser Trainingsablauf kann wie folgt aussehen:
- Auswahl des richtigen Modells: Nicht jedes KI-Modell funktioniert gleich oder ist für die spezifischen Daten einer Organisation geeignet. Zunächst sollten Verantwortliche im IT-Bereich den Anwendungsfall für die KI-Einführung skizzieren: Datenanalyse? Kundenservice? Betriebliche Effizienz? Dies hilft ihnen bei der Auswahl der richtigen KI-Architektur, des richtigen Algorithmus und der richtigen Parameter für ihre geschäftlichen Anforderungen.
- Mit einer Aufgabe beginnen: Als Nächstes bringen Sie dem neuen KI-Modell bei, eine bestimmte Aufgabe mithilfe eines Trainingsdatensatzes aus der Datenaggregationsphase auszuführen. Dadurch kann das KI-Modell beginnen, Muster und Beziehungen in den Daten zu erkennen. Während es zu lernen beginnt, können diejenigen, die das KI-Modell trainieren, damit beginnen, seine Parameter zu optimieren, um es präziser und effektiver zu machen.
- Testen und Bewerten: Testen Sie das Modell weiter, um sein Wissen zu stärken und zu vertiefen. Erweitern Sie die Tests auf zusätzliche Datensätze und beobachten Sie, wie es sich anpasst, und optimieren Sie es bei Bedarf. Bewerten Sie die Leistung während des gesamten Testprozesses, um sicherzustellen, dass sie den Erwartungen entspricht und die Genauigkeit, den Rückruf, die Präzision und andere erforderliche Bewertungsmetriken erreicht.
- Validierung der Leistung: Jetzt ist es an der Zeit, die Leistung der KI anhand eines neuen Validierungsdatensatzes zu bewerten, um zu sehen, wie sie gelernt hat. Dies ist der Zeitpunkt, um die Parameter zu optimieren und das KI-Modell für den Einsatz im Unternehmen vorzubereiten.
Phase 3: Inferenz
Jetzt ist es an der Zeit, die KI zum Einsatz zu bringen! In dieser Phase ist das KI-Modell bereit, in verschiedenen Anwendungen und Anwendungsfällen eingesetzt zu werden, wo es seine Inferenzfähigkeiten nutzen wird, um Vorhersagen oder Entscheidungen über neue Datensätze zu treffen.
Allerdings sollten Sie die KI nicht einfach einsetzen und sie ungeprüft arbeiten lassen. Richten Sie einen Prozess zur kontinuierlichen Validierung ein, um sicherzustellen, dass das KI-Modell richtig funktioniert und umsetzbare Ergebnisse liefern kann, und um sich insbesondere gegen „Halluzinationen“ abzusichern, die sich auf das Geschäft auswirken könnten. Dieser Prozess der Überwachung eines Algorithmus in der Produktion wird allgemein als Modellbeobachtbarkeit bezeichnet.
In der Harvard Business Review wird beispielsweise beschrieben, wie Morgan Stanley „eine Reihe von 400 ‚goldenen Fragen‘“ verwendet, deren Antworten bekannt sind und die als fortlaufender KI-Genauigkeitstest dienen. Wenn sich die Art und Weise ändert, wie die KI diese goldenen Fragen beantwortet, wissen sie, dass sie das Modell neu abstimmen müssen.
Herausforderungen beim Navigieren im KI-Workflow
Im Idealfall verläuft die Implementierung von Unternehmens-KI reibungslos, von der Datenstrategie über die Schulung bis hin zur Einführung. IT-Führungskräfte sollten sich dabei jedoch der folgenden Herausforderungen bewusst sein.
- Schlechte Datenqualität: KI ist nur so gut wie die Daten, auf denen sie trainiert wird. Unstrukturierte oder unformatierte Daten oder sogar ein Mangel an Daten aus dem gesamten Unternehmen führen dazu, dass das KI-Modell nicht wie gewünscht lernen oder funktionieren kann. Laut dem „Global AI Adoption Index 2023“ von IBM ist „zu hohe Datenkomplexität“ das zweitgrößte Hindernis für eine erfolgreiche KI-Einführung. Aus diesem Grund ist es wichtig, zunächst Maßnahmen zu ergreifen, um einen Datenverwaltungsplan aufzustellen, wie oben beschrieben.
- Mangel an Hardware: Um KI schnell und effizient auszuführen, ist eine Rechenhardware erforderlich, die den Anforderungen gerecht wird – und ein Mangel daran wirkt sich auf Leistung und Geschwindigkeit aus. Hochleistungs-Computerhardware (HPC) kann die KI-Anforderungen von Unternehmen – insbesondere in der latenzempfindlichen Inferenzphase – ausreichend unterstützen, indem sie Simulations- und Modellierungsumgebungen durch Parallelverarbeitung antreibt. Sie nimmt außerdem nur einen Bruchteil des Platzes von veralteter Hardware ein.
- Schwache Infrastruktur: Neben der Hardware benötigt KI die richtige Infrastruktur, um sie zu unterstützen. Dazu gehört auch die richtige Leistungsdichte, die bei KI fünf- bis zehnmal höher sein kann als bei anderen Systemen, die von einer veralteten Infrastruktur verwaltet werden. Mit dieser Zunahme der Rechenleistung werden KI-Workflows auch eine spezielle Kühlung für das Rechenzentrum erfordern.
- Steigende Kosten: KI-Investitionen können für ein Unternehmen kostspielig sein, sowohl in der Entwicklung als auch in der zugrunde liegenden Infrastruktur und Hardware. Eine Möglichkeit, KI kostengünstiger zu gestalten, besteht darin, sicherzustellen, dass KI-Bereitstellungen und -Projekte mit den Geschäftszielen übereinstimmen und dass KI-Anwendungsfälle dem Wachstum und der Wirkung des Unternehmens zugutekommen. POCs werden oft verwendet, um einen quantifizierbaren Wert zu demonstrieren, bevor ein Projekt in Angriff genommen wird.
- Komplexe IT-Abläufe: KI-Workflows erfordern viele neue Überlegungen zum IT-Betrieb, darunter einen strategischen Ansatz für das Datenmanagement und die Interkonnektivität, Zeitaufwand für Schulungen und entsprechende Hardware und Infrastruktur. Dazu gehört auch ein strategischer Ansatz für das Teammanagement und die Sicherstellung, dass die Mitarbeiter über das nötige Fachwissen verfügen, um neue KI-Rollouts zu verwalten – insbesondere, wenn laut dem oben genannten IBM-Bericht „begrenzte KI-Fähigkeiten, Fachkenntnisse oder Wissen“ das größte Hindernis für eine erfolgreiche KI-Einführung darstellen.
Die Grundlage für Unternehmens-KI schaffen
Unternehmens-KI bietet heute enorme Möglichkeiten, die nur durch eine erfolgreiche Implementierung genutzt werden können. Zunächst muss ein strategisches Programm zur Datenaggregation erstellt werden, um Daten effizient zu sammeln, zu verarbeiten und zu speichern. Anschließend werden diese Daten verwendet, um das KI-Modell zu trainieren, damit es mit domänenspezifischem Wissen, Mustern und statistischen Beziehungen vertraut wird. Schließlich muss sichergestellt werden, dass es einen Plan zur Leistungsbewertung und Nachverfolgung von Kennzahlen nach der Bereitstellung und dem Einsatz von KI in der Praxis gibt.
Diese drei Phasen der KI-Workflows bilden die Grundlage, auf der Unternehmen Innovationen aufbauen werden.
Möchten Sie erfahren, wie Sie KI erfolgreich implementieren können, um Ihr Unternehmen in die Zukunft zu führen? Laden Sie noch heute den Leitfaden „KI für IT-Führungskräfte: Bereitstellung einer zukunftssicheren IT-Infrastruktur“ herunter.