KI-bereite Daten sind ein Muss, um das Versprechen der KI-Bemühungen einzulösen. Machen Sie sich klar, worum es geht, und bereiten Sie sich mit diesen fünf Schritten vor.
KI-bereite Daten sind ein Muss, um das Versprechen der KI-Bemühungen einzulösen. Machen Sie sich klar, worum es geht, und bereiten Sie sich mit diesen fünf Schritten vor.
Von Rita Sallam | 21. Oktober 2024
Data- und Analytics-Führungskräfte müssen nachweisen, dass die Daten ihres Unternehmens für die immer zahlreicheren KI-Initiativen bereit sind. Es bestehen jedoch große Unterschiede zwischen den Anforderungen an KI-bereite Daten und der herkömmlichen Datenverwaltung. Um diese Lücke zu schließen, empfiehlt Gartner die folgenden Schritte:
Beurteilen Sie Ihren Datenbedarf in Abhängigkeit von den KI-Anwendungsfällen.
Präsentieren Sie die Anforderungen vor dem Vorstand und gewinnen Sie dessen Buy-in.
Entwickeln Sie die Praktiken der Datenverwaltung weiter.
Erweitern Sie das Ökosystem der Datenverwaltung.
Skalieren und steuern Sie.
Diese Roadmap stellt sicher, dass Ihre Daten für die von Ihnen geplanten KI-Initiativen bereit sind, und sorgt dafür, dass sich die Stakeholder darüber einig sind, was KI-bereit in Bezug auf Daten wirklich bedeutet.
Das könnte Ihnen auch gefallen: Lesen Sie Bereiten Sie sich auf KI vor – was IT-Führungskräfte wissen und tun müssen, um mehr über die Abbildung von KI-Nutzungsfällen zu erfahren.
Sie können nachweisen, dass Ihre Daten für die KI-Anforderungen bereit sind, indem Sie die Daten auf die Anwendungsfälle abstimmen, sie qualifizieren und eine angemessene Governance nachweisen. Es kann helfen, sich diese drei Fragen zu stellen:
Jeder KI-Anwendungsfall sollte beschreiben, welche Daten er benötigt, was auch abhängig von der verwendeten KI-Technik ist. Im Vorfeld kann dies vielleicht nicht vollständig definiert werden, aber es wird sich herausstellen, wenn die Daten verwendet werden und die KI-Anforderungen erfüllt sind. Gehen Sie auf Anforderungen ein, wie z. B.:
KI-Techniken: Verschiedene KI-Techniken, wie generative KI (GenAI) oder Simulationsmodelle, haben einzigartige Datenanforderungen.
Quantifizierung: Stellen Sie ein ausreichendes Datenvolumen unter Berücksichtigung von Mustern wie Saisonalität sicher.
Semantik und Kennzeichnung: Die korrekte Beschriftung und Kennzeichnung, insbesondere von Bildern und Videos, ist von entscheidender Bedeutung.
Qualität: Die Daten müssen die für den KI-Anwendungsfall spezifischen Qualitätsstandards erfüllen, auch wenn sie Fehler oder Abweichungen enthalten.
Vertrauen: Datenquellen und Pipelines müssen zuverlässig sein.
Vielfalt: Beziehen Sie vielfältige Datenquellen ein, um Verzerrungen zu vermeiden.
Herkunft: Sorgen Sie für Transparenz bezüglich der Datenherkunft und -transformationen.
Durch die Qualifizierung der Nutzung wird sichergestellt, dass die Daten kontinuierlich den Anforderungen entsprechen, sei es für das Training, die Entwicklung oder die Ausführung eines Modells im Betrieb. Verwenden Sie die folgenden Parameter, um sicherzustellen, dass die Daten die erwarteten Vertrauensanforderungen für KI-Anwendungsfälle erfüllen:
Validierung und Verifizierung: Stellen Sie regelmäßig sicher, dass die Daten während der Entwicklung und des Betriebs den Anforderungen entsprechen.
Leistung und Kosten: Die Daten sollten den betrieblichen Leistungsvereinbarungen entsprechen, einschließlich Reaktionszeit und Kosteneffizienz.
Versionierung: Verfolgen und verwalten Sie verschiedene Datenversionen, um Modellabweichungen und Pipeline-Probleme zu bewältigen.
Kontinuierliche Regressionstests: Entwickeln Sie Testfälle zur Erkennung von Fehlern und Datenabweichungen.
Beobachtbarkeitsmetriken: Überwachen Sie den Zustand der Daten, einschließlich rechtzeitiger Bereitstellung und Genauigkeit.
Definieren Sie die laufenden Data-Governance-Anforderungen, die die Daten zur Unterstützung des KI-Anwendungsfalls erfüllen müssen, indem Sie Parameter verwenden wie z. B:
Daten-Stewardship: Wenden Sie während des gesamten Lebenszyklus der Daten Richtlinien an, einschließlich Modellzugriff und -entwicklung.
Normen und Vorschriften: Erfüllen Sie die sich entwickelnden KI-Vorschriften, wie das EU-Gesetz zur KI und die DSGVO.
KI-Ethik: Sprechen Sie ethische Bedenken an, wie z. B. die Verwendung von echten Kundendaten für das Training.
Kontrollierte Inferenz und Ableitung: Verfolgen Sie, wie die Modelle interagieren, und sorgen Sie für Governance.
Datenverzerrung und -fairness: Gehen Sie proaktiv mit Datenverzerrungen um und testen Sie Modelle mit problematischen Datensätzen.
Gemeinsame Nutzung von Daten: Erleichtern Sie die gemeinsame Nutzung von Daten und Metadaten zur Unterstützung verschiedener KI-Anwendungsfälle.
Auf der Grundlage umfangreicher Interaktionen mit Kunden, die erfolgreich KI-bereite Dateninitiativen umgesetzt haben, empfiehlt Gartner fünf Schritte für D&A-Führungskräfte auf dem Weg zur KI-Readiness.
Die Bereitschaft zur Datenverwaltung bewerten: Bewerten Sie den aktuellen Stand Ihrer Datenverwaltungspraktiken, um Lücken und verbesserungswürdige Bereiche zu ermitteln.
Den Buy-in des Vorstandes gewinnen: Sichern Sie sich die Unterstützung und Zustimmung der Führungskräfte, um die notwendigen Ressourcen und das Engagement für KI-Initiativen sicherzustellen.
Die Datenverwaltungspraktiken weiterentwickeln: Passen Sie Ihre Datenverwaltungsstrategien an die spezifischen Anforderungen von KI-bereiten Daten an und verbessern Sie sie.
Das Ökosystem der Daten ausbauen: Erweitern Sie Ihre Dateninfrastruktur und -kapazitäten, um vielfältige und skalierbare KI-Anwendungsfälle zu unterstützen.
Skalieren und steuern: Implementieren Sie robuste Data-Governance-Frameworks, um Datenqualität, Compliance und ethische Nutzung zu gewährleisten, während Ihre KI-Initiativen wachsen.
Mit KI-bereiten Daten ist gemeint, dass Ihre Daten für den Anwendungsfall repräsentativ sein müssen, mit allen Mustern, Fehlern, Ausreißern und unerwarteten Erscheinungen, die zum Trainieren oder Ausführen eines KI-Modells für einen bestimmten Zweck erforderlich sind. Dieser Prozess und diese Praxis basieren auf der Verfügbarkeit von Metadaten, um die Daten abzustimmen, zu qualifizieren und zu steuern.
Es gibt keine Möglichkeit, Daten generell oder im Voraus KI-bereit zu machen. Die Bereitschaft von Daten für KI hängt davon ab, wie die Daten verwendet werden sollen. Für die Erstellung eines Algorithmus zur prognostizierbaren Wartung wären beispielsweise ganz andere Datensätze erforderlich als für die Anwendung von GenAI auf Unternehmensdaten.
„Hochwertige“ Daten sind – gemessen an herkömmlichen Datenqualitätsstandards – nicht gleichzusetzen mit KI-bereiten Daten. Wenn man über Daten im Zusammenhang mit Analysen redet, wird beispielsweise erwartet, dass man die Ausreißer entfernt oder die Daten bereinigt, um die menschlichen Erwartungen zu unterstützen. Wenn ein Algorithmus trainiert wird, benötigt er jedoch repräsentative Daten. Dazu können auch Daten von schlechter Qualität gehören.