Skip to main content

Vorbereiten der Daten

Lernziele

Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:

  • Erläutern, wie man Datenherausforderungen erkennt und löst
  • Definieren von Datenanforderungen für Ihr Projekt

Die Bedeutung von Datenbereitschaft

Ihr Unternehmen muss datenbereit sein, um ein AI-Projekt zu starten. Das bedeutet, dass die Daten für das Projekt genau, verfügbar, zugänglich und auf sichere Governance gestützt sind.

In vielen Unternehmen ist die Datenqualität eine große Hürde für die Umsetzung von AI-Projekten. Und das aus gutem Grund! Daten sind die Grundlage für AI-Algorithmen, die damit lernen, sich anpassen und bessere Entscheidungen treffen können. Daten guter Qualität können die Genauigkeit, Effizienz, Zuverlässigkeit und Fairness von AI-Systemen verbessern.

Es ist enorm wichtig, Probleme bei der Datenqualität vor der Implementierung Ihres AI-Projekts anzugehen. Lassen Sie sich jedoch nicht von Ihrem Projekt abbringen, weil Sie glauben, Daten müssten perfekt sein. Viele Projekte scheitern an der Datenbereitschaft, weil Teams versuchen, Perfektion zu erreichen. Legen Sie stattdessen zusammen mit Ihrem Team vernünftige Ziele für die Datenbereitschaft fest. In der Phase "Erstellen" können Sie Lücken in Ihren Daten, die sich auf die AI-Ausgabe auswirken, identifizieren und beheben.

In dieser Lektion erhalten Sie einen Überblick darüber, wie Sie Ihre Datenqualität bewerten und Ihre Daten für ein AI-Projekt vorbereiten.

Erstellen eines Dateninventars

Becca weiß, dass die Erstellung eines Dateninventars die beste Möglichkeit ist, sich einen vollständigen Überblick über die Daten für ihr Projekt zu verschaffen. Ein Dateninventar hilft, verschiedene Datenbestände zu verwalten und potenzielle Probleme zu erkennen.

Führen Sie folgende Schritte aus, um Ihr Dateninventar zu erstellen:

  1. Ermitteln Sie, welche Daten Sie für Ihr Projekt benötigen.
  2. Stellen Sie fest, wo die Daten gespeichert sind.
  3. Beantworten Sie einige Fragen zu Ihren Daten.
    • Sind die Daten strukturiert, unstrukturiert oder halbstrukturiert? (Weitere Informationen über die Datenklassifizierung finden Sie im Modul Datengrundlagen für die AI-Nutzung.)
    • Wie oft werden Ihre Daten aktualisiert?
    • Werden die Daten in Echtzeit, stündlich, täglich, monatlich oder statisch aktualisiert?
    • Wie kann auf die Daten zugegriffen werden?
    • Wurden Governance-Standards für die Daten implementiert?
    • Welche Datenüberlegungen können in Ihrem Projekt zu Herausforderungen führen?

Dateninventar von Coral Cloud

Fahren wir mit Beccas AI-Projekt zur Automatisierung des Check-in-Prozesses bei Coral Cloud Resorts fort. Zur Erinnerung: Hier ist Beccas Implementierungsplan mit wichtigen Datenpunkten in Fettdruck.

  1. Es wird ein Flow verwendet, um einen Datensatz namens "Guest Event" (Gäste-Event) auf der Grundlage der neuesten Reservierungsdaten in Data Cloud zu erstellen.
  2. Einstein Copilot wird beigebracht, wie er den Flow durch natürliche Dialogsprache startet. Wenn beispielsweise der Gast Sofia Rodriguez eintrifft, um ihren Aufenthalt zu beginnen, kann das Personal Einstein die Anweisung "Check in Sofia Rodriguez" (Sofia Rodriguez einchecken) geben und Einstein erledigt dann den Rest.
  3. Mithilfe von Prompt Builder (Aufforderungsgenerator) wird eine personalisierte Begrüßungs-E-Mail generiert und gesendet, die Ausflüge vorschlägt, die für den Gast interessant sein könnten.

Becca überprüft ihren Plan und überlegt, welche Daten sie für die Umsetzung der Lösung benötigt.

  • In Schritt 1 benötigt sie Reservierungsdaten. Coral Cloud verwendet eine externe Plattform namens Reserv-o-matic, um Reservierungsdaten zu speichern. Sie verwendet also Data Cloud, um diese Daten in Salesforce zu übernehmen.
  • In Schritt 2 muss sie Reservierungsdaten auf der Grundlage des Kundennamens abrufen können. Kundendaten sind in Salesforce verfügbar.
  • In Schritt 3 benötigt sie Daten über frühere Ausflüge, die der Gast gebucht hat. Die Kaufhistorie des Kunden ist ebenfalls in Salesforce verfügbar.

Nachdem sie die erforderlichen Datenquellen ermittelt hat, erstellt Becca ein Dateninventar.

Datenbezeichnung

Datenquelle

Art von Daten

Aktualisierungshäufigkeit

Überlegungen

Kontaktdatensätze

CRM

Strukturiert

Täglich

Datumsangaben liegen im Format MM/TT/JJ vor

Reservierungen

Reserv-o-matic

Strukturiert

Echtzeit

Datumsangaben liegen im Format TT/MM/JJ vor.

Ausflüge

CRM

Strukturiert

Täglich

Datumsangaben liegen im Format MM/TT/JJ vor

Erfassen der Datenanforderungen des Projekts

Die Datenanforderungen eines Projekts sind die grundlegenden Anforderungen, die für den Erfolg Ihres Projekts erforderlich sind. Wenn Sie Ihre Datenanforderungen verstehen, vermeiden Sie unnötige Arbeit.

Beurteilen der Datenqualität

Daten mit hoher Datenqualität ergeben zuverlässige und effektive AI-Projekte. (Weitere Informationen zur Bewertung der Datenqualität finden Sie im Modul Datenqualität.) Bei der Bewertung der Datenqualität sollten Sie feststellen, wo Ihre Daten Mängel aufweisen. Dies sind Bereiche, in denen Daten bereinigt werden sollten. Bei der Datenbereinigung werden falsche, beschädigte, falsch formatierte, doppelte oder unvollständige Daten in einem Datenset korrigiert oder entfernt. Dazu gehört auch das Schließen von Datenlücken. Da die Datenbereinigung zeitaufwändig sein kann, sollten Sie keine Daten bereinigen, die Sie nicht für Ihr Projekt benötigen.

Wie Becca anhand ihres Dateninventars feststellt, liegen Reservierungsdaten im Format TT/MM/JJ vor, während die Kontaktdatensätze und Ausflüge das Format MM/TT/JJ haben. Die Daten haben kein einheitliches Format und erfüllen daher nicht die Qualitätskriterien. Becca schreibt ein kleines Programm, um alle Reservierungsdaten in das Format MM/TT/JJ umzuwandeln.

Als Becca noch einige weitere Datenprobleme bereinigt, wird ihr klar, dass es viel zu viele Daten sind und sie keine Chance hat, alles perfekt zu machen. Coral Cloud ist ein Weltklasse-Resort mit Tausenden von Gästen pro Jahr. Sie fühlt sich entmutigt, bis ihr klar wird, dass sie die Datenanforderungen für ihr Projekt zu weit gefasst hat und Reservierungen der vergangenen Jahren bereinigt. Eigentlich muss sie ja nur Reservierungen bereinigen, die in der Zukunft liegen, da nur für diese Reservierungen der automatische Check-in genutzt wird. Becca filtert also die Reservierungen nach Terminen in der Zukunft. Da sie die Datenanforderungen des Projekts verstanden hat, muss sie jetzt viel weniger Datensätze durcharbeiten.

Migrieren und Integrieren von Daten

Wenn Ihre Daten aus mehreren Quellen stammen, müssen Sie die Daten migrieren. Das bedeutet, Daten aus einer Quelle in eine zentrale Quelle zu bringen. Wenn Ihr Projekt in Salesforce erstellt wird, übernehmen Sie Ihre externen Daten in Salesforce. Wenn Sie die Daten migriert haben, integrieren Sie sie, indem Sie Daten aus verschiedenen Quellen in einer einheitlichen, umfassenden Ansicht zusammenführen. Migrieren und integrieren Sie nur die Daten, die Sie für Ihr Projekt benötigen. Dadurch bleibt Ihr Projekt überschaubar und Sie vermeiden, Ihr System mit unnötigen Daten zu belasten.

Da für Beccas Projekt ein Datensatz namens "Guest Event" (Gäste-Event) auf der Grundlage der Reservierungsdaten in Reserv-o-matic und des Datensatzes "Contact" (Kontakt) in Salesforce erstellt werden muss, weiß sie, dass sie die Reservierungsdaten mit dem Datensatz "Contact" (Kontakt) verknüpfen muss. Ansonsten weiß der Flow nicht, welche Reservierung zu welchem Kontakt gehört. Da Becca keine unnötigen Daten integrieren möchte, sieht sie sich die Reservierungsdatensätze an, um festzustellen, welche Felder unnötig sind. Sie sieht, dass es bei den Reservierungen ein Feld für Anmerkungen gibt, in das die Kunden besondere Wünsche eintragen können. Das Feld hat kein bestimmtes Format und wird von vielen Kunden leer gelassen. Da Becca dieses Feld für die Erstellung des Datensatzes "Guest Event" (Gäste-Event) nicht benötigt, löscht sie es, bevor sie die Reservierungen zu Salesforce migriert.

Becca richtet einen Datenstrom ein, um Daten aus Reserv-o-matic zu übernehmen. Anschließend verwendet sie die "Identity Resolution" (Identitätsbestimmung), um die Sofia in Salesforce der Sofia in Reserv-o-matic zuzuordnen. Sofias Datensatz enthält jetzt sowohl ihre Kontaktinformationen aus Salesforce als auch ihre Reservierungsdaten aus Reserv-o-matic.

Umsetzen von Data Governance

Je weniger Personen mit Ihren Daten arbeiten, desto konsistenter sind diese. Beschränken Sie die Governance auf die notwendigen Personen. In unserem Beispiel gibt Becca nur sich selbst und ihrem Vorgesetzten Zugang.

Planen von Analysen

Erstellen Sie einen Analyseplan, um den Erfolg zu messen. Dies ist wichtig, um die Leistung zu überwachen und die Rendite (ROI) Ihres Projekts zu belegen. Der ROI-Nachweis ist der Schlüssel dazu, Unterstützung für die Weiterentwicklung Ihres Projekts oder künftige AI-Projekte zu bekommen.

Der Analyseplan sollte sich an den Projektzielen orientieren, die Sie in der vorherigen Lektion beschrieben haben. Zur Erinnerung – Becca hat folgende Projektziele:

  • Die Check-in-Dauer um 50 % reduzieren
  • Bei der Kundenzufriedenheit mindestens das gleiche Niveau wie vor dem Projekt erreichen

Sie legt fest, wie sie Daten sammeln und analysieren will, um zu bewerten, ob ihr Projekt diese Ziele erreicht hat. Becca erarbeitet den folgenden Plan.

  • Am Ende jedes Arbeitstages wird die Bildschirmzeit an den Computern der Rezeption berechnet. Die durchschnittlichen Bildschirmzeiten vor und nach der Einführung des AI-Check-in-Prozesses werden miteinander verglichen.
  • Jedem Gast wird am Ende des Aufenthalts eine optionale Umfrage zur Bewertung der Zufriedenheit angeboten. Die durchschnittlichen Zufriedenheitswerte vor und nach der Einführung des AI-Check-in-Prozesses werden miteinander verglichen.

Jetzt hat Becca eine konkrete Möglichkeit, die Auswirkungen ihres Projekts aufzuzeigen.

Lösen der Datenherausforderungen

Nachdem sie die Anforderungen für ihr Projekt definiert hat, muss Becca die kritischsten Datenherausforderungen lösen, zu denen in der Regel Qualitätsprobleme, Integrationshindernisse, Datenlücken und manchmal sogar eine veraltete Dateninfrastruktur gehören. Becca weiß, dass sie diese Probleme frühzeitig lösen muss, damit das neue AI-Projekt von Coral Cloud nicht auf möglicherweise unzuverlässigen oder ungenauen Daten basiert.

Becca macht bis jetzt große Fortschritte bei ihrem Projekt! Sie handelt Daten wie ein Profi. In der nächsten Lektion erfahren Sie, wie Becca die Risiken ihres AI-Projekts bewertet und das Projekt auf vertrauenswürdige, verantwortungsvolle Weise umsetzt.

Ressourcen

Teilen Sie Ihr Trailhead-Feedback über die Salesforce-Hilfe.

Wir würden uns sehr freuen, von Ihren Erfahrungen mit Trailhead zu hören: Sie können jetzt jederzeit über die Salesforce-Hilfe auf das neue Feedback-Formular zugreifen.

Weitere Infos Weiter zu "Feedback teilen"