Erste Schritte mit unstrukturierten Daten in Data 360
Lernziele
Nach diesem Schritt sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Definieren unstrukturierter Daten in Data 360
- Erläutern, wie sich Ihre KI- und Automatisierungsstrategien mithilfe unstrukturierter Daten verbessern lassen
- Beschreiben, wie Daten von einem externen Blob-Speicher (wie Amazon S3) verbunden werden
Was sind unstrukturierte Daten?
Die Daten, die Ihr Unternehmen sammelt, lassen sich im Allgemeinen in drei Formen einteilen: strukturierte, halbstrukturierte und unstrukturierte Daten. Unternehmen sammeln einen immer größeren Anteil an unstrukturierten Daten, nutzen jedoch nur einen sehr kleinen Teil davon effektiv. Große Datenmengen lassen sich nur schwer effektiv in Arbeitsabläufe integrieren, insbesondere für Such- und Abrufzwecke. Mit der Unterstützung für unstrukturierte Daten in Data 360 ist es an der Zeit, dies zu ändern.
Unstrukturierte Daten sind Daten, die kein spezifisches, konsistentes Format aufweisen und nicht auf einfache Weise in einer typischen relationalen Datenbank gespeichert werden können. Durch ihren Mangel an Struktur sind sie besonders schwierig zu durchsuchen oder zu analysieren. KI-Technologien wie große Sprachmodelle (LLMs) können unstrukturierte Daten jedoch effektiv verarbeiten. Diese Fähigkeit veranlasst viele Unternehmen dazu, ihre immer umfangreicheren Mengen an unstrukturierten Daten in ihre datengestützten Strategien einzubeziehen.
Zu den gängigen Formen unstrukturierter Daten gehören Chat-Abschriften, Audio- und Videodateien, E-Mails, juristische Dokumente und andere umfangreiche Texte wie beispielsweise Bücher. In Salesforce sind Beispiele für unstrukturierte Daten Daten aus Knowledge-Artikeln oder aus Transkripten von Verkaufsgesprächen.
Nutzen unstrukturierter Daten zur Verbesserung Ihrer KI- und Automatisierungsstrategien
Wenn Sie Ihre unstrukturierten Daten in Data 360 verknüpfen, können Sie kundenorientierte Ergebnisse in Ihren Anwendungen für generative KI (Prompt-Generator und Agentforce), Automatisierung (Flow Builder) und Analysen (Tableau und CRM Analytics) von Einstein erstellen. Beispielsweise können Sie die Antwortempfehlungen für den Service verbessern, indem Sie Antworten an Kunden unter Verwendung von Daten aus Knowledge-Artikeln generieren, oder Vorlagen erstellen, die frühere E-Mails verwenden, um personalisierte Nachrichten zu generieren. Oder Sie können Flow Builder und Agentforce verwenden, um Servicemitarbeitern Daten ähnlicher Fälle anzuzeigen, um sie bei der Lösung von Fällen oder beim Erfassen neuer Fälle zu unterstützen.
Verknüpfen unstrukturierter Daten aus externen Blob-Speichern
Data 360 kann auf unstrukturierte Daten in den Formaten HTML, TXT und PDF verweisen (weitere Formate werden in zukünftigen Versionen hinzukommen). Da Data 360 bereits Verbindungen von Amazon S3, Azure Blob Storage und Google Cloud Storage unterstützt, sind nur wenige Konfigurationsschritte erforderlich, um Ihre unstrukturierten Daten zu importieren, wenn Sie diese Verbindungen bereits eingerichtet haben.
Nachdem Sie eine Verbindung zwischen Ihrem externen Blob-Speicher und Data 360 hergestellt haben, können Sie auf unstrukturierte Daten in Data 360 verweisen, indem Sie ein unstrukturiertes Data Lake-Objekt (UDLO) erstellen und es einem unstrukturierten Datenmodellobjekt (UDMO) zuordnen.
Data 360 erstellt automatisch Feldzuordnungen zwischen UDLOs und UDMOs, da die Schemata der beiden Objekte identisch sind. Mehr über ihre Schemata finden Sie in der Salesforce-Hilfe.
Die Beziehung zwischen UDLOs und UDMOs kann 1:1 oder N:1 sein. Das bedeutet, dass jedes UDLO maximal einem UDMO zugeordnet werden kann, während mehrere UDLOs einem einzelnen UDMO zugeordnet werden können. Sehen wir uns ein Beispiel an.
Stellen Sie sich vor, Sie beziehen sich auf Daten aus Fallaufzeichnungen aus mehreren externen Blob-Speichern. Drei verschiedene UDLOs verweisen auf Daten aus diesen drei Quellen: CaseRecordingsFromAWSBucket1, CaseRecordingsFromAWSBucket2 und CaseRecordingsfromGCS. Da diese Quellen logisch das gleiche Objekt darstellen, werden die einzelnen UDLOs einem UDMO zugeordnet: CaseRecordings.
Wenn Sie unstrukturierte Daten aus Ihren externen Blob-Speichern mit Data 360 verbinden, stellen Sie Ihren Administratoren und Benutzern relevantere Inhalte zur Verfügung, mit denen sie Probleme lösen, Fälle verwalten und effektive Eingabeaufforderungen für generative KI-Anwendungen von Einstein erstellen können.
Registrieren für einen benutzerdefinierten Playground mit Data 360
Für den Abschluss dieses Projekts benötigen Sie einen speziellen benutzerdefinierten Playground, der Data 360 und unsere Beispieldaten umfasst. Wenn Sie noch nicht auf die Schaltfläche Create Playground (Playground erstellen) oben auf dieser Seite geklickt haben, tun Sie das jetzt. Befolgen Sie die Schritte, um einen benutzerdefinierten Playground zu erstellen und ihn mit Trailhead zu verbinden.
Nachdem Sie Ihren benutzerdefinierten Playground gestartet haben, können Sie den Inhalt eines Knowledge-Artikels als unstrukturierte Daten einlesen. Klicken Sie auf Verify step to earn 100 points (Überprüfen Sie den Schritt, um 100 Punkte zu erhalten) im Abschnitt "Challenge" (Aufgabe), um zum nächsten Schritt im Projekt zu gelangen.
