Introducción a los datos sin estructurar en Data 360
Objetivos de aprendizaje
Después de este paso, podrá hacer lo siguiente:
- Definir datos sin estructurar en Data 360.
- Explicar cómo los datos sin estructurar mejoran sus estrategias de IA y de automatización.
- Describir cómo conectar datos a partir de un almacén de "blobs" externo (por ejemplo, Amazon S3).
¿Qué son los datos sin estructurar?
Los datos que recopila su organización suelen ser de tres tipos: estructurados, semiestructurados y sin estructurar. Las organizaciones recopilan una gran cantidad de datos sin estructurar (cada vez más), pero solo utilizan de manera eficaz una pequeña parte de ellos. La integración de grandes cantidades de datos en flujos de trabajo puede suponer todo un reto, especialmente cuando hay que realizar búsquedas y recuperar información. Como Data 360 es compatible con los datos sin estructurar, podemos cambiar eso.
Los datos sin estructurar son datos que no tienen un formato específico y coherente, y que no pueden almacenarse de forma sencilla en una base de datos relacional. Su falta de estructura hace que resulte particularmente difícil realizar búsquedas o analizar información. Sin embargo, las tecnologías de IA, como los modelos de lenguaje grandes (LLM), pueden procesar datos sin estructurar de manera eficaz. Esta capacidad hace que muchas empresas incorporen cada vez más datos sin estructurar en sus estrategias basadas en datos.
Entre las formas más comunes de datos sin estructurar se encuentran las transcripciones de chats, archivos de vídeo y audio, correos electrónicos, documentos legales y otros tipos de textos extensos, como libros. En Salesforce, algunos ejemplo de datos sin estructurar son artículos de Knowledge o transcripciones de llamadas de ventas.
Utilizar datos sin estructurar para mejorar sus estrategias de IA y de automatización
Al conectar sus datos sin estructurar en Data 360, puede crear resultados centrados en los clientes en su IA generativa de Einstein (Prompt Builder y Agentforce), en la automatización (Flow Builder) y en aplicaciones de análisis (Tebleau y CRM Analytics). Por ejemplo, puede mejorar las recomendaciones de respuesta del servicio mediante la generación de respuestas para los clientes con datos de artículos de Knowledge o la creación de plantilla de solicitud que utilicen correos electrónicos anteriores para generar mensajes personalizados. Si lo prefiere, puede utilizar Flow Builder y Agentforce para mostrar a los agentes de servicio datos de casos similares a fin de ayudarles en la resolución de los casos o a registrar otros nuevos.
Conectar datos sin estructurar a partir de almacenes de "blobs" externos
Data 360 puede consultar datos sin estructurar en formato HTML, TXT y PDF (en futuras versiones habrá otros formatos adicionales). Dado que Data 360 ya es compatible con conexiones de Amazon S3, Azure Blob Storage y Google Cloud Storage, la configuración puede llevarse a cabo con tan solo unos clics y podrá incorporar sus datos sin estructurar si ya ha establecido esas conexiones.
Tras establecer una conexión entre su almacén de "blobs" externo y Data 360, podrá consultar datos sin estructurar en Data 360 mediante la creación de un objeto de lago de datos (UDLO) y la asignación del mismo a un objeto de modelo datos (UDMO).
Data 360 crea asignaciones a nivel de campo automáticamente entre los UDLL y los UDMO, ya que los esquemas de ambos objetos son idénticos. En la Ayuda de Salesforce podrá obtener más información sobre los esquemas.
La relación entre los UDLO y los UDMO puede ser 1:1 o N:1. Esto significa que cada UDLO puede asignarse, como máximo, a un UDMO; por otra parte, se pueden asignar varios UDLO a un único UDMO. Observemos un ejemplo.
Vamos a suponer que usted va a consultar datos de registros de casos de varios almacenes de "blobs" externos. Los diferentes UDLO consultan datos de estas tres fuentes: CaseRecordingsFromAWSBucket1, CaseRecordingsFromAWSBucket2, y CaseRecordingsfromGCS. Como estas fuentes son lógicamente el mismo objeto, los UDLO individuales se asignan a un UDMO: CaseRecordings.
Al conectar datos sin estructurar desde sus almacenes de "blobs" externos a Data 360, proporciona a sus administradores y usuarios un contexto más relevante a fin de ayudarles a resolver problemas, gestionar casos y crear solicitudes eficaces para las aplicaciones de IA generativa de Einstein.
Registrarse para conseguir un Playground personalizado con Data 360
Para completar este proyecto, necesita un Playground personalizado que contenga Data 360 y nuestros datos de ejemplo. Si todavía no ha hecho clic en el botón Create Playground (Crear Playground) que aparece en la parte superior de esta página, hágalo ahora. Siga los pasos para crear un Playground personalizado y conéctelo a Trailhead.
Una vez que haya iniciado su Playground personalizad, estará listo para introducir el contenido desde un artículo de Knowledge como datos sin estructurar. Haga clic en el paso Verify (Comprobar) para obtener 100 puntos en la sección Challenge (Reto) a fin de ir al siguiente paso en el proyecto.
