Primeros pasos con los datos no estructurados en Data 360
Objetivos de aprendizaje
Después de este paso, podrá hacer lo siguiente:
- Definir qué son los datos no estructurados en Data 360.
- Explicar cómo los datos no estructurados mejoran las estrategias de IA y automatización.
- Describir cómo conectar datos desde una tienda de almacenamiento de objetos externa (como Amazon S3).
¿Qué son los datos no estructurados?
Por lo general, los datos que la organización recopila adoptan tres formatos: estructurados, semiestructurados y no estructurados. Si bien las organizaciones recopilan un porcentaje cada vez más grande de datos no estructurados, solo aprovechan de manera efectiva una pequeña parte de estos. Puede resultar desafiante integrar de forma efectiva cantidades grandes de datos en flujos de trabajo, en especial para fines de búsqueda y recuperación. Es momento de cambiar esto: Data 360 ofrece compatibilidad con datos no estructurados.
Los datos no estructurados son aquellos que no tienen un formato específico coherente y no se pueden almacenar con facilidad en una base de datos relacional típica. Su falta de estructura hace que realizar búsquedas o análisis resulte particularmente desafiante. Sin embargo, las tecnologías de IA, como los modelos de lenguaje grandes (LLM, por sus siglas en inglés), pueden procesar datos no estructurados de forma efectiva. Esta capacidad hace que muchas empresas incorporen cantidades cada vez más grandes de datos no estructurados en sus estrategias basadas en datos.
Algunas formas comunes de datos no estructurados son las transcripciones de chats, archivos de audio y video, emails, documentos legales y otros tipos de textos extensos como libros. En Salesforce, como ejemplos de datos no estructurados, se encuentran los datos de los artículos de Knowledge o las transcripciones de llamadas de ventas.
Utilizar datos no estructurados para mejorar las estrategias de IA y automatización
Cuando conecta sus datos no estructurados en Data 360, puede generar resultados enfocados en los clientes en sus aplicaciones de IA generativa de Einstein (Generador de solicitudes y Agentforce), automatización (Flow Builder) y análisis (Tableau y CRM Analytics). Por ejemplo, puede mejorar las recomendaciones de respuestas de servicio al generar respuesta a clientes mediante datos de artículos de Knowledge o crear plantillas de solicitudes que utilicen emails anteriores para generar mensajes personalizados. O bien, puede utilizar Flow Builder y Agentforce para mostrar datos de casos similares a los agentes de servicio a fin de ayudar en la resolución de casos o cuando registran nuevos casos.
Conectar datos no estructurados de tiendas de almacenamiento de objetos externas
Data 360 puede hacer referencia a datos no estructurados en los formatos HTML, TXT y PDF (se incluirán formatos adicionales en futuras versiones). Además, como Data 360 ya es compatible con las conexiones de Amazon S3, Azure Blob Storage y Google Cloud Storage, solo se requiere una configuración de un par de clics para incorporar los datos no estructurados si estas conexiones ya se habían configurado.
Luego de crear una conexión entre su tienda de almacenamiento de archivos externa y Data 360, puede hacer referencia a datos no estructurados en Data 360 mediante la creación de un objeto de lago de datos no estructurados (UDLO, por sus siglas en inglés) y asignarlo a un objeto de modelo de datos no estructurados (UDMO, por sus siglas en inglés).
Data 360 crea asignaciones en el nivel del campo de forma automática entre los UDLO y los UDMO debido a que los esquemas entre ambos objetos son idénticos. Puede seguir leyendo acerca de sus esquemas en la Ayuda de Salesforce.
La relación entre los UDLO y los UDMO puede ser 1:1 o N:1. Esto significa que cada UDLO puede asignarse a un máximo de un UDMO mientras que se pueden asignar varios UDLO a un único UDMO. Observemos un ejemplo.
Supongamos que hará referencia a datos de registros de casos de varias tiendas de almacenamiento de archivos externas. Tres UDLO diferentes hacen referencia a datos de estas tres fuentes: CaseRecordingsFromAWSBucket1, CaseRecordingsFromAWSBucket2 y CaseRecordingsfromGCS. Como estas tres fuentes, por lógica, son el mismo objeto, los UDLO individuales se asignan a un único UDMO: CaseRecordings.
Cuando conecta datos no estructurados de sus tiendas de almacenamiento de archivos externas a Data 360, proporciona más contenido relevante a sus administradores y usuarios para ayudarlos a resolver problemas, gestionar casos y generar solicitudes efectivas para las aplicaciones de IA generativa de Einstein.
Registrarse para una zona de pruebas personalizada con Data 360
Para completar este proyecto, necesitará una zona de pruebas personalizada que contenga Data 360 y nuestros datos de muestra. Si aún no presionó el botón Create Playground (Crear zona de pruebas) en la parte superior de esta página, hágalo ahora. Luego, siga los pasos para crear una zona de pruebas personalizada y conectarla a Trailhead.
Una vez iniciada la zona de pruebas personalizada, estará todo listo para introducir el contenido de un artículo de Knowledge como datos no estructurados. Haga clic en Verify step to earn 100 points (Verificar paso para obtener 100 puntos) en la sección Challenge (Reto) para avanzar al siguiente paso en el proyecto.
