Crear una capa semántica
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Navegar por el panel de datos de Tableau.
- Describir cómo se organizan los tipos de campos en Tableau.
- Enumerar tipos de datos.
- Describir cómo se gestionan los campos redundantes en Tableau.
Antes de empezar
Antes de empezar con el módulo, asegúrese de haber completado el de Modelo de datos de Tableau. El trabajo que vamos a realizar se basa en los conceptos y el trabajo de ese módulo. En este módulo, se familiarizará con los datos con los que trabaja, así como con algunos conceptos básicos de Tableau.
Preparar los datos
Algunas personas son capaces de preparar platos preciosos y pasteles teniendo todo por medio. Para otras, es importante el concepto de mise en place. Este concepto, que procede de la cocina francesa, significa "todo está en su sitio". Es mucho más fácil hornear un pastel si la mantequilla ya se ha puesto en un recipiente y enfriado, o decorar una preciosa tarta si la espátula ya está lista y donde debe estar cuando quiera ir a cogerla.
En el caso de los datos y los análisis, ocurre lo mismo. Se puede hacer algo de limpieza para que sea más fácil trabajar con los datos. A esto se le llama "gestión de metadatos" o desarrollar la capa semántica de los datos (aunque una capa semántica es algo mucho más complejo de lo que vamos a ver aquí).
En Tableau, nos centramos todo el tiempo en el ciclo del análisis visual, y eso significa que la gestión de los metadatos puede tener lugar durante el flujo del análisis. A continuación, le explicaremos por qué.
Navegar por el espacio de trabajo de Tableau
El entorno de creación de Tableau está diseñado tanto para llevar a cabo análisis como para interactuar directamente con los datos y gestionar elementos como los siguientes:
- Tipos de datos
- Agregaciones predeterminadas
- Cálculos
- Campos divididos o combinados
- Agrupaciones y jerarquías
Aquí tiene una vista previa del espacio de trabajo y cómo funcionan todos los elementos al trabajar con los datos.
- La barra de herramientas desde donde puede deshacer pasos, añadir fuentes de datos, borras hojas, controlar el ajuste de las imágenes y mucho más.
- El panel Data (Datos), donde se ven las tablas de datos y sus campos. Arrastre los campos fuera del panel Data (Datos) para crear una visualización.
- Las fichas de hojas, incluida la ficha Data Source (Fuente de datos). Son similares a las fichas de hojas de Excel u Hojas de cálculo de Google, y permiten cambiar de una visualización a otra.
- La tarjeta Marks (Marcas), y arriba el estante Filters (Filtros) y el estante Pages (Páginas). Desde la tarjeta Marks (Marcas) se controla gran parte del aspecto de las marcas en una visualización.
- La tarjeta Marks (Marcas) tiene propiedades como Color (Color), Size (Tamaño), Text (Texto), Detail (Detail) y Tooltip (Descripción emergente). Estas propiedades se llaman a veces estantes. Lo importante es que son áreas para soltar elementos donde puede colocar campos y cambiar la estructura de la visualización. Las propiedades que aparecen en esta tarjeta pueden cambiar en función del tipo de marca.
- La tarjeta Marks (Marcas) tiene propiedades como Color (Color), Size (Tamaño), Text (Texto), Detail (Detail) y Tooltip (Descripción emergente). Estas propiedades se llaman a veces estantes. Lo importante es que son áreas para soltar elementos donde puede colocar campos y cambiar la estructura de la visualización. Las propiedades que aparecen en esta tarjeta pueden cambiar en función del tipo de marca.
- Los estantes Columns (Columnas) y Rows (Filas). Con estos se controla la estructura principal de la visualización.
- El lienzo de la visualización, donde ocurre la magia. También puede arrastrar y soltar campos directamente aquí desde el panel Data (Datos) en lugar de tener que colocarlos en un estante.
Antes de ponerse a practicar con Tableau en este módulo, es importante repasar estos conceptos en detalle.
Introducción al panel Data (Datos)
El panel Data (Datos) muestra la fuente de datos que utiliza, una barra de búsqueda para buscar campos y la lista de tablas con sus campos.
Los campos se organizan en orden alfabético, pero se dividen mediante una línea horizontal: por encima de la línea están las dimensiones y por debajo las medidas. Además, los campos son de color verde o azul para indicar si son discretos (azules) o continuos (verdes).
Las dimensiones suelen ser campos de datos categóricos (como marcas o colores) y las medidas suelen ser campos de datos numéricos (como la longitud o el precio) con los que puede realizar cálculos. Para cambiar un campo de dimensión a medida o viceversa, solo tiene que arrastrarlo por encima o por debajo de la línea en su tabla. Esto es útil cuando algo como un campo de identificador numérico está mal colocado y se considera una medida.
También hay iconos de tipos de datos delante de cada campo, como un calendario en el caso de una fecha, "Abc" para un campo de cadena (o de texto) y el símbolo de número para un campo numérico. Si la fuente de datos, como una base de datos, no define el tipo de datos, normalmente Tableau puede identificarlo sin problemas.
Para cambiar el tipo de datos de un campo, haga clic en el icono de delante y seleccione el tipo correcto. Esto se suele hacer para garantizar que el campo se pueda utilizar en los tipos adecuados de cálculos o visualizaciones, por ejemplo, un campo de fecha que tiene un menú desplegable que va del mes a la semana y al día.
Prestar atención a los campos redundantes
Si su conjunto de datos contiene más de una tabla, es probable que acabe con varios campos con el mismo nombre. En Tableau, cada nombre de campo debe ser único. Así que si ve un campo que tiene un paréntesis al final, como (Nombre de la tabla), significa que hay un campo con ese nombre en otro lugar del conjunto de datos.
Suelen ser campos que se utilizan en cláusulas de relaciones para definir cómo se relacionan las tablas entre ellas. No se pueden eliminar. Desde el punto de vista analítico, solo necesitamos una versión de cada campo: la versión del campo que esté más completa.
Por ejemplo, en el conjunto de datos que usamos en este módulo, SeasonEpisode está tanto en la tabla Outcomes (Resultados) como en la tabla ChallengeBakes.
- En la tabla Outcomes (Resultados) se realiza un seguimiento de la posición de cada pastelero al final de un episodio. No tiene registros para la final porque este episodio tiene un formato diferente.
- La tabla ChallengeBakes contiene la lista definitiva de todos los episodios de todas las temporadas.
Si se queda con la versión de esta tabla para el campo Season Episode (Episodio de temporada), perderá el último episodio. Lo mejor es conservar el campo Season Episode (Episodio de temporada) de la tabla ChallengeBakes y ocultar las copias del campo que no estén en esta tabla.
Es importante recordar que solo porque haya campos con el mismo nombre, no tienen por qué ser redundantes. Distintas tablas pueden tener campos con el mismo nombre y contener información totalmente distinta. Supongamos que el conjunto de datos contiene una tabla Hosts (Invitados) y otra Judges (Jueces). No puede ocultar el campo Name (Nombre) sin más en una de las tablas sin perder información.
Es importante conocer bien los datos y comprobar si estamos en lo cierto cuando presuponemos algo. Podrá practicar y seguir estas prácticas recomendadas en las próximas unidades.
Aplicar todo lo que sabe sobre los metadatos
Puede hacer muchas más cosas en el panel Data (Datos) para la gestión de metadatos, como crear jerarquías, combinar o dividir campos, y crear cálculos. Pero nos hemos centrado en lo que era relevante para este módulo.
Ahora toca aplicar el concepto de mise en place en su espacio de trabajo y prepararse para triunfar con los análisis.