Crear una capa semántica
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Explorar el panel Datos de Tableau.
- Explicar cómo se organizan los tipos de campos en Tableau.
- Enumerar los tipos de datos.
- Explicar cómo se tratan los campos redundantes en Tableau.
Antes de empezar
Antes de empezar este módulo, asegúrese de completar el Modelo de datos de Tableau. El trabajo que se realiza aquí se construye sobre los conceptos y el trabajo que se completa en ese módulo. Familiarícese con los datos con los que trabaje en este módulo, así como con los fundamentos de la experiencia de Tableau.
Preparar los datos
Algunas personas pueden preparar comidas increíbles y productos de pastelería de la nada y en medio del caos. Otras, necesitan mise en place, es decir, preparar todo previamente. Este concepto proviene de la cocina francesa y quiere decir “todo en su lugar”. Es mucho más fácil hacer un pastel cuando la manteca ya está cortada en cubos y fría o lograr una decoración espectacular para un pastel cuando la espátula está lista y donde debe estar para poder usarla.
Lo mismo sucede con los datos y los análisis. Se puede hacer una pequeña limpieza para que sea más fácil trabajar con los datos. De esto se trata la administración de metadatos o el desarrollo de la capa semántica de los datos (aunque la capa semántica es algo más profundo que lo que se trata aquí).
Con Tableau, todo se resume en el ciclo del análisis visual. Esto significa que la administración de metadatos sucede en el flujo del análisis. A continuación, se muestra cómo.
Explorar el espacio de trabajo de Tableau
El entorno de creación de Tableau está diseñado para analizar e interactuar directamente con los datos, lo que implica la administración de lo siguiente:
- Tipos de datos
- Agregaciones predeterminadas
- Cálculos
- Campos de división o combinados
- Agrupaciones y jerarquías
Aquí se ofrece una vista previa del espacio de trabajo y se explica cómo se une todo cuando se trabaja con datos.
- La barra de herramientas permite retroceder pasos, agregar fuentes de datos, borrar hojas, controlar el ajuste de imágenes, etc.
- El panel Data (Datos) muestra tablas de datos y sus campos. Arrastre los campos hacia fuera del panel Data (Datos) para crear una visualización.
- Entre las pestañas de la hoja , se incluye la pestaña Data Source (Fuente de datos). Estas son similares a las pestañas de las hojas de cálculos de Excel o Google Sheets, y permiten alternar diferentes visualizaciones.
- La tarjeta Marks (Marcas) y, arriba, el estante Filters (Filtros) y el estante Pages (Páginas). En la tarjeta Marks (Marcas), se controla gran parte del aspecto de las marcas en la visualización.
- La tarjeta Marks (Marcas) tiene propiedades como Color, Size (Tamaño), Text (Texto), Detail (Detalles) y Tooltip (Descripción emergente). Estas propiedades, a veces, se denominan estantes. Lo importante es que son partes donde se pueden colocar campos y cambiar la estructura de la visualización. Lo que las propiedades muestran en la tarjeta Marks (Marcas) puede cambiar según el tipo de marca.
- La tarjeta Marks (Marcas) tiene propiedades como Color, Size (Tamaño), Text (Texto), Detail (Detalles) y Tooltip (Descripción emergente). Estas propiedades, a veces, se denominan estantes. Lo importante es que son partes donde se pueden colocar campos y cambiar la estructura de la visualización. Lo que las propiedades muestran en la tarjeta Marks (Marcas) puede cambiar según el tipo de marca.
- En los estantes Columns (Columnas) y Rows (Filas) se controla la estructura principal de la visualización.
- El lienzo de la visualización es donde ocurre la magia. También se pueden arrastrar y soltar campos directamente aquí desde el panel Data (Datos) en lugar de colocarlos en un estante.
Antes de empezar a utilizar Tableau en este módulo, es importante revisar todo esto en detalle.
Conocer el panel de datos
En el panel Data (Datos), se muestra la fuente de datos que se está usando, una barra de búsqueda que permite buscar campos y la lista de tablas con sus respectivos campos.
Los campos están organizados en orden alfabético y divididos por una línea horizontal: Sobre la línea, se encuentran las dimensiones y debajo de la línea, las medidas. Además, los campos están codificados por colores: los azules son discretos y los verdes son continuos.
Normalmente, las dimensiones son campos de datos categóricos (como marcas o colores) y las medidas, campos de datos numéricos (como longitudes o precios) con los cuales se pueden hacer cálculos. Para cambiar un campo de dimensión por uno de medición o viceversa, arrastre el campo arriba o abajo de la línea en su tabla. Esto es útil cuando algo como un campo de Id. numérica se asigna incorrectamente como una medición.
También hay íconos de tipo de datos frente a cada campo, como un calendario para una fecha, Abc para un campo de cadena (texto) y un signo de número para un campo numérico. Si la fuente de datos, como una base de datos, no define el tipo de datos, Tableau normalmente puede identificar el tipo de datos correcto.
Para cambiar el tipo de datos de un campo, haga clic frente a él y elija el tipo de datos correcto. Esto se suele hacer para garantizar que el campo se pueda usar en los tipos de cálculos adecuados o para que se muestren correctamente, como en el caso de un campo de fecha que tenga una lista desplegable de mes a semana a día.
Tener en cuenta los campos redundantes
Si el conjunto de datos tiene más de una tabla, es posible que resulte en muchos campos con el mismo nombre. En Tableau, cada nombre de campo debe ser único. Por lo tanto, si un campo tiene (Table name) (Nombre de la tabla) al final, significa que hay un campo con ese nombre en alguna otra parte del conjunto de datos.
Esto suele ocurrir con los campos de las cláusulas de relación en los que se define cómo se relacionan las tablas entre sí. No podemos eliminar estos campos. Desde el punto de vista del análisis, solamente necesitamos una versión de cada campo: la versión del campo que esté más completo.
Por ejemplo, en el conjunto de datos que se usa en este módulo, SeasonEpisode está tanto en la tabla Outcomes (Resultados) como en la tabla ChallengeBakes.
- En la tabla Outcomes (Resultados), se registra el estado de cada pastelero al final de un episodio. No tiene registros para la final de la temporada porque la final tiene un formato diferente.
- La tabla ChallengeBakes tiene una lista definitiva de todos los episodios de todas las temporadas.
Si mantiene la versión de la tabla Outcomes (Resultados) del campo SeasonEpisode, se perdería el episodio de la final. En cambio, conserve el campo SeasonEpisode de la tabla ChallengeBakes y oculte toda copia de SeasonEpisode que esté fuera de la tabla ChallengeBakes.
Es importante recordar que el hecho de que los campos tengan el mismo nombre no significa que sean redundantes. Varias tablas pueden tener campos con el mismo nombre e información completamente diferente. Imagine si el conjunto de datos tuviera una tabla para Hosts (Anfitriones) y una tabla para Judges (Jueces). No se puede ocultar el campo Name (Nombre) de una de esas tablas sin perder información.
Siempre se deben conocer los datos y validar las suposiciones. Tendrá la oportunidad de empezar a usar la herramienta y seguir las prácticas recomendadas en las siguientes unidades.
Poner en acción los nuevos conocimientos sobre metadatos
Se puede hacer mucho más en el panel Data (Datos) en cuanto a la administración de metadatos, como crear jerarquías, combinar o separar campos y hacer cálculos. Pero nos hemos concentrado en lo que es relevante para este módulo.
Ahora es momento de aplicar el concepto mise en place en el espacio de trabajo para preparar todo lo necesario para lograr un análisis exitoso.