Explorar el conjunto de datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Configurar una cuenta de Tableau Public.
- Explicar las datos sin procesar que se usan en esta ruta.
- Definir la terminología clave sobre el modelo de datos de Tableau.
Aprender el análisis de datos con Tableau Public
A la hora de utilizar Tableau, la mejor manera de aprender el análisis de datos es haciendo precisamente eso, analizar datos. La mejor manera de analizar datos es formular preguntas sobre cosas por las que sienta curiosidad. Este módulo forma parte de una ruta en la que aprenderá a utilizar Tableau. Ya hemos preparado algo para abrir boca: un conjunto de datos que se centra en The Great British Bake Off.
No es necesario que sea fanático del programa o pastelero para comprender los datos. Solo debe saber que es un reality show en el que los participantes (pasteleros) se enfrentan a tres retos por episodio: the Signature Bake (Elaboración propia), Technical Challenge (Reto técnico) y Showstopper (Reto eliminatorio). Al final de cada episodio, según cómo lo hayan hecho en las tres pruebas, se elimina a un pastelero y se nombra a otro como el mejor pastelero. El episodio final es un enfrentamiento entre los tres mejores pasteleros.
Vamos a ver qué hay en el menú hoy. Primero, vamos a ver el equipamiento que necesita (una cuenta de Tableau), los ingredientes (detalles sobre el conjunto de datos) y técnicas con las que familiarizarse (relaciones de datos).
Preparar su equipamiento: Tableau Public
Las unidades interactivas de Tableau con las que trabaja utilizan la interfaz de creación web de Tableau Public como playground. Una vez que haya conectado su cuenta, no tendrá que ir a ninguna otra pestaña o cambiar de ventana. Estará en el sitio indicado. Vamos a crear una cuenta de Tableau Public para que esté preparado.
Si ya tiene una cuenta de Tableau Public, puede omitir este paso y pasar a la siguiente sección.
Las cuentas de Tableau Public son completamente gratuitas. Para obtener una introducción más detallada sobre Tableau Public, consulte Data Storytelling with Tableau Public (Contar historias con datos con Tableau Public).
- Regístrese para conseguir una cuenta de Tableau Public.
- Rellene el formulario con su información, incluida una contraseña segura.
- A continuación, haga clic en CREATE MY ACCOUNT (CREAR MI CUENTA)
- Asegúrese de que tiene su nombre de usuario y contraseña a mano, ya que los utilizará para conectarse a su playground en la siguiente unidad.
- Recibirá un correo electrónico de activación de @tableau.com.
- Rellene el formulario con su información, incluida una contraseña segura.
- Active su cuenta en el correo electrónico que reciba. Esto es necesario antes de poder enlazar su cuenta al playground.
Al crear una cuenta, se unirá a una comunidad de entusiastas de los datos que le ayudarán en su recorrido de aprendizaje.
Reunir los ingredientes: el conjunto de datos
Como ya saben todos los buenos pasteleros, es importante haber reunido todos los ingredientes antes de empezar a mezclarlos.
-
Descargue los archivos de datos comprimidos que utilizará en la ruta.
- Extraiga los archivos para que resulte sencillo acceder a ellos.
Hay cinco archivos .csv:
- Bakers (Pasteleros)
- ChallengeBakes (Retos)
- Episodes (Episodios)
- Outcomes (Resultados)
- Seasons (Temporadas)
Vamos a ver qué tipo de datos hay en cada tabla. Para obtener un diccionario de datos completo, consulte el diccionario de datos de Tableau Public.
La tabla Bakers (Pasteleros) tiene 5 campos y 168 filas. Contiene datos sobre cada participante, como el nombre, la edad que tenían cuando participaron en el concurso y un enlace a una foto.
La tabla ChallengeBakes (Retos) tiene 8 campos y 1003 filas. Contiene datos sobre lo que cocinó cada participantes en ese episodio y su rendimiento en el Technical Challenge (Reto técnico).
La tabla Episodes (Episodios) tiene 12 campos y 134 filas. Contiene información sobre cada episodio, como los retos que se asignaron y el tema.
La tabla Outcomes (Resultados) tiene 9 campos y 964 filas. Contiene información sobre el rendimiento de cada pastelero en cada uno de los episodios. Los episodios finales no están presentes porque tienen un formato de resultado diferente.
La tabla Seasons (Temporadas) tiene 10 campos y 56 filas. Contiene información sobre los jueces, los invitados y el ganador, además de la cadena y si la temporada está disponible en distintas plataformas de streaming. Cada temporada tiene cuatro filas porque la estructura de las columnas Hosts (Invitados) y Judges (Jueces) implica que haya cuatro combinaciones únicas de Host (Invitado) y Judge (Juez) por temporada.
Revisar sus técnicas: uniones y relaciones
Como los datos están almacenados en varias tablas, debe crear un modelo de datos que le indique a Tableau la manera en la que las tablas se conectan entre sí. Hay varias opciones para combinar tablas, entre las que se incluyen uniones, varios tipos de uniones de columnas y relaciones.
Las uniones combinan tablas de datos añadiendo nuevas filas en la misma estructura de columna. Se añade una nueva columna para monitorizar los nombres de la tabla original.
Es como si utilizara la función agregar en Excel para añadir datos nuevos en la parte inferior de una hoja de cálculo.
Las uniones de columnas combinan tablas de datos añadiendo nuevas columnas. Es similar a la función BUSCARV de Excel.
En este ejemplo, las tablas se han unido en la columna Name (Nombre). Si el nombre es el mismo en ambas tablas, las filas coinciden.
- Las uniones internas mantienen las filas que tienen el mismo nombre en ambas tablas. La tabla que se ha unido no tiene valores nulos ni filas para soltar con valores que no coinciden.
- Las uniones externas mantienen todas las filas de ambas tablas con valores nulos para los nombres que no coinciden. No se suelta ninguna fila.
- Las uniones por la izquierda mantienen todas las filas de la tabla izquierda e incorpora columnas de la tabla derecha con valores nulos para los nombres que no coinciden. Las filas para los nombres que solo aparecen en la tabla derecha se sueltan.
- Las uniones por la derecha mantienen todas las filas de la tabla derecha e incorpora columnas de la tabla izquierda con valores nulos para los nombres que no coinciden. Las filas para los nombres que solo aparecen en la tabla izquierda se sueltan.
Las relaciones son el método predeterminado para combinar datos en Tableau. Las relaciones se crean utilizando cláusulas de relaciones que establecen qué campos conectan cada tabla. (Si está familiarizado con las uniones de columnas, la cláusula de relación se puede comparar con la cláusula de unión).
Al configurar una relación se define la manera en la que dos tablas podrían unirse pero, en lugar de combinar las tablas inmediatamente como una unión de columnas o una unión, una relación incluye la información. Una fuente de datos relacionada es flexible y dinámica porque los datos no se combinan por adelantado en una configuración única y fija. A medida que realiza su análisis, Tableau utiliza esa información de relación para crear automáticamente las uniones necesarias en segundo plano a medida que usted utiliza la fuente de datos. Magnífico, ¿verdad?
Vista previa del modelo de datos
Este es un resumen del modelo de datos que creará en las siguientes unidades:
No se preocupe. Lo haremos paso a paso.
En la siguiente unidad, practicará estas técnicas en Tableau Public. Asegúrese de tener preparadas las credenciales de su cuenta de Tableau Public para poder enlazar su playground.
Recursos
- Ayuda de Tableau Desktop y de la creación web: El modelo de datos de Tableau
- Ayuda de Tableau Desktop y de la creación web: Plan the Data Source (Planificar la fuente de datos)
- Ayuda de Tableau Desktop y de la creación web: Estructurar datos para análisis
- Ayuda de Tableau Desktop y de la creación web: Las relaciones no deben asustarle