Explorar el conjunto de datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Configurar una cuenta de Tableau Public.
- Explicar los datos sin procesar utilizados en esta ruta.
- Definir terminología clave sobre el modelo de datos de Tableau.
Aprender sobre el análisis de datos con Tableau Public
Cuando se trata de utilizar Tableau, la mejor forma de aprender sobre el análisis de datos es analizando datos. La mejor forma de analizar datos es hacerse preguntas que le generen curiosidad. Este módulo es parte de una ruta en la que aprende a utilizar Tableau. Además, creamos algo tentador: un conjunto de datos que se enfoca en The Great British Bake Off (o el programa de pastelería de Gran Bretaña).
Por supuesto, no es necesario que sea un aficionado del programa o un pastelero para comprender los datos. Solo debe saber que es un programa de telerrealidad en el que los competidores (los pasteleros) se enfrentan a tres desafíos por episodio: de autor, técnico y de eliminación. Al final de cada episodio, según su desempeño en estos tres desafíos de cocina, se elimina a un pastelero y a otro se lo nombra Pastelero estrella. El episodio final es un enfrentamiento entre los tres mejores pasteleros.
Veamos qué ofrece el menú hoy. Primero, revisemos el equipamiento que necesita (una cuenta de Tableau Public), los ingredientes (detalles sobre el conjunto de datos) y las técnicas con las que familiarizarse (relaciones de datos).
Preparar su equipamiento: Tableau Public
Las unidades interactivas de Tableau en las que trabaja utilizan la interfaz de creación web de Tableau Public como zona de pruebas. Una vez que conecta su cuenta, no es necesario dirigirse a otra pestaña o cambiar a una ventana diferente. Usted se encuentra en ese punto. Para prepararse, cree una cuenta de Tableau Public.
Si ya tiene una cuenta de Tableau Public, puede avanzar a la siguiente sección.
Una cuenta de Tableau Public es completamente gratuita. Para una introducción más detallada de Tableau Public, consulte Narración de datos con Tableau Public.
- Regístrese para tener una cuenta de Tableau Public.
- Complete el formulario con su información, incluida una contraseña segura.
- Luego, haga clic en CREATE MY ACCOUNT (CREAR MI CUENTA).
- Asegúrese de tener a mano su nombre de usuario y contraseña cuando los utilice para conectarse a la zona de pruebas en la siguiente unidad.
- Recibirá un correo electrónico de activación de @tableau.com.
- Complete el formulario con su información, incluida una contraseña segura.
- Active su cuenta mediante el correo electrónico que recibió. Esto es necesario antes de poder vincular su cuenta a la zona de pruebas.
Al crear una cuenta, se une a una comunidad de entusiastas inspiradores de los datos que está allí para ayudarlo en su recorrido de aprendizaje.
Reunir los ingredientes: El conjunto de datos
Como todo buen pastelero sabe, es importante reunir todos los ingredientes antes de comenzar la mezcla.
-
Descargue los archivos de datos zip que utilizará durante la ruta.
- Extraiga los archivos para que sean de fácil acceso.
Hay cinco archivos .csv:
- Bakers (Pasteleros)
- ChallengeBakes
- Episodes (Episodios)
- Outcomes (Resultados)
- Seasons (Temporadas)
Exploremos qué tipo de datos se encuentra en cada tabla. Para obtener un diccionario de datos completo, consulte el diccionario de datos de Tableau Public.
La tabla Bakers (Pasteleros) tiene 5 campos y 168 filas. Contiene datos sobre cada participante, como su nombre, edad, cuándo estuvo en el programa y un enlace a una fotografía de rostro.
La tabla ChallengeBakes tiene 8 campos y 1003 filas. Contiene datos sobre lo que cada participante horneó en ese episodio y su desempeño en el desafío técnico.
La tabla Episodes (Episodios) tiene 12 campos y 134 filas. Contiene información sobre cada episodio, como qué desafíos de pastelería se asignaron y la temática.
La tabla Outcomes (Resultados) tiene 9 campos y 964 filas. Contiene información sobre el desempeño de cada pastelero en cada episodio. Los episodios finales no están presentes, ya que tienen un formato de resultados diferente.
La tabla Seasons (Temporadas) tiene 10 campos y 56 filas. Contiene información sobre los jueces, los anfitriones y el ganador, además de la cadena y cómo figuraba la temporada en varias plataformas de transmisión. Cada temporada tiene cuatro filas porque la estructura de las columnas Hosts (Anfitriones) y Judges (Jueces) significa que hay cuatro combinaciones únicas de anfitrión y juez por temporada.
Revisar las técnicas: Combinaciones y relaciones
Como los datos se almacenan en varias tablas, debe crear un modelo de datos que indique a Tableau cómo se conectan las tablas entre sí. Existen varias opciones para combinar tablas, que incluyen las uniones, varios tipos de combinaciones y las relaciones.
Las uniones fusionan tablas de datos mediante el agregado de filas nuevas en la misma estructura de columnas. Se agrega una columna nueva para realizar un seguimiento de los nombres de las tablas originales.
Es como utilizar la operación append en Excel para agregar datos nuevos a la parte inferior de una hoja.
Las combinaciones fusionan tablas de datos mediante el agregado de columnas nuevas. Es similar a la operación vlookup en Excel.
En este ejemplo, las tablas se combinan en la columna Name (Nombre). Si el nombre es el mismo en ambas tablas, las filas coincidirán.
- Las combinaciones internas conservan las filas con el mismo nombre en ambas tablas. La tabla combinada no tiene valores nulos, y se descartan las filas con valores no coincidentes.
- Las combinaciones externas conservan todas las filas de ambas tablas con valores nulos para los nombres sin coincidencia. No se descartan filas.
- Las combinaciones a la izquierda conservan todas las filas de la tabla a la izquierda e incorporan columnas de la tabla a la derecha con valores nulos para los nombres sin coincidencia. Se descartan las filas de los nombres que solo se encuentran en la tabla a la derecha.
- Las combinaciones a la derecha conservan todas las filas de la tabla a la derecha e incorporan columnas de la tabla a la izquierda con valores nulos para los nombres sin coincidencia. Se descartan las filas de nombre que solo se encuentran en la tabla a la izquierda.
Las relaciones son el método predeterminado para combinar datos en Tableau. Las relaciones se generan mediante cláusulas de relación que establecen qué campos conectan qué tablas. (Si ya se familiarizó con las combinaciones, la cláusula de relación es análoga a una cláusula de combinación).
Establecer una relación define cómo se podrían combinar dos tablas, pero en lugar de mezclar las tablas directamente como una combinación o una unión, una relación solo contiene la información. Una fuente de datos relacionada se mantiene muy flexible y dinámica porque los datos no se encuentran combinados de forma anticipada en una única configuración fija. Mientras realiza su análisis, Tableau utiliza la información de la relación para crear de forma automática las combinaciones necesarias en segundo plano mientras utiliza la fuente de datos. Magnífico, ¿verdad?
Obtener una vista previa del modelo de datos
A continuación, se encuentra un adelanto del modelo de datos que creará en las siguientes unidades.
No se preocupe. Lo creará paso por paso a medida que avance.
En la siguiente unidad, se pondrá en práctica con estas técnicas en Tableau Public. Asegúrese de tener listas las credenciales de su cuenta de Tableau Public para poder vincular su zona de pruebas.