Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir la estructura de los datos en el contexto del análisis.
- Utilizar la agregación: total, promedio y recuento.
- Trabajar con varias cápsulas del mismo campo.
Conectar su cuenta de Tableau Public
Para empezar, conéctese a su cuenta de Tableau Public en la ventana del Playground que está a la derecha. Si todavía no tiene una cuenta de Tableau Public, regístrese para conseguir una y no olvide activarla antes de empezar esta unidad interactiva. Encontrará instrucciones detalladas en el modelo de datos de Tableau.
Analizar los datos
En los módulos anteriores, ha explorado algunos datos, y ahora ya está listo para empezar el análisis. Aquí tiene una pregunta que puede ayudarle a empezar.
Preguntas para el análisis: ¿Cuáles son las tendencias en las valoraciones?
¡Vamos a averiguarlo!
- Haga clic en el icono de la ficha New Sheet (Nueva hoja) (junto a la ficha de la hoja Validation (Validación) en la parte inferior).
- Si es necesario, expanda la tabla Episodes.csv.
- Haga doble clic en el campo My Rating (Mi valoración). Se añade el campo a la visualización y se crea automáticamente un gráfico de barras.
Ahora, el estante Rows (Filas) incluye una copia de ese campo (cada instancia de un campo en la visualización se conoce como cápsula). En la cápsula no solo leemos el nombre del campo. También leemos SUM(My Rating).
¿Por qué? Pues porque tiene que haber alguna forma de agregar muchos registros de datos en un solo número, y la manera predeterminada es sumarlos todos. Si necesita más información sobre la agregación, consulte Agregación y granularidad.
En este caso, tiene el total de valoraciones del conjunto de datos, 1040, como altura de la barra. Desplace el cursor por la barra para ver una descripción emergente con el valor preciso.
- Si es necesario, expanda la tabla Seasons.csv en el panel Data (Datos) y arrastre Season (Temporada) hasta el estante Columns (Columnas).
Pare un momento y piense en lo que tiene por ahora. Es un gráfico de 14 barras, una por cada temporada. En cada barra se muestra la valoración total de la temporada. A medida que empieza a visualizar los datos, es habitual que los pasos intermedios del análisis se vuelvan confusos o no tengan sentido. ¿Es este el caso? Vamos a formular algunas preguntas para comprobar si el gráfico se puede interpretar bien.
Inspeccionar los datos
¿Puede afirmar con seguridad que las temporadas 1 y 2 tienen las valoraciones más bajas? ¿Por qué sí o por qué no?
¡No! El campo de las valoraciones se encuentra en la tabla Episode (Episodio), no en la tabla Season (Temporada), lo que quiere decir que, probablemente, las valoraciones corresponden a cada capítulo de una temporada, y no a la temporada entera. Pero si no está seguro de cómo es la estructura de los datos, nunca es mala idea inspeccionarlos.
- Cree una hoja nueva con el icono de la ficha New Sheet (Nueva hoja) de la parte inferior.
- Expanda la tabla ChallengeBakes.csv.
- Arrastre Season Episode (Episodio de temporada) a Rows (Filas).
- Expanda la tabla Episode.csv.
- Arrastre My Rating (Mi valoración) al estante Text (Texto) de la tarjeta Marks (Marcas). Sugerencia: Solemos referirnos a este elemento como estante aunque parece más un mosaico.
Sí, esos valores son realistas. Recuerde que en el módulo anterior el campo se llamaba originalmente MyRating (para un total de 10). Definitivamente, parece que estas valoraciones son por episodio. Cada fila contiene información de un episodio, incluida una valoración, y las valoraciones cambian en cada fila.
- Haga clic con el botón derecho en la ficha Sheet 3 (Hoja 3) y elimínela para volver a la visualización anterior. Sugerencia: Le recomendamos crear y eliminar nuevas hojas todas las veces que lo necesite para explorar preguntas tangenciales o probar cosas. Pero conserve solamente las hojas que necesite, para que el libro de trabajo no esté demasiado saturado.
Realizar más preguntas y eliminar elementos visuales confusos
Si el número de episodios no es constante en cada temporada, sumar el total de valoraciones puede generar resultados confusos. Vamos a comprobarlo.
¿Cómo podemos verificar el número de episodios por temporada?
En todas las tablas del panel Data (Datos) hay un campo Count (Recuento). Estos campos no están presentes en los datos originales. Son campos especiales que añade Tableau (lo podemos saber porque aparecen en cursiva) donde se realiza un recuento del número de registros de cada tabla.
- Arrastre Episodes.csv (Count) (Episodes.csv [Recuento]) al estante Label (Etiqueta) de la tarjeta Marks (Marcas). Como puede ver, la temporada 1 solo tuvo seis episodios y la temporada 2 tuvo ocho. El resto de temporadas tuvo 10 episodios cada una.
Si el número de episodios no es constante, ¿SUM es la mejor agregación que podemos usar en este caso? Si no es así, ¿cuál deberíamos usar?
A fin de controlar las distintas cantidades de episodios y mantener el valor de las valoraciones dentro de una escala útil hasta el 10, lo mejor es calcular un promedio de las valoraciones de cada episodio de una temporada, y no el total. Esto generará un valor útil que se podrá comparar en todas las temporadas.
- Haga clic con el botón derecho en la cápsula SUM(MyRating) en el estante Rows (Filas) para abrir el menú contextual.
- Desplace el cursor por Measure (Medida en el menú y seleccione Average (Promedio). La cápsula cambia a AVG(MyRating), y el eje de la vista se actualiza a una escala del 0 al 8.
¿Por qué leemos todavía en la etiqueta 6, 8, 10, 10...? Porque no hemos cambiado el campo en el estante Label (Etiqueta), así que se sigue haciendo un recuento de la cantidad de episodios.
- Arrastre el campo CNT(Episodes.csv) fuera de la tarjeta Marks (Marcas). Sugerencia: También puede hacer clic con el botón derecho y seleccionar Remove (Quitar).
- Arrastre My Rating (Mi valoración) desde el panel Data (Datos) hasta Label (Etiqueta) en la tarjeta Marks (Marcas). No mueva la cápsula del estante Rows (Filas). Lo que debe hacer es arrastrar una copia nueva del campo de valoración desde el panel Data (Datos).
La opción predeterminada es realizar la agregación mediante una suma, así que la etiqueta se vuelve a sumar. Cambie la agregación a Average (Promedio) para la cápsula también.
- Haga clic con el botón derecho en la cápsula SUM(My Rating) de la tarjeta Marks (Marcas) y cambie Measure (Medida) | Average (Promedio).
Ya podemos ver que los valores se alinean con el eje. Sin embargo, esas etiquetas añaden un poco de desorden que no necesitamos.
- Arrastre My Rating (Mi valoración) fuera de la tarjeta Marks (Marcas).
- Al arrastrar un campo fuera de una etiqueta, debe soltarlo en cualquier sitio que no esté marcado en naranja como área activa para soltar elementos. No debe colocarlo en ningún sitio en particular. Si lo pone sin querer en algún sitio en lugar de eliminarlo, haga clic en el botón Undo (Deshacer) en la barra de herramientas y vuelva a intentarlo.
- Al arrastrar un campo fuera de una etiqueta, debe soltarlo en cualquier sitio que no esté marcado en naranja como área activa para soltar elementos. No debe colocarlo en ningún sitio en particular. Si lo pone sin querer en algún sitio en lugar de eliminarlo, haga clic en el botón Undo (Deshacer) en la barra de herramientas y vuelva a intentarlo.
Las etiquetas ya no deberían verse.
Pregunta actualizada para el análisis: ¿Cuál es el promedio de tendencias en las valoraciones de todas las temporadas?
Hemos empezado con la pregunta "¿Cuáles son las tendencias en las valoraciones?", pero ahora queremos conocer las tendencias en promedio y las valoraciones de las temporadas. Parece un cambio muy sutil, pero a medida que profundiza en un análisis, es importante volver al principio y comprobar que se están formulando las preguntas adecuadas y que estas son lo más precisas posibles. Esto le permitirá comunicar sus hallazgos y explicar sus argumentos a las partes interesadas. De esta manera, también podrá permitir que otras personas utilicen más fácilmente las visualizaciones que crea.
Con el fin de comunicarse y colaborar, siempre es buena idea asignar nombres a las hojas, y que estos nombres sean significativos y guarden relación con lo que se explica en el análisis.
- Haga doble clic en la ficha de Sheet 2 (Hoja 2) al final de la pantalla.
- Hay formas alternativas de realizar muchas acciones en Tableau. También puede hacer clic con el botón derecho y seleccionar Rename (Cambiar nombre).
- Hay formas alternativas de realizar muchas acciones en Tableau. También puede hacer clic con el botón derecho y seleccionar Rename (Cambiar nombre).
- Cambie el nombre de la hoja a
Avg Seasonal Ratings
(Promedio de valoraciones de las temporadas) y haga clic en cualquier lugar fuera de la ficha para confirmar el cambio.