Skip to main content

Explorar granularidade

Objetivos de aprendizagem

Após concluir esta unidade, você estará apto a:

  • Definir granularidade.
  • Identificar como a agregação e a granularidade afetam os dados.

O que é granularidade? 

Granularidade refere-se a quão detalhados são os dados. Na unidade anterior, você analisou o gráfico de barras a seguir com todos os valores na variável Age (Idade) agregada como uma soma. A informação não é muito detalhada, ou seja, tem baixa granularidade. 

O gráfico de barras mostra dados totalmente agregados, com um único número para todo o conjunto de dados. O diagrama de dispersão mostra dados totalmente desagregados, com uma marca para cada valor. O diagrama de dispersão é mais detalhado e, portanto, tem maior granularidade que o gráfico de barras. O gráfico de barras tem alta agregação e baixa granularidade. O diagrama de dispersão tem baixa agregação e alta granularidade. 

Um gráfico de barras à esquerda.

Um diagrama de dispersão à direita.

Esses dados desagregados mostram o menor nível de detalhes, o que proporciona a maior granularidade de todas as visualizações. "Menor nível de detalhe" é uma das características dos dados relevantes, conforme explicado no módulo Dados corretamente estruturados.

Exemplos de granularidade

Vamos continuar explorando a granularidade. Usaremos um conjunto de dados que contém informações sobre uma franquia de negócios e examinaremos os dados usando níveis de granularidade.

Este conjunto de dados contém mais de 50.000 linhas. Cada uma dessas linhas contém informações sobre uma única transação. A menor granularidade (maior agregação) permite que você veja padrões maiores. O aumento para uma granularidade mais alta (agregação mais baixa) permite ver os detalhes por trás dos padrões.

Um gráfico de dispersão é um gráfico que permite que os usuários plotem dados numéricos (variáveis quantitativas) em um eixo horizontal e um vertical para ver correlações ou relações entre valores. Para este exemplo, usamos um gráfico de dispersão para explorar a relação entre as vendas de uma empresa e seus lucros.

Exibir um gráfico de dispersão com duas variáveis quantitativas

Começamos com as variáveis quantitativas Profit (Lucro) e Sales (Vendas), exibidas no gráfico de dispersão a seguir. 

Neste ponto, um número (Vendas) é plotado contra outro (Lucro). Os dois números são comparados com apenas um ponto de dados ou marca porque as variáveis Sales (Vendas) e Profit (Lucro) são totalmente agregadas em um único número (Soma das vendas e Soma do lucro). 

Esses dados não são muito detalhados, ou seja, têm baixa granularidade. Para saber mais sobre o lucro e as vendas do negócio, os dados precisam ser mais granulares.

Um gráfico de dispersão com apenas um ponto de dados ou marca.

Exibir um gráfico de dispersão com uma variável qualitativa adicionada

Quando uma variável qualitativa é adicionada ao gráfico de dispersão, a granularidade dos dados aumenta. 

Com a qualitativa variável Categoria codificada por cores, os dados agora são separados em três marcas, uma para cada categoria de produto vendida. É mais granular do que o gráfico de dispersão de uma marca, mas talvez seja melhor ver os dados com mais detalhes. 

Veja os lucros por categoria no gráfico de dispersão a seguir. Os lucros dos móveis ficam para trás em relação aos outros dois. Um próximo passo razoável é adicionar granularidade investigando se essa tendência se mantém verdadeira nos vários mercados geográficos.

Um gráfico de dispersão com três pontos de dados ou marcas.

Exibir um gráfico de dispersão com uma segunda variável qualitativa adicionada

Com a variável qualitativa Region (Região) adicionada à visualização a seguir, você pode explorar se os móveis têm lucros menores em todos os mercados geográficos. O número de regiões diferentes da fonte de dados é multiplicado pelo número de categorias para criar marcas no gráfico de dispersão. Assim, as 13 regiões são multiplicadas pelas 3 categorias para criar 39 marcas no gráfico de dispersão. 

Os dados agora são granulares o suficiente para que você possa ver uma causa potencial dos baixos lucros de móveis. A região do Sudeste Asiático tem lucros sobre móveis visivelmente menores do que as outras regiões. Você pode continuar aumentando a granularidade dos dados para se aprofundar em relação ao prejuízo dos móveis naquela região.

Um gráfico de dispersão com 39 pontos de dados ou marcas com a marca do Sudeste Asiático destacada.

Exibir um gráfico de dispersão com dados filtrados

Você percebe que a região do Sudeste Asiático tem lucros sobre móveis visivelmente menores do que as demais regiões. Você quer ver se essa falta de lucro é por causa de apenas uma ou duas transações ou se muitas transações não são lucrativas.

Você sabe que o conjunto de dados contém uma linha para cada transação. Se os dados forem desagregados, você verá um ponto de dados (ou marca) para cada transação no conjunto de dados. Mas antes de desagregar os dados nesse nível, filtre os dados para manter apenas as transações de móveis na região do Sudeste Asiático.

O gráfico de dispersão a seguir mostra que os dados filtrados têm apenas uma marca para móveis no Sudeste Asiático

O gráfico de dispersão tem apenas uma marca, que representa móveis no Sudeste Asiático.

Observação

Os filtros não alteram a granularidade dos dados porque o nível de detalhe não muda. Os filtros simplesmente excluem transações que não são pertinentes para sua análise. 

Exibir dados agregados

Com os dados filtrados para mostrar apenas móveis no Sudeste Asiático, agora você já pode ver os dados em sua maior granularidade. 

A desagregação dos dados mostra uma marca separada para cada valor de dados em cada linha dos dados selecionados. Na visualização a seguir, você vê uma marca para cada transação de móveis no Sudeste Asiático. Explorar níveis de granularidade dessa forma leva a uma importante descoberta: muitas transações de vendas de móveis não são lucrativas no Sudeste Asiático.

Um gráfico de dispersão com todas as transações de móveis no Sudeste Asiático. US$ 0 em destaque indicando transações não rentáveis.

Agora você sabe como as agregações predefinidas afetam os dados e como diferentes níveis de granularidade afetam a análise de dados.

Recursos 

Compartilhe seu feedback do Trailhead usando a Ajuda do Salesforce.

Queremos saber sobre sua experiência com o Trailhead. Agora você pode acessar o novo formulário de feedback, a qualquer momento, no site Ajuda do Salesforce.

Saiba mais Continue compartilhando feedback