Visualização de variáveis numéricas e categóricas

Para visualizar detalhes de cada variável da tabela, clique no nome da variável desejada e será exibida algumas informações relevantes sobre a variável selecionada. Você pode visualizar as informações de outras variáveis clicando na lateral esquerda da tabela. Para voltar para a visualização completa, clique em  .

 

Visualização de variáveis numéricas

Para as variáveis do tipo numérica, a tela mostrada será semelhante a seguinte:


Nela será possível ver as seguintes características:

  •  Tipo da Variável (numérica ou categórica)
    • Variáveis categóricas - Apresentam como possíveis realizações uma qualidade daquela observação. Exemplos: estado civil, grau de instrução.
    • Variáveis numéricas- Apresentam como possíveis realizações um número resultante de uma contagem ou mensuração. Exemplos: salário, idade.
  •  Média

Uma média é simplesmente a soma de várias observações numéricas dividida pelo número de observações. É uma medida de agregação dos dados que busca representar todas as amostras por meio de um único número.

  • Desvio Padrão

O desvio padrão é calculado tomando-se a raiz quadrada de uma outra medida chamada de variância. Para calcular a variância, primeiro calculamos a diferença entre o valor de cada observação e a média das observações. Após isso, elevamos essas diferenças ao quadrado, e as somamos. Por fim, divide-se essa soma pelo número de observações. Tanto o desvio padrão quanto a variância são medidas de dispersão dos dados, isto é, medem a variabilidade do conjunto de observações.

  • Mínimo

Menor valor de um conjunto de observações numéricas.

  • p1 (Percentil 1%) e p25 (Percentil 25%)

O p1 é um número tal qual 1% das observações numéricas são menores ou iguais a esse valor. O p25, por sua vez, também chamado de primeiro quartil, é o número tal qual 25% das observações ali ordenadas são menores ou iguais a esse valor.

  • Mediana

A mediana (Percentil 50%) é o número tal qual 50% das observações numéricas são menores ou iguais a esse valor.

  • p75 (Percentil 75%) e p99 (Percentil 99%)

O p75, também chamado de terceiro quartil, é um número tal qual 75% das observações numéricas são menores ou iguais a esse valor. O p99, por sua vez, é o número tal qual 99% das observações ali ordenadas são menores ou iguais a esse valor.

  • Máximo

Maior valor de um conjunto de observações numéricas.

 

Além disso, um histograma e um boxplot são exibidos. É possível gerar outros histogramas e boxplots bastando selecionar o intervalo desejado na barra horizontal azul na parte inferior ou digitando diretamente o intervalo desejado e clicando em "OK".

 

Visualização de variáveis categóricas

Para as variáveis tipo categórica, a tela mostrada será semelhante a seguinte:


Nela será possível ver as seguintes características:

  1. Tipo da variável (numérica ou categórica)
  2. Mais frequente: Qual a categoria que mais aparece e a quantidade desta
  3. Menos frequente: Qual a categoria que menos aparece e sua quantidade
  4. Total de categorias: Quantidade de categorias que a variável possui
  5. Missing: Quantidade de missing (esse valor é definido quando a tabela é enviada ao sistema)

 

Também é possível ver uma tabela de frequência, com as seguintes informações:

  1. Categoria: Nome das categorias que pertencem a variável selecionada
  2. Percentual: O percentual da categoria em relação ao todo
  3. Acumulado: Percentual acumulado
  4. Quantidade: Quantidade observada na categoria