Benefício de Domínio Tipos de Dados
A compreensão de diferentes tipos de dados contribui imensamente para que um especialista ou o interessado realize uma Análise de Dados de forma consistente, objetiva e efetiva. Além disso, sabendo que objectivo final desta atividade visa comunicar (tendencialmente) as outros (sejam eles um superiores hierárquico, colegas, ou a um público específico ou não) dos resultados obtidos, as tendências e os padrões relativamente ao fenómeno em causa essa compreensão torna-se ainda mais necessária. Em resumo, a compreensão do tipo de dados presente na análise facilita tanto a análise (aplicação de técnicas, métodos e princípios mais apropriados) assim como simplificação durante o processo de apresentação (isto é, durante a publicação dos resultados quer numa apresentação outro através de criação de diferentes documentos como relatórios, postagens ou flyers, etc.)
Tipos de Dados
Existem dois tipos de dados que encontramos durante o processo de Análise de Dados. A seguir encontram as principais categorias (ou tipos) de dados:
- Dados numéricos (numero inteiros e numero decimais)
- Dados Categóricos (alfanuméricos ou “string” – na gíria computacional)
Estas categorias encontram-se subdividir em duas que são:
- Dados numéricos (numero inteiros e numero decimais)
- Discretos (Número inteiros, “integer” no meio computacional)
- Continuas (Número Decimais, “float” no meio computacional)
- Dados alfanuméricos
- Nominal
- Ordinal
(Pode visualizar alguns exemplos destas variaveis na imagem abaixo)
Variáveis
Assim, as variáveis que contém os dados de tipos numéricos são chamados de variáveis numéricas e categóricas para o caso dos dados categóricos (“string”). Esse procedimento facilita-nos durante o processo de análise visto que relembramos do tipo de dados associado a variável em causa, assim como facilidade de comunicação e compreensão numa eventual troca de ideia com a equipa de trabalho.
Dados Numéricos
Dados numéricos encontram-se, por sua vez, divididos em duas subcategorias: Discreta e Contínuas.
Os Dados Numérico Discreto ou de número inteiro ( “integer” em inglês) estão associados a variáveis cujos valores são numéricos e inteiros. Por exemplo, ocorrem associadas às contagens de objetos, seres vivos, etc. Nestes casos não podemos nunca mencionar contabilizar por exemplo 3.5 pessoas (3 pessoas e meia) mas sim 3 ou 4 pessoas ou mais.
Os Dados Numéricos Contínuos ou de número decimal (“float” em inglês) estão associados às variáveis com números decimais. Por exemplo, na quantificação da temperatura, da altura, peso ou pressão arterial de pessoas onde podem valores aparecer com inúmeras ou mesmo infinitas casas decimais.
Dados Categóricos
Dados categóricos também subdivide em duas categorias sendo elas: Categóricos Nominal e Ordinal. Assim, temos que:
Dados Categóricos Nominais são tipos de dados (categóricos ou “String”) que descreve uma realidade ou fenômeno com ausência de uma ordem associada. Por exemplo, uma variável com informação das cores de vários automóveis (carros) preto, azul, amarelo, branco, vermelho, cinzento, etc., por si, só não transmitem-nos nenhuma ideia da importância (ordem) daqueles carros sem que haja uma terceira informação.
Dados Categóricos Ordinais são tipos de dados (categóricos ou “String”) que descrevem uma realidade ou fenômeno transmitindo uma ordem associada. Por exemplo, uma variável sobre automóvel (carro) excelente, carro bom, carro normal, carro mau e carro péssimo transmite-nos uma ordem associada aos carros.
Ilustração Variáveis Numéricas (Contínuas e Discretas) (bloco esquerdo) versus Variáveis Categóricas (Nominais e Ordinais) (bloco direito)
Benefício de Domínio e Compreensão
Naturalmente, o respeito destas nuances nota-se em representações gráficas. Mais importante ainda, facilita imenso a leitura e interpretação dos resultados após análise sobretudo pela audiência (o consumidor final) que na sua grande maioria não possui domínio técnico.
Mesmo para aqueles pretendam conduzir a análise mais complexas ou desenvolver algoritmos de automação, por exemplo, baseado no subdomínio da Inteligência Artificial – “Machine Learning” também ganham imenso, visto que há necessidade transformar todos dados categóricos (“string”) em numéricos, além de aplicação da importância e impacto que tem a chamada – engenharia de variáveis ou “feature engineering”.
Siga- me