3.1 Análise exploratória


A análise exploratória de dados ( EDA: Exploratory Data Analisys , originalmente desenvolvida pelo matemático e estatístico norte-americano John Tukey na década de 1970) é usada para se investigar conjuntos de dados e resumir suas principais características, muitas vezes usando métodos de visualização de dados por gráficos e apresentação de tabelas.


John Tukey (1915-2000)

Figure 3.1: John Tukey (1915-2000)


Habitualmente uma EDA envolve:

  • verificar quais são os tipos de variáveis presentes nos dados;
  • sintetizar os valores assumidos por cada uma das variáveis;
  • verificar os padrões de cada variável e eventuais associações entre duas ou mais delas; e,
  • apresentação de tabelas e gráficos expositivos variados.