3.5 Apresentação tabular de dados
As sínteses numéricas expostas condensam ao máximo a informação trazida pelos dados na forma de estatísticas associadas à:
- posição: média, moda, mediana;
- dispersão: amplitude total dos dados, variância (esvio padrão), coeficiente de variação;
- separatrizes (repartição): como por exemplo os quartis (\(Q_{1}\); \(Q_{2}\)/mediana e \(Q_{3}\)).
A correta exposição dos dados na forma de tabelas e gráficos auxilia o entendimento de muitas outras características relacionadas aos dados trabalhados por parte do leitor com grande riqueza visual.
Ao se lidar com grandes conjuntos de dados a visualização da informação contida nos dados fica comprometida se eles forem simplesmente apresentados como uma listagem, mesmo que depurados de eventuais inconsistências e ordenados como a lista abaixo:
## [1] 1.41 1.44 1.47 1.54 1.55 1.56 1.56 1.56 1.57 1.58 1.58 1.61 1.62 1.62 1.63
## [16] 1.64 1.64 1.65 1.65 1.65 1.65 1.66 1.66 1.66 1.66 1.66 1.67 1.67 1.67 1.67
## [31] 1.68 1.68 1.68 1.69 1.71 1.71 1.72 1.72 1.73 1.73 1.73 1.73 1.73 1.74 1.75
## [46] 1.76 1.76 1.77 1.78 1.78 1.79 1.82 1.83 1.83 1.84 1.85 1.86 1.93 1.95 2.00
Um dos modos de se lidar com isso é condensando a informação dos dados brutos em tabelas.
Uma tabela é uma forma não discursiva de apresentar informações nas quais o dado numérico se destaca como informação central. Uma tabela se diferencia de um quadro por este ter todos os seus campos delimitados por linhas e conter apenas informações de natureza qualitativa.
Uma tabela deve conter algumas informações essenciais, fora daquela estritamente relacionada aos dados, para que a compreensão do leitor acerca dos dados expostos seja a mais imediata possível:
- título que explique o que a tabela contém, local, data;
- cabeçalho nas colunas e linhas com a explicação, ainda que resumis, a que se referem as quantidades expostas no corpo;
- corpo formado pelos dados referentes às variáveis;
- fonte dos dados;
- uniformidade no número de casas decimais apresentadas no corpo;
- todas as casas devem apresentar valores ou símbolos que expliquem a ausência da informação (NI, NE, ou 0-zero).
Trabalhos de natureza acadêmica ou científica deveriam obrigatoriamente seguir, quando publicados no Brasil, a norma vigente publicada pela ABNT: Associação Brasileira de Normas Técnicas e algumas punlicações do IBGE: Instituto Brasileiro de Geografia e Estatística (como em link).
Observa-se frequentemente, todavia, que as publicações seguem normas particulares das instituições de ensino (para trabalhos de conclusão de curso, monografias, dissertações e teses) ou das editoras (artigos), muitas vezes mescladas com recomendações da ABNT. Na Universidade Estadual de Londrina o portal da biblioteca possui uma ligação para a seção “Normas para trabalhos” (link).
3.5.1 Apresentação tabular de dados qualitativos
3.5.1.1 Dados qualitativos em entrada única
Para alguns tipos de dados, a apresentação tabular é bastante imediata.
Admita que tenha sido realizada uma pesquisa junto a um terminal de desembarque internacional em algum aeroporto sobre o continente de procedência do passageiro, num determinado período de um certo dia, tendo sido anotados os seguintes valores: AM, AM, A, A, A, AM, EU, EU, EU, EU, AM, AS, AS, AS, OC, AS, EU, AM, onde os continente anotados são assim identificados: americano (AM); africano (A), europeu (EU); asiático (AS) e da oceania (OC). Uma tabela para a apresentação dos resultados poderia ser:
Continente de procedência | Desembarques |
---|---|
América | 5 |
África | 3 |
Europa | 5 |
Ásia | 4 |
Oceania | 1 |
Total | 18 |
Fonte: Próprio autor
Outro exemplo de apresentação tabular onde são apresentadas as proporções relativas observadas de cada nível da variável estudada (“tipo de família”, com quatro níveis diferentes), de um levantamento amostral feito pela Agência do Censo dos Estados Unidos em 2005.
Estrutura domiciliar | Número (milhões) | Freq. rel. | Freq. rel. (%) |
---|---|---|---|
Casal com filhos | 24,1 | 0,22 | 22 |
Casal sem filhos | 31,1 | 0,28 | 28 |
Solteiro, sem parceiro | 19,1 | 0,17 | 17 |
Morando sozinho | 30,1 | 0,27 | 27 |
Outros domicílios | 6,7 | 0,06 | 6 |
Total | 111.1 | 1,00 | 100% |
Fonte: Censo dos EUA (2005)
3.5.1.2 Dados qualitativos em entrada dupla
Outros tipos de dados são provenientes de pesquisas que têm por base respostas de natureza binária como, por exemplo:
- sim ou não;
- gosto ou não gosto;
- voto em “A” ou voto em “B”; ou,
- concordo ou não concordo.
Como resultado final, são obtidas contagens que expressam as frequências absolutas observadas para cada uma das variáveis (ou seus níveis) como na apresentação tabular de dados qualitativos por Tabelas de Contingência.
As tabelas de contingência são usadas para associar duas ou mais variáveis qualitativas (ou seus níveis) às contagens das respostas obtidas, na forma das frequências absoluta e relativa observadas em cada uma dessas variáveis (ou seus níveis).
O uso desse tipo de tabela é comum quando se pretende investigar se as variáveis estudadas têm alguma associação por meio de testes não paramétricos. Esse tipo de apresentação facilita a extração de informações relacionadas às probabilidades marginais ou condicionadas de cada uma variáveis ou seus níveis.
Admita agora que a pesquisa anterior junto ao terminal de desembarque internacional tenha também apontado o sexo do passageiro em seu desembarque. Uma tabela de dupla entrada com aqueles dados assumiria a forma:
Desembarques no terminal internacional A em Cumbica (SP, Brasil) | Sexo do passageiro | Total | |
M | F | ||
América | 3 | 2 | 5 |
África | 3 | 0 | 3 |
Europa | 1 | 4 | 5 |
Ásia | 2 | 2 | 4 |
Oceania | 0 | 1 | 1 |
Total | 9 | 9 | 18 |
Fonte: Próprio autor
Um outro exemplo, usando dados da incidência de baixo peso ao nascer em recém-nascidos de Pelotas (RS) segundo o hábito tabágico da mãe durante a gravidez (1982):
Classificação da mãe | Baixo peso ao nascer | Total | |
Sim | Não | ||
Fumante | 275 | 2.144 | 2.419 |
Não fumante | 311 | 4.496 | 4.807 |
Total | 586 | 6.640 | 7.226 |
Fonte: Próprio autor
Ou ainda neste outro estudo que analisa a inclinação partidária de dois tipos de núcleos familiares em relação à presença de filhos:
Estrutura domiciliar | Democrata | Republicano | Totais |
---|---|---|---|
Casal com filho(s) | 762 | 468 | 1230 |
Casal sem filhos | 484 | 477 | 961 |
Totais | 1246 | 945 | 2191 |
Fonte: Próprio autor
A partir das contagens obtidas na pesquisa (as frequências absolutas), uma tabela com as frequências relativas pode ser construída, passando a apresentar as proporções relativas de cada categoria em relação aos níveis pesquisados:
Estrutura domiciliar | Democrata (%) | Republicano (%) | Totais (%) |
---|---|---|---|
Casal com filho(s) | 34,78 | 21,36 | 56,14 |
Casal sem filhos | 22,09 | 21,77 | 43,86 |
Totais (%) | 56,87 | 43,13 | 100 |
Fonte: Próprio autor
3.5.2 Apresentação tabular de dados quantitativos
Todavia, para grandes quatidades de observações de dados quantitativos, a apresentação na forma de tabelas deve ser precedida do agrupamento dos valores observados em classes. O procedimento estatístico de agrupar os dados em classes ou categorias envolve construir uma tabela de distribuição de frequências.
Uma tabela de distribuição de frequências associa cada classe (intervalo) de valores da variável estudada ao número de ocorrências observadas. Como regra prática, a repartição dos dados brutos em classes deve sempre observar para que não haja um número excessivo de classes (diminuição da finalidade de resumir os dados, criação de classes sem nenhuma observação) nem tampouco poucas (que não possibilitem a visualização da distribuição e promovam perda da informação original).
A construção de uma distribuição de frequências consiste essencialmente em:
- escolher as classes ou intervalos (dados quantitativos) ou categorias (dados qualitativos);
- separar ou enquadrar os dados nessas classes ou categorias; e,
- contar o número de dados de cada classe ou categoria.
A literatura propõe vários modos para se determinar o número k de classes:
Crítério | Tamanho da amostra (n) | Fórmula |
---|---|---|
n \(\leq\) 25 | k=5 | |
Raiz quadrada | 25 \(\leq\) n \(\leq\) 220 | k=\(\sqrt{n}\) |
Raiz quadrada | 25 \(\leq\) n \(\leq\) 220 | \(2^{k} > n\) |
Herbert Sturges | 135 \(\leq\) 572237 | k=1+3,22.log(n)\(^{(1)}\) |
Giuseppe Milone | 20 \(\leq 36315\) | k=-1+2.ln(n) \(^{(2)}\) |
- \(^{(1)}\): logarítmo na base 10; e
- \(^{(2)}\): logarítmo na base e.
Ao se escolher um número (\(k\)) de classes deve-se ponderar para que:
- os intervalos das classes tenham, geralmente, a mesma amplitude (raramente se necessita dispor de classes com amplitudes diferentes);
- os intervalos, a faixa de variação que vai do limite inferior da primeira classe ao limite superior da **última classe*, devem conter todos os valores possíveis da variável;
- cada valor observado deve pertencer apenas a uma classe;
- nenhuma classe deverá estar vazia (sem observação alguma);
- não adotar um número muito elevado de classes de modo que cada classe possua poucas observações (ou mesmo nenhuma); e,
- não adotar um número muito reduzido de classes de modo a esconder a variabilidade dos dados ao se reunir todas as observações em poucas faixas de valores;
- alguns autores recomendam um número mínimo de 5 classes e um máximo de 15;
- podemos considerar a amplitude de cada classe com uma casa decimal a mais que os dados de modo a facilitar a incorporação do último valor (mais elevado) na última classe.
Em nosso exemplo das alturas dos estudantes, a determinação do número de classes pelo critério da raiz quadrada ( n=60) sugere 8 classes (outros critérios: pelo menor inteiro tq. \(2^{k}>n; k=6\), pelo critério de Sturges \(k=6,86 \sim 7\), de Giuseppe Milone \(k=8,18 \sim 9)\)).
\[\begin{align*} k & =\sqrt{n} \\ & = 7,74 \\ \end{align*}\]
Arredondar para mais: \(k=8\).
A amplitude total (C) dos valores observados é a simples diferença entre o valor máximo (2,00 m) e o valor mínimo (1,41 m):
\[\begin{align*} C & =2,00-1,41 \\ & =0,59 m \end{align*}\]
A amplitude de cada uma das classes ( c) será dada pelo quociente da amplitude total ( C) pelo número de classes ( k).
\[\begin{align*} c & = \frac{C}{k} \\ & = \frac{0,59}{8}\\ & = 0,07375 m \end{align*}\]
Arredondar para mais: \(c=0,075 m\).
As classes são então assim construídas:
- Limite inferior da \(1^{a}\) classe (\(LI_{1}\)): valor mínimo observado; e,
- Limite superior da \(1^{a}\) classe (\(LS_{1}\)): \(LI_{1}\) + c.
e assim sucessivamente atá a última classe.
Símbolos gráficos para intervalos:
- Os símbolos abaixo indicam que o valor situado à sua esquerda está incluído no intervalo e o da direita não está:
\[ \vdash \\ {\bullet}-{\circ} \]
- Os símbolos abaixo indicam que o valor situado à sua esquerda não está incluído no intervalo e o da direita **está incluído*:
\[ \dashv \\ {\circ}-{\bullet} \]
As tabelas que serão apresentadas a seguir estão sem os requisitos essenciais expostos anteriormente uma vez que o propósito é explicar a construção e cálculo dos valores de suas células.
Com \(c=0,075m\) as 8 classes ficam assim estabelecidas, tendo-se como ponto de partida o valor mínimo observado: 1,41 m - 1,485 m; 1,485 m - 1,56 m; 1,56 m - 1,635 m; 1,635 m - 1,71 m; 1,71 m - 1,785 m; 1,785 m - 1,86 m; 1,86 m - 1,935m; 1,935 - 2,01 m.
{ 1,41 ; 1,44 ; 1,47 ; 1,54 ; 1,55 ; 1,56 ; 1,56 ; 1,56; 1,57 ; 1,58 ; 1,58 ; 1,61 ; 1,62 ; 1,62 ; 1,63; 1,64 ;1,64 ; 1,65 ; 1,65 ; 1,65 ; 1,65 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,67 ; 1,67 ; 1,67 ; 1,67 ; 1,68 ; 1,68 ;1,68 ; 1,69 ; 1,71 ; 1,71 ; 1,72 ; 1,72 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,74 ; 1,75 ; 1,76 ; 1,76 ; 1,77 ; 1,78 ; 1,78; 1,79 1,82 ; 1,83 ; 1,83 ; 1,84 ; 1,85 ; 1,86 ; 1,93; 1,95 ; 2,00}
A tabela de distribuição de frequências com 8 classes, cada uma com amplitude 0,075 m, assume a forma:
Classe | Frequência absoluta (\(f_{i}\)) |
---|---|
1,41 m \(\vdash\) 1,485 m | 3 |
1,485 m \(\vdash\) 1,56 m | 2 |
1,56 m \(\vdash\) 1,635 m | 10 |
1,635 m \(\vdash\) 1,71 m | 19 |
1,71 m \(\vdash\) 1,785 m | 16 |
1,785 m \(\vdash\) 1,86 m | 6 |
1,86 m \(\vdash\) 1,935 m | 2 |
1,935m \(\vdash\) 2,01 m | 2 |
Total | 60 |
Alternativamente, caso adotássemos como ponto de partida (um pouco abaixo do valor mínimo observado) o valor de 1,40 m e como aplitude de classe 0,08 m, uma tabela alternativa de distribuição de frequẽncias teria como classes : 1,40 m - 1,48 m; 1,48 m - 1,56 m; 1,56 m - 1,64 m; 1,64 m - 1,72 m; 1,72 m - 1,80 m; 1,80 m - 1,88 m; 1,88 m - 2,06 m e, para facilitar a contagem das observações pertencentes a cada uma das classes ordenamos os dados:
{ 1,41 ; 1,44 ; 1,47 ; 1,54 ; 1,55 ; 1,56 ; 1,56 ; 1,56 ; 1,57 ; 1,58 ; 1,58 ; 1,61 ; 1,62 ; 1,62 ; 1,63 ; 1,64 ;1,64 ; 1,65 ; 1,65 ; 1,65 ; 1,65 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,67 ; 1,67 ; 1,67 ; 1,67 ; 1,68 ; 1,68 ;1,68 ; 1,69 ; 1,71 ; 1,71 ; 1,72 ; 1,72 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,74 ; 1,75 ; 1,76 ; 1,76 ; 1,77 ; 1,78 ; 1,78 ;1,79; 1,82 ; 1,83 ; 1,83 ; 1,84 ; 1,85 ; 1,86 ; 1,93 ; 1,95 ; 2,00; }
A tabela de distribuição de frequências com 7 classes, cada uma com amplitude 0,08 m, assume a forma:
Classe | Frequência absoluta (\(f_{i}\)) |
---|---|
1,40 m \(\vdash\) 1,48 m | 3 |
1,48 m \(\vdash\) 1,56 m | 2 |
1,56 m \(\vdash\) 1,64 m | 10 |
1,64 m \(\vdash\) 1,72 m | 21 |
1,72 m \(\vdash\) 1,80 m | 15 |
1,80 m \(\vdash\) 1,88 m | 6 |
1,88 m \(\vdash\) 2,06 m | 3 |
Total | 60 |
Também podemos cogitar adotar alternativamente um intervalo de classe \(c=0,10\) m, com a primeira classe começando (um pouco abaixo do valor mínimo observado) na altura de 1,40 m; todavia, a última classe não iria contemplar o valor máximo observado (2,00 m) e necessitaíamos abrir mais uma classe apenas para incluí-lo.
Mas começando-se no valor mínimo obseravado (1,41 m) estaríamos assegurando que o limite superior da última classe incluiria o valor máximo observado (2,00 m). Assim, essas seriam as classes sob uma amplitude de 0,10 m: 1,41 m - 1,51 m; 1,51 m - 1,61 m; 1,61 m - 1,71 m; 1,71 m - 1,81 m; 1,81 m - 1,91 m; 1,91 m - 2,01 m. O total de 6 classes (1,41 m a 2,01 m) cobre toda faixa de variação dos valores dos dados (de 1,41 m a 2,00 m ) e é de rápida assimilação pelo leitor.
Ordenando-se os dados para facilitar a contagem das observações pertencentes a cada uma das classes:
{1,41 ; 1,44 ; 1,47 ; 1,54 ; 1,55 ; 1,56 ; 1,56 ; 1,56 ; 1,57 ; 1,58 ; 1,58 ; 1,61 ; 1,62 ; 1,62 ; 1,63 ; 1,64 ;1,64 ; 1,65 ; 1,65 ; 1,65 ; 1,65 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,66 ; 1,67 ; 1,67 ; 1,67 ; 1,67 ; 1,68 ; 1,68 ;1,68 ; 1,69 ; 1,71 ; 1,71 ; 1,72 ; 1,72 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,73 ; 1,74 ; 1,75 ; 1,76 ; 1,76 ; 1,77 ; 1,78 ; 1,78 ; 1,79 ; 1,82 ; 1,83 ; 1,83 ; 1,84 ; 1,85 ; 1,86 ; 1,93 ; 1,95 ; 2,00}
A tabela de distribuição de frequências com 6 classes, cada uma com amplitude 0,10 m, assume a forma:
Classe | Frequência absoluta (\(f_{i}\)) |
---|---|
1,41 m \(\vdash\) 1,51 m | 3 |
1,51 m \(\vdash\) 1,61 m | 8 |
1,61 m \(\vdash\) 1,71 m | 23 |
1,71 m \(\vdash\) 1,81 m | 17 |
1,81 m \(\vdash\) 1,91 m | 6 |
1,91 m \(\vdash\) 2,01 m | 3 |
Total | 60 |
Tabelas de distribuição de frequências mais completas podem montadas agregando muitas informações adicionais em novas colunas, mediante simples operações aritméticas.
Essas informações servem para tornar a visualização mais imediata e muitas delas são obtidas com operações matemáticas elementares:
- Classe i: é a simples identificação de cada classe;
- Amplitude (\(\Delta_{i}\)) da classe \(i\): a diferença entre o valor do limite superior e o do inferior de cada classe;
- Intervalo de valores da classe \(i\) (onde seu limite inferior está contido e o limite superior não está contido);
- Valor médio (\(\stackrel{-}{x}_{i}\)) de cada classe \(i\): o valor de seu limite inferior mais a metade da amplitude da classe;
- Frequência absoluta (\(f_{i}\)) da classe \(i\): o número de observações contidas no intervalo da classe considerada;
- Frequência relativa (\(fr_{i}= \frac{f_{i}}{n}\)) da classe \(i\) (ou frequência relativa percentual, se assim apresentada): o quociente do número de observações \(n_{i}\) contidas no intervalo da classe \(f_{i}\), pelo número total de observações (\(n\));
- Frequência acumulada (\(fac_{i}\)) da classe \(i\) (ou frequência acumulada percentual, se assim apresentada): o número de observações com medidas contidas na classe \(i\) e nas anteriores a ela;
- Densidade absoluta (\(\delta_{i}=\frac{f_{i}}{\Delta_{i}}\)): o quociente do número de observações da classe (\(f_{i}\)) pela sua amplitude (\(\Delta_{i}\));
- Densidade relativa \(\delta_{fr_{i}}=\frac{fr_{i}}{\Delta_{i}}\): o quociente da frequência relativa (\(fr_{i}\)) pela amplitude (\(\Delta_{i}\)) da classe.
Vejo como exemplo as tabelas abaixo:
Classe | Int. de valores | Alt. média | Freq. abs. | Freq. rel. | Freq. rel. (%) | Freq. acumulada | Freq. acum. (%) |
---|---|---|---|---|---|---|---|
(\(\stackrel{-}{x}_{i}\)) | (\(f_{i}\)) | (\(fr_{i}\)) | (\(fr_{i}\%\)) | (\(fac_{i}\)) | (\(fac_{i}\%\)) | ||
1 | 1,41 \(\vdash\) 1,51 | 1,46 | 3 | 0,05 | 5 | 3 | 5,00 |
2 | 1,51 \(\vdash\) 1,61 | 1,56 | 8 | 0,13 | 13,33 | 11 | 18,33 |
3 | 1,61 \(\vdash\) 1,71 | 1,66 | 23 | 0,38 | 38,33 | 34 | 56,66 |
4 | 1,71 \(\vdash\) 1,81 | 1,76 | 17 | 0,28 | 28,34 | 51 | 85,00 |
5 | 1,81 \(\vdash\) 1,91 | 1,86 | 6 | 0,10 | 10 | 57 | 95,00 |
6 | 1,91 \(\vdash\) 2,01 | 1,96 | 3 | 0,05 | 5 | 60 | 100,00 |
Totais | - | 60 | 1,00 | 100,00 | - | - |
Classe | Int. de valores | Freq. abs. | Amplitude | Dens. abs | Freq. rel. | Dens. rel. |
---|---|---|---|---|---|---|
(\(f_{i}\)) | (\(\Delta_{i}\)) | (\(\delta_{i}\)) | (\(fr_{i}\)) | (\(\delta_{fr_{i}}\)) | ||
1 | 1,41 \(\vdash\) 1,51 | 3 | 0,10 | 30 | 0,05 | 0,5 |
2 | 1,51 \(\vdash\) 1,61 | 8 | 0,10 | 80 | 0,13 | 1,33 |
3 | 1,61 \(\vdash\) 1,71 | 23 | 0,10 | 230 | 0,39 | 3,83 |
4 | 1,71 \(\vdash\) 1,81 | 17 | 0,10 | 170 | 0,28 | 2,83 |
5 | 1,81 \(\vdash\) 1,91 | 6 | 0,10 | 60 | 0,10 | 1 |
6 | 1,91 \(\vdash\) 2,01 | 3 | 0,10 | 30 | 0,05 | 0,5 |
Totais | - | 60 | - | - | 1,00 | - |
3.5.3 Média
Nas tabelas de distribuições de frequências os resultados estão agrupados em intervalos de classes (\(i\)). Por essa razão, os dados perdem sua identidade individual e passam a se representados pelo valor médio de cada intervalo (\(\stackrel{-}{x}_{i}\)).
A média será então dada pelo produto deste valor médio de cada intervalo (\(\stackrel{-}{x}_{i}\)) pela frequência absoluta que ele apresentou (\({n}_{i}\)), dividido pela quantidade de dados (\(n\)).
Sejam \(n_{1}, n_{2}, ..., n_{n}\) as frequências apresentadas para cada intervalo \(i\) dos valores assumidos pela variável \(X\) para o total \(n\) de observações. Assim a média aritmética simples para dados agrupados será dada por:
\[
\stackrel{-}{x}=\frac{\sum _{i=1}^{k}{f}_{i}\cdot{\stackrel{-}{x}}_{i}}{n}
\]
onde:
- \(\stackrel{-}{x}_{i}\): o valor médio do intervalo da classe \(i\);
- \(f_{i}\): a frequência absoluta da classe \(i\);
- \(k\) é o número de classes da tabela de distribuição de frequências;
- \(n\) é o número de dados da tabela (eventualmente, os dados podem se referir a toda a população sob estudo) .
3.5.4 Moda
Moda para dados apresentados na forma de uma distribuição de frequências:
\[
Mo = l_{inf} + (\frac{\Delta_{1}}{\Delta_{1} + \Delta_{2}}) \times \Delta_{i}
\]
Primeiramente identificamos a(s) classe(s) modal(is), que é (são) a(s) classe(s) com maior(es) frequência(s) absoluta \(f_{i}\). Os demias elementos da expressã da moda são:
- \(l_{inf}\): limite inferior da classe modal;
- \(\Delta_{1}\) frequência absoluta da classe modal menos a frequência absoluta da classe anterior à classe modal;
- \(\Delta_{2}\) frequência absoluta da classe modal menos a frequência absoluta da classe posterior à classe modal; e,
- \(\Delta_{i}\) é o intervalo de cada classe.
3.5.5 Mediana
Mediana para dados apresentados na forma de uma distribuição de frequências:
\[ Md = l_{inf} + \left[ \frac{\frac{\sum_{i}^{k} f_{i}}{2} - f_{ac_{(md-1)}}}{f_{md}} \right] \times \Delta_{i} \]
Primeiramente identificamos a classe mediana, que é a classe que contem o elemento de posição \(\frac{n}{2}\) (basta observar a coluna da frequência absoluta acumulada: \(f_{ac_i}\), percorrendo-a até a classe \(i\) que tenha valor \(>\frac{n}{2}\). Os demais elementos da expressão da mediana são:
- \(l_{inf}\): limite inferior da classe mediana;
- \(f_{ac_{(i-1)}}\): é a frequência absoluta acumulada até a classe anterior à classe mediana;
- \(f_{md}\): é a frequência absoluta da classe mediana; e,
- \(\Delta_{i}\): é o intervalo de cada classe.
3.5.6 Variância
Variância para dados agrupados:
\[ S^{2}= \frac{1}{n-1} \times \left[ \sum _{i=1}^{k}{(\stackrel{-}{x}}_{i})^{2} \cdot {f}_{i} - \frac{{\left(\sum _{i=1}^{k}{\stackrel{-}{x}}_{i} \cdot {f}_{i}\right)}^{2} }{n}\right] \]
em que:
- \(\stackrel{-}{x}_{i}\): o valor médio do intervalo da classe \(i\);
- \(f_{i}\): a frequência absoluta da classe \(i\);
- \(k\) é o número de classes da tabela de distribuição de frequências;
- \(n\) é o número de dados da tabela (eventualmente, os dados podem se referir a toda a população sob estudo) .
3.5.7 Quartis
Quartis para dados agrupados:
\[ Q_{i}= l_{inf_{Q_{i}}} + \Delta_{i} \frac{L_{Q_{i}} - f_{ac_{Q_{i-1}}}}{f_{Q_{i}}} \]
em que:
- \(n\) é o número de dados;
- \(Q_{i}\) é o quartil desejado: \(i=1, 2, 3\);
- \(L_{Q_{i}}\) é posição do quartil desejado tal que:
- \(L_{Q_{1}}=0.25n\)
- \(L_{Q_{2}}=0.5n\)
- \(L_{Q_{3}}=0.75n\)
- classe quartílica é a classe onde a posição do quartil desejado ( \(L_{Q_{i}}\)) se localiza;
- \(l_{inf_{Q_{i}}}\) é o limite inferior da classe quartílica;
- \(f_{ac_{Q_{i-1}}}\) é a frequência acumulada da classe imediatamente anterior à classe quartílica;
- \(f_{Q_{i}}\) é a frequência absoluta de classe quartílica;
- \(\Delta_{i}\) é a amplitude de cada classe (fraquentemente igual para todas).