9.1 Distribuições amostrais


Parâmetro é toda medida numérica descritiva de uma população. Quando essas medidas são calculadas sobre amostras extraídas de uma população passam a ser denominadas como estatísticas da população de origem. A média, a mediana, a variância, a proporção amostrais, assim como outras estatísticas amostrais, são exemplos de variáveis aleatórias (v.a.) uma vez que seus valores sofrem variação a cada amostra extraída.


Considere uma população com \(N\) elementos da qual se deseja extrair todas as possíveis amostras de tamanho \(n\). Para cada amostra extraída pode-se calcular uma mesma medida descritiva como, por exemplo, a média ( ou a variância, proporção ). O conjunto dos valores resultantes nos permite analisar como as estimativas amostrais se distribuem em comparação ao parâmetro que estão a estimar.


Essas distribuições são denominadas distribuições amostrais. O estudo das distribuições amostrais é um elemento fundamental na inferência estatística posto possibilitar o estabelecimento de intervalos de confiança relacionados ao valor de um parâmetro que se deseja inferir, a partir de uma estatística proveniente de uma única amostra.


O processo de extração de amostras pode ser com ou sem reposição. A extração com reposição assegura a independência entre os eventos e, eventos independentes são mais facilmente analisados.


O quantidade possível de amostras de tamanho \(n\) extraídas de uma população de tamanho \(N\) é dado por :


  • com reposição: \(N^{n}\); e,
  • sem reposição: \(C_{(N.n)}\)


Mais adiante veremos que processos de extração de amostras de tamanho \(n\), sem reposição de populações finitas com parâmetros \(\mu\) (média) e \(\sigma^{2}\) (variância) a esperança da v.a. de sua média amostral ainda é dada por:


\[ E(\stackrel{-}{X})=\mu \]


mas sua variância deve ser corrigida de:


\[ Var(\stackrel{-}{X}) =\frac{\sigma^{2}}{n} \]


para:


\[ Var(\stackrel{-}{X}) =\frac{\sigma^{2}}{n} \cdot (\frac{N-n}{N-1}) \]


em que \((\frac{N-n}{N-1})\) é denominado como fator de correção para populações finitas.


Para ilustrar o conceito de distribuição das médias amostrais considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).


Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:

  • um erro máximo: \(\varepsilon\)=20 horas;
  • um nível de significância estabelecido: \(\alpha\)=0,05; e,
  • e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).



Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição $\sim N (\mu; \sigma)$

Figure 9.1: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)

##       mu media     erro   li   ls
## 1   1600  1588 -11.6394 1569 1608
## 2   1600  1601   1.0996 1582 1620
## 3   1600  1593  -6.9867 1572 1614
## 4   1600  1593  -6.5679 1571 1616
## 5   1600  1597  -2.7840 1577 1618
## 6   1600  1586 -14.2874 1565 1606
## 7   1600  1617  17.2543 1597 1637
## 8   1600  1599  -0.6388 1580 1619
## 9   1600  1611  11.4581 1590 1633
## 10  1600  1613  12.8718 1592 1634
## 11  1600  1595  -5.4192 1575 1614
## 12  1600  1590 -10.1660 1571 1609
## 13  1600  1614  14.1141 1593 1635
## 14  1600  1581 -18.7113 1560 1602
## 15  1600  1595  -5.2575 1574 1615
## 16  1600  1592  -8.4134 1573 1610
## 17  1600  1604   3.8397 1585 1623
## 18  1600  1615  14.6114 1592 1637
## 19  1600  1599  -0.8603 1578 1620
## 20  1600  1599  -1.1057 1580 1618
## 21  1600  1583 -17.1686 1564 1601
## 22  1600  1588 -12.3840 1568 1608
## 23  1600  1601   0.5392 1582 1620
## 24  1600  1612  12.1341 1592 1633
## 25  1600  1602   1.6418 1583 1621
## 26  1600  1604   3.6607 1584 1624
## 27  1600  1598  -2.3074 1578 1618
## 28  1600  1616  16.4101 1597 1636
## 29  1600  1596  -4.0192 1575 1617
## 30  1600  1604   3.9387 1585 1623
## 31  1600  1584 -16.4777 1567 1600
## 32  1600  1586 -14.2115 1567 1605
## 33  1600  1607   7.1556 1587 1628
## 34  1600  1605   5.4911 1585 1626
## 35  1600  1589 -11.0606 1571 1607
## 36  1600  1594  -6.2184 1573 1614
## 37  1600  1595  -5.1511 1576 1613
## 38  1600  1608   7.6712 1585 1630
## 39  1600  1587 -12.5379 1568 1607
## 40  1600  1603   2.5277 1580 1625
## 41  1600  1591  -8.6773 1572 1611
## 42  1600  1598  -1.9435 1580 1616
## 43  1600  1602   1.9350 1580 1623
## 44  1600  1593  -7.1189 1574 1612
## 45  1600  1603   2.6695 1583 1622
## 46  1600  1587 -13.0259 1568 1606
## 47  1600  1602   2.4136 1583 1622
## 48  1600  1597  -2.8676 1578 1617
## 49  1600  1604   3.7305 1583 1625
## 50  1600  1589 -10.9146 1568 1610
## 51  1600  1595  -5.0159 1574 1616
## 52  1600  1609   9.3958 1588 1631
## 53  1600  1604   4.3433 1584 1625
## 54  1600  1590  -9.5156 1571 1610
## 55  1600  1578 -21.7536 1558 1598
## 56  1600  1591  -9.2159 1570 1611
## 57  1600  1603   2.9119 1583 1623
## 58  1600  1598  -1.6191 1579 1618
## 59  1600  1588 -11.8871 1570 1606
## 60  1600  1611  10.6317 1591 1630
## 61  1600  1597  -3.4371 1576 1617
## 62  1600  1602   1.9026 1582 1622
## 63  1600  1615  15.0581 1595 1635
## 64  1600  1627  27.4596 1609 1646
## 65  1600  1608   7.8091 1586 1629
## 66  1600  1602   1.8752 1582 1621
## 67  1600  1615  14.8989 1595 1635
## 68  1600  1598  -2.4313 1578 1617
## 69  1600  1595  -5.2849 1576 1614
## 70  1600  1594  -5.8153 1574 1615
## 71  1600  1593  -6.6351 1572 1615
## 72  1600  1613  13.2190 1594 1632
## 73  1600  1587 -13.4253 1567 1606
## 74  1600  1609   8.7817 1588 1629
## 75  1600  1609   9.0159 1590 1628
## 76  1600  1601   0.8666 1580 1622
## 77  1600  1591  -9.2432 1570 1611
## 78  1600  1599  -1.2618 1579 1619
## 79  1600  1583 -16.8795 1562 1605
## 80  1600  1605   5.4504 1586 1625
## 81  1600  1588 -11.8617 1568 1609
## 82  1600  1605   5.0905 1584 1626
## 83  1600  1596  -3.8665 1576 1616
## 84  1600  1590 -10.0511 1569 1611
## 85  1600  1592  -8.3953 1572 1612
## 86  1600  1590 -10.4788 1570 1609
## 87  1600  1595  -4.5341 1576 1615
## 88  1600  1593  -7.3909 1574 1611
## 89  1600  1605   4.5280 1582 1627
## 90  1600  1576 -24.0661 1552 1600
## 91  1600  1603   3.2298 1582 1624
## 92  1600  1597  -3.1677 1577 1617
## 93  1600  1598  -2.2099 1578 1618
## 94  1600  1599  -1.3632 1578 1619
## 95  1600  1588 -11.7852 1569 1608
## 96  1600  1588 -12.2711 1566 1609
## 97  1600  1604   4.2110 1586 1623
## 98  1600  1597  -3.3856 1577 1616
## 99  1600  1596  -4.0964 1575 1617
## 100 1600  1607   6.8088 1587 1627


Observa-se no gráfico acima que algumas das amostras (em vermelho), numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), geram médias (amostrais) se afastam do valor médio na população mais que o erro estabelecido (20 h).