9.2 Intervalos de confiança
Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.
\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]
Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).
De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.
O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.
Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.
O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.
Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.
Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:
- médias;
- proporções; e,
- variâncias.
Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.
Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.
Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:
IC.N = function (N, n, mu, sigma, conf) {
dados=data.frame()
plot(0, 0,
type="n",
xlim=c(mu-0.4*mu,mu+0.4*mu),
ylim=c(0,N),
bty="l",
xlab="Escala de valores da variável",
ylab="Intervalos amostrais construídos",
main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") ,
sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
abline(v=mu, col='red', lwd=2, lty=2)
#axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
x = rnorm(n, mu, sigma)
media = mean(x)
erro= media-mu
sd = sd(x)
li = media - zc * sd/(sqrt(n))
ls = media + zc * sd/(sqrt(n))
temp=cbind(mu, media, erro, li, ls)
dados=rbind(dados, temp)
plotx = c(li,ls)
ploty = c(i,i)
if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
else lines(plotx,ploty, lend=0)
if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
else points(media, i, col="black", cex=1)
}
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}
## mu media erro li ls
## 1 9.421 9.612 0.19082 8.708 10.516
## 2 9.421 8.089 -1.33203 7.035 9.143
## 3 9.421 9.834 0.41276 8.722 10.946
## 4 9.421 9.465 0.04412 8.502 10.429
## 5 9.421 8.914 -0.50654 7.918 9.911
## 6 9.421 10.286 0.86470 9.057 11.514
## 7 9.421 9.866 0.44549 8.935 10.798
## 8 9.421 8.985 -0.43555 8.069 9.902
## 9 9.421 9.255 -0.16617 8.139 10.371
## 10 9.421 9.484 0.06299 8.542 10.426
## 11 9.421 10.117 0.69611 8.952 11.282
## 12 9.421 9.125 -0.29550 8.126 10.125
## 13 9.421 8.921 -0.50045 7.911 9.930
## 14 9.421 9.614 0.19273 8.789 10.438
## 15 9.421 9.040 -0.38052 7.926 10.155
## 16 9.421 9.158 -0.26259 7.958 10.359
## 17 9.421 9.005 -0.41551 7.852 10.159
## 18 9.421 10.325 0.90351 9.262 11.388
## 19 9.421 9.813 0.39183 8.776 10.849
## 20 9.421 9.993 0.57219 8.994 10.992
## 21 9.421 9.723 0.30238 8.759 10.688
## 22 9.421 10.537 1.11576 9.459 11.615
## 23 9.421 9.770 0.34930 8.640 10.901
## 24 9.421 9.743 0.32213 8.610 10.876
## 25 9.421 9.629 0.20847 8.724 10.535
## 26 9.421 9.847 0.42568 8.848 10.846
## 27 9.421 9.550 0.12874 8.455 10.644
## 28 9.421 9.740 0.31910 8.617 10.864
## 29 9.421 10.293 0.87172 9.238 11.347
## 30 9.421 9.796 0.37469 8.858 10.733
## 31 9.421 8.991 -0.43049 7.957 10.024
## 32 9.421 9.743 0.32233 8.632 10.854
## 33 9.421 9.001 -0.42006 7.997 10.005
## 34 9.421 9.639 0.21837 8.564 10.715
## 35 9.421 8.686 -0.73492 7.617 9.755
## 36 9.421 10.228 0.80729 9.154 11.303
## 37 9.421 10.279 0.85769 9.291 11.266
## 38 9.421 9.805 0.38442 8.707 10.904
## 39 9.421 10.402 0.98143 9.481 11.324
## 40 9.421 9.055 -0.36628 7.873 10.237
## 41 9.421 9.130 -0.29087 7.956 10.304
## 42 9.421 9.718 0.29660 8.728 10.707
## 43 9.421 10.514 1.09324 9.568 11.460
## 44 9.421 10.214 0.79312 9.122 11.307
## 45 9.421 9.856 0.43511 8.910 10.803
## 46 9.421 8.676 -0.74478 7.574 9.778
## 47 9.421 10.230 0.80861 9.192 11.267
## 48 9.421 10.337 0.91645 9.315 11.360
## 49 9.421 10.460 1.03943 9.462 11.459
## 50 9.421 9.203 -0.21833 8.234 10.171
## 51 9.421 9.285 -0.13624 8.264 10.305
## 52 9.421 9.750 0.32881 8.643 10.856
## 53 9.421 9.803 0.38218 8.629 10.977
## 54 9.421 8.949 -0.47237 7.791 10.106
## 55 9.421 9.660 0.23934 8.657 10.663
## 56 9.421 10.228 0.80652 9.268 11.187
## 57 9.421 9.649 0.22770 8.646 10.651
## 58 9.421 9.389 -0.03158 8.372 10.407
## 59 9.421 9.432 0.01110 8.410 10.454
## 60 9.421 9.972 0.55115 8.698 11.246
## 61 9.421 9.842 0.42080 8.646 11.038
## 62 9.421 9.120 -0.30058 8.204 10.037
## 63 9.421 10.025 0.60434 9.108 10.943
## 64 9.421 8.591 -0.82996 7.605 9.577
## 65 9.421 9.511 0.08958 8.567 10.454
## 66 9.421 9.822 0.40087 8.672 10.972
## 67 9.421 9.398 -0.02285 8.429 10.367
## 68 9.421 9.020 -0.40094 7.981 10.059
## 69 9.421 9.898 0.47739 8.943 10.853
## 70 9.421 9.935 0.51359 9.024 10.845
## 71 9.421 9.114 -0.30661 8.159 10.070
## 72 9.421 9.290 -0.13067 8.240 10.340
## 73 9.421 9.446 0.02463 8.473 10.419
## 74 9.421 9.832 0.41059 8.926 10.738
## 75 9.421 9.707 0.28617 8.747 10.667
## 76 9.421 10.106 0.68491 8.980 11.232
## 77 9.421 9.523 0.10248 8.377 10.670
## 78 9.421 8.910 -0.51128 7.854 9.966
## 79 9.421 10.306 0.88522 9.298 11.315
## 80 9.421 9.696 0.27525 8.610 10.783
## 81 9.421 9.688 0.26672 8.586 10.789
## 82 9.421 10.016 0.59528 8.911 11.122
## 83 9.421 8.927 -0.49420 7.772 10.081
## 84 9.421 8.450 -0.97109 7.414 9.486
## 85 9.421 9.143 -0.27784 8.207 10.079
## 86 9.421 9.461 0.04037 8.462 10.461
## 87 9.421 9.402 -0.01889 8.533 10.271
## 88 9.421 9.395 -0.02577 8.378 10.412
## 89 9.421 9.946 0.52478 8.955 10.936
## 90 9.421 9.621 0.20016 8.679 10.563
## 91 9.421 9.576 0.15450 8.501 10.650
## 92 9.421 8.882 -0.53942 7.840 9.923
## 93 9.421 8.993 -0.42760 8.032 9.955
## 94 9.421 8.520 -0.90056 7.547 9.494
## 95 9.421 9.581 0.15954 8.642 10.519
## 96 9.421 9.944 0.52290 8.825 11.063
## 97 9.421 9.220 -0.20143 8.372 10.067
## 98 9.421 9.670 0.24891 8.566 10.773
## 99 9.421 9.735 0.31417 8.662 10.808
## 100 9.421 9.242 -0.17903 8.190 10.294
O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.
A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.
Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.
Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.