9.2 Intervalos de confiança
Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.
\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]
Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).
De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.
O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.
Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.
O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.
Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.
Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:
- médias;
- proporções; e,
- variâncias.
Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.
Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.
Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:
IC.N = function (N, n, mu, sigma, conf) {
dados=data.frame()
plot(0, 0,
type="n",
xlim=c(mu-0.4*mu,mu+0.4*mu),
ylim=c(0,N),
bty="l",
xlab="Escala de valores da variável",
ylab="Intervalos amostrais construídos",
main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") ,
sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
abline(v=mu, col='red', lwd=2, lty=2)
#axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
x = rnorm(n, mu, sigma)
media = mean(x)
erro= media-mu
sd = sd(x)
li = media - zc * sd/(sqrt(n))
ls = media + zc * sd/(sqrt(n))
temp=cbind(mu, media, erro, li, ls)
dados=rbind(dados, temp)
plotx = c(li,ls)
ploty = c(i,i)
if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
else lines(plotx,ploty, lend=0)
if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
else points(media, i, col="black", cex=1)
}
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}
## mu media erro li ls
## 1 9.421 9.054 -0.36707 7.972 10.135
## 2 9.421 10.568 1.14731 9.528 11.609
## 3 9.421 9.631 0.20985 8.648 10.614
## 4 9.421 9.148 -0.27331 8.192 10.103
## 5 9.421 9.029 -0.39194 8.110 9.948
## 6 9.421 9.506 0.08547 8.538 10.475
## 7 9.421 10.167 0.74595 9.092 11.242
## 8 9.421 9.228 -0.19273 8.284 10.172
## 9 9.421 8.931 -0.48953 7.885 9.978
## 10 9.421 10.504 1.08263 9.468 11.540
## 11 9.421 9.187 -0.23410 8.199 10.175
## 12 9.421 9.209 -0.21246 8.104 10.313
## 13 9.421 9.249 -0.17194 8.132 10.366
## 14 9.421 10.005 0.58431 8.977 11.033
## 15 9.421 9.718 0.29652 8.740 10.695
## 16 9.421 9.823 0.40162 8.753 10.892
## 17 9.421 8.504 -0.91701 7.532 9.476
## 18 9.421 9.367 -0.05385 8.310 10.424
## 19 9.421 9.062 -0.35908 8.113 10.011
## 20 9.421 9.488 0.06739 8.514 10.463
## 21 9.421 9.738 0.31657 8.665 10.810
## 22 9.421 9.885 0.46443 8.857 10.914
## 23 9.421 9.359 -0.06196 8.540 10.179
## 24 9.421 9.220 -0.20147 8.161 10.278
## 25 9.421 9.372 -0.04947 8.404 10.340
## 26 9.421 9.072 -0.34925 8.012 10.131
## 27 9.421 9.621 0.19986 8.749 10.492
## 28 9.421 9.477 0.05574 8.460 10.493
## 29 9.421 9.874 0.45305 8.809 10.940
## 30 9.421 9.445 0.02448 8.312 10.579
## 31 9.421 9.026 -0.39483 8.102 9.950
## 32 9.421 8.979 -0.44230 7.950 10.008
## 33 9.421 9.591 0.16954 8.395 10.786
## 34 9.421 8.765 -0.65618 7.599 9.931
## 35 9.421 9.780 0.35868 8.783 10.777
## 36 9.421 8.452 -0.96913 7.351 9.553
## 37 9.421 10.193 0.77178 9.220 11.165
## 38 9.421 8.554 -0.86748 7.534 9.574
## 39 9.421 10.018 0.59651 9.091 10.944
## 40 9.421 9.100 -0.32097 7.885 10.316
## 41 9.421 9.400 -0.02140 8.395 10.404
## 42 9.421 10.273 0.85165 9.207 11.339
## 43 9.421 8.685 -0.73556 7.570 9.800
## 44 9.421 9.570 0.14919 8.655 10.485
## 45 9.421 9.921 0.49980 8.944 10.897
## 46 9.421 8.872 -0.54908 7.855 9.889
## 47 9.421 9.521 0.10032 8.440 10.603
## 48 9.421 9.232 -0.18878 8.159 10.305
## 49 9.421 9.851 0.43000 8.904 10.798
## 50 9.421 9.097 -0.32447 8.208 9.985
## 51 9.421 10.444 1.02267 9.162 11.725
## 52 9.421 9.980 0.55894 9.177 10.783
## 53 9.421 8.392 -1.02913 7.461 9.323
## 54 9.421 10.063 0.64172 8.981 11.144
## 55 9.421 10.010 0.58868 9.021 10.999
## 56 9.421 8.362 -1.05862 7.220 9.505
## 57 9.421 10.326 0.90490 9.321 11.331
## 58 9.421 9.438 0.01740 8.375 10.501
## 59 9.421 9.337 -0.08437 8.374 10.299
## 60 9.421 8.892 -0.52939 7.857 9.926
## 61 9.421 9.008 -0.41251 8.018 9.999
## 62 9.421 9.253 -0.16763 8.387 10.120
## 63 9.421 9.819 0.39768 8.740 10.897
## 64 9.421 9.555 0.13416 8.379 10.731
## 65 9.421 9.161 -0.26005 8.160 10.162
## 66 9.421 9.712 0.29135 8.719 10.706
## 67 9.421 9.277 -0.14427 8.359 10.195
## 68 9.421 9.641 0.22004 8.749 10.533
## 69 9.421 9.914 0.49331 8.947 10.881
## 70 9.421 9.399 -0.02241 8.322 10.476
## 71 9.421 8.798 -0.62329 7.709 9.887
## 72 9.421 8.771 -0.65025 7.800 9.742
## 73 9.421 8.865 -0.55598 7.729 10.001
## 74 9.421 9.385 -0.03569 8.511 10.260
## 75 9.421 9.639 0.21850 8.524 10.755
## 76 9.421 9.439 0.01825 8.418 10.461
## 77 9.421 9.820 0.39882 8.913 10.727
## 78 9.421 9.081 -0.34012 8.069 10.093
## 79 9.421 10.287 0.86577 9.329 11.245
## 80 9.421 9.711 0.28951 8.685 10.736
## 81 9.421 9.239 -0.18247 8.188 10.289
## 82 9.421 8.886 -0.53474 7.970 9.802
## 83 9.421 9.698 0.27738 8.686 10.711
## 84 9.421 9.340 -0.08072 8.385 10.295
## 85 9.421 9.218 -0.20318 8.141 10.294
## 86 9.421 9.778 0.35662 8.885 10.670
## 87 9.421 9.934 0.51269 8.789 11.078
## 88 9.421 8.561 -0.86004 7.689 9.433
## 89 9.421 9.990 0.56912 9.009 10.972
## 90 9.421 9.165 -0.25556 8.080 10.251
## 91 9.421 9.404 -0.01698 8.368 10.440
## 92 9.421 9.988 0.56735 8.826 11.151
## 93 9.421 9.369 -0.05212 8.329 10.409
## 94 9.421 9.970 0.54932 8.894 11.046
## 95 9.421 8.971 -0.44971 7.958 9.984
## 96 9.421 9.190 -0.23078 8.165 10.216
## 97 9.421 9.132 -0.28940 8.124 10.139
## 98 9.421 8.798 -0.62290 7.740 9.857
## 99 9.421 9.501 0.07989 8.456 10.546
## 100 9.421 8.872 -0.54916 7.855 9.889
O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.
A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.
Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.
Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.