9.2 Intervalos de confiança


Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.


\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]


Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).


De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.


O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.


Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.


O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.


Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.

Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:

  • médias;
  • proporções; e,
  • variâncias.


Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.


Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.


Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:


IC.N = function (N, n, mu, sigma, conf) {
  dados=data.frame()
  plot(0, 0, 
       type="n", 
       xlim=c(mu-0.4*mu,mu+0.4*mu), 
       ylim=c(0,N), 
       bty="l",
       xlab="Escala de valores da variável", 
       ylab="Intervalos amostrais construídos", 
       main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") , 
       sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
  abline(v=mu, col='red', lwd=2, lty=2)
  #axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
  x = rnorm(n, mu, sigma)
  media = mean(x)
  erro= media-mu
  sd = sd(x)
  li = media - zc * sd/(sqrt(n))
  ls = media + zc * sd/(sqrt(n))
  temp=cbind(mu, media, erro, li, ls)
  dados=rbind(dados, temp)
  plotx = c(li,ls)
  ploty = c(i,i)
  if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
  else lines(plotx,ploty, lend=0) 
   if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
  else points(media, i, col="black", cex=1) 
} 
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}


N=100
n=64
mu=9.421
sigma=4.1681
conf=0.95
IC.N(N, n, mu, sigma, conf)

##        mu  media      erro    li     ls
## 1   9.421  8.953 -0.468110 7.898 10.008
## 2   9.421  8.833 -0.587553 7.662 10.005
## 3   9.421  8.459 -0.961674 7.587  9.331
## 4   9.421  9.085 -0.335556 8.043 10.128
## 5   9.421  8.602 -0.818795 7.370  9.834
## 6   9.421  9.399 -0.022313 8.270 10.527
## 7   9.421  8.533 -0.887631 7.513  9.554
## 8   9.421  8.835 -0.586377 7.820  9.849
## 9   9.421  9.230 -0.190982 8.103 10.357
## 10  9.421 10.195  0.773813 9.116 11.273
## 11  9.421  9.265 -0.155973 8.158 10.372
## 12  9.421  8.777 -0.643763 7.833  9.721
## 13  9.421  9.195 -0.226478 8.219 10.170
## 14  9.421  9.232 -0.189045 8.208 10.255
## 15  9.421  8.315 -1.106080 7.245  9.385
## 16  9.421  8.850 -0.570926 7.929  9.771
## 17  9.421 10.028  0.606528 8.877 11.178
## 18  9.421  9.595  0.174055 8.418 10.773
## 19  9.421  9.354 -0.067116 8.464 10.244
## 20  9.421  9.062 -0.358986 8.143  9.981
## 21  9.421  8.632 -0.788895 7.691  9.573
## 22  9.421  9.271 -0.150338 8.196 10.345
## 23  9.421  9.208 -0.212552 8.105 10.312
## 24  9.421  9.937  0.515851 8.933 10.940
## 25  9.421  9.843  0.421604 8.633 11.052
## 26  9.421  9.595  0.173627 8.584 10.606
## 27  9.421  8.775 -0.645506 7.861  9.690
## 28  9.421  9.918  0.496879 8.892 10.944
## 29  9.421 10.215  0.793859 9.310 11.120
## 30  9.421  9.740  0.318600 8.905 10.574
## 31  9.421  9.158 -0.263492 8.053 10.262
## 32  9.421  9.980  0.558533 8.924 11.035
## 33  9.421  9.273 -0.148062 8.243 10.303
## 34  9.421  8.613 -0.807575 7.579  9.648
## 35  9.421  9.379 -0.041935 8.324 10.434
## 36  9.421  9.347 -0.074198 8.285 10.409
## 37  9.421  9.341 -0.080191 8.358 10.324
## 38  9.421  9.100 -0.321138 8.207  9.992
## 39  9.421  8.504 -0.916943 7.416  9.592
## 40  9.421  9.975  0.553976 8.853 11.097
## 41  9.421  8.997 -0.423951 7.989 10.005
## 42  9.421  9.325 -0.095669 8.171 10.480
## 43  9.421  9.017 -0.403945 8.044  9.990
## 44  9.421  9.965  0.544198 9.007 10.923
## 45  9.421  9.066 -0.354740 8.075 10.057
## 46  9.421  9.151 -0.269638 7.991 10.312
## 47  9.421  9.384 -0.037300 8.403 10.365
## 48  9.421  9.725  0.304329 8.654 10.797
## 49  9.421  9.621  0.200200 8.534 10.709
## 50  9.421  9.711  0.289587 8.757 10.664
## 51  9.421 10.130  0.709367 9.226 11.035
## 52  9.421  8.871 -0.549906 7.957  9.785
## 53  9.421  9.983  0.561607 8.844 11.121
## 54  9.421  9.292 -0.128993 8.241 10.343
## 55  9.421  9.612  0.190910 8.514 10.710
## 56  9.421 10.682  1.260748 9.564 11.799
## 57  9.421  9.569  0.147977 8.669 10.469
## 58  9.421  9.762  0.340821 8.615 10.908
## 59  9.421  9.739  0.317556 8.697 10.780
## 60  9.421  9.351 -0.069968 8.202 10.500
## 61  9.421  9.813  0.392025 8.847 10.779
## 62  9.421  8.980 -0.441208 7.998  9.961
## 63  9.421  8.652 -0.769368 7.578  9.725
## 64  9.421  9.634  0.213420 8.629 10.640
## 65  9.421  9.668  0.246596 8.672 10.663
## 66  9.421  8.789 -0.631823 7.816  9.762
## 67  9.421  9.779  0.358364 8.834 10.725
## 68  9.421  9.206 -0.215136 8.094 10.318
## 69  9.421  9.154 -0.267280 8.140 10.168
## 70  9.421 10.323  0.901987 9.080 11.566
## 71  9.421  9.500  0.078776 8.513 10.487
## 72  9.421  9.662  0.241256 8.591 10.733
## 73  9.421  9.956  0.535270 9.085 10.827
## 74  9.421  8.791 -0.630072 7.741  9.841
## 75  9.421 10.118  0.696755 9.220 11.016
## 76  9.421  8.800 -0.620981 7.798  9.802
## 77  9.421  9.833  0.411725 8.809 10.857
## 78  9.421  9.059 -0.361670 8.035 10.084
## 79  9.421 10.449  1.027628 9.285 11.612
## 80  9.421  9.702  0.280580 8.596 10.807
## 81  9.421  8.806 -0.615025 7.785  9.827
## 82  9.421 10.005  0.584156 8.914 11.097
## 83  9.421 10.175  0.753837 9.186 11.164
## 84  9.421  9.550  0.129071 8.599 10.501
## 85  9.421  9.423  0.002036 8.422 10.424
## 86  9.421  9.108 -0.313109 8.127 10.089
## 87  9.421  9.317 -0.103913 8.330 10.304
## 88  9.421  9.022 -0.398857 7.996 10.048
## 89  9.421  8.885 -0.536189 7.691 10.078
## 90  9.421  9.255 -0.166292 8.276 10.233
## 91  9.421  9.531  0.110188 8.627 10.435
## 92  9.421  9.577  0.156488 8.395 10.760
## 93  9.421  8.866 -0.555293 7.854  9.878
## 94  9.421  8.466 -0.955350 7.366  9.565
## 95  9.421  8.075 -1.346481 7.127  9.022
## 96  9.421  9.337 -0.084405 8.027 10.646
## 97  9.421 10.269  0.848410 9.165 11.374
## 98  9.421 10.012  0.591484 8.895 11.130
## 99  9.421  9.507  0.085835 8.615 10.399
## 100 9.421  9.214 -0.207022 8.116 10.312


O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.


A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.


Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.

Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.