9.2 Intervalos de confiança


Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.


\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]


Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).


De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.


O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.


Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.


O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.


Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.

Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:

  • médias;
  • proporções; e,
  • variâncias.


Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.


Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.


Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:


IC.N = function (N, n, mu, sigma, conf) {
  dados=data.frame()
  plot(0, 0, 
       type="n", 
       xlim=c(mu-0.4*mu,mu+0.4*mu), 
       ylim=c(0,N), 
       bty="l",
       xlab="Escala de valores da variável", 
       ylab="Intervalos amostrais construídos", 
       main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") , 
       sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
  abline(v=mu, col='red', lwd=2, lty=2)
  #axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
  x = rnorm(n, mu, sigma)
  media = mean(x)
  erro= media-mu
  sd = sd(x)
  li = media - zc * sd/(sqrt(n))
  ls = media + zc * sd/(sqrt(n))
  temp=cbind(mu, media, erro, li, ls)
  dados=rbind(dados, temp)
  plotx = c(li,ls)
  ploty = c(i,i)
  if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
  else lines(plotx,ploty, lend=0) 
   if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
  else points(media, i, col="black", cex=1) 
} 
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}


N=100
n=64
mu=9.421
sigma=4.1681
conf=0.95
IC.N(N, n, mu, sigma, conf)

##        mu  media     erro    li     ls
## 1   9.421  9.612  0.19082 8.708 10.516
## 2   9.421  8.089 -1.33203 7.035  9.143
## 3   9.421  9.834  0.41276 8.722 10.946
## 4   9.421  9.465  0.04412 8.502 10.429
## 5   9.421  8.914 -0.50654 7.918  9.911
## 6   9.421 10.286  0.86470 9.057 11.514
## 7   9.421  9.866  0.44549 8.935 10.798
## 8   9.421  8.985 -0.43555 8.069  9.902
## 9   9.421  9.255 -0.16617 8.139 10.371
## 10  9.421  9.484  0.06299 8.542 10.426
## 11  9.421 10.117  0.69611 8.952 11.282
## 12  9.421  9.125 -0.29550 8.126 10.125
## 13  9.421  8.921 -0.50045 7.911  9.930
## 14  9.421  9.614  0.19273 8.789 10.438
## 15  9.421  9.040 -0.38052 7.926 10.155
## 16  9.421  9.158 -0.26259 7.958 10.359
## 17  9.421  9.005 -0.41551 7.852 10.159
## 18  9.421 10.325  0.90351 9.262 11.388
## 19  9.421  9.813  0.39183 8.776 10.849
## 20  9.421  9.993  0.57219 8.994 10.992
## 21  9.421  9.723  0.30238 8.759 10.688
## 22  9.421 10.537  1.11576 9.459 11.615
## 23  9.421  9.770  0.34930 8.640 10.901
## 24  9.421  9.743  0.32213 8.610 10.876
## 25  9.421  9.629  0.20847 8.724 10.535
## 26  9.421  9.847  0.42568 8.848 10.846
## 27  9.421  9.550  0.12874 8.455 10.644
## 28  9.421  9.740  0.31910 8.617 10.864
## 29  9.421 10.293  0.87172 9.238 11.347
## 30  9.421  9.796  0.37469 8.858 10.733
## 31  9.421  8.991 -0.43049 7.957 10.024
## 32  9.421  9.743  0.32233 8.632 10.854
## 33  9.421  9.001 -0.42006 7.997 10.005
## 34  9.421  9.639  0.21837 8.564 10.715
## 35  9.421  8.686 -0.73492 7.617  9.755
## 36  9.421 10.228  0.80729 9.154 11.303
## 37  9.421 10.279  0.85769 9.291 11.266
## 38  9.421  9.805  0.38442 8.707 10.904
## 39  9.421 10.402  0.98143 9.481 11.324
## 40  9.421  9.055 -0.36628 7.873 10.237
## 41  9.421  9.130 -0.29087 7.956 10.304
## 42  9.421  9.718  0.29660 8.728 10.707
## 43  9.421 10.514  1.09324 9.568 11.460
## 44  9.421 10.214  0.79312 9.122 11.307
## 45  9.421  9.856  0.43511 8.910 10.803
## 46  9.421  8.676 -0.74478 7.574  9.778
## 47  9.421 10.230  0.80861 9.192 11.267
## 48  9.421 10.337  0.91645 9.315 11.360
## 49  9.421 10.460  1.03943 9.462 11.459
## 50  9.421  9.203 -0.21833 8.234 10.171
## 51  9.421  9.285 -0.13624 8.264 10.305
## 52  9.421  9.750  0.32881 8.643 10.856
## 53  9.421  9.803  0.38218 8.629 10.977
## 54  9.421  8.949 -0.47237 7.791 10.106
## 55  9.421  9.660  0.23934 8.657 10.663
## 56  9.421 10.228  0.80652 9.268 11.187
## 57  9.421  9.649  0.22770 8.646 10.651
## 58  9.421  9.389 -0.03158 8.372 10.407
## 59  9.421  9.432  0.01110 8.410 10.454
## 60  9.421  9.972  0.55115 8.698 11.246
## 61  9.421  9.842  0.42080 8.646 11.038
## 62  9.421  9.120 -0.30058 8.204 10.037
## 63  9.421 10.025  0.60434 9.108 10.943
## 64  9.421  8.591 -0.82996 7.605  9.577
## 65  9.421  9.511  0.08958 8.567 10.454
## 66  9.421  9.822  0.40087 8.672 10.972
## 67  9.421  9.398 -0.02285 8.429 10.367
## 68  9.421  9.020 -0.40094 7.981 10.059
## 69  9.421  9.898  0.47739 8.943 10.853
## 70  9.421  9.935  0.51359 9.024 10.845
## 71  9.421  9.114 -0.30661 8.159 10.070
## 72  9.421  9.290 -0.13067 8.240 10.340
## 73  9.421  9.446  0.02463 8.473 10.419
## 74  9.421  9.832  0.41059 8.926 10.738
## 75  9.421  9.707  0.28617 8.747 10.667
## 76  9.421 10.106  0.68491 8.980 11.232
## 77  9.421  9.523  0.10248 8.377 10.670
## 78  9.421  8.910 -0.51128 7.854  9.966
## 79  9.421 10.306  0.88522 9.298 11.315
## 80  9.421  9.696  0.27525 8.610 10.783
## 81  9.421  9.688  0.26672 8.586 10.789
## 82  9.421 10.016  0.59528 8.911 11.122
## 83  9.421  8.927 -0.49420 7.772 10.081
## 84  9.421  8.450 -0.97109 7.414  9.486
## 85  9.421  9.143 -0.27784 8.207 10.079
## 86  9.421  9.461  0.04037 8.462 10.461
## 87  9.421  9.402 -0.01889 8.533 10.271
## 88  9.421  9.395 -0.02577 8.378 10.412
## 89  9.421  9.946  0.52478 8.955 10.936
## 90  9.421  9.621  0.20016 8.679 10.563
## 91  9.421  9.576  0.15450 8.501 10.650
## 92  9.421  8.882 -0.53942 7.840  9.923
## 93  9.421  8.993 -0.42760 8.032  9.955
## 94  9.421  8.520 -0.90056 7.547  9.494
## 95  9.421  9.581  0.15954 8.642 10.519
## 96  9.421  9.944  0.52290 8.825 11.063
## 97  9.421  9.220 -0.20143 8.372 10.067
## 98  9.421  9.670  0.24891 8.566 10.773
## 99  9.421  9.735  0.31417 8.662 10.808
## 100 9.421  9.242 -0.17903 8.190 10.294


O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.


A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.


Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.

Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.