9.2 Intervalos de confiança


Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.


\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]


Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).


De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.


O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.


Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.


O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.


Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.

Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:

  • médias;
  • proporções; e,
  • variâncias.


Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.


Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.


Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:


IC.N = function (N, n, mu, sigma, conf) {
  dados=data.frame()
  plot(0, 0, 
       type="n", 
       xlim=c(mu-0.4*mu,mu+0.4*mu), 
       ylim=c(0,N), 
       bty="l",
       xlab="Escala de valores da variável", 
       ylab="Intervalos amostrais construídos", 
       main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") , 
       sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
  abline(v=mu, col='red', lwd=2, lty=2)
  #axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
  x = rnorm(n, mu, sigma)
  media = mean(x)
  erro= media-mu
  sd = sd(x)
  li = media - zc * sd/(sqrt(n))
  ls = media + zc * sd/(sqrt(n))
  temp=cbind(mu, media, erro, li, ls)
  dados=rbind(dados, temp)
  plotx = c(li,ls)
  ploty = c(i,i)
  if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
  else lines(plotx,ploty, lend=0) 
   if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
  else points(media, i, col="black", cex=1) 
} 
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}


N=100
n=64
mu=9.421
sigma=4.1681
conf=0.95
IC.N(N, n, mu, sigma, conf)

##        mu  media     erro    li     ls
## 1   9.421 10.392  0.97146 9.345 11.440
## 2   9.421  8.979 -0.44187 7.966  9.992
## 3   9.421  9.796  0.37478 8.773 10.819
## 4   9.421  9.180 -0.24129 8.073 10.286
## 5   9.421  8.402 -1.01880 7.326  9.478
## 6   9.421 10.043  0.62168 8.952 11.134
## 7   9.421 10.024  0.60294 9.056 10.992
## 8   9.421  9.771  0.35029 8.796 10.747
## 9   9.421  8.170 -1.25122 7.198  9.142
## 10  9.421  8.872 -0.54860 7.836  9.909
## 11  9.421 10.080  0.65882 9.294 10.866
## 12  9.421  9.954  0.53311 8.988 10.920
## 13  9.421  9.653  0.23183 8.729 10.577
## 14  9.421 10.257  0.83566 9.335 11.179
## 15  9.421  9.402 -0.01921 8.503 10.300
## 16  9.421 10.205  0.78408 9.070 11.340
## 17  9.421  9.860  0.43898 8.903 10.817
## 18  9.421  9.052 -0.36875 7.917 10.187
## 19  9.421  9.536  0.11458 8.524 10.547
## 20  9.421  9.726  0.30486 8.697 10.755
## 21  9.421  9.196 -0.22486 8.305 10.087
## 22  9.421  9.476  0.05530 8.365 10.587
## 23  9.421  9.163 -0.25779 8.127 10.200
## 24  9.421  9.929  0.50752 8.883 10.974
## 25  9.421  9.113 -0.30840 7.891 10.334
## 26  9.421  9.408 -0.01283 8.454 10.362
## 27  9.421  9.316 -0.10481 8.341 10.291
## 28  9.421  8.926 -0.49518 7.878  9.973
## 29  9.421  9.233 -0.18771 8.270 10.197
## 30  9.421  8.076 -1.34510 7.184  8.968
## 31  9.421  8.635 -0.78551 7.646  9.625
## 32  9.421 10.030  0.60940 8.979 11.082
## 33  9.421  9.598  0.17749 8.467 10.730
## 34  9.421  8.395 -1.02582 7.372  9.418
## 35  9.421  9.500  0.07932 8.312 10.689
## 36  9.421  9.775  0.35364 8.733 10.816
## 37  9.421  9.931  0.50985 8.939 10.922
## 38  9.421  9.121 -0.30045 8.159 10.082
## 39  9.421 10.120  0.69908 9.079 11.162
## 40  9.421 10.393  0.97188 9.249 11.537
## 41  9.421  9.160 -0.26135 8.039 10.280
## 42  9.421  9.154 -0.26731 8.063 10.244
## 43  9.421  9.075 -0.34618 7.903 10.247
## 44  9.421  8.652 -0.76852 7.638  9.667
## 45  9.421 10.022  0.60060 9.073 10.971
## 46  9.421 10.126  0.70524 9.102 11.151
## 47  9.421  9.775  0.35354 8.698 10.851
## 48  9.421  9.773  0.35236 8.631 10.916
## 49  9.421  9.769  0.34832 8.851 10.688
## 50  9.421  8.766 -0.65490 7.654  9.878
## 51  9.421  8.601 -0.81979 7.632  9.570
## 52  9.421 10.340  0.91916 9.398 11.282
## 53  9.421 10.060  0.63917 8.975 11.145
## 54  9.421 10.048  0.62731 9.049 11.048
## 55  9.421 10.215  0.79405 9.177 11.253
## 56  9.421  9.887  0.46595 8.781 10.993
## 57  9.421 10.368  0.94713 9.329 11.407
## 58  9.421  8.838 -0.58319 7.773  9.902
## 59  9.421  9.273 -0.14805 8.169 10.377
## 60  9.421  9.120 -0.30124 8.229 10.011
## 61  9.421  8.898 -0.52329 7.759 10.036
## 62  9.421 10.284  0.86276 9.294 11.274
## 63  9.421  8.637 -0.78386 7.308  9.966
## 64  9.421  9.706  0.28531 8.762 10.651
## 65  9.421  9.343 -0.07848 8.122 10.563
## 66  9.421  9.596  0.17534 8.637 10.555
## 67  9.421  9.391 -0.03017 8.352 10.430
## 68  9.421  8.963 -0.45815 7.860 10.066
## 69  9.421  9.328 -0.09285 8.462 10.195
## 70  9.421  9.568  0.14661 8.519 10.617
## 71  9.421  9.347 -0.07435 8.139 10.554
## 72  9.421 10.283  0.86204 9.419 11.147
## 73  9.421  8.820 -0.60143 7.810  9.829
## 74  9.421  9.820  0.39888 8.833 10.807
## 75  9.421  8.691 -0.73001 7.583  9.799
## 76  9.421  9.564  0.14315 8.601 10.527
## 77  9.421  9.288 -0.13296 8.156 10.420
## 78  9.421  9.936  0.51523 9.005 10.867
## 79  9.421  9.827  0.40603 8.697 10.957
## 80  9.421  9.938  0.51690 8.898 10.977
## 81  9.421  8.962 -0.45909 8.037  9.887
## 82  9.421  8.972 -0.44865 7.918 10.027
## 83  9.421  9.518  0.09662 8.521 10.514
## 84  9.421 10.299  0.87756 9.361 11.236
## 85  9.421  9.223 -0.19794 8.361 10.085
## 86  9.421  9.071 -0.35030 7.824 10.318
## 87  9.421  9.464  0.04307 8.527 10.401
## 88  9.421  9.233 -0.18801 8.332 10.134
## 89  9.421  9.693  0.27247 8.857 10.530
## 90  9.421  9.632  0.21147 8.687 10.578
## 91  9.421 10.362  0.94112 9.298 11.426
## 92  9.421  8.046 -1.37473 7.120  8.973
## 93  9.421 10.581  1.15978 9.468 11.694
## 94  9.421  9.095 -0.32570 8.003 10.187
## 95  9.421  9.774  0.35278 8.892 10.656
## 96  9.421  9.647  0.22646 8.724 10.571
## 97  9.421 10.748  1.32702 9.710 11.786
## 98  9.421  8.541 -0.88014 7.452  9.630
## 99  9.421  8.808 -0.61254 7.662  9.955
## 100 9.421  9.135 -0.28636 8.045 10.225


O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.


A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.


Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.

Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.