9.2 Intervalos de confiança


Um intervalo de confiança (\(IC\)) pode ser entendido com a faixa de valores delimitada por um mínimo e um máximo, calculados como função direta de um nível de confiança e da variabilidade e inversa da tamanho amostral.


\[ \text{estimativa amostral} \pm confiança.\sqrt\frac{variabilidade}{n} \]


Raramente se dispõe de informação a respeito da variabilidade (\(\sigma^{2}\)) da população estudada. Assim, a variabilidade populacional será frequentemente incorporado na expressão acima, com ligeiras modificações, na forma de sua estimativa amostral (\(S^{2}\)).


De certo modo, um intervalo de confiança reflete uma estimativa objetiva da (im)precisão e do tamanho da amostra de determinada pesquisa e, assim, podemos considerá-lo como uma medida da qualidade da amostra e da pesquisa.


O nível de confiança é designado pela quantidade \((1-\alpha)\) na qual \(\alpha\) é denominado de nível de significância, uma medida da probabilidade de erro.


Dependendo do nível de confiança que escolhemos os limites superior e inferior do intervalo mudam para uma mesma estimativa amostral. Os intervalos de confiança mais utilizados na literatura são os de 90%, 95%, 99% e menos de 99,9%.


O intervalo de confiança de 95% é tradicionalmente o intervalo mais utilizado na literatura e isso está relacionado ao nível de significância estatística (\(P<0,05\)) geralmente mais aceito.


Quanto menor for a amplitude de um intervalo, maior será a precisão da estimativa. Todavia, somente estudos com amostras razoavelmente grandes resultarão em um intervalo de confiança estreito, indicando simultaneamentente com alta precisão e alto grau de confianla a estimativa do parâmetro.

Intervalos de confiança podem ser construídos a quase todas as quantidades estatísticas e suas diferenças (quando se procura estudar se há ou não diferenças entre os parâmetros de duas populaçoes) como, por exemplo:

  • médias;
  • proporções; e,
  • variâncias.


Um intervalo de confiança estabelecido sob certa probabilidade não deve ser interpretado como sendo a faixa de valores, delimitada por um mínimo e máximo, entre os quais o parâmetro da população (o qual se estima ou sobre o qual se infere) se insere.


Mas sim que, extraíndo-se um grande número de amostras de igual tamanho e da mesma população, e construindo-se para cada uma dessas amostras um intervalo de confiança de um mesmo nível de significância (\(\alpha\)), observaremos que uma determinada proporção desses intervalos, chamada de nível de confiança (\(1-\alpha\)) irá, de fato, conter o parâmetro sobre o qual se estima ou sobre o qual se infere. Por conseguinte, uma proporção desses intervalos chamada de nível de significância (\(\alpha\)) não irá conter o verdadeiro valor do parâmetro populacional.


Assim, \((1-\alpha)\) traduz o grau de confiança que se tem que um intervalo de confiança, calculado sobre uma estatística advinda de uma particular amostra de tamanho \(n\) da variável aleatória \(X\), inclua o verdadeiro valor do parâmetro da população:


IC.N = function (N, n, mu, sigma, conf) {
  dados=data.frame()
  plot(0, 0, 
       type="n", 
       xlim=c(mu-0.4*mu,mu+0.4*mu), 
       ylim=c(0,N), 
       bty="l",
       xlab="Escala de valores da variável", 
       ylab="Intervalos amostrais construídos", 
       main=paste0("Intervalos com iguais níveis de confiança fixados em ", 100*conf, "% \n(",N," amostras de tamanho ",n,")") , 
       sub=paste0("Parâmetros da distribuição da população Normal ( \u03bc, \u03c3) = (",mu,", ", sigma,")"))
  abline(v=mu, col='red', lwd=2, lty=2)
  #axis(1, at = c(mu-1*mu, mu, mu+1*mu))
zc = qnorm(1-((1-conf)/2))
#sigma.xbarra = sigma/sqrt(n)
for (i in 1:N) {
  x = rnorm(n, mu, sigma)
  media = mean(x)
  erro= media-mu
  sd = sd(x)
  li = media - zc * sd/(sqrt(n))
  ls = media + zc * sd/(sqrt(n))
  temp=cbind(mu, media, erro, li, ls)
  dados=rbind(dados, temp)
  plotx = c(li,ls)
  ploty = c(i,i)
  if (li > mu | ls < mu) lines(plotx,ploty, col="red", lwd=2, lend=0)
  else lines(plotx,ploty, lend=0) 
   if (li > mu | ls < mu) points(media, i, col="red", cex=1)+text(y=i+3,x=media, labels=round(media,1), cex=1, col='red')
  else points(media, i, col="black", cex=1) 
} 
colnames(dados)=c("mu", "media", "erro", "li", "ls")
return(dados)
}


N=100
n=64
mu=9.421
sigma=4.1681
conf=0.95
IC.N(N, n, mu, sigma, conf)

##        mu  media     erro    li     ls
## 1   9.421  9.054 -0.36707 7.972 10.135
## 2   9.421 10.568  1.14731 9.528 11.609
## 3   9.421  9.631  0.20985 8.648 10.614
## 4   9.421  9.148 -0.27331 8.192 10.103
## 5   9.421  9.029 -0.39194 8.110  9.948
## 6   9.421  9.506  0.08547 8.538 10.475
## 7   9.421 10.167  0.74595 9.092 11.242
## 8   9.421  9.228 -0.19273 8.284 10.172
## 9   9.421  8.931 -0.48953 7.885  9.978
## 10  9.421 10.504  1.08263 9.468 11.540
## 11  9.421  9.187 -0.23410 8.199 10.175
## 12  9.421  9.209 -0.21246 8.104 10.313
## 13  9.421  9.249 -0.17194 8.132 10.366
## 14  9.421 10.005  0.58431 8.977 11.033
## 15  9.421  9.718  0.29652 8.740 10.695
## 16  9.421  9.823  0.40162 8.753 10.892
## 17  9.421  8.504 -0.91701 7.532  9.476
## 18  9.421  9.367 -0.05385 8.310 10.424
## 19  9.421  9.062 -0.35908 8.113 10.011
## 20  9.421  9.488  0.06739 8.514 10.463
## 21  9.421  9.738  0.31657 8.665 10.810
## 22  9.421  9.885  0.46443 8.857 10.914
## 23  9.421  9.359 -0.06196 8.540 10.179
## 24  9.421  9.220 -0.20147 8.161 10.278
## 25  9.421  9.372 -0.04947 8.404 10.340
## 26  9.421  9.072 -0.34925 8.012 10.131
## 27  9.421  9.621  0.19986 8.749 10.492
## 28  9.421  9.477  0.05574 8.460 10.493
## 29  9.421  9.874  0.45305 8.809 10.940
## 30  9.421  9.445  0.02448 8.312 10.579
## 31  9.421  9.026 -0.39483 8.102  9.950
## 32  9.421  8.979 -0.44230 7.950 10.008
## 33  9.421  9.591  0.16954 8.395 10.786
## 34  9.421  8.765 -0.65618 7.599  9.931
## 35  9.421  9.780  0.35868 8.783 10.777
## 36  9.421  8.452 -0.96913 7.351  9.553
## 37  9.421 10.193  0.77178 9.220 11.165
## 38  9.421  8.554 -0.86748 7.534  9.574
## 39  9.421 10.018  0.59651 9.091 10.944
## 40  9.421  9.100 -0.32097 7.885 10.316
## 41  9.421  9.400 -0.02140 8.395 10.404
## 42  9.421 10.273  0.85165 9.207 11.339
## 43  9.421  8.685 -0.73556 7.570  9.800
## 44  9.421  9.570  0.14919 8.655 10.485
## 45  9.421  9.921  0.49980 8.944 10.897
## 46  9.421  8.872 -0.54908 7.855  9.889
## 47  9.421  9.521  0.10032 8.440 10.603
## 48  9.421  9.232 -0.18878 8.159 10.305
## 49  9.421  9.851  0.43000 8.904 10.798
## 50  9.421  9.097 -0.32447 8.208  9.985
## 51  9.421 10.444  1.02267 9.162 11.725
## 52  9.421  9.980  0.55894 9.177 10.783
## 53  9.421  8.392 -1.02913 7.461  9.323
## 54  9.421 10.063  0.64172 8.981 11.144
## 55  9.421 10.010  0.58868 9.021 10.999
## 56  9.421  8.362 -1.05862 7.220  9.505
## 57  9.421 10.326  0.90490 9.321 11.331
## 58  9.421  9.438  0.01740 8.375 10.501
## 59  9.421  9.337 -0.08437 8.374 10.299
## 60  9.421  8.892 -0.52939 7.857  9.926
## 61  9.421  9.008 -0.41251 8.018  9.999
## 62  9.421  9.253 -0.16763 8.387 10.120
## 63  9.421  9.819  0.39768 8.740 10.897
## 64  9.421  9.555  0.13416 8.379 10.731
## 65  9.421  9.161 -0.26005 8.160 10.162
## 66  9.421  9.712  0.29135 8.719 10.706
## 67  9.421  9.277 -0.14427 8.359 10.195
## 68  9.421  9.641  0.22004 8.749 10.533
## 69  9.421  9.914  0.49331 8.947 10.881
## 70  9.421  9.399 -0.02241 8.322 10.476
## 71  9.421  8.798 -0.62329 7.709  9.887
## 72  9.421  8.771 -0.65025 7.800  9.742
## 73  9.421  8.865 -0.55598 7.729 10.001
## 74  9.421  9.385 -0.03569 8.511 10.260
## 75  9.421  9.639  0.21850 8.524 10.755
## 76  9.421  9.439  0.01825 8.418 10.461
## 77  9.421  9.820  0.39882 8.913 10.727
## 78  9.421  9.081 -0.34012 8.069 10.093
## 79  9.421 10.287  0.86577 9.329 11.245
## 80  9.421  9.711  0.28951 8.685 10.736
## 81  9.421  9.239 -0.18247 8.188 10.289
## 82  9.421  8.886 -0.53474 7.970  9.802
## 83  9.421  9.698  0.27738 8.686 10.711
## 84  9.421  9.340 -0.08072 8.385 10.295
## 85  9.421  9.218 -0.20318 8.141 10.294
## 86  9.421  9.778  0.35662 8.885 10.670
## 87  9.421  9.934  0.51269 8.789 11.078
## 88  9.421  8.561 -0.86004 7.689  9.433
## 89  9.421  9.990  0.56912 9.009 10.972
## 90  9.421  9.165 -0.25556 8.080 10.251
## 91  9.421  9.404 -0.01698 8.368 10.440
## 92  9.421  9.988  0.56735 8.826 11.151
## 93  9.421  9.369 -0.05212 8.329 10.409
## 94  9.421  9.970  0.54932 8.894 11.046
## 95  9.421  8.971 -0.44971 7.958  9.984
## 96  9.421  9.190 -0.23078 8.165 10.216
## 97  9.421  9.132 -0.28940 8.124 10.139
## 98  9.421  8.798 -0.62290 7.740  9.857
## 99  9.421  9.501  0.07989 8.456 10.546
## 100 9.421  8.872 -0.54916 7.855  9.889


O gráfico acima expõe os intervalos de confiança: \((1-\alpha)\)=95% produzidos para as 100 médias de amostras de tamanho 64 extraídas de uma população com parâmetros \(\mu:\) 9.421 e \(\sigma:\) 4.1681.


A proporção de intervalos amostrais que não contém o verdadeiro valor do parâmetro populacional pode ser visualmente inspecionada pelas linhas em vermelho.


Intervalos de confiança bilaterais: intervalos delimitados por dois valores: mínimo e máximo, para a proporção amostral, dentro do qual todos os valores possuem um mesmo nível de confiança de ocorrência.

Intervalos de confiança unilaterais: intervalos delimitados apenas em um de seus lados, nos quais todos os valores possuem um mesmo nível de confiança. Podem ser limitados à direita por um valor máximo ou limitados à esquerda por um valor mínimo.