11.4 Natureza dos erros

Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).


Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.


Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:


  • um erro máximo tolerado: \(\varepsilon\)=20 horas;
  • um nível de significância estabelecido: \(\alpha\)=0,05; e,
  • e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).



Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição $\sim N (\mu; \sigma)$

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)

##       mu    media        erro       li       ls
## 1   1600 1604.527   4.5266243 1584.265 1624.788
## 2   1600 1585.924 -14.0760624 1565.376 1606.472
## 3   1600 1599.382  -0.6176159 1580.549 1618.215
## 4   1600 1590.464  -9.5355509 1570.532 1610.397
## 5   1600 1601.495   1.4951824 1581.925 1621.065
## 6   1600 1597.037  -2.9626889 1575.903 1618.171
## 7   1600 1595.633  -4.3666613 1575.751 1615.516
## 8   1600 1599.820  -0.1797689 1578.705 1620.935
## 9   1600 1606.035   6.0353935 1587.633 1624.438
## 10  1600 1588.948 -11.0519670 1567.364 1610.532
## 11  1600 1607.107   7.1065739 1586.907 1627.306
## 12  1600 1597.806  -2.1937925 1577.807 1617.805
## 13  1600 1601.597   1.5965893 1581.587 1621.606
## 14  1600 1598.902  -1.0983708 1579.905 1617.898
## 15  1600 1570.620 -29.3795932 1550.081 1591.160
## 16  1600 1595.289  -4.7111788 1576.720 1613.858
## 17  1600 1590.190  -9.8096021 1570.163 1610.217
## 18  1600 1592.817  -7.1826505 1571.942 1613.693
## 19  1600 1594.994  -5.0061016 1576.062 1613.926
## 20  1600 1602.570   2.5696048 1583.982 1621.157
## 21  1600 1591.498  -8.5017404 1573.000 1609.997
## 22  1600 1597.682  -2.3183535 1578.142 1617.222
## 23  1600 1612.211  12.2111506 1592.924 1631.498
## 24  1600 1585.804 -14.1963150 1566.759 1604.848
## 25  1600 1603.394   3.3939747 1585.209 1621.579
## 26  1600 1586.838 -13.1620467 1564.307 1609.369
## 27  1600 1608.816   8.8156499 1588.612 1629.019
## 28  1600 1602.046   2.0462207 1580.002 1624.090
## 29  1600 1608.343   8.3432382 1588.912 1627.774
## 30  1600 1584.824 -15.1758216 1563.903 1605.746
## 31  1600 1611.275  11.2753060 1592.269 1630.281
## 32  1600 1581.971 -18.0288945 1562.238 1601.705
## 33  1600 1595.401  -4.5991319 1574.132 1616.670
## 34  1600 1590.683  -9.3173962 1571.109 1610.256
## 35  1600 1593.389  -6.6106347 1574.456 1612.323
## 36  1600 1602.650   2.6496164 1581.283 1624.017
## 37  1600 1596.097  -3.9031861 1575.819 1616.375
## 38  1600 1611.902  11.9022609 1593.103 1630.702
## 39  1600 1607.836   7.8363601 1588.110 1627.563
## 40  1600 1583.837 -16.1633089 1562.345 1605.328
## 41  1600 1592.145  -7.8550603 1573.355 1610.935
## 42  1600 1588.731 -11.2686107 1569.600 1607.863
## 43  1600 1608.601   8.6006075 1588.321 1628.880
## 44  1600 1608.698   8.6980051 1586.688 1630.708
## 45  1600 1597.294  -2.7057709 1575.740 1618.848
## 46  1600 1588.199 -11.8012758 1569.627 1606.770
## 47  1600 1607.274   7.2736019 1588.459 1626.089
## 48  1600 1602.559   2.5589052 1582.719 1622.399
## 49  1600 1620.269  20.2694146 1601.982 1638.557
## 50  1600 1594.085  -5.9146128 1572.060 1616.110
## 51  1600 1614.035  14.0352375 1593.845 1634.226
## 52  1600 1611.667  11.6666903 1591.012 1632.321
## 53  1600 1599.837  -0.1629434 1580.004 1619.670
## 54  1600 1596.735  -3.2654469 1578.478 1614.991
## 55  1600 1600.958   0.9584824 1580.213 1621.704
## 56  1600 1582.478 -17.5223803 1563.612 1601.343
## 57  1600 1603.620   3.6198153 1582.598 1624.642
## 58  1600 1600.793   0.7926739 1579.050 1622.535
## 59  1600 1607.834   7.8344747 1587.721 1627.948
## 60  1600 1597.968  -2.0322029 1575.220 1620.716
## 61  1600 1593.555  -6.4449270 1572.895 1614.215
## 62  1600 1608.345   8.3448728 1591.004 1625.686
## 63  1600 1599.416  -0.5843896 1579.994 1618.837
## 64  1600 1601.379   1.3794242 1581.416 1621.343
## 65  1600 1614.734  14.7341421 1593.859 1635.609
## 66  1600 1596.825  -3.1747446 1578.259 1615.392
## 67  1600 1596.100  -3.8995840 1576.290 1615.911
## 68  1600 1620.848  20.8481650 1601.739 1639.957
## 69  1600 1604.490   4.4904077 1586.012 1622.969
## 70  1600 1603.887   3.8871359 1582.581 1625.193
## 71  1600 1597.802  -2.1977913 1577.201 1618.404
## 72  1600 1599.068  -0.9322044 1580.520 1617.616
## 73  1600 1588.368 -11.6317436 1569.178 1607.559
## 74  1600 1607.004   7.0037521 1585.453 1628.554
## 75  1600 1601.516   1.5156821 1582.971 1620.061
## 76  1600 1602.530   2.5296313 1583.462 1621.597
## 77  1600 1614.112  14.1115940 1594.460 1633.763
## 78  1600 1593.955  -6.0445513 1573.869 1614.042
## 79  1600 1592.464  -7.5361079 1573.048 1611.880
## 80  1600 1598.184  -1.8161738 1577.791 1618.577
## 81  1600 1597.258  -2.7418256 1576.043 1618.473
## 82  1600 1595.917  -4.0834494 1575.944 1615.889
## 83  1600 1602.520   2.5198565 1583.773 1621.267
## 84  1600 1602.039   2.0388279 1581.714 1622.363
## 85  1600 1594.455  -5.5450441 1573.255 1615.655
## 86  1600 1594.044  -5.9563064 1574.633 1613.455
## 87  1600 1596.123  -3.8770579 1574.532 1617.713
## 88  1600 1622.542  22.5417307 1600.630 1644.454
## 89  1600 1595.759  -4.2414492 1575.202 1616.315
## 90  1600 1596.033  -3.9672125 1576.896 1615.169
## 91  1600 1600.651   0.6508446 1582.377 1618.925
## 92  1600 1606.103   6.1029062 1585.160 1627.045
## 93  1600 1600.631   0.6311651 1579.663 1621.599
## 94  1600 1588.593 -11.4071174 1567.778 1609.408
## 95  1600 1607.928   7.9284073 1588.503 1627.354
## 96  1600 1598.993  -1.0070874 1578.345 1619.641
## 97  1600 1617.983  17.9832446 1598.731 1637.236
## 98  1600 1598.873  -1.1267061 1579.383 1618.364
## 99  1600 1594.856  -5.1442071 1574.822 1614.890
## 100 1600 1589.176 -10.8238142 1569.236 1609.116


Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).

 

Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.


Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).


Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.


Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.


Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.


Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).


Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.


  • Erro do tipo I e
  • Erro do tipo II.


Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).


Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).


Erros envolvidos na rejeição ou não da hipótese nula
Valor real do parâmetro Não rejeitar Rejeitar
(desconhecido) H0 H0
H0 verdadeira Decisão correta Erro do tipo I
probabilidade associada=(1 − α) probabilidade associada= α
H0 falsa Erro do tipo II Decisão correta
probabilidade associada=β probabilidade associada =(1 − β)


No quadro acima identificam-se:


  • \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
  • \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
  • (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
  • (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.


Qual erro é o pior?


Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.


Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.


Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.


Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.


Consequências da tomada de decisão face aos erro envolvidos
H0 explicada Erro tipo 1: rejeitar H0 quando verdadeira Erro tipo II: não rejeitar H0 quando falsa
O medicamento “A“ não alivia a Condição “B“ O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento
Consequências Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado.


É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.


  • aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
  • aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).