11.4 Natureza dos erros

Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).


Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.


Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:


  • um erro máximo tolerado: \(\varepsilon\)=20 horas;
  • um nível de significância estabelecido: \(\alpha\)=0,05; e,
  • e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).



Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição $\sim N (\mu; \sigma)$

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)

##       mu media     erro   li   ls
## 1   1600  1595  -4.5606 1576 1615
## 2   1600  1588 -11.5487 1570 1607
## 3   1600  1600   0.1976 1580 1620
## 4   1600  1598  -2.3805 1578 1618
## 5   1600  1606   5.5548 1585 1626
## 6   1600  1607   6.9240 1587 1627
## 7   1600  1599  -1.1558 1581 1617
## 8   1600  1614  13.6985 1594 1633
## 9   1600  1598  -2.0338 1579 1617
## 10  1600  1582 -18.1887 1560 1604
## 11  1600  1589 -11.2907 1570 1607
## 12  1600  1603   3.2179 1584 1622
## 13  1600  1588 -12.0200 1567 1609
## 14  1600  1588 -11.9716 1568 1608
## 15  1600  1602   2.2997 1582 1622
## 16  1600  1599  -1.0017 1577 1621
## 17  1600  1608   8.1276 1587 1629
## 18  1600  1592  -8.0096 1572 1612
## 19  1600  1597  -3.0950 1578 1615
## 20  1600  1590 -10.1361 1571 1608
## 21  1600  1597  -2.8355 1577 1618
## 22  1600  1609   8.9345 1589 1629
## 23  1600  1600  -0.4320 1581 1618
## 24  1600  1600  -0.3062 1578 1621
## 25  1600  1605   5.1129 1585 1625
## 26  1600  1597  -2.7083 1577 1617
## 27  1600  1584 -15.9724 1564 1604
## 28  1600  1591  -9.2973 1572 1610
## 29  1600  1603   3.1010 1583 1624
## 30  1600  1597  -3.0386 1576 1618
## 31  1600  1590  -9.8039 1569 1611
## 32  1600  1593  -6.8264 1574 1612
## 33  1600  1604   4.1742 1586 1623
## 34  1600  1582 -18.2114 1560 1604
## 35  1600  1598  -1.6966 1579 1618
## 36  1600  1593  -6.7529 1571 1616
## 37  1600  1602   1.8596 1582 1622
## 38  1600  1595  -4.6799 1576 1614
## 39  1600  1598  -2.3190 1579 1617
## 40  1600  1594  -6.3596 1573 1614
## 41  1600  1601   0.7168 1582 1619
## 42  1600  1565 -34.8979 1544 1586
## 43  1600  1597  -2.9364 1577 1617
## 44  1600  1608   8.4071 1589 1628
## 45  1600  1598  -2.3850 1577 1618
## 46  1600  1594  -5.6010 1573 1616
## 47  1600  1591  -8.9175 1571 1611
## 48  1600  1620  20.1495 1601 1640
## 49  1600  1603   3.1301 1583 1623
## 50  1600  1610   9.8788 1590 1630
## 51  1600  1601   1.2695 1581 1621
## 52  1600  1612  12.1637 1593 1631
## 53  1600  1605   4.6654 1583 1626
## 54  1600  1596  -4.3355 1578 1613
## 55  1600  1601   1.4139 1583 1620
## 56  1600  1616  16.2812 1597 1636
## 57  1600  1603   3.4765 1584 1623
## 58  1600  1608   7.8432 1587 1629
## 59  1600  1587 -13.0025 1569 1605
## 60  1600  1595  -4.7842 1574 1616
## 61  1600  1587 -13.3086 1567 1606
## 62  1600  1600  -0.4556 1580 1619
## 63  1600  1590  -9.6073 1572 1609
## 64  1600  1613  12.8219 1593 1633
## 65  1600  1614  13.8891 1594 1634
## 66  1600  1598  -2.4593 1576 1619
## 67  1600  1614  13.8851 1595 1633
## 68  1600  1596  -3.9662 1576 1616
## 69  1600  1585 -15.4192 1566 1603
## 70  1600  1599  -0.6441 1581 1618
## 71  1600  1593  -7.3975 1574 1612
## 72  1600  1607   7.3526 1588 1627
## 73  1600  1603   2.8460 1582 1624
## 74  1600  1613  13.1983 1593 1634
## 75  1600  1600  -0.1698 1582 1618
## 76  1600  1603   3.4569 1584 1623
## 77  1600  1610   9.6105 1589 1630
## 78  1600  1584 -15.7962 1565 1603
## 79  1600  1598  -2.4947 1578 1617
## 80  1600  1603   3.1440 1583 1623
## 81  1600  1604   3.7231 1584 1623
## 82  1600  1611  10.7253 1593 1628
## 83  1600  1608   7.5068 1589 1626
## 84  1600  1615  14.9781 1596 1634
## 85  1600  1584 -15.7908 1564 1605
## 86  1600  1600   0.4415 1582 1619
## 87  1600  1582 -17.5067 1563 1602
## 88  1600  1579 -20.9721 1559 1599
## 89  1600  1610   9.5464 1591 1629
## 90  1600  1610  10.4705 1590 1631
## 91  1600  1592  -8.1028 1574 1610
## 92  1600  1593  -6.5755 1575 1612
## 93  1600  1591  -8.8884 1572 1611
## 94  1600  1606   6.0590 1586 1626
## 95  1600  1609   8.8132 1588 1630
## 96  1600  1605   5.0000 1585 1625
## 97  1600  1603   3.0013 1586 1620
## 98  1600  1617  17.4735 1599 1636
## 99  1600  1603   3.1474 1584 1623
## 100 1600  1604   3.7261 1585 1622


Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).

 

Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.


Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).


Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.


Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.


Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.


Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).


Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.


  • Erro do tipo I e
  • Erro do tipo II.


Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).


Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).


Erros envolvidos na rejeição ou não da hipótese nula
Valor real do parâmetro Não rejeitar Rejeitar
(desconhecido) H0 H0
H0 verdadeira Decisão correta Erro do tipo I
probabilidade associada=(1 − α) probabilidade associada= α
H0 falsa Erro do tipo II Decisão correta
probabilidade associada=β probabilidade associada =(1 − β)


No quadro acima identificam-se:


  • \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
  • \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
  • (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
  • (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.


Qual erro é o pior? Depende!


Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.


Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.


Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.


Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.


Consequências da tomada de decisão face aos erro envolvidos
H0 explicada Erro tipo 1: rejeitar H0 quando verdadeira Erro tipo II: não rejeitar H0 quando falsa
O medicamento “A“ não alivia a Condição “B“ O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento
Consequências Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado.


É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.


  • aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
  • aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).