11.4 Natureza dos erros

Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).


Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.


Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:


  • um erro máximo tolerado: \(\varepsilon\)=20 horas;
  • um nível de significância estabelecido: \(\alpha\)=0,05; e,
  • e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).



Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição $\sim N (\mu; \sigma)$

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)

##       mu media     erro   li   ls
## 1   1600  1621  20.5916 1600 1641
## 2   1600  1601   0.9818 1581 1621
## 3   1600  1598  -1.9727 1579 1617
## 4   1600  1582 -17.5506 1564 1601
## 5   1600  1578 -22.2244 1556 1600
## 6   1600  1595  -4.6633 1577 1614
## 7   1600  1603   2.7745 1582 1624
## 8   1600  1586 -14.3403 1565 1606
## 9   1600  1599  -1.2613 1578 1620
## 10  1600  1590 -10.1190 1570 1610
## 11  1600  1621  20.8486 1601 1640
## 12  1600  1611  10.8251 1591 1631
## 13  1600  1568 -31.8197 1549 1587
## 14  1600  1596  -3.9270 1576 1616
## 15  1600  1585 -14.7758 1567 1604
## 16  1600  1614  13.8580 1594 1633
## 17  1600  1599  -1.2980 1581 1616
## 18  1600  1574 -26.3989 1554 1594
## 19  1600  1598  -1.8732 1578 1618
## 20  1600  1593  -6.8153 1571 1615
## 21  1600  1594  -5.7039 1576 1613
## 22  1600  1608   7.8771 1584 1632
## 23  1600  1608   7.7501 1589 1627
## 24  1600  1593  -7.1834 1575 1610
## 25  1600  1611  11.0307 1592 1630
## 26  1600  1614  13.6239 1591 1636
## 27  1600  1597  -3.0565 1577 1617
## 28  1600  1606   5.5707 1586 1625
## 29  1600  1587 -13.1158 1567 1607
## 30  1600  1597  -3.2379 1577 1616
## 31  1600  1606   5.6780 1587 1625
## 32  1600  1591  -9.2492 1572 1609
## 33  1600  1612  11.7920 1592 1631
## 34  1600  1610   9.8398 1591 1628
## 35  1600  1602   2.4396 1582 1623
## 36  1600  1597  -2.8977 1579 1616
## 37  1600  1594  -5.8185 1574 1614
## 38  1600  1590 -10.0867 1571 1609
## 39  1600  1604   3.9141 1583 1625
## 40  1600  1592  -8.4307 1572 1611
## 41  1600  1609   9.0399 1588 1630
## 42  1600  1590 -10.3582 1570 1609
## 43  1600  1604   3.8988 1585 1623
## 44  1600  1603   2.8483 1583 1623
## 45  1600  1607   6.5999 1587 1627
## 46  1600  1599  -1.4433 1579 1618
## 47  1600  1602   2.3586 1583 1622
## 48  1600  1605   5.3816 1585 1625
## 49  1600  1608   8.2557 1589 1628
## 50  1600  1604   3.7427 1584 1624
## 51  1600  1602   1.8234 1583 1621
## 52  1600  1592  -8.0442 1573 1611
## 53  1600  1585 -15.3170 1566 1603
## 54  1600  1597  -2.9355 1578 1616
## 55  1600  1600   0.1100 1579 1621
## 56  1600  1589 -11.2926 1568 1610
## 57  1600  1584 -15.7926 1565 1603
## 58  1600  1594  -6.4238 1573 1614
## 59  1600  1588 -11.5850 1570 1607
## 60  1600  1610   9.7151 1588 1631
## 61  1600  1598  -2.3908 1575 1620
## 62  1600  1616  15.7981 1595 1637
## 63  1600  1598  -2.0218 1579 1617
## 64  1600  1603   3.0903 1582 1624
## 65  1600  1593  -6.7772 1574 1612
## 66  1600  1607   6.8417 1587 1627
## 67  1600  1602   2.0756 1580 1624
## 68  1600  1598  -1.7513 1580 1616
## 69  1600  1615  15.0697 1595 1635
## 70  1600  1592  -7.7435 1572 1612
## 71  1600  1602   2.0272 1581 1623
## 72  1600  1594  -6.0277 1574 1614
## 73  1600  1606   6.4455 1587 1626
## 74  1600  1597  -3.2756 1576 1618
## 75  1600  1601   0.7172 1583 1619
## 76  1600  1596  -3.6159 1576 1617
## 77  1600  1621  21.0073 1601 1641
## 78  1600  1612  11.9392 1592 1632
## 79  1600  1608   8.1256 1587 1629
## 80  1600  1599  -0.5480 1581 1618
## 81  1600  1604   4.3180 1582 1626
## 82  1600  1605   5.0494 1587 1623
## 83  1600  1576 -23.6972 1555 1597
## 84  1600  1585 -15.2639 1564 1605
## 85  1600  1601   1.2183 1582 1621
## 86  1600  1608   7.8568 1586 1630
## 87  1600  1609   9.0989 1589 1629
## 88  1600  1589 -11.4263 1569 1608
## 89  1600  1592  -7.6164 1572 1612
## 90  1600  1609   9.2438 1590 1628
## 91  1600  1596  -4.2547 1575 1617
## 92  1600  1608   7.8495 1589 1627
## 93  1600  1595  -4.6479 1575 1615
## 94  1600  1600  -0.2492 1578 1622
## 95  1600  1596  -4.1568 1576 1616
## 96  1600  1608   8.4035 1588 1629
## 97  1600  1590  -9.6376 1570 1611
## 98  1600  1610   9.9356 1590 1629
## 99  1600  1591  -8.6985 1571 1612
## 100 1600  1591  -8.6423 1569 1613


Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).

 

Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.


Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).


Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.


Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.


Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.


Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).


Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.


  • Erro do tipo I e
  • Erro do tipo II.


Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).


Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).


Erros envolvidos na rejeição ou não da hipótese nula
Valor real do parâmetro Não rejeitar Rejeitar
(desconhecido) H0 H0
H0 verdadeira Decisão correta Erro do tipo I
probabilidade associada=(1 − α) probabilidade associada= α
H0 falsa Erro do tipo II Decisão correta
probabilidade associada=β probabilidade associada =(1 − β)


No quadro acima identificam-se:


  • \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
  • \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
  • (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
  • (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.


Qual erro é o pior?


Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.


Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.


Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.


Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.


Consequências da tomada de decisão face aos erro envolvidos
H0 explicada Erro tipo 1: rejeitar H0 quando verdadeira Erro tipo II: não rejeitar H0 quando falsa
O medicamento “A“ não alivia a Condição “B“ O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento
Consequências Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado.


É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.


  • aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
  • aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).