11.4 Natureza dos erros
Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).
Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.
Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:
- um erro máximo tolerado: \(\varepsilon\)=20 horas;
- um nível de significância estabelecido: \(\alpha\)=0,05; e,
- e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).
## mu media erro li ls
## 1 1600 1595 -4.5606 1576 1615
## 2 1600 1588 -11.5487 1570 1607
## 3 1600 1600 0.1976 1580 1620
## 4 1600 1598 -2.3805 1578 1618
## 5 1600 1606 5.5548 1585 1626
## 6 1600 1607 6.9240 1587 1627
## 7 1600 1599 -1.1558 1581 1617
## 8 1600 1614 13.6985 1594 1633
## 9 1600 1598 -2.0338 1579 1617
## 10 1600 1582 -18.1887 1560 1604
## 11 1600 1589 -11.2907 1570 1607
## 12 1600 1603 3.2179 1584 1622
## 13 1600 1588 -12.0200 1567 1609
## 14 1600 1588 -11.9716 1568 1608
## 15 1600 1602 2.2997 1582 1622
## 16 1600 1599 -1.0017 1577 1621
## 17 1600 1608 8.1276 1587 1629
## 18 1600 1592 -8.0096 1572 1612
## 19 1600 1597 -3.0950 1578 1615
## 20 1600 1590 -10.1361 1571 1608
## 21 1600 1597 -2.8355 1577 1618
## 22 1600 1609 8.9345 1589 1629
## 23 1600 1600 -0.4320 1581 1618
## 24 1600 1600 -0.3062 1578 1621
## 25 1600 1605 5.1129 1585 1625
## 26 1600 1597 -2.7083 1577 1617
## 27 1600 1584 -15.9724 1564 1604
## 28 1600 1591 -9.2973 1572 1610
## 29 1600 1603 3.1010 1583 1624
## 30 1600 1597 -3.0386 1576 1618
## 31 1600 1590 -9.8039 1569 1611
## 32 1600 1593 -6.8264 1574 1612
## 33 1600 1604 4.1742 1586 1623
## 34 1600 1582 -18.2114 1560 1604
## 35 1600 1598 -1.6966 1579 1618
## 36 1600 1593 -6.7529 1571 1616
## 37 1600 1602 1.8596 1582 1622
## 38 1600 1595 -4.6799 1576 1614
## 39 1600 1598 -2.3190 1579 1617
## 40 1600 1594 -6.3596 1573 1614
## 41 1600 1601 0.7168 1582 1619
## 42 1600 1565 -34.8979 1544 1586
## 43 1600 1597 -2.9364 1577 1617
## 44 1600 1608 8.4071 1589 1628
## 45 1600 1598 -2.3850 1577 1618
## 46 1600 1594 -5.6010 1573 1616
## 47 1600 1591 -8.9175 1571 1611
## 48 1600 1620 20.1495 1601 1640
## 49 1600 1603 3.1301 1583 1623
## 50 1600 1610 9.8788 1590 1630
## 51 1600 1601 1.2695 1581 1621
## 52 1600 1612 12.1637 1593 1631
## 53 1600 1605 4.6654 1583 1626
## 54 1600 1596 -4.3355 1578 1613
## 55 1600 1601 1.4139 1583 1620
## 56 1600 1616 16.2812 1597 1636
## 57 1600 1603 3.4765 1584 1623
## 58 1600 1608 7.8432 1587 1629
## 59 1600 1587 -13.0025 1569 1605
## 60 1600 1595 -4.7842 1574 1616
## 61 1600 1587 -13.3086 1567 1606
## 62 1600 1600 -0.4556 1580 1619
## 63 1600 1590 -9.6073 1572 1609
## 64 1600 1613 12.8219 1593 1633
## 65 1600 1614 13.8891 1594 1634
## 66 1600 1598 -2.4593 1576 1619
## 67 1600 1614 13.8851 1595 1633
## 68 1600 1596 -3.9662 1576 1616
## 69 1600 1585 -15.4192 1566 1603
## 70 1600 1599 -0.6441 1581 1618
## 71 1600 1593 -7.3975 1574 1612
## 72 1600 1607 7.3526 1588 1627
## 73 1600 1603 2.8460 1582 1624
## 74 1600 1613 13.1983 1593 1634
## 75 1600 1600 -0.1698 1582 1618
## 76 1600 1603 3.4569 1584 1623
## 77 1600 1610 9.6105 1589 1630
## 78 1600 1584 -15.7962 1565 1603
## 79 1600 1598 -2.4947 1578 1617
## 80 1600 1603 3.1440 1583 1623
## 81 1600 1604 3.7231 1584 1623
## 82 1600 1611 10.7253 1593 1628
## 83 1600 1608 7.5068 1589 1626
## 84 1600 1615 14.9781 1596 1634
## 85 1600 1584 -15.7908 1564 1605
## 86 1600 1600 0.4415 1582 1619
## 87 1600 1582 -17.5067 1563 1602
## 88 1600 1579 -20.9721 1559 1599
## 89 1600 1610 9.5464 1591 1629
## 90 1600 1610 10.4705 1590 1631
## 91 1600 1592 -8.1028 1574 1610
## 92 1600 1593 -6.5755 1575 1612
## 93 1600 1591 -8.8884 1572 1611
## 94 1600 1606 6.0590 1586 1626
## 95 1600 1609 8.8132 1588 1630
## 96 1600 1605 5.0000 1585 1625
## 97 1600 1603 3.0013 1586 1620
## 98 1600 1617 17.4735 1599 1636
## 99 1600 1603 3.1474 1584 1623
## 100 1600 1604 3.7261 1585 1622
Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).
Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.
Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).
Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.
Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.
Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.
Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).
Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.
- Erro do tipo I e
- Erro do tipo II.
Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).
Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).
Valor real do parâmetro | Não rejeitar | Rejeitar |
(desconhecido) | H0 | H0 |
H0 verdadeira | Decisão correta | Erro do tipo I |
probabilidade associada=(1 − α) | probabilidade associada= α | |
H0 falsa | Erro do tipo II | Decisão correta |
probabilidade associada=β | probabilidade associada =(1 − β) |
No quadro acima identificam-se:
- \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
- \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
- (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
- (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.
Qual erro é o pior? Depende!
Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.
Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.
Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.
Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.
H0 explicada | Erro tipo 1: rejeitar H0 quando verdadeira | Erro tipo II: não rejeitar H0 quando falsa |
---|---|---|
O medicamento “A“ não alivia a Condição “B“ | O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento | O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento |
Consequências | Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais | Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado. |
É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.
- aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
- aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).