11.4 Natureza dos erros
Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).
Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.
Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:
- um erro máximo tolerado: \(\varepsilon\)=20 horas;
- um nível de significância estabelecido: \(\alpha\)=0,05; e,
- e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)
## mu media erro li ls
## 1 1600 1621 20.5916 1600 1641
## 2 1600 1601 0.9818 1581 1621
## 3 1600 1598 -1.9727 1579 1617
## 4 1600 1582 -17.5506 1564 1601
## 5 1600 1578 -22.2244 1556 1600
## 6 1600 1595 -4.6633 1577 1614
## 7 1600 1603 2.7745 1582 1624
## 8 1600 1586 -14.3403 1565 1606
## 9 1600 1599 -1.2613 1578 1620
## 10 1600 1590 -10.1190 1570 1610
## 11 1600 1621 20.8486 1601 1640
## 12 1600 1611 10.8251 1591 1631
## 13 1600 1568 -31.8197 1549 1587
## 14 1600 1596 -3.9270 1576 1616
## 15 1600 1585 -14.7758 1567 1604
## 16 1600 1614 13.8580 1594 1633
## 17 1600 1599 -1.2980 1581 1616
## 18 1600 1574 -26.3989 1554 1594
## 19 1600 1598 -1.8732 1578 1618
## 20 1600 1593 -6.8153 1571 1615
## 21 1600 1594 -5.7039 1576 1613
## 22 1600 1608 7.8771 1584 1632
## 23 1600 1608 7.7501 1589 1627
## 24 1600 1593 -7.1834 1575 1610
## 25 1600 1611 11.0307 1592 1630
## 26 1600 1614 13.6239 1591 1636
## 27 1600 1597 -3.0565 1577 1617
## 28 1600 1606 5.5707 1586 1625
## 29 1600 1587 -13.1158 1567 1607
## 30 1600 1597 -3.2379 1577 1616
## 31 1600 1606 5.6780 1587 1625
## 32 1600 1591 -9.2492 1572 1609
## 33 1600 1612 11.7920 1592 1631
## 34 1600 1610 9.8398 1591 1628
## 35 1600 1602 2.4396 1582 1623
## 36 1600 1597 -2.8977 1579 1616
## 37 1600 1594 -5.8185 1574 1614
## 38 1600 1590 -10.0867 1571 1609
## 39 1600 1604 3.9141 1583 1625
## 40 1600 1592 -8.4307 1572 1611
## 41 1600 1609 9.0399 1588 1630
## 42 1600 1590 -10.3582 1570 1609
## 43 1600 1604 3.8988 1585 1623
## 44 1600 1603 2.8483 1583 1623
## 45 1600 1607 6.5999 1587 1627
## 46 1600 1599 -1.4433 1579 1618
## 47 1600 1602 2.3586 1583 1622
## 48 1600 1605 5.3816 1585 1625
## 49 1600 1608 8.2557 1589 1628
## 50 1600 1604 3.7427 1584 1624
## 51 1600 1602 1.8234 1583 1621
## 52 1600 1592 -8.0442 1573 1611
## 53 1600 1585 -15.3170 1566 1603
## 54 1600 1597 -2.9355 1578 1616
## 55 1600 1600 0.1100 1579 1621
## 56 1600 1589 -11.2926 1568 1610
## 57 1600 1584 -15.7926 1565 1603
## 58 1600 1594 -6.4238 1573 1614
## 59 1600 1588 -11.5850 1570 1607
## 60 1600 1610 9.7151 1588 1631
## 61 1600 1598 -2.3908 1575 1620
## 62 1600 1616 15.7981 1595 1637
## 63 1600 1598 -2.0218 1579 1617
## 64 1600 1603 3.0903 1582 1624
## 65 1600 1593 -6.7772 1574 1612
## 66 1600 1607 6.8417 1587 1627
## 67 1600 1602 2.0756 1580 1624
## 68 1600 1598 -1.7513 1580 1616
## 69 1600 1615 15.0697 1595 1635
## 70 1600 1592 -7.7435 1572 1612
## 71 1600 1602 2.0272 1581 1623
## 72 1600 1594 -6.0277 1574 1614
## 73 1600 1606 6.4455 1587 1626
## 74 1600 1597 -3.2756 1576 1618
## 75 1600 1601 0.7172 1583 1619
## 76 1600 1596 -3.6159 1576 1617
## 77 1600 1621 21.0073 1601 1641
## 78 1600 1612 11.9392 1592 1632
## 79 1600 1608 8.1256 1587 1629
## 80 1600 1599 -0.5480 1581 1618
## 81 1600 1604 4.3180 1582 1626
## 82 1600 1605 5.0494 1587 1623
## 83 1600 1576 -23.6972 1555 1597
## 84 1600 1585 -15.2639 1564 1605
## 85 1600 1601 1.2183 1582 1621
## 86 1600 1608 7.8568 1586 1630
## 87 1600 1609 9.0989 1589 1629
## 88 1600 1589 -11.4263 1569 1608
## 89 1600 1592 -7.6164 1572 1612
## 90 1600 1609 9.2438 1590 1628
## 91 1600 1596 -4.2547 1575 1617
## 92 1600 1608 7.8495 1589 1627
## 93 1600 1595 -4.6479 1575 1615
## 94 1600 1600 -0.2492 1578 1622
## 95 1600 1596 -4.1568 1576 1616
## 96 1600 1608 8.4035 1588 1629
## 97 1600 1590 -9.6376 1570 1611
## 98 1600 1610 9.9356 1590 1629
## 99 1600 1591 -8.6985 1571 1612
## 100 1600 1591 -8.6423 1569 1613
Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).
Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.
Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).
Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.
Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.
Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.
Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).
Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.
- Erro do tipo I e
- Erro do tipo II.
Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).
Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).
Valor real do parâmetro | Não rejeitar | Rejeitar |
(desconhecido) | H0 | H0 |
H0 verdadeira | Decisão correta | Erro do tipo I |
probabilidade associada=(1 − α) | probabilidade associada= α | |
H0 falsa | Erro do tipo II | Decisão correta |
probabilidade associada=β | probabilidade associada =(1 − β) |
No quadro acima identificam-se:
- \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
- \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
- (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
- (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.
Qual erro é o pior?
Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.
Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.
Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.
Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.
H0 explicada | Erro tipo 1: rejeitar H0 quando verdadeira | Erro tipo II: não rejeitar H0 quando falsa |
---|---|---|
O medicamento “A“ não alivia a Condição “B“ | O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento | O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento |
Consequências | Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais | Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado. |
É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.
- aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
- aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).