11.4 Natureza dos erros
Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).
Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.
Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:
- um erro máximo tolerado: \(\varepsilon\)=20 horas;
- um nível de significância estabelecido: \(\alpha\)=0,05; e,
- e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)
## mu media erro li ls
## 1 1600 1616 16.3151 1597 1636
## 2 1600 1612 11.5697 1593 1630
## 3 1600 1608 8.1650 1590 1627
## 4 1600 1602 2.0270 1583 1621
## 5 1600 1602 2.0289 1583 1621
## 6 1600 1603 2.5526 1582 1623
## 7 1600 1594 -5.6906 1576 1612
## 8 1600 1584 -16.4768 1564 1603
## 9 1600 1604 4.0345 1584 1624
## 10 1600 1600 -0.4252 1580 1619
## 11 1600 1584 -15.8765 1565 1603
## 12 1600 1611 11.4942 1592 1631
## 13 1600 1613 12.5781 1592 1633
## 14 1600 1602 1.9146 1581 1623
## 15 1600 1599 -0.5371 1580 1619
## 16 1600 1599 -1.0145 1580 1618
## 17 1600 1584 -16.4424 1562 1605
## 18 1600 1598 -1.6196 1577 1620
## 19 1600 1610 9.6945 1588 1631
## 20 1600 1606 5.6605 1586 1625
## 21 1600 1598 -2.1323 1579 1617
## 22 1600 1591 -8.9016 1573 1610
## 23 1600 1591 -9.3981 1569 1613
## 24 1600 1593 -7.0078 1573 1613
## 25 1600 1608 7.5389 1587 1628
## 26 1600 1601 1.3178 1580 1622
## 27 1600 1597 -2.6773 1579 1616
## 28 1600 1615 15.4813 1596 1635
## 29 1600 1591 -9.4544 1569 1612
## 30 1600 1580 -19.5474 1559 1602
## 31 1600 1599 -1.1140 1581 1617
## 32 1600 1603 3.0734 1584 1623
## 33 1600 1599 -0.8915 1581 1617
## 34 1600 1591 -9.0863 1570 1612
## 35 1600 1621 21.4264 1602 1641
## 36 1600 1593 -6.8440 1573 1613
## 37 1600 1598 -2.2345 1577 1618
## 38 1600 1614 13.9671 1596 1632
## 39 1600 1595 -4.6778 1576 1615
## 40 1600 1605 4.7965 1585 1625
## 41 1600 1616 16.4879 1598 1635
## 42 1600 1602 2.2212 1583 1621
## 43 1600 1614 13.5271 1593 1634
## 44 1600 1593 -7.1988 1574 1612
## 45 1600 1605 4.9445 1584 1626
## 46 1600 1584 -15.5532 1565 1604
## 47 1600 1602 2.2019 1582 1622
## 48 1600 1607 6.5546 1588 1625
## 49 1600 1610 9.8894 1590 1630
## 50 1600 1602 2.1602 1583 1621
## 51 1600 1619 18.6267 1599 1639
## 52 1600 1599 -0.6726 1578 1621
## 53 1600 1611 10.9881 1593 1629
## 54 1600 1607 6.6949 1588 1626
## 55 1600 1586 -14.4828 1566 1605
## 56 1600 1600 -0.4519 1580 1619
## 57 1600 1587 -12.5921 1566 1609
## 58 1600 1586 -14.4863 1565 1606
## 59 1600 1593 -7.3895 1572 1613
## 60 1600 1598 -1.9706 1579 1617
## 61 1600 1599 -0.9360 1581 1617
## 62 1600 1613 12.7514 1593 1633
## 63 1600 1583 -17.0069 1563 1603
## 64 1600 1602 1.6973 1580 1623
## 65 1600 1587 -13.2585 1567 1606
## 66 1600 1605 5.2341 1586 1624
## 67 1600 1586 -14.4755 1562 1609
## 68 1600 1603 2.9214 1583 1623
## 69 1600 1591 -8.8587 1571 1612
## 70 1600 1596 -3.9001 1575 1617
## 71 1600 1602 1.6750 1580 1623
## 72 1600 1601 1.4795 1584 1619
## 73 1600 1590 -9.8966 1569 1611
## 74 1600 1603 2.9040 1584 1622
## 75 1600 1613 12.5350 1592 1633
## 76 1600 1610 9.5725 1590 1630
## 77 1600 1594 -5.7881 1575 1614
## 78 1600 1599 -0.8031 1581 1618
## 79 1600 1607 7.0693 1587 1627
## 80 1600 1598 -1.7968 1579 1617
## 81 1600 1619 18.8460 1599 1639
## 82 1600 1593 -6.6569 1573 1613
## 83 1600 1598 -1.9942 1579 1617
## 84 1600 1602 2.3482 1582 1623
## 85 1600 1573 -26.7749 1551 1595
## 86 1600 1578 -22.2604 1560 1596
## 87 1600 1598 -1.9653 1578 1618
## 88 1600 1615 15.1544 1595 1635
## 89 1600 1609 9.3404 1591 1628
## 90 1600 1588 -11.8189 1569 1607
## 91 1600 1586 -14.4968 1564 1607
## 92 1600 1601 0.7246 1581 1620
## 93 1600 1590 -10.1073 1570 1610
## 94 1600 1595 -4.7349 1576 1615
## 95 1600 1583 -17.0122 1565 1601
## 96 1600 1594 -5.9265 1572 1616
## 97 1600 1596 -3.8663 1576 1616
## 98 1600 1609 8.8171 1590 1627
## 99 1600 1592 -7.7222 1574 1611
## 100 1600 1601 0.8865 1582 1620
Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).
Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.
Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).
Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.
Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.
Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.
Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).
Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.
- Erro do tipo I e
- Erro do tipo II.
Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).
Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).
Valor real do parâmetro | Não rejeitar | Rejeitar |
(desconhecido) | H0 | H0 |
H0 verdadeira | Decisão correta | Erro do tipo I |
probabilidade associada=(1 − α) | probabilidade associada= α | |
H0 falsa | Erro do tipo II | Decisão correta |
probabilidade associada=β | probabilidade associada =(1 − β) |
No quadro acima identificam-se:
- \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
- \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
- (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
- (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.
Qual erro é o pior?
Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.
Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.
Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.
Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.
H0 explicada | Erro tipo 1: rejeitar H0 quando verdadeira | Erro tipo II: não rejeitar H0 quando falsa |
---|---|---|
O medicamento “A“ não alivia a Condição “B“ | O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento | O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento |
Consequências | Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais | Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado. |
É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.
- aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
- aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).