11.4 Natureza dos erros
Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).
Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.
Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:
- um erro máximo tolerado: \(\varepsilon\)=20 horas;
- um nível de significância estabelecido: \(\alpha\)=0,05; e,
- e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)
## mu media erro li ls
## 1 1600 1593 -7.1598 1573 1612
## 2 1600 1589 -11.4953 1568 1609
## 3 1600 1608 8.4721 1591 1626
## 4 1600 1603 3.1176 1585 1622
## 5 1600 1597 -3.0133 1578 1616
## 6 1600 1618 17.6017 1596 1639
## 7 1600 1608 7.7099 1589 1626
## 8 1600 1569 -30.5064 1548 1591
## 9 1600 1599 -0.6307 1579 1619
## 10 1600 1595 -5.3031 1575 1615
## 11 1600 1598 -1.9372 1580 1616
## 12 1600 1605 4.5558 1582 1627
## 13 1600 1601 0.6203 1581 1620
## 14 1600 1599 -1.2787 1578 1619
## 15 1600 1609 8.6444 1588 1629
## 16 1600 1601 0.9588 1580 1622
## 17 1600 1589 -10.5011 1572 1607
## 18 1600 1582 -17.9580 1560 1604
## 19 1600 1595 -4.5925 1575 1616
## 20 1600 1613 13.2274 1593 1634
## 21 1600 1589 -10.5960 1570 1609
## 22 1600 1581 -18.5774 1562 1601
## 23 1600 1572 -28.1906 1552 1592
## 24 1600 1598 -1.9635 1579 1617
## 25 1600 1596 -4.0299 1577 1615
## 26 1600 1616 15.8098 1597 1635
## 27 1600 1588 -11.9716 1569 1607
## 28 1600 1597 -2.6980 1577 1618
## 29 1600 1599 -1.4935 1578 1619
## 30 1600 1601 1.2884 1580 1623
## 31 1600 1604 4.2684 1584 1625
## 32 1600 1596 -3.6951 1577 1616
## 33 1600 1603 3.4826 1583 1624
## 34 1600 1585 -15.4752 1566 1603
## 35 1600 1600 0.3418 1579 1622
## 36 1600 1588 -12.0148 1568 1608
## 37 1600 1600 -0.1962 1580 1620
## 38 1600 1596 -3.9480 1577 1615
## 39 1600 1599 -1.1425 1577 1621
## 40 1600 1591 -8.9447 1572 1610
## 41 1600 1591 -9.2761 1569 1612
## 42 1600 1607 7.3410 1586 1628
## 43 1600 1599 -0.7335 1582 1617
## 44 1600 1620 19.7041 1600 1639
## 45 1600 1610 10.1851 1589 1631
## 46 1600 1602 2.3830 1581 1623
## 47 1600 1601 1.3758 1581 1622
## 48 1600 1589 -10.6149 1572 1607
## 49 1600 1610 9.7338 1591 1628
## 50 1600 1607 6.7186 1586 1627
## 51 1600 1609 9.0705 1589 1630
## 52 1600 1602 1.6082 1579 1624
## 53 1600 1610 9.6766 1589 1630
## 54 1600 1608 7.8260 1589 1626
## 55 1600 1586 -14.4609 1566 1605
## 56 1600 1613 12.7919 1593 1633
## 57 1600 1601 1.3852 1583 1620
## 58 1600 1607 6.7959 1587 1627
## 59 1600 1606 5.7451 1586 1625
## 60 1600 1604 4.0732 1584 1624
## 61 1600 1590 -10.3649 1570 1609
## 62 1600 1606 6.0708 1586 1627
## 63 1600 1591 -9.1539 1569 1613
## 64 1600 1598 -2.0829 1580 1615
## 65 1600 1610 9.9315 1591 1629
## 66 1600 1606 6.4447 1588 1625
## 67 1600 1604 4.3114 1585 1624
## 68 1600 1592 -7.8329 1571 1614
## 69 1600 1607 7.0028 1588 1627
## 70 1600 1611 10.7924 1591 1630
## 71 1600 1600 0.4419 1580 1621
## 72 1600 1599 -1.4311 1579 1618
## 73 1600 1576 -24.2778 1555 1596
## 74 1600 1601 0.5643 1581 1621
## 75 1600 1606 5.9696 1586 1626
## 76 1600 1610 10.3087 1592 1628
## 77 1600 1593 -7.1006 1574 1612
## 78 1600 1594 -5.9672 1577 1612
## 79 1600 1589 -11.0913 1568 1610
## 80 1600 1593 -6.9559 1573 1613
## 81 1600 1593 -6.5584 1572 1615
## 82 1600 1603 2.7623 1584 1622
## 83 1600 1590 -9.5469 1568 1613
## 84 1600 1601 1.4875 1583 1620
## 85 1600 1592 -7.6152 1574 1611
## 86 1600 1603 3.2195 1585 1622
## 87 1600 1593 -6.6361 1574 1613
## 88 1600 1588 -12.4914 1565 1610
## 89 1600 1590 -10.4640 1569 1610
## 90 1600 1590 -9.6043 1569 1612
## 91 1600 1591 -9.0363 1570 1612
## 92 1600 1601 0.9786 1580 1622
## 93 1600 1614 14.0600 1594 1634
## 94 1600 1585 -15.3078 1564 1605
## 95 1600 1593 -7.2477 1575 1610
## 96 1600 1606 5.6988 1585 1627
## 97 1600 1579 -21.1466 1560 1598
## 98 1600 1595 -5.1132 1575 1615
## 99 1600 1579 -20.7075 1558 1600
## 100 1600 1601 0.6380 1580 1622
Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).
Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.
Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).
Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.
Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.
Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.
Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).
Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.
- Erro do tipo I e
- Erro do tipo II.
Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).
Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).
Valor real do parâmetro | Não rejeitar | Rejeitar |
(desconhecido) | H0 | H0 |
H0 verdadeira | Decisão correta | Erro do tipo I |
probabilidade associada=(1 − α) | probabilidade associada= α | |
H0 falsa | Erro do tipo II | Decisão correta |
probabilidade associada=β | probabilidade associada =(1 − β) |
No quadro acima identificam-se:
- \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
- \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
- (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
- (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.
Qual erro é o pior?
Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.
Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.
Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.
Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.
H0 explicada | Erro tipo 1: rejeitar H0 quando verdadeira | Erro tipo II: não rejeitar H0 quando falsa |
---|---|---|
O medicamento “A“ não alivia a Condição “B“ | O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento | O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento |
Consequências | Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais | Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado. |
É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.
- aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
- aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).