11.4 Natureza dos erros

Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).


Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.


Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:


  • um erro máximo tolerado: \(\varepsilon\)=20 horas;
  • um nível de significância estabelecido: \(\alpha\)=0,05; e,
  • e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).



Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição $\sim N (\mu; \sigma)$

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)

##       mu media     erro   li   ls
## 1   1600  1593  -7.1598 1573 1612
## 2   1600  1589 -11.4953 1568 1609
## 3   1600  1608   8.4721 1591 1626
## 4   1600  1603   3.1176 1585 1622
## 5   1600  1597  -3.0133 1578 1616
## 6   1600  1618  17.6017 1596 1639
## 7   1600  1608   7.7099 1589 1626
## 8   1600  1569 -30.5064 1548 1591
## 9   1600  1599  -0.6307 1579 1619
## 10  1600  1595  -5.3031 1575 1615
## 11  1600  1598  -1.9372 1580 1616
## 12  1600  1605   4.5558 1582 1627
## 13  1600  1601   0.6203 1581 1620
## 14  1600  1599  -1.2787 1578 1619
## 15  1600  1609   8.6444 1588 1629
## 16  1600  1601   0.9588 1580 1622
## 17  1600  1589 -10.5011 1572 1607
## 18  1600  1582 -17.9580 1560 1604
## 19  1600  1595  -4.5925 1575 1616
## 20  1600  1613  13.2274 1593 1634
## 21  1600  1589 -10.5960 1570 1609
## 22  1600  1581 -18.5774 1562 1601
## 23  1600  1572 -28.1906 1552 1592
## 24  1600  1598  -1.9635 1579 1617
## 25  1600  1596  -4.0299 1577 1615
## 26  1600  1616  15.8098 1597 1635
## 27  1600  1588 -11.9716 1569 1607
## 28  1600  1597  -2.6980 1577 1618
## 29  1600  1599  -1.4935 1578 1619
## 30  1600  1601   1.2884 1580 1623
## 31  1600  1604   4.2684 1584 1625
## 32  1600  1596  -3.6951 1577 1616
## 33  1600  1603   3.4826 1583 1624
## 34  1600  1585 -15.4752 1566 1603
## 35  1600  1600   0.3418 1579 1622
## 36  1600  1588 -12.0148 1568 1608
## 37  1600  1600  -0.1962 1580 1620
## 38  1600  1596  -3.9480 1577 1615
## 39  1600  1599  -1.1425 1577 1621
## 40  1600  1591  -8.9447 1572 1610
## 41  1600  1591  -9.2761 1569 1612
## 42  1600  1607   7.3410 1586 1628
## 43  1600  1599  -0.7335 1582 1617
## 44  1600  1620  19.7041 1600 1639
## 45  1600  1610  10.1851 1589 1631
## 46  1600  1602   2.3830 1581 1623
## 47  1600  1601   1.3758 1581 1622
## 48  1600  1589 -10.6149 1572 1607
## 49  1600  1610   9.7338 1591 1628
## 50  1600  1607   6.7186 1586 1627
## 51  1600  1609   9.0705 1589 1630
## 52  1600  1602   1.6082 1579 1624
## 53  1600  1610   9.6766 1589 1630
## 54  1600  1608   7.8260 1589 1626
## 55  1600  1586 -14.4609 1566 1605
## 56  1600  1613  12.7919 1593 1633
## 57  1600  1601   1.3852 1583 1620
## 58  1600  1607   6.7959 1587 1627
## 59  1600  1606   5.7451 1586 1625
## 60  1600  1604   4.0732 1584 1624
## 61  1600  1590 -10.3649 1570 1609
## 62  1600  1606   6.0708 1586 1627
## 63  1600  1591  -9.1539 1569 1613
## 64  1600  1598  -2.0829 1580 1615
## 65  1600  1610   9.9315 1591 1629
## 66  1600  1606   6.4447 1588 1625
## 67  1600  1604   4.3114 1585 1624
## 68  1600  1592  -7.8329 1571 1614
## 69  1600  1607   7.0028 1588 1627
## 70  1600  1611  10.7924 1591 1630
## 71  1600  1600   0.4419 1580 1621
## 72  1600  1599  -1.4311 1579 1618
## 73  1600  1576 -24.2778 1555 1596
## 74  1600  1601   0.5643 1581 1621
## 75  1600  1606   5.9696 1586 1626
## 76  1600  1610  10.3087 1592 1628
## 77  1600  1593  -7.1006 1574 1612
## 78  1600  1594  -5.9672 1577 1612
## 79  1600  1589 -11.0913 1568 1610
## 80  1600  1593  -6.9559 1573 1613
## 81  1600  1593  -6.5584 1572 1615
## 82  1600  1603   2.7623 1584 1622
## 83  1600  1590  -9.5469 1568 1613
## 84  1600  1601   1.4875 1583 1620
## 85  1600  1592  -7.6152 1574 1611
## 86  1600  1603   3.2195 1585 1622
## 87  1600  1593  -6.6361 1574 1613
## 88  1600  1588 -12.4914 1565 1610
## 89  1600  1590 -10.4640 1569 1610
## 90  1600  1590  -9.6043 1569 1612
## 91  1600  1591  -9.0363 1570 1612
## 92  1600  1601   0.9786 1580 1622
## 93  1600  1614  14.0600 1594 1634
## 94  1600  1585 -15.3078 1564 1605
## 95  1600  1593  -7.2477 1575 1610
## 96  1600  1606   5.6988 1585 1627
## 97  1600  1579 -21.1466 1560 1598
## 98  1600  1595  -5.1132 1575 1615
## 99  1600  1579 -20.7075 1558 1600
## 100 1600  1601   0.6380 1580 1622


Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).

 

Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.


Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).


Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.


Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.


Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.


Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).


Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.


  • Erro do tipo I e
  • Erro do tipo II.


Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).


Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).


Erros envolvidos na rejeição ou não da hipótese nula
Valor real do parâmetro Não rejeitar Rejeitar
(desconhecido) H0 H0
H0 verdadeira Decisão correta Erro do tipo I
probabilidade associada=(1 − α) probabilidade associada= α
H0 falsa Erro do tipo II Decisão correta
probabilidade associada=β probabilidade associada =(1 − β)


No quadro acima identificam-se:


  • \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
  • \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
  • (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
  • (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.


Qual erro é o pior?


Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.


Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.


Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.


Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.


Consequências da tomada de decisão face aos erro envolvidos
H0 explicada Erro tipo 1: rejeitar H0 quando verdadeira Erro tipo II: não rejeitar H0 quando falsa
O medicamento “A“ não alivia a Condição “B“ O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento
Consequências Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado.


É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.


  • aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
  • aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).