11.4 Natureza dos erros
Para introduzir os conceitos relacionados aos erros considere uma situação onde uma empresa produz lâmpadas e a vida útil média, em horas, dessas lâmpadas segue uma distribuição Normal tal que \(VU \sim N (1600, 120)\).
Se não temos conhecimento algum sobre a real vida útil média dessas lâmpadas e alguém nos afirma que a vida útil é de 1.600 h, para confirmar ou não essa proposição (de um modo ``científico’’) devemos extrair uma amostra.
Usando conceitos já explicados em uma unidade anterior podemos determinar o tamanho amostral em função de:
- um erro máximo tolerado: \(\varepsilon\)=20 horas;
- um nível de significância estabelecido: \(\alpha\)=0,05; e,
- e alguma informação sobre a medida da variabilidade da variável em estudo: \(\sigma\)=120 horas (no caso, o desvio padrão populacional).

Figure 11.7: Flutuação dos valores médios para diversas amostras extraídas de uma mesma população distribuição \(\sim N (\mu; \sigma)\)
## mu media erro li ls
## 1 1600 1604.527 4.5266243 1584.265 1624.788
## 2 1600 1585.924 -14.0760624 1565.376 1606.472
## 3 1600 1599.382 -0.6176159 1580.549 1618.215
## 4 1600 1590.464 -9.5355509 1570.532 1610.397
## 5 1600 1601.495 1.4951824 1581.925 1621.065
## 6 1600 1597.037 -2.9626889 1575.903 1618.171
## 7 1600 1595.633 -4.3666613 1575.751 1615.516
## 8 1600 1599.820 -0.1797689 1578.705 1620.935
## 9 1600 1606.035 6.0353935 1587.633 1624.438
## 10 1600 1588.948 -11.0519670 1567.364 1610.532
## 11 1600 1607.107 7.1065739 1586.907 1627.306
## 12 1600 1597.806 -2.1937925 1577.807 1617.805
## 13 1600 1601.597 1.5965893 1581.587 1621.606
## 14 1600 1598.902 -1.0983708 1579.905 1617.898
## 15 1600 1570.620 -29.3795932 1550.081 1591.160
## 16 1600 1595.289 -4.7111788 1576.720 1613.858
## 17 1600 1590.190 -9.8096021 1570.163 1610.217
## 18 1600 1592.817 -7.1826505 1571.942 1613.693
## 19 1600 1594.994 -5.0061016 1576.062 1613.926
## 20 1600 1602.570 2.5696048 1583.982 1621.157
## 21 1600 1591.498 -8.5017404 1573.000 1609.997
## 22 1600 1597.682 -2.3183535 1578.142 1617.222
## 23 1600 1612.211 12.2111506 1592.924 1631.498
## 24 1600 1585.804 -14.1963150 1566.759 1604.848
## 25 1600 1603.394 3.3939747 1585.209 1621.579
## 26 1600 1586.838 -13.1620467 1564.307 1609.369
## 27 1600 1608.816 8.8156499 1588.612 1629.019
## 28 1600 1602.046 2.0462207 1580.002 1624.090
## 29 1600 1608.343 8.3432382 1588.912 1627.774
## 30 1600 1584.824 -15.1758216 1563.903 1605.746
## 31 1600 1611.275 11.2753060 1592.269 1630.281
## 32 1600 1581.971 -18.0288945 1562.238 1601.705
## 33 1600 1595.401 -4.5991319 1574.132 1616.670
## 34 1600 1590.683 -9.3173962 1571.109 1610.256
## 35 1600 1593.389 -6.6106347 1574.456 1612.323
## 36 1600 1602.650 2.6496164 1581.283 1624.017
## 37 1600 1596.097 -3.9031861 1575.819 1616.375
## 38 1600 1611.902 11.9022609 1593.103 1630.702
## 39 1600 1607.836 7.8363601 1588.110 1627.563
## 40 1600 1583.837 -16.1633089 1562.345 1605.328
## 41 1600 1592.145 -7.8550603 1573.355 1610.935
## 42 1600 1588.731 -11.2686107 1569.600 1607.863
## 43 1600 1608.601 8.6006075 1588.321 1628.880
## 44 1600 1608.698 8.6980051 1586.688 1630.708
## 45 1600 1597.294 -2.7057709 1575.740 1618.848
## 46 1600 1588.199 -11.8012758 1569.627 1606.770
## 47 1600 1607.274 7.2736019 1588.459 1626.089
## 48 1600 1602.559 2.5589052 1582.719 1622.399
## 49 1600 1620.269 20.2694146 1601.982 1638.557
## 50 1600 1594.085 -5.9146128 1572.060 1616.110
## 51 1600 1614.035 14.0352375 1593.845 1634.226
## 52 1600 1611.667 11.6666903 1591.012 1632.321
## 53 1600 1599.837 -0.1629434 1580.004 1619.670
## 54 1600 1596.735 -3.2654469 1578.478 1614.991
## 55 1600 1600.958 0.9584824 1580.213 1621.704
## 56 1600 1582.478 -17.5223803 1563.612 1601.343
## 57 1600 1603.620 3.6198153 1582.598 1624.642
## 58 1600 1600.793 0.7926739 1579.050 1622.535
## 59 1600 1607.834 7.8344747 1587.721 1627.948
## 60 1600 1597.968 -2.0322029 1575.220 1620.716
## 61 1600 1593.555 -6.4449270 1572.895 1614.215
## 62 1600 1608.345 8.3448728 1591.004 1625.686
## 63 1600 1599.416 -0.5843896 1579.994 1618.837
## 64 1600 1601.379 1.3794242 1581.416 1621.343
## 65 1600 1614.734 14.7341421 1593.859 1635.609
## 66 1600 1596.825 -3.1747446 1578.259 1615.392
## 67 1600 1596.100 -3.8995840 1576.290 1615.911
## 68 1600 1620.848 20.8481650 1601.739 1639.957
## 69 1600 1604.490 4.4904077 1586.012 1622.969
## 70 1600 1603.887 3.8871359 1582.581 1625.193
## 71 1600 1597.802 -2.1977913 1577.201 1618.404
## 72 1600 1599.068 -0.9322044 1580.520 1617.616
## 73 1600 1588.368 -11.6317436 1569.178 1607.559
## 74 1600 1607.004 7.0037521 1585.453 1628.554
## 75 1600 1601.516 1.5156821 1582.971 1620.061
## 76 1600 1602.530 2.5296313 1583.462 1621.597
## 77 1600 1614.112 14.1115940 1594.460 1633.763
## 78 1600 1593.955 -6.0445513 1573.869 1614.042
## 79 1600 1592.464 -7.5361079 1573.048 1611.880
## 80 1600 1598.184 -1.8161738 1577.791 1618.577
## 81 1600 1597.258 -2.7418256 1576.043 1618.473
## 82 1600 1595.917 -4.0834494 1575.944 1615.889
## 83 1600 1602.520 2.5198565 1583.773 1621.267
## 84 1600 1602.039 2.0388279 1581.714 1622.363
## 85 1600 1594.455 -5.5450441 1573.255 1615.655
## 86 1600 1594.044 -5.9563064 1574.633 1613.455
## 87 1600 1596.123 -3.8770579 1574.532 1617.713
## 88 1600 1622.542 22.5417307 1600.630 1644.454
## 89 1600 1595.759 -4.2414492 1575.202 1616.315
## 90 1600 1596.033 -3.9672125 1576.896 1615.169
## 91 1600 1600.651 0.6508446 1582.377 1618.925
## 92 1600 1606.103 6.1029062 1585.160 1627.045
## 93 1600 1600.631 0.6311651 1579.663 1621.599
## 94 1600 1588.593 -11.4071174 1567.778 1609.408
## 95 1600 1607.928 7.9284073 1588.503 1627.354
## 96 1600 1598.993 -1.0070874 1578.345 1619.641
## 97 1600 1617.983 17.9832446 1598.731 1637.236
## 98 1600 1598.873 -1.1267061 1579.383 1618.364
## 99 1600 1594.856 -5.1442071 1574.822 1614.890
## 100 1600 1589.176 -10.8238142 1569.236 1609.116
Observa-se que algumas das amostras, numa proporção igual ao nível de significância estabelecido quando do dimensionamento (5%), apresentam médias com valores que se afastam do valor médio populacional mais que o erro estabelecido (20 h).
Como já informado anteriormente, um teste de hipóteses é um método quantitativo e não se baseia, sobremaneira, em impressões pessoais ou outros achismos. Os cenários a seguir foram criados apenas para tentar estabelcer um paralelo entre a probabilidade de se obter médias amostrais muito destoantes da média populacional e uma “inclinação subjetiva” em se rejeitar uma afirmação.
Considere que a sua amostra em particular é uma das que não se afasta tanto do valor que lhe afirmaram (a vida útil das lâmpadas é de 1.600 h).
Nessa situação, talvez você não se “convencesse” de que a vida útil média fosse diferente daquilo que lhe informaram e, assim, não iria recusar a afirmação.
Agora considere que a sua amostra em particular é uma das que se afasta muito do valor que lhe afirmaram.
Nessa nova situação, certamente você iria “suspeitar” que a vida útil média é diferente daquilo que lhe informaram e assim, recusar a afirmação.
Na primeira decisão, você não recusou uma afirmação que era, de fato, verdadeira; ao passo que na segunda, você rejeitou uma afirmação que era verdadeira (lembrando que você não sabia que a vida útil média é, de fato, 1.600 h).
Como se vê no quadro abaixo, há dois tipos de erros envolvidos em um teste de hipóteses e suas consequências, muitas vezes, são bem diferentes.
- Erro do tipo I e
- Erro do tipo II.
Um erro do tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade (limitada pelo pesquisador) de se incorrer em um erro do tipo I é chamada de nível de significância e é frequentemente denotada pela letra grega \(\alpha\).
Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do tipo II, também chamada de poder do teste e é frequentemente denotada pela letra grega \(\beta\).
Valor real do parâmetro | Não rejeitar | Rejeitar |
(desconhecido) | H0 | H0 |
H0 verdadeira | Decisão correta | Erro do tipo I |
probabilidade associada=(1 − α) | probabilidade associada= α | |
H0 falsa | Erro do tipo II | Decisão correta |
probabilidade associada=β | probabilidade associada =(1 − β) |
No quadro acima identificam-se:
- \(\alpha\): a probabilidade associada ao cometimento de um erro do tipo I: rejeitar a hipótese nula sendo ela verdadeira (arbitrado pelo pesquisador, é denominado nível de significância do teste);
- \(\beta\): a probabilidade associada ao cometimento de um erro do tipo II: não rejeitar a hipótese nula sendo esta falsa;
- (1-\(\alpha\)): o nível de confiança estabelecido para a decisão, a probabilidade associada em não se rejeitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, verdadeira; e,
- (1-\(\beta\)): o poder do teste, a probabilidade associada em não se aceitar a hipótese nula (\(H_{0}\)) quando ela é, de fato, falsa.
Qual erro é o pior?
Por exemplo, se alguém testa a presença de alguma doença em um paciente, decidindo incorretamente sobre a necessidade do tratamento (ou seja, decidindo que a pessoa está doente), pode submetê-lo ao desconforto pelo tratamento (efeitos colaterais) além de perda financeira pela despesa incorrida.
Mas por outro lado, a falha em diagnosticar a presença da doença no paciente pode levá-lo à morte pela ausência de tratamento.
Outro exemplo clássico a ser citado seria o de condenar uma pessoa inocente ou libertar um criminoso.
Como não há uma regra clara sobre qual tipo de erro é o pior recomenda-se quando se usa dados para testar uma hipótese observar com muito cuidado as consequências que podem seguir os dois tipos de erros. Vários especialistas sugerem o uso de uma tabela como a abaixo para detalhar as consequências de um erro Tipo 1 e Tipo 2 em sua análise específica.
H0 explicada | Erro tipo 1: rejeitar H0 quando verdadeira | Erro tipo II: não rejeitar H0 quando falsa |
---|---|---|
O medicamento “A“ não alivia a Condição “B“ | O medicamento “A“ não alivia a Condição “B“, mas não é eliminado como opção de tratamento | O medicamento “A“ alivia a condição “B“, mas é eliminado como opção de tratamento |
Consequências | Pacientes com Condição “B“ que recebem o Medicamento “A“ não obtêm alívio. Eles podem experimentar piora da condição e/ou efeitos colaterais, até e incluindo a morte. A empresa produtora do medicamento pode enfrentar processos judiciais | Um tratamento viável permanece indisponível para pacientes com Condição “B“. Os custos de desenvolvimento são perdidos. O potencial lucro pela produção do medicamente “A“ pela empresa é eliminado. |
É desejável conduzir o teste de um modo a manter a probabilidade de ambos os tipos de erro em um mínimo.
- aumentar o tamanho amostral reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)) e, consequentemente, aumenta o poder do teste (\(1- \beta\));
- aumentar o nível de significância (\(\alpha\)) tem implicação direta na probabilidade associada ao cometimento de erro do tipo I todavia reduz a probabilidade associada ao cometimento de erro do tipo II (\(\beta\)).