Capítulo 1 Introdução histórica daquilo que veio a se chamar estatística


  • do latim: statisticum collegium (colegiado dos assuntos do Estado);
  • do alemão: statistik (Gottfried Achenwall, 1719-1772);
  • no inglês: statistics (Enciclopédia Britânica, 1797).


De acordo com a revista do Instituto Internacional de Estatística cinco homens são chamados de fundadores dos primórdios da estatística:


  • Hermann Conring;
  • Gottfried Achenwall;
  • Johan Peter Süßmilch;
  • John Graunt, e
  • William Petty.


1.1 Filosofia da ciencia (teoria do conhecimento, epistemologia)


Estritamente falando, todo o conhecimento fora da matemática, da lógica demonstrativa (um ramo da mesma) e da taxonomia, encontra-se fundamentado em hipóteses (naturalmente há inúmeros tipos de hipóteses, mas as que estamos a nos referir são altamente confiáveis, como as expressas em certas leis gerais da física e da química como, por exemplo, a Lei de Hooke as Leis de Kepler dentre tantas outras).


O raciocínio lógico demonstrativo permeia as ciências até onde a matemática lhe suporta; todavia, em si (assim como também a matemática), é incapaz de gerar novos conhecimentos sobre o mundo que nos rodeia.


O método lógico demonstrativo é próprio para objetos que existem apenas idealmente, que são construídos inteiramente pelo nosso pensamento.


O método hipotético experimental é próprio das ciências naturais (física, química, biologia, etc.), que observam seus objetos e realizam experimentos.


Método demonstrativo e Método experimental hipotético (George Polya, 1954)

Figure 1.1: Método demonstrativo e Método experimental hipotético (George Polya, 1954)


Hipotético porque os cientistas partem de hipóteses sobre os objetos que guiam os experimentos e a avaliação dos resultados e experimental porque se baseia em observações e em experimentos, tanto para formular quanto para verificar as teorias.


O método hipotético experimental pode ser indutivo (fatos \(\to\) lei geral) ou dedutivo (lei geral \(\to\) fatos).


Isso é observado em qualquer que seja a área do conhecimento:


  • ciências biológicas;
  • ciências exatas;
  • ciências agrárias;
  • ciências humanas;
  • ciência sociais e outras.


Representação esquemática do fluxo de infomações da amostra à produção de conhecimento

Figure 1.2: Representação esquemática do fluxo de infomações da amostra à produção de conhecimento


Assim, na investigação científica é imposto ao pesquisador formular perguntas que deverão ser apropriadamente respondidas.


  • comparar esses resultados a outros valores; ou,
  • comparar resultados obtidos pela aplicação de diferentes métodos/ou produtos (valores centrais, variabilidade, proporções) observados em diferentes amostras.


Método experimental hipotético

Figure 1.3: Método experimental hipotético


Uma hipótese é uma conjectura racional feita após um grande número de observações e experimentos; é uma tese que precisa ser confirmada ou verificada por meio de novas observações e experimentos.


Uma hipótese estatística é uma suposição feita sobre uma determinada característica de interesse de uma população sob estudo (um parâmetro) que subsiste (perdura, sobrevive, permanece incontestável) até que alguma informação sobre essa população seja estatisticamente significativa para contradizê-la.


``A ciência não consegue provar coisa alguma. Ela pode apenas refutar as coisas’’ (Karl Popper)


Uma teoria científica é, portanto, transitória. Uma conjectura temporariamente sustentada que um dia poderá ser refutada e substituída por outra. Conclusões baseadas em raciocínios plausíveis são provisórias, ao contrário daquelas produzidas por raciocínios lógico demonstrativos.


1.2 Diferentes usos relacionados ao termo, primeiros levantamentos, estudos e publicações (o passado distante)


O Domesday Book (link) foi encomendado em dezembro de 1085 por Guilherme, o Conquistador (King William I), que invadiu a Inglaterra em 1066.

O primeiro esboço foi concluído em agosto de 1086 e continha registros de 13.418 assentamentos nos condados ingleses ao sul dos rios Ribble e Tees (a fronteira com a Escócia) com informações sobre terras, proprietários, uso da terra, empregados e animais cujo propósito básico era fundamentar a taxação (Figura 1.4).


Domesday Book

Figure 1.4: Domesday Book


O dramaturgo inglês William Shakespeare usou a palavra statists (estadistas e, portanto, num sentido não relacionado com números ou matemática) no diálogo da Cena II de Hamlet (link).


“Hamlet: Cercado assim por tantas vilanias, mesmo antes de eu poder dizer o prólogo, representava o cérebro. Sentei-me e escrevi com capricho nova carta. Já pensei, como os nossos estadistas, que é feio escrever bem, tendo insistido, até, em desaprendê-lo; mas, nessa hora muito bom me foi isso. Quererias saber qual o conteúdo da mensagem?[…]”


Um ponto de partida para a compreensão a ligação entre estado e estatística é Hermann Conring (1606-1681), professor de filosofia, medicina e política da Universidade de Helmstadt (atual Alemanha), criou um curso de Ciência política em 1660 para funcionários do estado, que descrevia e examinava as questões fundamentais do Estado. Nele a palavra estatística (parece ter) passado a ser considerada como uma disciplina autônoma que tinha por objetivo a descrição das coisas do Estado (Figura 1.5).


Hermann Conring (1606-1681)

Figure 1.5: Hermann Conring (1606-1681)


Microscopium Statisticum: quo status imperii Romano-Germanici cum primis extraordinarius, ad vivum repraentatur (Statistical Microscope: An Analysis of the State, in which the State of the Germanic Roman Empire is vividly represented, above all extraordinary) é um livro cujo título normalmente chama mais atenção do que seu conteúdo: o uso de statisticum – que significa do estado – é reconhecido como um dos primeiros passos em direção ao uso da palavra estatística como hoje empregamos (Figura 1.6). Foi publicado sob o pseudônimo de Helenus Politanus em 1672.


Microscopium Statisticum (ed. de 1672)

Figure 1.6: Microscopium Statisticum (ed. de 1672)


Johan Peter Süßmilch é mais conhecido por seu notável trabalho de 1741 sobre população, conectando o direito natural e a aritmética política. O trabalho de Süssmilch foi amplamente referenciado por Robert Malthus (1798). Ele reconheceu não apenas a “proporção geométrica” da fertilidade humana, mas também o efeito de padrões de vida mais elevados sobre o problema populacional (Figura 1.7).


The Divine order in the circumstances of the human sex (1741)

Figure 1.7: The Divine order in the circumstances of the human sex (1741)


Com um sentido não relacionado com números ou matemática, a palavra estatística parece ter sido também proposta no século XVII, pelo historiador e professor alemão (à época Transilvânia) Martin Schmeitzel (1679-1747) da Universidade de Jena e, posteriormente adotada por seu aluno, (igualmente) historiador e jurista Gottfried Achenwall (1719-1772) em 1749, em Abriß der neuen Staatswissenschaft der vornehmen Europäischen Reiche und Republiken (Esboço da nova ciência política dos nobres impérios europeus e repúblicas, Figura 1.8).


Abriß der neuen Staatswissenschaft der vornehmen Europäischen Reiche und Republiken (1749)

Figure 1.8: Abriß der neuen Staatswissenschaft der vornehmen Europäischen Reiche und Republiken (1749)


Muitos anos depois, William Hooper usou a palavra estatística em sua tradução de The Elements of Universal Erudition(Elementos da Erudição Universal) escrita por Jacob Friedrich Freiherr von Bielfeld (1717-1770). Nesse livro, a estatística foi definida como a ciência que nos ensina o arranjo político de todos os estados modernos do mundo conhecido (novamente num sentido não associado a números ou matemática, Figura 1.9).


The Elements of Universal Erudition  (1771)

Figure 1.9: The Elements of Universal Erudition (1771)


Na Inglaterra a palavra estatística estava mais associada ao estudo de dados numéricos como modo de se obter insights sobre questões sociais e demográficas no país. Dois pioneiros nessa linha foram William Petty e John Graunt. Em 1687 o economista e filósofo inglês William Petty (1623-1687) publicou Several Essays on Political Arithmetic (Vários ensaios sobre aritmética política), sugerindo ao governo inglês a criação de um departamento para registro de estatísticas vitais (Figura 1.10).


Several Essays in Political Arithmetick (ed. de 1699)

Figure 1.10: Several Essays in Political Arithmetick (ed. de 1699)


O negociante inglês John Graunt (1620-1674) substituiu a crença pela evidência em Natural and Political Observations Mentioned in a Following Index and Made upon the Bills of Mortality (Observações naturais e políticas feitas sobre as notas de mortalidade).


Nesse trabalho, realizado com dados coletados das paróquias de Londres entre 1604 e 1660, Graunt tirou as seguintes conclusões: que havia maior nascimento de crianças do sexo masculino, mas havia distribuição aproximadamente igual de ambos os sexos na população geral; alta mortalidade nos primeiros anos de vida; maior mortalidade nas zonas urbanas em relação às zonas rurais (Figura 1.11).


Natural and Political Observations Mentioned in a Following Index and Made upon the Bills of Mortality (ed. de 1662)

Figure 1.11: Natural and Political Observations Mentioned in a Following Index and Made upon the Bills of Mortality (ed. de 1662)


O matemático e astrônomo inglês Edmond Halley (1656-1742) construiu em 1693, baseado em dados coletados na cidade (à época) alemã de Bresláu, uma Life Table (Tábua de sobrevivência), um estudo que analisa as probabilidades de sobrevivência e morte em relação à idade (Figura 1.12).


Halley’s life table (1693)

Figure 1.12: Halley’s life table (1693)


O jurista e político escocês John Sinclair propôs que se realizasse uma detalhada pesquisa em 938 paróquias para elucidar a história natural e política de seu país ( Statistics Accounts ). Essa pesquisa fazia parte de um projeto muito mais ousado: The Pyramid of Statistical Enquiry (A Pirâmide da Pesquisa Estatística, Figura 1.13).


The Pyramid of Statistical Enquiry  (1814)

Figure 1.13: The Pyramid of Statistical Enquiry (1814)


Outro trabalho com vertente demográfica foi o de Sébastien Le Prestre, Marquês de Vauban (1633– 1707), intitulado Méthode générale et facile pour faire le dénombrement des peuples, detakhado num livro de 1686 (Figura 1.14).


Méthode générale et facile pour faire le dénombrement des peuples (1686)

Figure 1.14: Méthode générale et facile pour faire le dénombrement des peuples (1686)


O médico inglês (considerado por alguns como o “pai” da epidemiologia moderna) John Snow (1813-1858) estudou a dispersão espacial dos casos de cólera em Londres e concluiu que sua causa residia na contaminação da água consumida (poço localizado na Broad Street, no distrito do Soho): Report to the Cholera Outbreak in the Parish of St. James, Westminster during the Autumn of 1854 (Relatório sobre o surto de cólera na paróquia de St. James, Westminster durante o outono de 1854, Figura 1.15).


Mapa dos casos de cólera (1854)

Figure 1.15: Mapa dos casos de cólera (1854)

1.3 Visualização de dados & Estudos e primeiras publicações


O teólogo e filósofo inglês Joseph Priestley (1733-1804) introduziu como inovação os primeiros gráficos com linha temporal, em que barras individuais eram usadas para visualizar o tempo de vida de uma pessoa e o todo pode ser usado para comparar a expectativa de vida de várias pessoas (Figura 1.16).


Expectativa de vida de diversas pessoas (1765)

Figure 1.16: Expectativa de vida de diversas pessoas (1765)


O engenheiro e economista escocês William Playfair (1759-1823) é considerado comumente como fundador dos métodos gráficos para apresentação de estatísticas. Playfair concebeu vários tipos de diagramas para visualização de dados:

  • em 1786, o gráfico de barras (Figura 1.17); e,
  • em 1801, o gráfico de setores (Figura 1.18).


Commercial and Political Atlas (Atlas Comercial e Político de 1786): cada barra representa as exportações e importações da Escócia para 17 países em 1781

Figure 1.17: Commercial and Political Atlas (Atlas Comercial e Político de 1786): cada barra representa as exportações e importações da Escócia para 17 países em 1781


Statistical Breviary (Breviário Estatístico de 1801): proporção da extensão do Império Turco em diferentes regiões do mundo: Asia, Europa e África, antes de 1789

Figure 1.18: Statistical Breviary (Breviário Estatístico de 1801): proporção da extensão do Império Turco em diferentes regiões do mundo: Asia, Europa e África, antes de 1789


A enfermeira inglesa Florence Nightingale (1820-1910) conduziu um trabalho pioneiro ao chegar no hospital militar britânico na Turquia em 1856, estabelecendo uma ordem e um método muito necessários aos registros médicos estatísticos e que indicaram serem as precárias práticas sanitárias o culpado da alta mortalidade (link) , Figuras 1.19 e 1.20.


Esse diagrama (coxcomb) feito durante a Guerra da Crimeia foi dividido igualmente em 12 setores, representando os meses do ano, com a área sombreada do setor  de cada mês proporcional à taxa de mortalidade naquele mês. Seu sombreamento com código de cores indicava a causa da morte em cada área do diagrama

Figure 1.19: Esse diagrama (coxcomb) feito durante a Guerra da Crimeia foi dividido igualmente em 12 setores, representando os meses do ano, com a área sombreada do setor de cada mês proporcional à taxa de mortalidade naquele mês. Seu sombreamento com código de cores indicava a causa da morte em cada área do diagrama


Gráfico de barras de Florence Nightingale mostrando as diferenças de mortalidade entre soldados britânicos e a população masculina inglesa geral (civis)

Figure 1.20: Gráfico de barras de Florence Nightingale mostrando as diferenças de mortalidade entre soldados britânicos e a população masculina inglesa geral (civis)


1.4 Pesquisadores cuja contribuição foi fundamental na área


Uma breve biografia de cada um dos pesquisadores a seguir relacionados pode ser obtida em: (link).


  • Niccolò Fontana Tartaglia (Veneza à época, hoje Itália: 1499-1557)
  • Girolamo Cardano (Pávia à época, hoje Itália: 1501-1576)
  • Galileu Galilei (Florença à época, hoje Itália: 1564-1642)
  • Pierre de Fermat (França: 1607-1665)
  • Blaise Pascal (França: 1623-1662)
  • Jakob Bernoulli (Suíça: 1655-1705)
  • Abrahan de Moivre (França: 1667-1754)
  • Thomas Bayes (Inglaterra: 1702-1761)
  • Pierre-Simon Laplace (França: 1749-1827)
  • Johann Carl Friedrich Gauss (Alemanha: 1777-1856)
  • Lambert Adolphe Jacques Quételet (França à época, hoje Bélgica: 1796-1874)
  • Pafnuti Lvovitch Chebyshev (Rússia: 1821-1894)
  • Francis Galton (Inglaterra: 1822-1911)
  • Wilhelm Lexis (Alemanha: 1837-1914)
  • Thorvald Nicolai Thiele (Dinamarca: 1838-1910)
  • Friedrich Robert Helmert (Saxônia: 1843-1917)
  • Francis Ysidro Edgeworth (Inglaterra: 1845-1926)
  • James Douglas Hamilton Dickson (Escócia: 1849-1931)
  • Andrei Andreyevich Markov (Rússia: 1856-1922)
  • Aleksandr Mikhailovich Lyapunov (Rússia: 1857-1918)
  • Walter Frank Raphael Weldon (Inglaterra: 1860-1906)
  • Karl Pearson (Inglaterra: 1857-1936)
  • William Seally Gosset (Inglaterra: 1876-1937)
  • Ronald Aylmer Fisher (Inglaterra: 1890-1962)
  • Andrei Nikolaevich Kolmogorov (Rússia: 1903-1987)

1.5 Revista Biometrika


Karl Pearson (1857-1936) é amplamente considerado o fundador da disciplina moderna de estatística, e também é famoso como um filósofo da ciência, como escritor sobre o darwinismo social e como um dos principais impulsionadores para instalar a eugenia como a ciência social chave.


“Pretende-se que a Biometrika sirva como um meio não apenas de coletar ou publicar, sob um título, dados biológicos de um tipo não coletados sistematicamente ou publicados em outro lugar em qualquer outro periódico, mas também de disseminar um conhecimento de tal teoria estatística para o seu tratamento científico[…]”


Em outubro de 1901 foi fundada a Biometrika, the Journal for the Statistical Study of Biological Problems (Biometrika, o Jornal para o Estudo Estatístico de Problemas Biológicos) com o propósito de promover a análise estatística de fenômenos biológicos, isto é, a matematização da biologia.


Os fundadores da Biometrika foram Sir Francis Galton (primo de Charles Darwin), Walter Frank Raphael Weldon e Karl Pearson. A maior parte do trabalho foi feita por Pearson e Weldon, este último focando na edição do conteúdo (ou seja, o aspecto biológico) e o primeiro nos detalhes, incluindo correções de prova. Galton e o eugenista americano Charles Davenport atuaram, respectivamente, como consultor e editor.


Alguns dos tópicos abordados na revista incluem criminologia, botânica, zoologia, epidemiologia e outros aspectos da saúde humana. Na década de 1930, o caráter da Biometrika mudou, e ``representou a vanguarda internacional da pesquisa em métodos estatísticos e sua aplicação na ciência e tecnologia’’, ao invés de focar a hereditariedade.


Sir Francis Galton, que serviu como editor da primeira edição (1901), escreveu a Introdução, que incluiu uma declaração de propósito para a revista
(link).


1.6 Eugenia


Em 16 de maio de 1883 Sir Francis Galton cunhou o termo eugenia, posteriormente descrevendo-o como “o estudo das agências sob controle social que podem melhorar ou reparar as qualidades raciais das gerações futuras, seja fisicamente ou mentalmente”.


Galton detalha o conceito em seu livro Inquiries into Human Faculty and its Development, e recomenda que indivíduos de famílias altamente classificadas em seu sistema de mérito sejam encorajados a se casar cedo e receber incentivos para ter filhos. Ele também condenou os casamentos tardios dentro desse mesmo grupo como “disgênicos” ou desvantajosos para a espécie humana.


A palavra eugenia foi extraída da palavra grega eu, que significa bem, e genos, que significa prole. Juntos, significaria bem-nascido.


Este livro caiu em domínio público e pode ser lido na íntegra online. A caracterização original de eugenia de Galton pode ser encontrada na página 17 desta edição de domínio público (Parte 1 do pdf):


“uma breve palavra para expressar a ciência de melhorar o rebanho, que não está de modo algum confinado a questões de acasalamento criterioso, mas que, especialmente no caso do homem, toma conhecimento de todas as influências que tendem, mesmo que em grau remoto, a dar ao raças ou linhagens de sangue mais adequadas uma melhor chance de prevalecer rapidamente sobre os menos adequados do que teriam de outra forma […]”(Galton, 1883, p.17)


Mais recentemente, alguns grupos sociais viram no trabalho e opiniões de Fisher endossos ao colonialismo, à supremacia branca e à eugenia (como hoje interpretada).


Outros grupos, todavia, afirmam que Fisher não era racista nem eugenista, embora ele achasse que havia diferenças comportamentais e de inteligência entre os grupos humanos.


Gráfico de linhagens para alergias

Figure 1.21: Gráfico de linhagens para alergias


Gráfico de linhagens para aptidão musical

Figure 1.22: Gráfico de linhagens para aptidão musical


<img src=“images1/chart_Kallikak_pedigree2.jpg” alt=“Linhas”normais” e “degeneradas” da família Kallikak (New Jersey)” width=“75%” />

Figure 1.23: Linhas “normais” e “degeneradas” da família Kallikak (New Jersey)


Lei da Inegridade Racia (Virginia, EUA, 1924)

Figure 1.24: Lei da Inegridade Racia (Virginia, EUA, 1924)


Licença para casamento

Figure 1.25: Licença para casamento