• Índice
  • 1 Introdução histórica daquilo que veio a se chamar estatística
    • 1.1 Filosofia da ciencia (teoria do conhecimento, epistemologia)
    • 1.2 Diferentes usos relacionados ao termo, primeiros levantamentos, estudos e publicações (o passado distante)
    • 1.3 Visualização de dados & Estudos e primeiras publicações
    • 1.4 Pesquisadores cuja contribuição foi fundamental na área
    • 1.5 Revista Biometrika
    • 1.6 Eugenia
    • 1.7 Estatística e machine learning : uma livre tradução deste link
  • 2 Introdução conceitual essencial
    • 2.1 Estatística descritiva
    • 2.2 Estatística inferencial
    • 2.3 População (universo) & amostra
    • 2.4 Parâmetros e estatísticas
    • 2.5 Tipos de variáveis
    • 2.6 Indexação de dados (\(i\))
    • 2.7 Noções básicas sobre somatórios (\(\Sigma\))
    • 2.8 Análise combinatória (métodos de enumeração)
      • 2.8.1 Princípio básico da contagem (regra da multiplicação)
      • 2.8.2 Regra da adição
      • 2.8.3 Permutações (ordenação de elementos)
      • 2.8.4 Arranjos sem repetição
      • 2.8.5 Arranjos com repetição
      • 2.8.6 Combinações sem repetição
      • 2.8.7 Combinações com Repetição
    • 2.9 Fatoriais
    • 2.10 Conectivos lógicos
    • 2.11 Leis de De Morgan
    • 2.12 Noções básicas para o uso de calculadora (Cassio fx-82MS)
    • 2.13 Instalação do software R em conjunto com a interface gráfica RStudio
      • 2.13.1 RStudio
      • 2.13.2 Pacotes
  • 3 Introdução à estatística descritiva
    • 3.1 Análise exploratória
    • 3.2 Dados brutos e pr-e-processamentos elementares
    • 3.3 Apresentacao descritiva de dados na forma de resumos numericos
      • 3.3.1 Estimadores
      • 3.3.2 Medidas de tendência central (posição)
      • 3.3.3 Medidas de dispersão (variabilidade)
      • 3.3.4 Medidas de subdivisão (separatrizes)
    • 3.4 Padronizacao de dados (z-scores)
    • 3.5 Medidas de forma (assimetria & curtose)
    • 3.6 Diferentes posições da média, moda e mediana (2\(^{o}\) quartil)
    • 3.7 Apresentacao descritiva de dados na forma tabular
      • 3.7.1 Apresentacao tabular de dados qualitativos
      • 3.7.2 Apresentacao tabular de dados quantitativos
      • 3.7.3 Média para dados tabelados
      • 3.7.4 Moda para dados tabelados
      • 3.7.5 Mediana (\(=Q_{2}=D_{5}=P_{50}\)) para dados tabelados
      • 3.7.6 Variância e desvio padrão para dados tabelados
      • 3.7.7 Coeficiente de variação para dados tabelados.
      • 3.7.8 Quartis
    • 3.8 Apresentacao descritiva de dados na forma grafica
      • 3.8.1 Gráficos para uma variável qualitativa
      • 3.8.2 Gráficos para uma variável quantitativa
  • 4 Introdução ao cálculo de probabilidades
    • 4.1 Introdução histórica
    • 4.2 Conceitos essenciais
      • 4.2.1 Experimentos determinísticos e experimentos aleatórios
      • 4.2.2 O espaço amostral
      • 4.2.3 Evento
      • 4.2.4 Probabilidade
    • 4.3 Probabilidade da união de eventos
    • 4.4 Probabilidade de eventos condicionados
    • 4.5 Dependência e independência de eventos
      • 4.5.1 Demonstração de Independência entre Eventos
      • 4.5.2 Reciprocidade da Independência
      • 4.5.3 Exemplo clássico de eventos independentes
      • 4.5.4 Exemplo clássico de eventos dependentes
    • 4.6 Probabilidade de eventos independentes (regra da cadeia)
    • 4.7 Teorema de Bayes
    • 4.8 Teoremas da Teoria das probabilidades
      • 4.8.1 Teorema 01
      • 4.8.2 Teorema 02
      • 4.8.3 Teorema 03
      • 4.8.4 Teorema 04
      • 4.8.5 Teorema 05
      • 4.8.6 Teorema 06
      • 4.8.7 Teorema 07
      • 4.8.8 Teorema 08
  • 5 Introdução a variáveis aleatórias
    • 5.1 Variáveis aleatórias discretas e contínuas
    • 5.2 Função massa de probabilidade (Probability Mass Function - PMF)
    • 5.3 Função cumulativa de probabilidade
    • 5.4 Função de densidade de probabilidade (Probability Density Function - PDF)
    • 5.5 Esperança e variância de uma variável aleatória discreta
    • 5.6 Esperança e variância de uma variável aleatória contínua
  • 6 Introdução a modelos teóricos de probabilidade
    • 6.1 Modelos teóricos de probabilidade para variáveis aleatórias discretas
      • 6.1.1 Uniforme
      • 6.1.2 Bernoulli
      • 6.1.3 Binomial
      • 6.1.4 Poisson
      • 6.1.5 Multinomial
    • 6.2 Modelos téoricos do tempo de espera
      • 6.2.1 Geométrica
      • 6.2.2 Binomial Negativa
    • 6.3 Modelos teóricos de probabilidade para variáveis aleatórias contínuas
      • 6.3.1 Uniforme
      • 6.3.2 Exponencial
      • 6.3.3 Normal
      • 6.3.4 Student “t”
      • 6.3.5 Qui-Quadrado
      • 6.3.6 Fisher-Snedecor “F”
    • 6.4 Tabelas
  • 7 Introdução ao planejamento de pesquisas
    • 7.1 Planejamento de pesquisas
    • 7.2 Tipos de pesquisas
      • 7.2.1 Quanto à finalidade
      • 7.2.2 Quanto à forma de abordagem
      • 7.2.3 Quanto aos objetivos
      • 7.2.4 Quanto ao desenvolvimento no tempo
      • 7.2.5 Quanto à natureza
      • 7.2.6 Quanto à forma de obtenção dos dados
    • 7.3 Principais etapas de uma pesquisa:
      • 7.3.1 Objetivo
    • 7.4 População
    • 7.5 Censo
    • 7.6 Amostra
    • 7.7 Planejamento do levantamento amostral
    • 7.8 Elaboração dos questionários
      • 7.8.1 Tipos de perguntas:
      • 7.8.2 Execução do levantamento amostral
      • 7.8.3 Análise exploratória dos dados
      • 7.8.4 Resultados e conclusões
    • 7.9 Técnicas de amostragem
    • 7.10 Amostragem probabilística
      • 7.10.1 Amostragem aleatória simples (AAS)
      • 7.10.2 Amostragem aleatória sistemática
      • 7.10.3 Amostragem aleatória estratificada
      • 7.10.4 Amostragem aleatória por conglomerados
    • 7.11 Amostragem não probabilística
      • 7.11.1 Amostragem por conveniência
      • 7.11.2 Amostragem por cotas
    • 7.12 Dimensionamento de amostras
      • 7.12.1 Erros
      • 7.12.2 Determinação do tamanho de uma amostra para estimação da média populacional
      • 7.12.3 Determinação do tamanho de uma amostra para estimação da proporção populacional
  • 8 Introdução às estatísticas epidemiológicas
    • 8.1 Tipos de estudos epidemiológicos
    • 8.2 Estudos transversais
    • 8.3 Estudos longitudinais
      • 8.3.1 Estudos de casos e controles
      • 8.3.2 Estudos de coorte
      • 8.3.3 Estudos clínicos aleatorizados
    • 8.4 Terminologia
    • 8.5 Medidas de risco, morte, associação e correlação
      • 8.5.1 Incidência
      • 8.5.2 Prevalência
      • 8.5.3 Incidência cumulativa - IC (Risco)
      • 8.5.4 Fatalidade dos Casos (FC)
      • 8.5.5 Taxas de mortalidade (TM)
      • 8.5.6 Sobrevida
      • 8.5.7 Taxas mais específicas
    • 8.6 Medidas de associação em estudos de coorte
      • 8.6.1 Incidência observada de nascimentos com baixo peso entre mães expostas ao risco (não fumantes): \(I_{e}\)
      • 8.6.2 Incidência observada de nascimentos com baixo peso entre mães não expostas ao risco (não fumantes): \(I_{0}\)
      • 8.6.3 Prevalência de nascimentos com baixo peso na população estudada
      • 8.6.4 Diferença de risco (Risco atribuível - RA)
      • 8.6.5 Razão de risco (Risco relativo - RR)
      • 8.6.6 Risco atribuível proporcional (Fração etiológica - FE)
    • 8.7 Odds ratio (Razão das chances) em studos de casos e controles
      • 8.7.1 Chance (odds) de observar um desfecho entre os casos:
      • 8.7.2 Chance (odds) de observar um desfecho entre os controles:
      • 8.7.3 A razão das chances entre os casos e controle (odds ratio):
    • 8.8 Intervalos de confiança
      • 8.8.1 Razão de risco (Risco relativo - RR)
      • 8.8.2 Razão de chances ( odds ratio - OR)
      • 8.8.3 Diferença de risco (Risco atribuível - RA)
  • 9 Introdução à distribuição das médias e diferenças entre médias e seus intervalos de confiança
    • 9.1 Distribuições amostrais
    • 9.2 Intervalos de confiança
    • 9.3 Distribuição das médias amostrais e seus intervalos de confiança
      • 9.3.1 Fator de correção para populações finitas
      • 9.3.2 Intervalo de confiança para a média de uma população Normal
      • 9.3.3 Intervalos de confiança para a média de uma população Normal com variância conhecida (Figura @ref(fig:fig28))
      • 9.3.4 Intervalos de confiança para a média de uma população Normal de variância desconhecida mas amostra não tão pequena: \(n \ge 30\) (Figura @ref(fig:fig55))
      • 9.3.5 Intervalos de confiança para a média de uma população Normal com variância desconhecida e amostra de qualquer tamanho (Figura @ref(fig:fig58))
      • 9.3.6 Fluxograma auxiliar
    • 9.4 Distribuição das diferenças das médias de duas populações Normais e seus intervalos de confiança
      • 9.4.1 Intervalos de confiança para a diferença das médias de duas populações Nomrais de variâncias conhecidas e amostras independentes de qualquer tamanho
      • 9.4.2 Intervalos de confiança para a diferença das médias de duas populações Normais de variâncias desconhecidas e amostras independentes grandes
      • 9.4.3 Intervalos de confiança para a diferença das médias de duas populações Normais de variâncias desconhecidas mas iguais
      • 9.4.4 Intervalos de confiança para a diferença das médias de duas populações Normais de variâncias desconhecidas e desiguais
    • 9.5 Distribuição das diferenças das médias de duas populações Normais com médias não independentes e seus intervalos de confiança
      • 9.5.1 Fluxograma auxiliar
  • 10 Introdução à distribuição das proporções e seus intervalos de confiança
    • 10.1 Conceito elementar de uma proporção
    • 10.2 Distribuição das proporções amostrais
      • 10.2.1 Simulações ilustrativas da aproximação da distribuição das proporções amostrais pela distribuição Normal
    • 10.3 A aleatoriedade das proporções amostrais e o tamanho amostral
      • 10.3.1 Simulações ilustrativas sobre as flutuações das proporções amostrais e o erro amostral fixado
    • 10.4 Intervalos de confiança para uma proporção \(\Pi\) pela aproximação da Binomial pela Normal
    • 10.5 Intervalo de confiança para \(\Pi\) diretamente da Distribuição Binomial
    • 10.6 Pobabilidades associadas à observação de uma proporção amostral \(\hat{p}\)
    • 10.7 Intervalos de confiança para a diferença entre duas proporções (\(\Pi_{X}-\Pi_{Y}\))pela aproximação da Binomial pela Normal
  • 11 Introdução a testes de hipóteses
    • 11.1 Filosofia da ciência
    • 11.2 História
    • 11.3 Conceitos
    • 11.4 Natureza dos erros
    • 11.5 Recomendações gerais
    • 11.6 Efeito do limite central
      • 11.6.1 Erro global
    • 11.7 Estruturas das hipóteses
      • 11.7.1 Interpretação gráfica dos níveis de significância/confiança
      • 11.7.2 Teste de hipóteses Bilateral
      • 11.7.3 Teste de hipóteses Unilateral à esquerda
      • 11.7.4 Teste de hipóteses Unilateral à direita
    • 11.8 Teste de hipóteses para a média \(\mu\) de uma população Normal
      • 11.8.1 Cenários possíveis
      • 11.8.2 Roteiro geral
      • 11.8.3 Probabilidade dos intervalos de confiança para os testes de hipóteses com o uso da estatística Z (\(Z \sim \mathcal{N}(0,1)\)):
      • 11.8.4 Probabilidade dos intervalos de confiança para os testes de hipóteses com o uso da estatística T (\(T\sim t_{(n-1)}\)):
    • 11.9 Teste de hipóteses para a razão de duas variâncias (\(\frac{\sigma_{1}^{2}}{\sigma_{2}^{2}}\))
    • 11.10 Teste de hipóteses para as médias (\(\mu_{1};\mu_{2}\)) de duas populações Normais independentes
      • 11.10.1 As estruturas possíveis dos testes de hipóteses relacionados às suas médias serão:
      • 11.10.2 Testes de hipóteses para as médias de duas populações Normais com variâncias conhecidas (ou não conhecidas mas o tamanho das amostras é grande: \(n\ge30\): \(S^{2}\approx\sigma^{2}\))
      • 11.10.3 Testes de hipóteses para as médias de duas populações Normais com variâncias desconhecidas mas iguais: teste “t’’ homocedástico (\(\sigma_{1}^{2}=\sigma_{2}^{2}=?\))
      • 11.10.4 Teste de hipóteses para as médias de duas populações Normais com variâncias desconhecidas e desiguais: teste “``t’’ heterocedástico (\(\sigma_{1}^{2} \neq \sigma_{2}^{2}=?\))
    • 11.11 Teste de hipóteses para uma proporção \(\Pi\) de uma população binomial
      • 11.11.1 Estruturas possíveis para as hipóteses
      • 11.11.2 Probabilidade dos intervalos de confiança para os testes de hipóteses com o uso da estatística Z (\(Z \sim \mathcal{N}(0,1)\)):
    • 11.12 Testes não paramétricos
      • 11.12.1 Teste Qui-quadrado para verificação da independência (homogeneidade)
      • 11.12.2 Correção de continuidade em tabelas 2x2
      • 11.12.3 Coeficiente de contingência de Pearson (modificado: \(C^{*}\))
      • 11.12.4 Teste Qui-quadrado para verificação da qualidade do ajuste a uma distribuição teórica de probabilidade
      • 11.12.5 Teste de significância para as médias de duas populações dependentes
    • 11.13 Fluxograma auxiliar para escolha da estatística do teste de hipóteses
    • 11.14 Tabelas
  • 12 Introdução às Medidas de Associação para Variáveis Quantitativas
    • 12.1 Etimologia e contexto histórico
    • 12.2 Conceitos Correlatos
      • 12.2.1 Correlação e autocorrelação
      • 12.2.2 Diagrama de dispersão ( scatterplot )
      • 12.2.3 Correlação versus causação
      • 12.2.4 Correlação linear versus regressão linear
      • 12.2.5 Associações
    • 12.3 Coeficiente de correlação linear de Pearson
    • 12.4 Teste de hipóteses para a correlação linear na população
      • 12.4.1 Teste de hipóteses para \(\rho = \rho_0 = 0\)
      • 12.4.2 Teste de hipóteses para \(\rho = \rho_0\) com \(\neq 0\): a transformação \(Z\) de Fisher
    • 12.5 Coeficiente de correlação linear de Spearman
      • 12.5.1 Definição
      • 12.5.2 Atribuição dos postos
      • 12.5.3 Fórmulas
      • 12.5.4 Propriedades
      • 12.5.5 Teste de Hipóteses
    • 12.6 Tabelas
  • 13 Introdução à Regressão Linear
    • 13.1 Contexto
    • 13.2 Conceitos iniciais
      • 13.2.1 Relação das variáveis estudadas e o fenômeno estudado:
      • 13.2.2 Natureza das variáveis:
      • 13.2.3 Modelos Estatísticos e de Machine Learning
      • 13.2.4 Modelos Estatísticos Clássicos
      • 13.2.5 Modelos de Regressão Linear
      • 13.2.6 Regressão Linear Simples e Múltipla
    • 13.3 Regressão Linear Simples
      • 13.3.1 Amostragem
    • 13.4 Método dos Mínimos Quadrados
      • 13.4.1 Dedução para uma Regressão Linear Simples
      • 13.4.2 Estatísticas amostrais:
    • 13.5 O Teorema de Gauss-Markov
      • 13.5.1 Pressupostos
    • 13.6 Modelo de Regressão Linear com Erros Normais
      • 13.6.1 Propriedades dos Estimadores sob Erro Normal
      • 13.6.2 Consequências da Normalidade
      • 13.6.3 Expressão Matricial Geral de Modelos de Regressão
    • 13.7 Análise Diagnóstica do Modelo de Regressão Linear
      • 13.7.1 Tipos de Resíduos
      • 13.7.2 Linearidade na relação entre a variável preditora \(X\) e a variável resposta \(Y\):
      • 13.7.3 Homogeneidade da variância dos resíduos \(\varepsilon_i\) (homocedasticidade):
      • 13.7.4 Independência
      • 13.7.5 Normalidade dos Resíduos
      • 13.7.6 Observações Inconsistentes
      • 13.7.7 Observações Influentes
      • 13.7.8 Multicolinearidade: Fator de Inflação da Variância (VIF)
    • 13.8 Métricas de Aferição da Qualidade de Ajuste de uma Regressão Linear
      • 13.8.1 Coeficiente de determinação \(R^{2}\) da Regressão Linear
      • 13.8.2 AIC (Akaike Information Criterion) e RMSE (Root Mean Squared Error)
    • 13.9 Testes de Hipóteses da Regressão Linear
      • 13.9.1 Análise de Variância da Regressão - ANOVA (Teste F)
      • 13.9.2 Extensão da ANOVA para Regressão Múltipla
      • 13.9.3 Testes de Hipóteses para os Parâmetros do Modelo de Regressão
    • 13.10 Intervalos de Confiança para os Parâmetros do Modelo de Regressão Linear
      • 13.10.1 Coeficiente Linear (\(\alpha\))
      • 13.10.2 Regressor (\(\beta_j\))
      • 13.10.3 Variância (\(\sigma^2\))
      • 13.10.4 Intervalo de Confiança para o Valor Esperado de uma Observação: \(E[Y|\mathbf{X}]\)
      • 13.10.5 Intervalo de Confiança para a Predição do Valor de um Dado não Observado
    • 13.11 Roteiro Geral
  • 14 Introdução à Modelagem de Dados
    • 14.1 Introdução
    • 14.2 Tipos de Aprendizado
    • 14.3 Classificação e Regressão
    • 14.4 Dados
      • 14.4.1 Importação
      • 14.4.2 Estrutura
      • 14.4.3 Tipo das Variáveis
    • 14.5 Engenharia de features
      • 14.5.1 Depuração de Dados (Data Cleaning)
      • 14.5.2 Atribuição de Valores (Imputation)
      • 14.5.3 Recodificação de Variáveis Quantitativas
      • 14.5.4 Codificação de Variáveis Qualitativas
    • 14.6 Repartições em Treino e Validação
    • 14.7 Padronização
    • 14.8 Análise Exploratória
      • 14.8.1 Gráficos Exploratórios
    • 14.9 Seleção de Variáveis Regressoras
      • 14.9.1 Todas as Regressões Possíveis
      • 14.9.2 Método “Passo Atrás” (Backward)
      • 14.9.3 Método “Passo a Frente” (Forward)
      • 14.9.4 Método “Passo a Passo” (Stepwise)
  • 15 Introdução à modelagem de processos estocásticos
    • 15.1 Modelos determinísticos e estocásticos
    • 15.2 Dedução e indução
    • 15.3 Processos estocásticos temporais, espaciais e espaçotemporais
      • 15.3.1 Processos Estocásticos Temporais
      • 15.3.2 Processos Estocásticos Espaciais
      • 15.3.3 Processos Estocásticos Espaçotemporais
    • 15.4 Processo de Poisson
      • 15.4.1 Natureza
      • 15.4.2 Processo de Poisson com classificação de eventos
      • 15.4.3 Processos de Poisson não homogêneos
      • 15.4.4 Tempo de espera em um processo de Poisson
      • 15.4.5 Distribuição condicional dos tempos de chegada
    • 15.5 Simulações Monte Carlo
      • 15.5.1 Introdução
      • 15.5.2 Fundamentação
      • 15.5.3 Números Aleatórios e Pseudoaleatórios
      • 15.5.4 Geração de amostras aleatórias de distribuições de probabilidade
      • 15.5.5 Exemplo 1 (Goodwin e Wright, 2009)
      • 15.5.6 Exemplo 2: The Elite Pottery Company (Goodwin e Wright, 2009)
      • 15.5.7 Exemplo 3: Integração Numérica Usando o Método de Monte Carlo
  • 16 Introdução a números índices
    • 16.1 Definição
    • 16.2 Características principais
    • 16.3 Aplicações
    • 16.4 Números índice relativos simples: apenas um produto está sendo analisado.
    • 16.5 Números índice compostos: mais de um produto está sendo analisado (cesta de produtos).
      • 16.5.1 Método dos agregados simples
      • 16.5.2 Método dos agregados ponderados
      • 16.5.3 Índice de Fisher (Média geométrica)
    • 16.6 Exemplo completo
      • 16.6.1 Índices Simples (preços, quantidades e valores/receitas)
      • 16.6.2 Índices Agregativos
  • 17 Orientações Gerais
    • 17.1 Informações administrativas
      • 17.1.1 Regimento geral da UEL
      • 17.1.2 Amparos e apoios na UEL
      • 17.1.3 Tutoriais para os estudantes da graduação da UEL
    • 17.2 Programas de atividade acadêmica para o primeiro semestre de 2026
      • 17.2.1 Química: 2STA032 - Estatística
      • 17.2.2 Farmácia: 2STA010 - Elementos de bioestatística
      • 17.2.3 Economia: 2STA007 - Estatística Econômica
  • FJCosta Github

UNIVERSIDADE ESTADUAL DE LONDRINA
CCE - Centro de Ciências Exatas
DSTA - Departamento de Estatística (sala 11)
Apostila com alguns tópicos de estatística, probabilidade e inferência
Prof. M.e Eng.\(^{o}\) Felinto Junior Da Costa
contato (sugestões):
fjcosta@uel.br

UNIVERSIDADE ESTADUAL DE LONDRINA
CCE - Centro de Ciências Exatas
DSTA - Departamento de Estatística (sala 11)
Apostila com alguns tópicos de estatística, probabilidade e inferência
Prof. M.e Eng.\(^{o}\) Felinto Junior Da Costa
contato (sugestões): fjcosta@uel.br

Londrina, 24 de April de 2026.