4.3 Probabilidade da união de eventos


Considerem o espaço amostral de um experimento que consiste no lançamento de um dado honesto: \(S=\{1,2,3,4,5,6\}\) e admitam alguns eventos constituídos sobre esse espaço mostral, abaixo descritos:


\[ E_{1}=\{par\},\\ E_{2}=\{ímpar\},\\ E_{3}=\{1,2,3\},\\ E_{4}=\{4,5,6\},\\ E_{5}=\{\ge4\},\\ E_{6}=\{\le5\}.\\ \]

A partir desses eventos podemos propros novos eventos de interesse a partir de uniões (conectivo \(\cup\)) de dois (ou mais) dos eventos originais como, por exemplo,

\[ H_{a}=E_{1} \cup E_{2},\\ H_{b}=E_{1} \cup E_{4},\\ H_{c}=E_{2} \cup E_{3},\\ H_{d}=E_{2} \cup E_{5},\\ H_{e}=E_{4} \cup E_{6},\\ H_{f}=E_{3} \cup E_{5}. \].


No experimento aleatório estabelecido:


  • lembrando que a união de dois conjuntos é o conjunto formado pelos elementos que estão em um, no outro ou em ambos, e
  • pensando em probabilidade como a razão do “número de resultados favoráveis” pelo “número de resultados possíveis” (conceito a priori)


podemos fcimente verificar que as probabilidades de ocorrência desses eventos são:


\[ P(H_{a})=1\\ P(H_{b})=P(H_{c})=P(H_{d})=P(H_{e})=\frac{1}{3}\\ P(H_{f})=0\\ \]


Considerem agora a Tabela 4.3, de dupla entrada, na qual vemos a distribuição dos alunos de uma escola conforme seu sexo e o curso:


Table 4.3: Distribuição da quantidade de alunos segundo seu sexo e curso escolhido
Curso Sexo
Masculino (M) Feminino (F) Total
Matemática pura (M) 70 40 110
Matemática aplicada (A) 15 15 30
Estatística (E) 10 20 30
Computação (C) 20 10 30
Total 115 85 200


Essa tabela nos possibilita calcular a probabilidade de ocorrência de diversos eventos de interesse que desejemos estabelecer.


Exemplo: seja o experimento aleatório de se escolher, aleatoriamente, um estudante qualquer desses quatro cursos. Assim, se definimos nosso evento de interesse \(M\) como sendo M:sexo masculino, a probabilidade de sucesso (que o indivíduo sorteado aleatoriamente seja do sexo masculino) será:


\[ P(M) = \frac{115}{200} \]


Exemplo: se nosso evento de interesse \(A\) como sendo \(A:\) curso de matemática aplicada , a probabilidade de sucesso (que o indivíduo sorteado aleatoriamente seja do curso de matemática aplicada será):

\[ P(A) = \frac{30}{200} \]


A partir dos eventos de interesse anteriormente estabelecidos, podemos definir outros eventos na forma de uniões (\(\cup\)) e interseções (\(\cap\)):


  • uma união entre os dois eventos de interesse anteriores \(A\) e \(M\) é representada por \(A \cup M\) (alternativamente lê-se também ou) e representa um evento onde pelo menos um dos dois eventos básicos pode ocorrer: ou \(A\), ou \(M\) ou ambos; e,
  • uma interseção dos dois eventos de interesse anteriores \(A\) e \(M\) é representada por \(A \cap M\) (alternativamente lê-se também e) e representa um evento onde os dois eventos básicos devem ocorrer: \(A\) e \(M\).


Exemplo: se definimos nosso evento de interesse (\(P(A \cap M)\)) como sendo sexo masculino e cursando matemática aplicada. Facilmente podemos visualizar na Tabela 4.3 que apenas 15 alunos do curso do evento de interesse (matemática aplicada) são do sexo do segundo evento de interesse (masculino), em relação a todo espaço amostral e assim:


\[ P(A \cap M) = \frac{15}{200} \].


Exemplo: consideremos agora o evento de interesse (\(P(A \cup M)\)) como sendo sexo masculino ou cursando matemática aplicada.


Na Tabela 4.3 temos as duas probabilidades marginais:


  1. \(P(A)=\frac{30}{200}\) (curso: matemática aplicada); e, 2- \(P(M)=\frac{115}{200}\) (sexo masc).


Poderíamos intuir equivocadamente que:


\[ P(A \cup M) = P(A) + P(M) = \frac{30}{200} + \frac{115}{200} = \frac{145}{200} \]


Tal raciocínio é errado pois iria considerar por duas vezes os alunos do sexo masculino. Uma fração da quantidade global (115) de alunos do sexo masculino já considera aqueles que estão matriculados no curso de matemática aplicada (15). É preciso subtrair da soma das probabilidades marginais essa parcela em comum que é a interseção dos dois eventos básicos.

A resposta correta será:

\[ P(A \cup M) = P(A) + P(M) - P(A \cap M) = \frac{30}{200} + \frac{115}{200} -\frac{15}{200} = \frac{130}{200} \].


Portanto, para quaisquer eventos de intersse \(A\) e \(B\), podemos estabelecer uma regra geral da pobabilidade da união de dois eventos quaiquer como:


\[ P(A \cup B) = P(A) + P(B) - P(A \cap B) \]


Se \(A\) e \(B\) forem mutuamente exclusivos, a interseção entre eles será vazia (\(A \cap B =\varnothing\)) e, assim, essa probabiidade é zero. Nessa situação, a probabilidade de \(P(A \cup B)\) fica reduzida a uma regra particular para a adição de probabilidades de eventos mutuamente exclusivos:


\[ P(A \cup B) = P(A) + P(B) \]


Relembrando o que se denomina como regularidade estatística dos resultados :

\[ P\left(E\right)=\underset{n\to \infty }{lim}{\frac{F(E)}{n}} \]


# Função para simular uma população maior mantendo proporções
simPop <- function(tamanho_populacao) {
  # Proporções conforme a tabela
  prop <- data.frame(
    Curso = c("Matemática pura", "Matemática aplicada", "Estatística", "Computação"),
    Masculino = c(70, 15, 10, 20),
    Feminino = c(40, 15, 20, 10),
    Total = c(110, 30, 30, 30)
  )

  # Calculando as proporções relativas
  prop$propM <- prop$Masculino / prop$Total
  prop$propF <- prop$Feminino / prop$Total

  # Função para gerar amostra de acordo com as proporções
  gerar_amostra <- function(curso, propM, propF, total, tamanho_populacao) {
    n_curso <- round((total / sum(prop$Total)) * tamanho_populacao)
    sexo <- sample(c("M", "F"), n_curso, replace = TRUE, prob = c(propM, propF))
    data.frame(Curso = rep(curso, n_curso), Sexo = sexo)
  }

  # Gerando a população para cada curso
  populacao <- do.call(rbind, lapply(1:nrow(prop), function(i) {
    gerar_amostra(prop$Curso[i], prop$propM[i], prop$propF[i],
                  prop$Total[i], tamanho_populacao)
  }))

  return(populacao)
}


# Gerando uma população de 10.000 indivíduos
popSim <- simPop(100000)
table(popSim$Curso, popSim$Sexo)
##                      
##                           F     M
##   Computação           4998 10002
##   Estatística          9931  5069
##   Matemática aplicada  7507  7493
##   Matemática pura     20097 34903


# Selecionar uma amostra de 200 com reposição (simular a tabela)
ordem1=c("Matemática pura", "Matemática aplicada", "Estatística", "Computação")
ordem2=c("M", "F")
amostPop=popSim[sample(1:nrow(popSim), 200, replace = TRUE), ]
tab=table(factor(amostPop$Curso, levels = ordem1), factor(amostPop$Sexo, levels = ordem2))
tab=addmargins(tab)
colnames(tab)=c("M", "F", "Total")
rownames(tab)=c("Matemática pura (M)", "Matemática aplicada (A)","Estatística (E)","Computação (C)","Total")
tab
##                          
##                             M   F Total
##   Matemática pura (M)      68  39   107
##   Matemática aplicada (A)  15  18    33
##   Estatística (E)          10  23    33
##   Computação (C)           12  15    27
##   Total                   105  95   200
# Calcular a probabilidade de ser do sexo "Masculino" na amostra
pMasc<- mean(amostPop$Sexo == "M")
pMasc
## [1] 0.525
# Calcular a probabilidade de cursar "Matemática aplicada" na amostra
pMatAp <- mean(amostPop$Curso == "Matemática aplicada")
pMatAp
## [1] 0.165
# Calcular a probabilidade de cursar "Matemática aplicada" -E- ser do sexo "Masculino" na amostra
pMatAp_and_Masc <- mean(amostPop$Curso == "Matemática aplicada" & amostPop$Sexo == "M")
pMatAp_and_Masc
## [1] 0.075
# Calcular a probabilidade de cursar "Matemática aplicada" -OU- ser do sexo "Masculino" na amostra
pMatAp_or_Masc <- mean(amostPop$Curso == "Matemática aplicada" | amostPop$Sexo == "M")
pMatAp_or_Masc
## [1] 0.615


Exemplo: Uma população é composta por 20 pessoas que consomem o produto A, 30 pessoas que consomem o produto B e 50 pessoas que consomem o produto C . Um pesquisador de mercado seleciona aleatoriamente uma pessoa desta população. Sabendo que uma pessoa não consome mais de um produto ao mesmo tempo, qual a probabilidade de ter sido selecionada uma pessoa que consome os produtos A ou C?


Solução:


Definindo os eventos de interesse e as probabilidades associadas:


1- \(E_{A}=\text{consumidor do produto A}\): \(P(E_{A}=\frac{20}{100}\));
2- \(E_{B}=\text{consumidor do produto B}\): \(P(E_{B}=\frac{30}{100}\)); e,
3- \(E_{C}=\text{consumidor do produto C}\): \(P(E_{C}=\frac{50}{100}\)).


Pela regra geral da probabilidade da união de dois eventos quaiquer sabemos que:


\[ P(E_{A} \cup E_{C}) = P(E_{A}) + P(E_{C}) - P(E_{A} \cap E_{C}) \]


Como foi estabelecido no enunciado que uma pessoa não consome mais de um produto ao mesmo tempo (esses eventos são, portanto, mutuamente exclusivos: \(E_{A} \cap E_{C}=\varnothing\)) a probabilidade pedida será:


\[\begin{align*} P(E_{A} \cup E_{C}) & = P(E_{A}) + P(E_{C}) - P(E_{A} \cap E_{C}) \\ & = \frac{20}{10} + \frac{50}{100} - 0 \\ & = \frac{70}{100} \\ & = 0,70 \end{align*}\]