5.1 Função massa de probabilidade (Probability Mass Function - PMF)
Considere \(X\) uma variável aleatória discreta com o contradomínio \(x_{1},x_{2},x_{3}, \dots x_{n} \dots\). Uma função (de distribuição) de probabilidade \(f(x)\) é assim denominada se, aplicada a cada um dos possíveis valores \(x_{i}\) da variável aleatória \(X\), resultar em sua probabilidade de ocorrência. Assim, para \(x = x_{i}\), \(f(x_{i}) = P(X=x_{i})=p(x{i})\).
Para que essa função \(f(x)\) possa ser considerada uma função de distribuição de probabilidade, ela precisa necessariamente atender às seguintes condições:
Postulado do intervalo:
\[ 0 \leq f(x_{i}) \leq 1 \]
para qualquer \(x_{i} \in \mathcal{R}_{X}\), onde \(\mathcal{R}_{X}\) é o contradomínio de \(X\).
Postulado do evento certo:
\[ \sum _{i=1}^{n}f\left(x_{i}\right) = 1. \]
Equivale afirmar que a probabilidade de ocorrência de um dos valores que a variável aleatória pode assumir está sempre compreendida no intervalo \(0 \leq P(X = x_{i}) \leq 1\). E mais, que a soma das probabilidades de todos os possíveis valores de \(X\) será 1.
Observação: somente se a soma acma for finita há a posibilidade de se ter probabilidades \(p(x_{i})\) iguais para todos \(x_{i}\)
Exemplo: Suponha que uma moeda seja lançada duas vezes e que \(X\) seja a variável aleatória que represente o número de \(caras\) verificado. Defina o espaço amostral, associe para cada evento possível o valor da variável aleatória e definda uma função discreta de probabilidade correspondente.
O espaço amostral desse experimento é S = {(cara,cara), (cara,coroa), (coroa,cara), (coroa,coroa)} e a tabela abaixo relaciona o número de caras (o valor da variável aleatória \(X\)) associado a cada evento possível desse experimento:
Ponto amostral | (cara,cara) | (cara,coroa) | (coroa,cara) | (coroa,coroa) |
---|---|---|---|---|
X | 2 | 1 | 1 | 0 |
As probabilidades de ocorrência de cada um desses eventos é:
\[\begin{align*} P(cara,cara) & = \frac{1}{4} \\ P(cara,coroa) & = \frac{1}{4}\\ P(coroa,cara) & = \frac{1}{4} \\ P(coroa,coroa) & = \frac{1}{4}\\ \end{align*}\]
Para definir uma função discreta de distribuição de probabilidade deveremos associar a cada valor que a variável aleatória \(X\) assume sua correspondente probabilidade de ocorrência.
\[\begin{align*} P(X=0) & = P(coroa,coroa) = \frac{1}{4} \\ P(X=1) & = P[(cara,coroa) \cup (coroa,cara)] \\ & = P(cara,coroa) + P(coroa,cara)\\ & = \frac{1}{4} + \frac{1}{4} \\ & = \frac{1}{2} \\ P(X=2) & = P(cara,cara) = \frac{1}{4} \end{align*}\]
xk | 0 | 1 | 2 |
---|---|---|---|
P(X = xk) = f(xk) | 1/4 | 1/2 | 1/4 |
# Valores possíveis para o número de caras
x <- c(0, 1, 2)
# Probabilidades associadas (calculadas com o modelo binomial)
p <- c(0.25, 0.5, 0.25)
# Criando o gráfico de barras
barplot(
p,
names.arg = x,
xlab = "x",
ylab = expression(f(x)),
col = "gray",
ylim = c(0, 1),
main = "Probabilidade de observar caras ao lançar 2 moedas"
)
# Adicionando linhas no eixo y para reforçar a interpretação
abline(h = seq(0, 1, by = 0.25), col = "lightgray", lty = 2)
Uma função de distribuição cumulativa \(F(x)\) para uma variável aleatória \(X\) exprime a probabilidade de que a variável aleatória \(X\) assuma um valor menor ou igual a determinado \(x\) , sendo definida por:
\[ F(x) = P(X \leq x) \]
Propriedades:
1- \(0 \leq F(x) \leq 1\) (os valores da função estão no intervalo de probabilidade);
2- \(F(x)\) é não decrescente: \(F(x) \leq F(y)\) se \(x \leq y\) (a probabilidade cumulativa nunca diminui);
- \(F(- \infty) = \underset{x\to -\infty }{lim}F\left(x\right)=0\) (a probabilidade cumulativa no limite inferior é zero);
4- \(F(+ \infty) = \underset{x\to \infty }{lim}F\left(x\right)=1\) (a probabilidade cumulativa no limite superior é um).
Relação com a Função de Probabilidade:
Para uma variável aleatória discreta \(X\), a função massa de probabilidade \(f(x)\) pode ser derivada da função de distribuição cumulativa \(F(x)\). Especificamente, para todo \(x\) em \((-\infty, \infty)\)):
\[
f(x) = P(X = x) = F(x) - F(x^-),
\]
onde \(F(x^-)\) é o valor de \(F(x)\) imediatamente antes de \(x\), considerando a natureza discreta da variável.
Além disso, a definição cumulativa da função \(F(x)\) para valores discretos \(x\) pode ser escrita como:
\[ F\left(x\right)=P\left(X\le x\right)=\sum _{u\le n}f\left(u\right), \]
em que \(u\) são os valores possíveis da variável aleatória \(X\). Equivale dizer que é a soma sobre todos os valores \(u\) assumidos por \(X\) para os quais \(u \leq x\).
Se \(X\) é discreta e assume um número finito de valores \(x_{1},x_{2}, \dots, x_{n}\), então sua função de probabilidade cumulativa \(F(x)\) será dada por:
\[ F(x) = \begin{cases} 0, & \text{se } -\infty < x < x_{1}, \\ f(x_{1}), & \text{se } x_{1} \leq x < x_{2}, \\ f(x_{1}) + f(x_{2}), & \text{se } x_{2} \leq x < x_{3}, \\ \vdots & \\ f(x_{1}) + f(x_{2}) + \dots + f(x_{n}), & \text{se } x_{n} \leq x < \infty. \end{cases} \]
Essa expressão mostra que \(F(x)\) é obtida pela soma cumulativa das probabilidades associadas aos valores discretos de \(X\), até um ponto \(x\).
Exemplo: Suponha que uma moeda seja lançada duas vezes e que \(X\) seja a variável aleatória que represente o número de caras verificado. Especifique sua função de probabilidade cumulativa dessa variável aleatória e apresente seu gráfico.
xk | 0 | 1 | 2 |
---|---|---|---|
P(X = xk) = f(xk) | 1/4 | 1/2 | 1/4 |
Sua função de probabilidade cumulativa é dada por:
O gráfico de sua função de probabilidade cumulativa é:
# Valores possíveis para o número de caras
x <- c(0, 1, 2)
# Probabilidades associadas (calculadas com o modelo binomial)
p <- c(0.25, 0.5, 0.25)
# Probabilidade acumulada
p_cumulative <- cumsum(p)
# Criando o gráfico de probabilidade acumulada com linhas verticais
plot(
x,
p_cumulative,
type = "s", # Tipo "steps" para probabilidade acumulada
xlab = "x",
ylab = expression(F(x)),
ylim = c(0, 1),
xlim = c(0, 3), # Expandido para incluir margens
main = "Função de distribuição acumulada (CDF)",
col = "blue",
lwd = 2,
axes = FALSE # Desabilita os eixos padrão para customização
)
# Adicionando linhas verticais para conectar os valores
segments(
x0 = x[-1], # Exclui o primeiro valor (X=0)
y0 = c(0, p_cumulative[-length(p_cumulative)])[-1], # Exclui o valor inicial (F(0))
x1 = x[-1],
y1 = p_cumulative[-1], # Exclui o valor inicial (F(0))
col = "red",
lty = 2 # Linhas tracejadas
)
# Adicionando bolinhas abertas nos limites inferiores (apenas X > 0)
points(x[-1], c(0, p_cumulative[-length(p_cumulative)])[-1], pch = 1, col = "blue", cex = 1.5)
# Adicionando bolinhas fechadas no limite superior de cada degrau
points(x, p_cumulative, pch = 16, col = "blue", cex = 1.5)
# Customizando o eixo X
axis(1, at = 0:3, labels = 0:3)
# Customizando o eixo Y com frações
axis(2, at = c(0, 0.25, 0.5, 0.75, 1), labels = c("0", "1/4", "1/2", "3/4", "1"), las = 1)
# Adicionando grades para facilitar a interpretação
grid(nx = NULL, ny = NULL, col = "lightgray", lty = "dotted")