2 Definições de probabilidade

Aqui será vista uma definição em termos da frequência relativa dos eventos associados a um experimento (acontecimento) aleatório, em seguida será apresentada a definição clássica de probabilidade (estudadas por Fermat e Pascal, metade do século XVII) e, finalmente, será dada uma definição mais geral denominada definição axiomática de probabilidade, que foi proposta por um matemático alemão chamado Andrei Kolmogorov.

2.1 Definição Frequentista de Probabilidade

Considere que um experimento aleatório seja realizado n vezes e seja \(n_A\) o número de vezes que o evento A acorre. A frequência relativa de \(A\), nesse caso, é dada por:

\[f_n(A)=\frac{n_A}{n}=\frac{\mbox{frequência do evento A}}{\mbox{Total de realizações}}, \ \ \ 0\leq f_n(A)\leq 1.\] Dessa forma, pode ser mostrado que a probabilidade do evento \(A\) ocorrer é dada por: \[P(A)=\lim_{n\rightarrow \infty} f_n(A).\] Ou seja, se \(n\) for grande, \(f_n\) se aproxima da probabilidade do evento \(A\) ocorrer.

Exemplo.2.1 Considere o problema em decidir se uma moeda é honesta. Para resolver esse problema, considere que a moeda seja lançada 100 vezes, caso a moeda seja honesta, qual o número aproximado de caras que esperamos obter?

Simulação de lançamentos de uma moeda honesta.

## Experimento
set.seed(13684)
moeda <- c("Cara", "Coroa")

lanc1 <- sample(moeda, size=10, replace = TRUE)    ## 10 lançamentos
lanc2 <- sample(moeda, size=50, replace = TRUE)    ## 50 lançamentos
lanc3 <- sample(moeda, size=100, replace = TRUE)   ## 100 lançamentos
lanc4 <- sample(moeda, size=10000, replace = TRUE) ## 1000 lançamentos

## frequência relativa dos lançamentos
n1=as.vector(table(lanc1)/length(lanc1))
n2=as.vector(table(lanc2)/length(lanc2))
n3=as.vector(table(lanc3)/length(lanc3))
n4=as.vector(table(lanc4)/length(lanc4))


## contrução da tabela de valores
Tabela<- data.frame(
 face=moeda,
 n1= round(n1, digits = 3),
 n2= round(n2, digits = 3),
 n3= round(n3, digits = 3),
 n4= round(n4, digits = 3)
 )



## print da tabela de valores
knitr::kable(
  Tabela, 
  caption = 'Frequência relativa da variável "Face da moeda".',
  booktabs = TRUE,
  col.names = c("Face", "$n=10$", "$n=50$", "$n=100$", "$n=1000$"),
   align = "ccccc"
)

Tabela 2.1: Frequência relativa da variável “Face da moeda”.
Face	\(n=10\)	\(n=50\)	\(n=100\)	\(n=1000\)
Cara	0,6	0,44	0,49	0,494
Coroa	0,4	0,56	0,51	0,506

Propriedade 2.1 (Frequência Relativa) A frequência relativa obedece as seguintes propriedades.

\(f_n:\mathcal{P}(\Omega)\rightarrow\mathbb{R}\).
\(f_n(A) \in [0,1]\).
\(f_n(\Omega)=1\).
Se \(A, B \in \mathcal{P}(\Omega)\) são disjuntos,

\[f_n(A ∪ B)= f_n(A)+ f_n(B)\].

Se \(A, B \in \mathcal{P}(\Omega)\) são quaisquer,

\[f_n(A ∪ B)= f_n(A)+ f_n(B) - f_n(A \cap B)\].

Como \(f_n(A)\) se aproxima da \(P(A)\) a medida que \(n\) cresce, é intuitivo que as propriedades apresentadas anteriormente também satisfaça essas propriedades.

2.2 Definição Clássica de Probabilidade

Considere um espaço amostral \(\Omega\) finito em que todos os seus eventos elementares são igualmente prováveis. Nessas condições, a probabilidade de um evento \(A \subset \Omega\) é calculada como a razão entre o número de casos favoráveis ao evento A (eventos elementares de A) e o número de casos possíveis (número de eventos elementares de \(\Omega\)). Ou seja: \[P(A)= \frac{\text{nº de casos favoráveis a A}}{\text{nº de casos possíveis}}= \frac{\sharp A}{\sharp \Omega}\]

Exemplo.2.2 Lança-se um dado honesto, qual a probabilidade de ocorrer a face 3? Sendo: A= ocorrer a face 3,

\[P(A)= \frac{1}{6}.\]

A definição clássica de probabilidade é bastante intuitiva e resolve muitos problemas práticos, no entanto não é suficiente para resolver todos os problemas que podem ser encontrados. Assim, faz-se necessária uma definição mais geral que é dada a seguir.

2.3 Definição Axiomática de Probabilidade

Seja \(\epsilon\) um experimento e \(\Omega\) o espaço amostral associado ao mesmo. A cada evento \(A\) desse espaço amostral associamos uma medida \(P(A)\), denominada probabilidade de \(A\), que satisfaz:

\(0\leq P(A) \leq 1\);
\(P(\Omega) = 1\);
se \(A_1,A_2,\cdots, A_n \subset \Omega\) forem disjuntos 2 a 2 (ou seja \((A_i\cap A_j)=0\), para todo \(i\neq j)\), então \(P(\displaystyle\bigcup_{i=1}^{n} A_i) = \displaystyle \sum_{i=1}^{n} P(A_i)\).

A partir dos três axiomas apresentados, podemos provar diversas propriedades da probabilidade. Vejamos algumas delas.

Propriedade 2.2 Se \(\emptyset\) é o evento impossível, então \(P(\emptyset)=0\).

Demostração: \(P(\Omega)=P(\emptyset \cup \Omega)=P(\emptyset) + P(\Omega)=1\).

Isso implica, \(P(\emptyset) =1-P(\Omega)=1-1=0\). \(\blacksquare\)

Propriedade 2.3 Se A e B são dois eventos quaisquer então:

\[P(A\cup B)= P(A) + P(B) - P(A\cap B).\]

Demostração: Como \((B^c\cap A)\) e \((A \cap B)\) são disjuntos, \(P(A)=P(B^c\cap A) + P(A \cap B)\) o que implica \[P(B^c\cap A) =P(A) - P(A \cap B). \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (1)\]

Além disso, \((B^c\cap A)\) e \(B\) também são disjuntos, logo

\[ P(A \cup B)= P(B^c\cap A)+ P(B). \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (2)\]

Substituído a Equação (1) em (2), tem-se

\[P(A \cup B)= P(A) + P(B) - P(A \cap B). \blacksquare\]

Propriedade 2.4 Se \(A\subset B\), então \(P(A) \leq P(B).\)

Demostração: Exercício.

Propriedade 2.5 \(P(A^c)= 1-P(A)\).

Demostração: Exercício.

Exemplo.2.3 Considere um experimento e os eventos \(A\) e \(B\) associados, tais que:

\(P(A)=\frac{1}{2}\), \(P(B)=\frac{1}{3}\) e \(P(A\cap B)= \frac{1}{4}\). Encontre:

\(P(A^c)\) e \(P(B^c)\);
\(P(A\cup B)\);
\(P(A^c \cap B^c)\);
\(P(A^c \cup B^c)\);
\(P(A^c \cap B)\).

Exemplo.2.4 Suponha que um lote com 20 peças existam cinco defeituosas.

Experimento: Escolher ao acaso quatro peças desse lote (uma amostra de 4 elementos) de modo que a ordem de retirada seja irrelevante.

De quantas maneiras poderíamos obter essa amostra?
Qual a probabilidade de ter duas peças defeituosas na amostra?