Capítulo 5 Distribuicoes Discretas

Variáveis aleatórias discretas são caracterizadas pelo seu suporte, que toma valores finitos ou infitos enumeráveis. A cada variável aleatória X é associada uma função de probabilidade ou função de massa de probabilidade.

A Função de probabilidade de uma variável aleatória discreta é \(\pi(x) = P(X=x)\)

  x = c(0,1,2,3)
  f = c(1/8, 3/8 , 2/8, 2/8)
plot(x,f, type = "h")

Esperança

Para uma Variável Aleatória Discreta com suporte {x_j}, a esperança de X é:

$ E(X) = _{j=1}^{}x_j _j$

mu = sum(x * f)
mu
## [1] 1.625

Variância

sigma2 <- sum((x-mu)^2 * f)
sigma2
## [1] 0.984375

Desvio Padrão

sigma = sqrt(sigma2)
sigma
## [1] 0.9921567

OBservação: é preciso ter cuidado com variáveis que possuem probabilidades desiguais. As funções mean e var só devem ser usadas nos casos de probabilidades iguais. Para exemplificar esse problema, vamos calcular abaixo a média, a variância e o desvio padrão da variável \(x\).

mean(x)
## [1] 1.5
var(x)
## [1] 1.666667
sqrt(var(x))
## [1] 1.290994

O pacote distrEx fornece funções para calcular alguns momentos de distribuições mesmo com probabilidades desiguais.

#install.packages("distrEx")
library(distrEx)
## Warning: package 'distrEx' was built under R version 4.1.3
## Carregando pacotes exigidos: distr
## Warning: package 'distr' was built under R version 4.1.3
## Carregando pacotes exigidos: startupmsg
## Utilities for Start-Up Messages (version 0.9.6)
## For more information see ?"startupmsg", NEWS("startupmsg")
## Carregando pacotes exigidos: sfsmisc
## Warning: package 'sfsmisc' was built under R version 4.1.3
## Object Oriented Implementation of Distributions (version 2.8.0)
## Attention: Arithmetics on distribution objects are understood as operations on corresponding random variables (r.v.s); see distrARITH().
## Some functions from package 'stats' are intentionally masked ---see distrMASK().
## Note that global options are controlled by distroptions() ---c.f. ?"distroptions".
## For more information see ?"distr", NEWS("distr"), as well as
##   http://distr.r-forge.r-project.org/
## Package "distrDoc" provides a vignette to this package as well as to several extension packages; try vignette("distr").
## 
## Attaching package: 'distr'
## The following object is masked from 'package:prob':
## 
##     prob
## The following object is masked from 'package:fAsianOptions':
## 
##     igamma
## The following objects are masked from 'package:stats':
## 
##     df, qqplot, sd
## Extensions of Package 'distr' (version 2.8.0)
## Note: Packages "e1071", "moments", "fBasics" should be attached /before/ package "distrEx". See distrExMASK().Note: Extreme value distribution functionality has been moved to
##       package "RobExtremes". See distrExMOVED().
## For more information see ?"distrEx", NEWS("distrEx"), as well as
##   http://distr.r-forge.r-project.org/
## Package "distrDoc" provides a vignette to this package as well as to several related packages; try vignette("distr").
## 
## Attaching package: 'distrEx'
## The following object is masked from 'package:timeSeries':
## 
##     median
## The following objects are masked from 'package:timeDate':
## 
##     kurtosis, skewness
## The following objects are masked from 'package:stats':
## 
##     IQR, mad, median, var

Criar uma variável aleatória com a mesma distribuição da variável \(x\) criada anteriormente usando a função DiscreteDistribution:

X <- DiscreteDistribution(supp = 0:3, prob = c(1,3,2,2)/8)

Calcular a esperança, a variância e o desvio padrão.

E(X)
## [1] 1.625
var(X)
## [1] 0.984375
sd(X)
## [1] 0.9921567

Transformação de \(X\)

\(E[g(x)] = \sum_{j=1}^{\infty} g(x_j) \pi_j\)

  g = x*2 + 3
  sum(g * f)
## [1] 6.25
E(X*2+3)
## [1] 6.25

Linearidade da Esperança

\(E(a+bX) = a + bE(X)\)

E(3+2*X) == 3+2*E(X)
## [1] TRUE
  3 + 2*mu
## [1] 6.25

Função de Distribuição (Função de Distribuição Cumulativa)

A função de distribuição é \(F(x) = P(X \le x)\), que é a probabilidade do evento \({X \le x}\).

Para uma Variável Aleatória Discreta, com pontos de suporte \({x_j}\), a função de distribuição nos pontos do suporte é igual à soma cumulativa das probabilidades.

\(F(x_j) = \sum_{k=1}^j \pi(x_j)\)

F = cumsum(f)
F
## [1] 0.125 0.500 0.750 1.000
plot(F, type = "h")