Capítulo 5 Distribuicoes Discretas
Variáveis aleatórias discretas são caracterizadas pelo seu suporte, que toma valores finitos ou infitos enumeráveis. A cada variável aleatória X é associada uma função de probabilidade ou função de massa de probabilidade.
A Função de probabilidade de uma variável aleatória discreta é \(\pi(x) = P(X=x)\)
= c(0,1,2,3)
x = c(1/8, 3/8 , 2/8, 2/8) f
plot(x,f, type = "h")
Esperança
Para uma Variável Aleatória Discreta com suporte {x_j}, a esperança de X é:
$ E(X) = _{j=1}^{}x_j _j$
= sum(x * f)
mu mu
## [1] 1.625
Variância
<- sum((x-mu)^2 * f)
sigma2 sigma2
## [1] 0.984375
Desvio Padrão
= sqrt(sigma2)
sigma sigma
## [1] 0.9921567
OBservação: é preciso ter cuidado com variáveis que possuem probabilidades desiguais. As funções mean
e var
só devem ser usadas nos casos de probabilidades iguais. Para exemplificar esse problema, vamos calcular abaixo a média, a variância e o desvio padrão da variável \(x\).
mean(x)
## [1] 1.5
var(x)
## [1] 1.666667
sqrt(var(x))
## [1] 1.290994
O pacote distrEx
fornece funções para calcular alguns momentos de distribuições mesmo com probabilidades desiguais.
#install.packages("distrEx")
library(distrEx)
## Warning: package 'distrEx' was built under R version 4.1.3
## Carregando pacotes exigidos: distr
## Warning: package 'distr' was built under R version 4.1.3
## Carregando pacotes exigidos: startupmsg
## Utilities for Start-Up Messages (version 0.9.6)
## For more information see ?"startupmsg", NEWS("startupmsg")
## Carregando pacotes exigidos: sfsmisc
## Warning: package 'sfsmisc' was built under R version 4.1.3
## Object Oriented Implementation of Distributions (version 2.8.0)
## Attention: Arithmetics on distribution objects are understood as operations on corresponding random variables (r.v.s); see distrARITH().
## Some functions from package 'stats' are intentionally masked ---see distrMASK().
## Note that global options are controlled by distroptions() ---c.f. ?"distroptions".
## For more information see ?"distr", NEWS("distr"), as well as
## http://distr.r-forge.r-project.org/
## Package "distrDoc" provides a vignette to this package as well as to several extension packages; try vignette("distr").
##
## Attaching package: 'distr'
## The following object is masked from 'package:prob':
##
## prob
## The following object is masked from 'package:fAsianOptions':
##
## igamma
## The following objects are masked from 'package:stats':
##
## df, qqplot, sd
## Extensions of Package 'distr' (version 2.8.0)
## Note: Packages "e1071", "moments", "fBasics" should be attached /before/ package "distrEx". See distrExMASK().Note: Extreme value distribution functionality has been moved to
## package "RobExtremes". See distrExMOVED().
## For more information see ?"distrEx", NEWS("distrEx"), as well as
## http://distr.r-forge.r-project.org/
## Package "distrDoc" provides a vignette to this package as well as to several related packages; try vignette("distr").
##
## Attaching package: 'distrEx'
## The following object is masked from 'package:timeSeries':
##
## median
## The following objects are masked from 'package:timeDate':
##
## kurtosis, skewness
## The following objects are masked from 'package:stats':
##
## IQR, mad, median, var
Criar uma variável aleatória com a mesma distribuição da variável \(x\) criada anteriormente usando a função DiscreteDistribution
:
<- DiscreteDistribution(supp = 0:3, prob = c(1,3,2,2)/8) X
Calcular a esperança, a variância e o desvio padrão.
E(X)
## [1] 1.625
var(X)
## [1] 0.984375
sd(X)
## [1] 0.9921567
Transformação de \(X\)
\(E[g(x)] = \sum_{j=1}^{\infty} g(x_j) \pi_j\)
= x*2 + 3
g sum(g * f)
## [1] 6.25
E(X*2+3)
## [1] 6.25
Linearidade da Esperança
\(E(a+bX) = a + bE(X)\)
E(3+2*X) == 3+2*E(X)
## [1] TRUE
3 + 2*mu
## [1] 6.25
Função de Distribuição (Função de Distribuição Cumulativa)
A função de distribuição é \(F(x) = P(X \le x)\), que é a probabilidade do evento \({X \le x}\).
Para uma Variável Aleatória Discreta, com pontos de suporte \({x_j}\), a função de distribuição nos pontos do suporte é igual à soma cumulativa das probabilidades.
\(F(x_j) = \sum_{k=1}^j \pi(x_j)\)
= cumsum(f)
F F
## [1] 0.125 0.500 0.750 1.000
plot(F, type = "h")