Chapter 4 Aula 03 Exercicio Analise Estatistica Desc e Regressao

dados=read_excel("Dados/03 B1 ESTATISTICAS DESC E REGRESSAO.xlsx",sheet=2,skip=1)
dados
## # A tibble: 3,147 × 20
##    Date...1            Close.…¹ Date...3            Close…² Date...5            Close…³ Date...7            Close…⁴
##    <dttm>                 <dbl> <dttm>                <dbl> <dttm>                <dbl> <dttm>                <dbl>
##  1 2010-01-04 16:56:00     37.4 2010-01-04 16:56:00    20.1 2010-01-04 16:56:00    8.05 2010-01-04 16:56:00    37.3
##  2 2010-01-05 16:56:00     37.1 2010-01-05 16:56:00    20.2 2010-01-05 16:56:00    8.02 2010-01-05 16:56:00    37  
##  3 2010-01-06 16:56:00     36.6 2010-01-06 16:56:00    20.0 2010-01-06 16:56:00    7.92 2010-01-06 16:56:00    37.5
##  4 2010-01-07 16:56:00     37.4 2010-01-07 16:56:00    19.8 2010-01-07 16:56:00    7.88 2010-01-07 16:56:00    37.2
##  5 2010-01-08 16:56:00     38.1 2010-01-08 16:56:00    19.5 2010-01-08 16:56:00    7.82 2010-01-08 16:56:00    37.0
##  6 2010-01-11 16:56:00     37.5 2010-01-11 16:56:00    19.4 2010-01-11 16:56:00    7.79 2010-01-11 16:56:00    36.8
##  7 2010-01-12 16:56:00     37.1 2010-01-12 16:56:00    19.2 2010-01-12 16:56:00    7.79 2010-01-12 16:56:00    36.4
##  8 2010-01-13 16:56:00     37.5 2010-01-13 16:56:00    19.2 2010-01-13 16:56:00    7.77 2010-01-13 16:56:00    36.3
##  9 2010-01-14 16:56:00     36.9 2010-01-14 16:56:00    19.0 2010-01-14 16:56:00    7.66 2010-01-14 16:56:00    35.7
## 10 2010-01-15 16:56:00     35.6 2010-01-15 16:56:00    18.7 2010-01-15 16:56:00    7.47 2010-01-15 16:56:00    35.8
## # … with 3,137 more rows, 12 more variables: Date...9 <dttm>, Close...10 <dbl>, Date...11 <dttm>,
## #   Close...12 <dbl>, Date...13 <dttm>, Close...14 <dbl>, Date...15 <dttm>, Close...16 <dbl>, Date...17 <dttm>,
## #   Close...18 <dbl>, Date...19 <dttm>, Close...20 <dbl>, and abbreviated variable names ¹​Close...2, ²​Close...4,
## #   ³​Close...6, ⁴​Close...8
colnames(dados) = c("DATA_ELETRO", "ELETRO","DATA_ITUB4", "ITUB4", "DATA_ITSA4","ITSA4", "DATA_PETR4", "PETR4", "DATA_NUBR33", "NUBR33", "DATA_MGLU3", "MGLU3", "DATA_BBDC4", "BBDC4", "DATA_VALE3", "VALE3", "DATA_BBAS3", "BBAS3", "DATA_LREN3", "LREN3"   )
plot(x=dados$DATA_ELETRO,y=dados$ELETRO,type="l",col=3,ylim = c(0,150))
lines(x=dados$DATA_PETR4,y=dados$PETR4,col=2 )
lines(x=dados$DATA_MGLU3,y=dados$MGLU3,col=4 )
lines(x=dados$DATA_ITUB4,y=dados$ITUB4,col=5 )
lines(x=dados$DATA_ITSA4,y=dados$ITSA4,col=6 )
lines(x=dados$DATA_NUBR33,y=dados$NUBR33,col=7 )
lines(x=dados$DATA_BBDC4,y=dados$BBDC4,col=8 )
lines(x=dados$DATA_VALE3,y=dados$VALE3,col=9 )
lines(x=dados$DATA_BBAS3,y=dados$BBAS3,col=3 )
lines(x=dados$DATA_LREN3,y=dados$LREN3,col=20 )
legend(x=dados$DATA_ELETRO[1],y=150,legend = c("ELETRO","PETROBRAS","MAGALU","ITUB4","ITSA4","NUBR33","BBDC4","VALE3","BBAS3", "LREN3"),fill=c(3,2,4)) 
abline(h=10+1)

> Na Análise descritiva de algumas ações a NUBR33 tem uma série menor que as demais ações.

4.1 Grafico Serie Temporal + desvios padroes da serie (banda com os limites superior e inferior das acoes Eletro, PETRO e MGLU)

m=mean(dados$ELETRO,na.rm =TRUE )
n=mean(dados$PETR4,na.rm =TRUE )
o=mean(dados$MGLU3,na.rm =TRUE )
m1=mean(dados$ITUB4,na.rm =TRUE )
n1=mean(dados$ITSA4,na.rm =TRUE )
o1=mean(dados$NUBR33,na.rm =TRUE )
m2=mean(dados$BBDC4,na.rm =TRUE )
n2=mean(dados$VALE3,na.rm =TRUE )
o2=mean(dados$BBAS3,na.rm =TRUE )
o3=mean(dados$LREN3,na.rm =TRUE )

desvio=sd(dados$ELETRO,na.rm =TRUE )
desvio1=sd(dados$PETR4,na.rm =TRUE )
desvio2=sd(dados$MGLU3,na.rm =TRUE )
desvio4=sd(dados$ITSA4,na.rm =TRUE )
desvio5=sd(dados$NUBR33,na.rm =TRUE )
desvio6=sd(dados$BBDC4,na.rm =TRUE )
desvio7=sd(dados$VALE3,na.rm =TRUE )
desvio8=sd(dados$BBAS3,na.rm =TRUE )
desvio9=sd(dados$LREN3,na.rm =TRUE )

plot(x=dados$DATA_ELETRO,y=dados$ELETRO,type="l",col=3,ylim = c(-10,60))
lines(x=dados$DATA_PETR4,y=dados$PETR4,col=2 )
lines(x=dados$DATA_MGLU3,y=dados$MGLU3,col=4 )
lines(x=dados$DATA_ITUB4,y=dados$ITUB4,col=5 )
lines(x=dados$DATA_ITSA4,y=dados$ITSA4,col=6 )
lines(x=dados$DATA_NUBR33,y=dados$NUBR33,col=7 )
lines(x=dados$DATA_BBDC4,y=dados$BBDC4,col=8 )
lines(x=dados$DATA_VALE3,y=dados$VALE3,col=9 )
lines(x=dados$DATA_BBAS3,y=dados$BBAS3,col=3 )
lines(x=dados$DATA_LREN3,y=dados$LREN3,col=20 )


abline(h=m, col=2)
abline(h=m+2*desvio, col=4)
abline(h=m-2*desvio, col=4)

abline(h=n, col=2)
abline(h=n+2*desvio, col=4)
abline(h=n-2*desvio, col=4)

abline(h=o, col=2)
abline(h=o+2*desvio, col=4)
abline(h=o-2*desvio, col=4)

abline(h=m1, col=2)
abline(h=m1+2*desvio, col=4)
abline(h=m1-2*desvio, col=4)

abline(h=n1, col=2)
abline(h=n1+2*desvio, col=4)
abline(h=n1-2*desvio, col=4)

abline(h=o1, col=2)
abline(h=o1+2*desvio, col=4)
abline(h=o1-2*desvio, col=4)


abline(h=m2, col=2)
abline(h=m2+2*desvio, col=4)
abline(h=m2-2*desvio, col=4)

abline(h=n2, col=2)
abline(h=n2+2*desvio, col=4)
abline(h=n2-2*desvio, col=4)

abline(h=o2, col=2)
abline(h=o2+2*desvio, col=4)
abline(h=o2-2*desvio, col=4)

abline(h=o3, col=2)
abline(h=o3+2*desvio, col=4)
abline(h=o3-2*desvio, col=4)

bcaixa=boxplot(dados$ELETRO, dados$PETR4, dados$MGLU3 )

bcaixa
## $stats
##       [,1]   [,2]   [,3]
## [1,]  4.36  4.200  0.030
## [2,]  7.21 15.605  0.260
## [3,] 19.56 20.605  0.530
## [4,] 31.64 26.685  6.025
## [5,] 49.60 37.500 14.650
## 
## $n
## [1] 3089 3084 2780
## 
## $conf
##         [,1]     [,2]      [,3]
## [1,] 18.8655 20.28976 0.3572437
## [2,] 20.2545 20.92024 0.7027563
## 
## $out
##   [1] 14.72 15.10 16.12 16.85 16.32 16.09 15.93 15.45 15.60 15.13 14.87 15.60 15.60 16.15 15.99 16.47 16.51 16.80
##  [19] 17.43 17.86 17.73 17.57 17.46 17.43 17.34 17.61 17.92 18.08 17.53 18.01 18.00 18.69 19.18 20.05 20.13 20.13
##  [37] 20.38 20.05 20.51 21.76 21.08 21.17 20.11 19.92 19.84 20.11 20.06 20.83 20.18 20.65 20.63 20.76 21.48 21.42
##  [55] 20.49 20.25 20.02 20.12 20.45 20.42 22.38 22.43 21.84 21.84 21.78 22.01 22.54 23.00 23.65 23.31 23.84 23.38
##  [73] 22.13 22.20 21.93 22.81 22.07 21.90 22.58 22.40 22.30 21.78 21.80 22.18 22.38 21.63 22.33 22.66 21.87 21.88
##  [91] 22.31 22.98 22.02 22.54 22.33 22.24 22.97 24.54 26.01 25.69 25.52 25.81 25.70 26.05 26.23 26.11 25.93 25.48
## [109] 25.46 24.64 25.37 24.64 25.00 26.20 27.46 27.34 26.46 25.23 25.59 25.49 25.11 24.86 24.74 24.55 24.65 24.21
## [127] 23.43 23.71 24.01 24.26 24.20 23.39 22.89 23.06 23.31 23.67 23.81 24.96 23.99 23.41 23.00 24.06 24.62 24.97
## [145] 24.55 24.53 25.01 25.17 24.98 25.26 25.29 24.96 25.21 24.77 23.47 23.17 23.85 23.50 24.21 24.03 23.74 23.97
## [163] 24.46 24.09 25.43 25.50 26.00 25.76 25.80 26.20 25.28 24.94 25.31 25.66 25.32 25.86 26.17 26.25 25.31 25.66
## [181] 25.92 25.51 25.05 24.95 24.26 24.87 24.65 24.06 24.19 24.56 24.28 25.13 25.45 25.14 23.11 23.40 24.91 24.81
## [199] 24.58 23.73 24.16 23.95 22.29 22.30 21.92 21.52 20.38 20.31 19.99 19.66 20.07 20.25 20.45 20.43 20.61 20.19
## [217] 21.86 21.68 21.66 22.21 22.13 22.21 21.93 21.66 21.61 21.16 21.74 21.72 20.96 20.66 20.27 20.04 20.19 19.76
## [235] 19.91 19.47 19.90 19.21 19.33 18.60 19.14 19.16 18.87 18.98 18.69 18.75 18.54 20.01 20.03 19.68 19.60 20.26
## [253] 20.17 20.36 20.51 20.86 20.81 21.06 20.28 20.29 20.39 20.60 20.90 20.32 21.32 21.08 21.28 20.98 20.59 21.66
## [271] 21.40 21.54 21.68 21.16 20.70 21.65 21.39 21.08 22.02 21.93 22.11 22.50 22.93 23.72 23.90 23.12 23.37 23.36
## [289] 23.25 22.60 22.04 21.45 21.53 21.72 20.60 20.63 20.43 19.96 20.46 20.68 20.49 20.40 20.91 20.97 20.27 19.42
## [307] 19.31 18.84 18.95 18.86 18.13 19.24 19.55 18.80 19.03 18.88 18.24 18.68 18.01 18.90 19.48 18.79 18.85 17.18
## [325] 17.44 17.03 16.62 16.37 16.57 16.05 16.39 16.34 15.87 15.63 15.01 14.97
## 
## $group
##   [1] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
##  [56] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [111] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [166] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [221] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [276] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [331] 3 3 3 3 3 3
## 
## $names
## [1] "1" "2" "3"

Usando boxplot para obter limites e percentíls.

##Grafico Serie temporal com infos dos Box Plot e Mediana armazenado no bcaixa

plot(x=dados$DATA_ELETRO,y=dados$ELETRO,type="l",col=3,ylim = c(-10,60))
abline(h=bcaixa$stats[1,1], col=2)
abline(h=bcaixa$stats[2,1], col=5)
abline(h=bcaixa$stats[3,1], col=4)
abline(h=bcaixa$stats[4,1], col=5)
abline(h=bcaixa$stats[5,1], col=2)

lines(x=dados$DATA_PETR4,y=dados$PETR4,col=2 )
lines(x=dados$DATA_MGLU3,y=dados$MGLU3,col=4 )
lines(x=dados$DATA_ITUB4,y=dados$ITUB4,col=5 )
lines(x=dados$DATA_ITSA4,y=dados$ITSA4,col=6 )
lines(x=dados$DATA_NUBR33,y=dados$NUBR33,col=7 )
lines(x=dados$DATA_BBDC4,y=dados$BBDC4,col=8 )
lines(x=dados$DATA_VALE3,y=dados$VALE3,col=9 )
lines(x=dados$DATA_BBAS3,y=dados$BBAS3,col=3 )
lines(x=dados$DATA_LREN3,y=dados$LREN3,col=20 )

##Grafico com Mediana e Media

plot(x=dados$DATA_ELETRO,y=dados$ELETRO,type="l",col=3,ylim = c(-10,60))
abline(h=bcaixa$stats[3,1], col=4)
abline(h=m, col=2)

lines(x=dados$DATA_PETR4,y=dados$PETR4,col=2 )
lines(x=dados$DATA_MGLU3,y=dados$MGLU3,col=4 )
lines(x=dados$DATA_ITUB4,y=dados$ITUB4,col=5 )
lines(x=dados$DATA_ITSA4,y=dados$ITSA4,col=6 )
lines(x=dados$DATA_NUBR33,y=dados$NUBR33,col=7 )
lines(x=dados$DATA_BBDC4,y=dados$BBDC4,col=8 )
lines(x=dados$DATA_VALE3,y=dados$VALE3,col=9 )
lines(x=dados$DATA_BBAS3,y=dados$BBAS3,col=3 )
lines(x=dados$DATA_LREN3,y=dados$LREN3,col=20 )

boxplot(dados$ELETRO,dados$PETR4,dados$MGLU3,dados$ITUB4,dados$ITSA4,dados$NUBR33,dados$BBDC4,dados$VALE3,dados$BBAS3,dados$LREN3)

median(dados$ELETRO,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 19.56
median(dados$PETR4,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 20.605
median(dados$ITUB4,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 21.61
median(dados$ITSA4,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 7.94
median(dados$NUBR33,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 4.76
median(dados$BBDC4,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 16.09
median(dados$VALE3,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 42.97
median(dados$BBAS3,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 28.93
median(dados$LREN3,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo 
## [1] 17.05
median(dados$MGLU3,na.rm =TRUE ) # calculo mediana e rm-true tira os vazios do calculo
## [1] 0.53