Prefácio
1
Introdução à Ciência de Dados
1.1
O que são “dados” e onde estão presentes?
1.1.1
Posso compartilhar dados?
1.1.2
Privacidade de dados
1.2
O ciclo dos Dados - Construindo uma pergunta estatística
1.3
Estruturando os dados
1.4
Identificando o tipo de problema
1.5
Considerações finais
2
Construindo Uma Base de Dados
2.1
O que é uma base de dados?
2.2
Como montar uma tabela
2.3
Tipos de variáveis
2.3.1
Variáveis Numéricas
2.3.2
Variáveis Categóricas
2.4
Como buscar base de dados abertas
2.4.1
Dados abertos governamentais
2.5
Concluindo…
Referências
3
Visualização e Ciência de Dados
3.1
Objeto de estudo
3.2
Gráfico de barra
3.3
Gráfico de tendências
3.4
Gráfico de setores
3.5
Gráfico de dispersão
3.6
Histograma
3.7
Concluindo …
3.8
Indo Além
3.9
Citações no capítulo
4
Correlação e Causalidade
4.1
O que é correlação?
4.2
Quão forte é a correlação?
4.2.1
Coeficiente de Pearson
4.2.2
Relações de causa e efeito: conhecendo a causalidade
4.2.3
Coincidência ou Causalidade?
4.2.4
Correlações espúrias
4.2.5
Considerações Finais
4.2.6
Dados das seleções brasileiras
Referências Bibliográficas
5
Indicadores Básicos na Ciência de Dados
5.1
Objeto de estudo
5.2
Medidas de tendência central
5.3
Medidas de dispersão
5.4
Diagramas de Caixa
5.5
Concluindo …
5.6
Indo Além
Citações no capítulo
6
Coletando Dados para Pesquisas
6.1
Como é realizado a coleta de dados
6.2
Pesquisa amostral
6.3
Viés
6.4
Análise de resultados
6.5
Pesquisa amostral em tempos de bigdata e aspectos éticos
6.6
Pesquisas amostrais e formas modernas de apresentação de resultados
6.7
Referências
7
Distribuições, Probabilidade e Possibilidade
7.1
Experimento, Espaço amostral e Evento
7.2
Probabilidade
7.3
Câncer de mama e dados
7.4
Desafio
7.5
Comentários finais
8
Entendendo e Avaliando sua Hipóteses
8.1
O que é “Teste de Hipóteses”?
8.2
Hipóteses estatísticas
8.3
\(p\)
-valor
8.4
Verificando a normalidade
8.4.1
Gráficos de normalidade: Histograma e Q-Q Plot
8.5
Testes de normalidade
8.6
Uma breve contextualização!
8.7
Concluindo…
8.8
Indo além
8.9
Referências
9
Classificação
10
Regressão
10.1
Qual é a tendência?
10.2
Predição a partir de duas variáveis
10.3
Predizendo valores
10.4
Avaliando os resultados
10.5
Avaliação de problemas com mais de uma variável preditora variáveis
10.6
Concluindo…
10.7
Bibliografia
References
Appendix
A
Glossário
Uma introdução gentil à Ciência de Dados
A
Glossário
Bias
The expected value of the error (the difference between the true value and the estimated value).