Definição:
- A estatística é uma metodologia científica destinada a obtenção, organização, apresentação, análise e interpretação de dados oriundos das mais variadas áreas do conhecimento.
Definição:
Dados são resultados de observações de fenômenos.
As observações podem ser espontâneas ou controladas.
Exemplo de observação espontânea: observar o desempenho de um novo equipamento.
Exemplo de observação controlada: observar o desempenho de um equipamento, alterando alguma característica de forma proposital.
Conjunto de todos os elementos ou resultados sob investigação.
Delimitação da população: delineamento da investigação;
definição dos objetos a serem investigados, com base em observações de características,
ou abrangência do fenômeno investigado.
Planejamento e obtenção dos dados;
Crítica dos valores obtidos.
nessa fase buscamos identificar ruído não causal (exemplo: erro de digitação ou de coleta).
Exploração dos dados.
Análises e conclusões sobre a população estudada.
Veja exemplos nas páginas 6 e 7 da apostila
População: conjunto de elementos com pelo menos uma característica em comum que o delimita, podendo ser um conjunto de indivíduos, fenômenos ou resultados que se pretende investigar.
Amostra: qualquer subconjunto da população.
Variável: característica dos elementos da população que se deseja investigar.
Dados: observações de uma ou mais variáveis em elementos de uma população.
Censo: observações realizadas a partir de todos os elementos da população.
Dados Amostrais: observações realizadas a partir de uma amostra.
Unidade Amostral: entidade (ou elemento) da população sobre a qual a característica de interesse (a variável) é observada.
Problema: investigar síndrome do impostor no Campus;
população: alunos ativos no Campus da UFC de Russas em 2023 (por ex.);
amostra: todos os alunos matriculados em uma turma ou curso.
variável: tem ou não tem a síndrome (resposta);
dados: respostas a instrumentos cuidadosamente preparados (questionários);
censo: observação de todos os alunos da população definida;
dados amostrais: observações a partir da amostra considerada;
unidades amostrais: um aluno investigado, ou seja, um aluno da amostra.
É nessa etapa que exploramos os dados a fim de evidenciar informações que eles podem conter.
Para realizar essa exploração usamos técnicas como:
tabelas de frequência;
gráficos e
resumos numéricos.
Esses métodos buscam evidenciar a frequência de ocorrência de uma dada característica, que aqui é chamada de Variável.
Uma variável é uma quantidade ou atributo, cujo valor observado pode variar de uma unidade investigada para outra.
Obs: exercícios na apostila, página 11.
Usaremos letras maiúsculas para representar uma variável: \(X\), \(Y\), \(W\), …
Observações pela mesma letra, mas minúscula: \(x_1,x_2,\cdots,x_n\) são \(n\) observações da variável \(X\).
\(n\) representa a quantidade de dados se esses vem de uma amostra.
\(N\) representa a quantidade de dados se esses vem de uma população.
A observação de ocorrências de variáveis da origem aos dados observados.
É comum que os dados sejam armazenados em planilhas.
No entanto, dependendo do seu uso, estes podem requerer estruturas mais complexas em bancos mais sofisticados.
Aqui não abordaremos estrutura de dados, vamos supor que estes estejam dispostos em uma planilha.
As variáveis são dispostas nas colunas e os indivíduos observados são dispostos nas linhas.
Chamada | ANO | CODIGO_CURSO | NOME_CURSO | TIPO_MOD_CONCORRENCIA | |
---|---|---|---|---|---|
1 | R | 2022 | 1299927 | CIENCIA DA COMPUTAÇÃO | A |
2 | R | 2022 | 1299927 | CIENCIA DA COMPUTAÇÃO | A |
3 | R | 2022 | 1299927 | CIENCIA DA COMPUTAÇÃO | A |
4 | R | 2022 | 1299927 | CIENCIA DA COMPUTAÇÃO | A |
5 | R | 2022 | 1299927 | CIENCIA DA COMPUTAÇÃO | A |
Aqui, o interesse é investigar o comportamento da variável em estudo, em termos de sua variabilidade entre as unidades amostrais (as vezes dentro dessas).
Assim é importante resumir os dados a fim de evidênciar essa variabilidade.
Ou seja, deseja-se estudar a distribuição de frequência das variáveis em estudo, no conjunto de observações (ou dados).
Para isso fazemos uso de ferramentas como: tabelas, gráficos e medidas de resumo.
Y | Frequência absoluta | Frequência relativa |
---|---|---|
1 | 21 | 0,808 |
2 | 5 | 0,192 |
Total | 26 | 1 |
Pode-se também usar o gráfico em setores, comumente utilizado para representar parte de um todo.
Apropriado para mostrar frequências de ocorrências de variáveis qualitativas.
Variável | \(n_i\) | \(f_i\) | \(F_{ac}\) |
---|---|---|---|
\(x_1\) | \(n_1\) | \(f_1=n_1/n\) | \(n_1/n\) |
\(x_2\) | \(n_2\) | \(f_2=n_2/n\) | \((n_1+n_2)/n\) |
\(...\) | \(...\) | \(...\) | \(...\) |
\(x_k\) | \(n_k\) | \(f_k=n_k/n\) | \((n_1+n_2+ ... +n_k)/n\) |
Total | \(n\) | 1 |
Obs: a frequencia relativa acumulada (\(F_{ac}\)) só faz sentido se existe ordenação nos possíveis valores da variável.
Tabela, assim como os gráficos, são elementos flutuantes no texto, pode aparecer que qualquer locar, desde que não prejudique a estética ou a fluidez da leitura.
Deve ser aberta nas laterais, do contrário trata-se de um quadro e não de uma tabela.
Deve ser mencionada no texto usando sua identificação (exemplo: veja modelo na Tabela 2).
A mesma regra para citação de tabelas são utilizadas para os gráficos (que em geral aparecem em elementos denominados “Figura”) e os quadros.
Em uma figura pode aparecer: um gráfico, uma foto, um fluxograma etc.
\(k\) sendo o número de classes da tabela, que neste caso é a quantidade de valores distíntos no conjunto de dados;
\(n_i\) a frequência absoluta;
\(f_i\) a frequência relativa;
\(F_{ac}\) a frequência relativa acumulada;
\(n\) total de elementos da amostra, se as medições são feitas em todos os elementos da população, tem-se \(N\) maiúsculo em vez de minúsculo.
Z | Frequência Absoluta | Frequência Relativa |
---|---|---|
F | 12 | 0,462 |
M | 14 | 0,538 |
Z | Frequência Absoluta | Frequência Relativa |
---|---|---|
CIENCIA DA COMPUTAÇÃO | 105 | 0,344 |
ENGENHARIA CIVIL | 26 | 0,085 |
ENGENHARIA DE PRODUÇÃO | 38 | 0,125 |
ENGENHARIA DE SOFTWARE | 97 | 0,318 |
ENGENHARIA MECANICA | 39 | 0,128 |
Realizar atividades da apostila para consolidação do conhecimento.
Realizar atividade: N1 At 01 do sistema AME, dentro do prazo lá estabelecido.