Ciência Estatística

Definição:

  • A estatística é uma metodologia científica destinada a obtenção, organização, apresentação, análise e interpretação de dados oriundos das mais variadas áreas do conhecimento.

Dados

Dados são resultados de observações de fenômenos.

  • As observações podem ser espontâneas ou controladas.

    • Exemplo de observação espontânea: observar o desempenho de um novo equipamento.

    • Exemplo de observação controlada: observar o desempenho de um equipamento, alterando alguma característica de forma proposital.

População ou Universo

Conjunto de todos os elementos ou resultados sob investigação.

Investigação Estatística

  • Delimitação da população: delineamento da investigação;

    • definição dos objetos a serem investigados, com base em observações de características,

    • ou abrangência do fenômeno investigado.

  • Planejamento e obtenção dos dados;

  • Crítica dos valores obtidos.

  • nessa fase buscamos identificar ruído não causal (exemplo: erro de digitação ou de coleta).

  • Exploração dos dados.

  • Análises e conclusões sobre a população estudada.

  • Veja exemplos nas páginas 6 e 7 da apostila

Possíveis etapas da análise

Conceitos básicos

  • População: conjunto de elementos com pelo menos uma característica em comum que o delimita, podendo ser um conjunto de indivíduos, fenômenos ou resultados que se pretende investigar.

  • Amostra: qualquer subconjunto da população.

  • Variável: característica dos elementos da população que se deseja investigar.

  • Dados: observações de uma ou mais variáveis em elementos de uma população.

  • Censo: observações realizadas a partir de todos os elementos da população.

  • Dados Amostrais: observações realizadas a partir de uma amostra.

  • Unidade Amostral: entidade (ou elemento) da população sobre a qual a característica de interesse (a variável) é observada.

Exemplo

Problema: investigar síndrome do impostor no Campus;

população: alunos ativos no Campus da UFC de Russas em 2023 (por ex.);

amostra: todos os alunos matriculados em uma turma ou curso.

variável: tem ou não tem a síndrome (resposta);

dados: respostas a instrumentos cuidadosamente preparados (questionários);

censo: observação de todos os alunos da população definida;

dados amostrais: observações a partir da amostra considerada;

unidades amostrais: um aluno investigado, ou seja, um aluno da amostra.

Primeira etapa: Exploração dos dados (Estatística Descritiva)

É nessa etapa que exploramos os dados a fim de evidenciar informações que eles podem conter.

Para realizar essa exploração usamos técnicas como:

  • tabelas de frequência;

  • gráficos e

  • resumos numéricos.

Esses métodos buscam evidenciar a frequência de ocorrência de uma dada característica, que aqui é chamada de Variável.

Classificação de Variáveis

Uma variável é uma quantidade ou atributo, cujo valor observado pode variar de uma unidade investigada para outra.

Obs: exercícios na apostila, página 11.

Notação

  • Usaremos letras maiúsculas para representar uma variável: \(X\), \(Y\), \(W\), …

  • Observações pela mesma letra, mas minúscula: \(x_1,x_2,\cdots,x_n\) são \(n\) observações da variável \(X\).

  • \(n\) representa a quantidade de dados se esses vem de uma amostra.

  • \(N\) representa a quantidade de dados se esses vem de uma população.

Estrutura dos dados e notações

  • A observação de ocorrências de variáveis da origem aos dados observados.

  • É comum que os dados sejam armazenados em planilhas.

  • No entanto, dependendo do seu uso, estes podem requerer estruturas mais complexas em bancos mais sofisticados.

  • Aqui não abordaremos estrutura de dados, vamos supor que estes estejam dispostos em uma planilha.

  • As variáveis são dispostas nas colunas e os indivíduos observados são dispostos nas linhas.

Exemplo

Dados de alunos matriculados no Campus da UFC de Russas no ano de 2022.
Chamada ANO CODIGO_CURSO NOME_CURSO TIPO_MOD_CONCORRENCIA
1 R 2022 1299927 CIENCIA DA COMPUTAÇÃO A
2 R 2022 1299927 CIENCIA DA COMPUTAÇÃO A
3 R 2022 1299927 CIENCIA DA COMPUTAÇÃO A
4 R 2022 1299927 CIENCIA DA COMPUTAÇÃO A
5 R 2022 1299927 CIENCIA DA COMPUTAÇÃO A

Frequência das Variáveis

Frequência de Ocorrência das Variáveis

Aqui, o interesse é investigar o comportamento da variável em estudo, em termos de sua variabilidade entre as unidades amostrais (as vezes dentro dessas).

  • Assim é importante resumir os dados a fim de evidênciar essa variabilidade.

  • Ou seja, deseja-se estudar a distribuição de frequência das variáveis em estudo, no conjunto de observações (ou dados).

  • Para isso fazemos uso de ferramentas como: tabelas, gráficos e medidas de resumo.

Visualização da Frequência

Tabela de Frequência Simples para os dados de ingressantes no Campus da UFC de Russas no curso de Engenharia de Civil

Distribução de frequência da variável Y=“Opção no SISU”.
Y Frequência absoluta Frequência relativa
1 21 0,808
2 5 0,192
Total 26 1

  

  • Nota: Esse tipo de tabela é apropriado para variáveis qualitativas ou quantitativas discretas com poucos valores possíveis.

Exemplo

Exemplo

Gráficos em Setores

Pode-se também usar o gráfico em setores, comumente utilizado para representar parte de um todo.

Apropriado para mostrar frequências de ocorrências de variáveis qualitativas.

Gráfico em Setores

Formato Geral da Tabela de Frequência

Tabela e Notação

Tabela 2: Modelo de uma tabela de frequência simples.
Variável \(n_i\) \(f_i\) \(F_{ac}\)
\(x_1\) \(n_1\) \(f_1=n_1/n\) \(n_1/n\)
\(x_2\) \(n_2\) \(f_2=n_2/n\) \((n_1+n_2)/n\)
\(...\) \(...\) \(...\) \(...\)
\(x_k\) \(n_k\) \(f_k=n_k/n\) \((n_1+n_2+ ... +n_k)/n\)
Total \(n\) 1

Obs: a frequencia relativa acumulada (\(F_{ac}\)) só faz sentido se existe ordenação nos possíveis valores da variável.

Como uma tabela deve aparecer no texto?

  • Tabela, assim como os gráficos, são elementos flutuantes no texto, pode aparecer que qualquer locar, desde que não prejudique a estética ou a fluidez da leitura.

  • Deve ser aberta nas laterais, do contrário trata-se de um quadro e não de uma tabela.

  • Deve ser mencionada no texto usando sua identificação (exemplo: veja modelo na Tabela 2).

  • A mesma regra para citação de tabelas são utilizadas para os gráficos (que em geral aparecem em elementos denominados “Figura”) e os quadros.

  • Em uma figura pode aparecer: um gráfico, uma foto, um fluxograma etc.

Outras Notações Importantes

  • \(k\) sendo o número de classes da tabela, que neste caso é a quantidade de valores distíntos no conjunto de dados;

  • \(n_i\) a frequência absoluta;

  • \(f_i\) a frequência relativa;

  • \(F_{ac}\) a frequência relativa acumulada;

  • \(n\) total de elementos da amostra, se as medições são feitas em todos os elementos da população, tem-se \(N\) maiúsculo em vez de minúsculo.

Exemplo: frequência dos estudantes matriculados no curso de Eng. Civil, ano de 2022

Distribução de frequência da variável.
Z Frequência Absoluta Frequência Relativa
F 12 0,462
M 14 0,538

Gráfico em Setores

Frequência das matrículas efetivadas em chamada regular e lista de espera

Distribução de frequência da variável em todos os cursos.
Z Frequência Absoluta Frequência Relativa
CIENCIA DA COMPUTAÇÃO 105 0,344
ENGENHARIA CIVIL 26 0,085
ENGENHARIA DE PRODUÇÃO 38 0,125
ENGENHARIA DE SOFTWARE 97 0,318
ENGENHARIA MECANICA 39 0,128

Atividades

  • Realizar atividades da apostila para consolidação do conhecimento.

  • Realizar atividade: N1 At 01 do sistema AME, dentro do prazo lá estabelecido.