2 Variável
Os dados são observações de fenômeno de interesse, a esses fenômenos damos o nome de variável. Assim, uma variável é um atributo, cujo valor pode variar de uma unidade de investigação para outra. Por exemplo, as unidades podem ser pessoas contaminadas por um vírus e a variável o tempo de recuperação após um determinado tipo de tratamento ser iniciado. Nesse caso, espera-se que o tempo de recuperação varie entre os indivíduos, ou unidades amostrais.
Uma observação, ou resposta, é o valor assumido por uma variável em uma das unidades investigadas. A observação da variável em várias unidades dá origem aos dados observados.
- População: todas as possíveis execuções do algoritmo para estas matrizes.
- Variável: tempo de execução do algoritmo nestas situações.
- Undades amostrais: condições do algoritmo que serão observadas e que fornecerão os dados observados.
- tempo de execução de um algoritmo em diferentes máquinas;
- rendimento das famílias de uma grande cidade;
- número de erros em pacotes de dados enviados por um servidor;
- número de clientes com a mesma dúvida em um site de suporte durante um período de tempo;
- opinião dos consumidores de um determinado produto (péssimo, regular, ótimo etc).
2.1 Tipos de Variáveis
Podemos classificar variáveis em qualitativas e quantitativas. As variáveis qualitativas têm seus valores expressos por atributos, exprimindo alguma qualidade.
As variáveis qualitativa podem ainda ser classificadas como nominais ou ordinais.
Uma variável é nominal se os atributos que esta representa não têm uma ordenação, por exemplo, cor de cabelo, sexo de indivíduos etc, enquanto que as variáeis ordinais exprimem alguma ordenação, como por exemplo, opinião sobre a qualidade de um produto (péssimo, regular, ótimo).
As variáveis quantitativas exprimem quantidades ou mensurações. Essas variáveis também podem ser classificadas em contínuas e discretas.
Variável discreta assume valores em um conjunto enumerável (ou contável), por exemplo, número de carros que passam por um posto de pedágio em um intervalo de tempo.
Uma variável é contínua quando assume valores em um conjunto não-enumerável, ou seja, em um intervalo da reta, por exemplo, alturas de pessoas em um determinado povoado. Veja um resumo dos tipos de variáveis no diagrama apresentado na Figura 2.1, criado com o uso do pacote (Iannone 2020).
Note que, na prática, em geral variáveis quantitativas contínuas são resultados de mensurações, enquanto variáveis quantitativas discretas são resultados de contagens. Portanto, para entender a natureza de uma variável, e classifica-la corretamente, deve-se entender o processo que a originou.
Referências
Iannone, Richard. 2020. DiagrammeR: Graph/Network Visualization. https://CRAN.R-project.org/package=DiagrammeR.