Chapter 11 Tema

Existem testes de hipóteses a uma amostra que podem ser usados para testar dados em contextos ecológicos. Neste tema pretende-se que apresentem exemplos de testes de hipóteses a uma amostra.

11.1 Membros do grupo

Este grupo é composto pelos seguintes elementos:

Ana Fonseca, 51308
Catarina Cunha, 52545
Constança Albuquerque, 52546
Dinis Duarte, 52662
Luísa Cysneiros, 51932
Madalena Sottomayor, 52952

11.2 Introdução Teórica

Testes de hipóteses a 1 amostra:

O que são?

Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Para avaliar o valor de uma hipótese, recorre-se a testes de hipóteses, cujo objectivo é inferir a significância estatística da hipótese estabelecida, face aos dados recolhidos: quão bem os dados recolhidos suportam as conclusões retiradas. Os testes de hipóteses podem aplicar-se a uma ou a várias amostras. Quando a uma amostra, permitem inferir a relação das observações com um parâmetro específico. Estes acabam por ter um poder de inferência superior ao dos testes a mais do que uma amostra, uma vez que, os dados observados são comparados a um valor de referência, isento de variância. Nestes testes, o mais comum é comparar-se a média populacional com esse valor, podendo ser bilaterais ou unilaterais. Quando bilaterais, testa-se o desvio em relação ao esperado, segundo a distribuição da hipótese nula, em ambos os sentidos. Quando unilaterais, testa-se se a amostra se desvia significativamente num único sentido em relação ao parâmetro respectivo (maior ou menor).
Quais são?

Existem vários testes que podem surgir neste contexto. A primeira grande distinção entre eles baseia-se nos pressupostos teóricos em relação às características da população. Os testes ditos paramétricos assumem que as observações são independentes e que possuem uma distribuição probabilística gaussiana. Nos testes não paramétricos, não existe o requisito da gaussianidade. Assim, no caso de distribuições enviesadas, como a exponencial, estes últimos ganham especial relevância, conseguindo reduzir a probabilidade de incorrer num erro tipo I, em comparação à aplicação de um teste paramétrico.

T-test a uma amostra

Este é um teste paramétrico. Assume-se, portanto, que as observações são independentes e que a distribuição destas é Gaussiana. Neste teste, a hipótese nula segue uma distribuição específica, semelhante à distribuição normal - distribuição t. Esta distribuição varia consoante o tamanho da amostra (n). Tal como teorizado pelo Teorema do Limite Central, quanto maior n (tamanho amostral), maior a aproximação desta distribuição de uma distribuição Gaussiana.

Sendo que, em contextos ecológicos, geralmente se observam valores de dispersão amostrais variáveis, é importante construir testes com base numa distribuição que considera o tamanho da amostra. Esta distribuição caracteriza-se por valores de variância superiores, para tamanhos amostrais menores. Tal permite um aumento da sensibilidade do teste perante a estocasticidade da natureza, que pode levar a que amostras pequenas apresentem uma elevada dispersão. Evita-se, assim, a subestimação de p-value. Ou seja, através da distribuição normal, mais facilmente se rejeitaria a hipótese nula, subestimando a variabilidade das observações.

Método de aplicação

Determina-se a hipótese nula (exemplo: média = x). Calcula-se a estatística de teste, com base na distribuição (com o respectivo tamanho amostral) e no parâmetro populacional estimado (média populacional). Determina-se então o p-value respectivo - que representa a probabilidade de se observar um valor tão ou mais extremo, sendo H0 verdadeira. De seguida, consoante o p-value é inferior ou superior ao nível de significância escolhido a priori (alpha), H0 é rejeitada ou não, respectivamente. Em suma, faz-se uma comparação entre a média populacional observada e o valor de comparação (valor teórico/ valor hipotético). O resultado permite inferir se estes são significativamente diferentes (teste bilateral) ou superiores/inferiores (testes unilaterais).

Bilateral

H0: não há diferença entre a média observada e o valor a comparar H1: há diferença entre a média e o valor a comparar

Unilateral

H0: a média observada é superior/inferior ou igual ao valor a comparar H1: a média observada é inferior/superior ao valor a comparar

Teste de Wilcoxon

Este é um teste não paramétrico, sendo geralmente usado em alternativa ao one sample t-test, quando não se verifica que os dados seguem uma distribuição Gaussiana. À semelhança do teste anterior, este permite também inferir sobre a relação da média amostral e um valor específico.
Enquanto que no t-test a hipótese nula segue uma distribuição contínua, distribuição t, neste a distribuição é discreta e depende apenas de n (tamanho da amostra). O teste de wilcoxon usa, ainda, as ordens dos valores, contrariamente ao t-test, que utiliza os valores observados. Este teste pode ser usado tanto com dados quantitativos como com dados ordinais. Note-se que o t-test apenas permite avaliar dados quantitativos, podendo ser usado quando temos variáveis aleatórias qualitativas ordinais.

Método de aplicação

De forma a estudar-se o desvio das observações em relação ao esperado, calculam-se, primeiramente, as diferenças entre as observações e o valor estipulado em H0. Calculam-se, depois, estes valores em módulo, ordenando os mesmos por ordem crescente e é-lhes atribuído um rank (valor discreto entre 1 e n), também por ordem crescente. Somando os valores de rank correspondentes às diferenças positivas ou às negativas obtém-se o valor T (T+ ou T- respectivamente). É com base neste valor que se obtém o p-value, permitindo rejeitar ou não H0, de acordo com alpha.
A distribuição é discreta, uma vez que consiste na distribuição possível da soma dos ranks. Valores estes, discretos dependentes apenas de n. O valor da estatística de teste e respectivo p-value são calculados com base em n e alpha.
Uma vez que se baseia numa ordenação de valores, este teste não é tão permeável à dispersão dos dados, sendo que esta poderia variar sem que os ranks se alterassem. Por esta razão, não se trata de um teste tão sensível. Ainda assim, pode revelar-se útil em distribuições enviesadas, nas quais a presença do que poderiam ser considerados “outliers” numa distribuição normal, levariam a uma grande variação do p-value, calculado através de um t-test (pelo aumento da variância amostral). Isto diminui a sensibilidade do teste paramétrico nestes casos.
Vídeo sobre testes não paramétricos. No tópico deste trabalho apenas a parte referente a Signed test e a Wilcoxon signed rank test (ou apenas Wilcoxon test) é do nosso interesse. https://www.youtube.com/watch?v=IcLSKko2tsg&ab_channel=zedstatistics

11.3 Exemplo em R

Os testes a uma amostra são usados para comparar um parâmetro da amostra, normalmente a média, com um valor fixo. Sendo especialmente útil fazer-se este tipo de comparações, por exemplo, em contextos industriais, onde se ambiciona normalmente um comprimento específico para a peça fabricada ou um peso determinado por embalagem; em ecologia, pelo contrário, não é tão comum possuírem-se valores exactos como referência de comparação. Isto porque, associada a cada medição, no mundo natural, existe um erro, este por sua vez com uma determinada distribuição estatística, tal como os valores da amostra. Assim sendo, é mais comum usarem-se testes a mais do que uma amostra, que as comparem entre si, tendo em conta também a própria variabilidade a elas inerente.
No exemplo apresentado abaixo, testa-se uma amostra em relação à média de outra amostra. A média é um parâmetro estimado, com o respectivo erro, o que retira alguma significância ao resultado prático do teste. Contudo, tal é feito como simplificação, em prole da exemplificação do uso destes testes.

Foram recolhidas folhas de dois arbustos Viburnum tinus, em diferentes condições de exposição solar (um ao sol e outro à sombra) e calcularam-se as áreas foliares, como variável resposta. Considerando as duas amostras, os valores não podem ser considerados independentes, uma vez que, por se terem amostrado apenas dois indivíduos, não existe aleatoriedade completa das variáveis ambientais, que não a explicativa. Nestas circunstâncias, as características morfológicas e fisiológicas de cada organismo podem constituir factores de confundimento.
Tratando apenas uma das amostras, neste caso, do indivíduo à sombra, o pressuposto da independência das observações deixa de ser violado. As folhas foram recolhidas de forma aleatória, nas 4 quatro direções dos principais pontos cardeais e a alturas que variaram entre 1,5m e 2m. Não possuindo um valor padrão para a área foliar desta espécie, em diferentes condições de luz, assume-se então como valor de comparação a média da amostra ao sol. Para além das características inerentes aos organismos em si, todas as restantes variáveis ambientais foram relativamente constantes, uma vez que os dois indivíduos se encontravam muito próximos (cerca de 30m de distância). Assim, ainda que o valor da média possa não ser completamente representativo, sendo uma extrapolação a partir de um indivíduo apenas, dada a constância das restantes condições ambientais e o grande contraste quanto à condição de luz, admite-se que exista fiabilidade nesta decisão.

library(readxl)
Dados <- read_excel("52546ConAlb.xlsx")

library(tidyverse)

## Registered S3 method overwritten by 'httr':
##   method         from  
##   print.response rmutil

## -- Attaching packages ----------------------------------------------- tidyverse 1.3.0 --

## v tibble  3.0.3     v dplyr   1.0.2
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## v purrr   0.3.4

## -- Conflicts -------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
## x dplyr::select() masks MASS::select()

Dados_sombra<- filter(Dados, luz == "sombra") 
Dados_sol<- filter(Dados, luz == "sol")

shapiro.test(Dados_sombra$areaf)

## 
## 	Shapiro-Wilk normality test
## 
## data:  Dados_sombra$areaf
## W = 0.97854, p-value = 0.3279

p-value = 0.3279

Sendo o p-value superior aos níveis usuais de significância, não se rejeita H0, ou seja, assume-se que a amostra apresenta uma distribuição normal.

Assim sendo, e assumindo que as observações são independentes, é possível usar-se o teste paramétrico a uma amostra - t-test.

Neste caso, é usado o t-test para analisar se há um desvio significativo da área foliar à sombra, em relação a um contexto de maior exposição solar. Como medida padrão, representativa deste último contexto, é usado o valor da média da área foliar da amostra ao sol.

media <- mean(Dados_sol$areaf)
t.test(Dados_sombra$areaf, mu=media, alternative = "two.sided")

## 
## 	One Sample t-test
## 
## data:  Dados_sombra$areaf
## t = 23.871, df = 63, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 15.54491
## 95 percent confidence interval:
##  39.86165 44.30485
## sample estimates:
## mean of x 
##  42.08325

ks.test(Dados_sombra$areaf, y=pnorm)

## 
## 	One-sample Kolmogorov-Smirnov test
## 
## data:  Dados_sombra$areaf
## D = 1, p-value = 2.22e-16
## alternative hypothesis: two-sided

A partir do teste Kolmogorov-Smirnov bilateral, sendo o p-value inferior a qualquer nível de significância, rejeita-se a hipótese nula. É então possível concluir com um grau de certeza significativo que os valores da amostra se afastam do valor médio da amostra ao sol - haverá diferenças significativas do indivíduo ensombrado em relação a condições de maior exposição solar.

Aplicando o teste Kolmogorov-Smirnov, ao contrário do resultado obtido com o teste Shapiro-Wilk, rejeita-se a hipótese nula, de que é seguida a distribuição normalidade. Nestas condições, deveria ser aplicado um teste não paramétrico equivalente ao t-test - teste de Wilcoxon.

wilcox.test(Dados_sombra$areaf, mu=media, alternative = "two.sided")

## 
## 	Wilcoxon signed rank test with continuity correction
## 
## data:  Dados_sombra$areaf
## V = 2080, p-value = 3.61e-12
## alternative hypothesis: true location is not equal to 15.54491

A partir do teste de Wilcoxon, constata-se também que a área foliar à sombra é significativamente diferente do valor médio da área foliar ao sol.

Tendo como hipótese de estudo que a área foliar à sombra será, não apenas diferente dos indivíduos ao sol, mas especificamente superior, é relevante aplicar-se o teste unilateral.

wilcox.test(Dados_sombra$areaf, mu=media, alternative = "greater")

## 
## 	Wilcoxon signed rank test with continuity correction
## 
## data:  Dados_sombra$areaf
## V = 2080, p-value = 1.805e-12
## alternative hypothesis: true location is greater than 15.54491

p-value = 1.805e-12

Mais uma vez se rejeita a hipótese nula, constatando-se neste caso, que os valores à sombra são significativamente superiores. Pode afirmar-se com elevada significância que as folhas do inidíduo à sombra são maiores que as do indivíduo ao sol

11.4 Exemplos reais de aplicação

Pernilla Brinkman, E., Van der Putten, W.H., Bakker, E.‐J. and Verhoeven, K.J. (2010), Plant–soil feedback: experimental approaches, statistical analyses and ecological interpretations. Journal of Ecology, 98: 1063-1073. https://doi.org/10.1111/j.1365-2745.2010.01695.x

Este artigo consiste numa análise comparativa das abordagens experimentais e métodos estatísticos utilizados para estimar o feedback planta-solo. A interpretação ecológica deste efeito, depende fortemente da abordagem experimental e há pouca uniformidade na sua quantificação e análise. Como tal, este paper propõe-se comparar diferentes metodologias apresentando um caso de estudo. O feedback planta-solo está relacionado com as interações das plantas e dos microorganismos presentes no solo. Este efeito é medido através da variação da biomassa e de alterações ontogenéticas. São comparados resultados de diversos testes estatísticos, tais como ANOVA e teste t para amostras emparelhadas. O teste t a uma amostra, foco do nosso trabalho, surge no contexto de comparação de valores de biomassa obtidos em 2 tipos de solos: “own” e “foreign”.

Cressie, N. A. C., Sheffield, L. J., & Whitford, H. J. (1984). Use of the one sample t-test in the real world. Journal of Chronic Diseases, 37(2), 107–114. https://doi.org/10.1016/0021-9681(84)90052-3

Este paper pretende demonstrar a validade de utilização de testes t em contextos reais, no ramo da medicina. As amostras recolhidas neste tipo de contextos não cumprem, na grande maioria dos casos, todos os pressupostos à aplicação de um teste t. Este é um fenómeno que se alarga a outros campos, sendo por isso bastante relevante. É exposta uma tabela onde é indicado um limite de valores (skewness and kurtosis) que permitem obter um nível de significância indicado, quando a distribuição da amostra não é normal. Face à falta de homogeneidade das variâncias, é proposta a divisão da amostra em subgrupos com variâncias idênticas e um correto ajustamento dos graus de liberdade. Como exemplo ilustrativo, é utilizado um estudo em 20 pacientes com β talassémia com contínua infusão de desferrioxamina. Sendo o objetivo a diminuição dos níveis de ferritina, é utilizado um teste t unilateral em que hipótese nula consiste na diminuição do valor médio de ferritina face ao valor médio testado no mês de Março, com nível de significância de 5%. O teste é aplicado à amostra dos valores de ferritina dos 20 pacientes no mês de Setembro, cinco meses após o início das infusões de desferrioxamina.

11.5 Recursos adicionais

https://www.nature.com/articles/nmeth.2698

https://www.statisticssolutions.com/manova-analysis-one-sample-t-test/

http://www.statisticssolutions.com/what-is-the-wilcoxon-sign-test/

https://www.statisticssolutions.com/how-to-conduct-the-wilcox-sign-test/

https://www.statisticshowto.com/wilcoxon-signed-rank-test/

http://www.sthda.com/english/wiki/one-sample-wilcoxon-signed-rank-test-in-r

https://online.stat.psu.edu/stat500/lesson/11/11.1/11.1.2

http://www.sthda.com/english/wiki/one-sample-t-test-in-r

11.6 Considerações finais

Como já referido, testes de hipóteses a uma amostra apenas, são menos frequentemente usados, uma vez que dados provenientes de contexto ecológico são dificilmente exactos. É portanto mais frequente compararem-se diversas amostras. Ainda que amplamente usados, hoje em dia estes testes caíram em desuso, sendo que modelos de regressão linear são usados preferencialmente.

11.7 Referências

https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/t.test

https://www.math.tecnico.ulisboa.pt/~apires/MaterialPE/AulaTCap8Q.pdf

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html

https://www.nature.com/collections/qghhqm/pointsofsignificance