Capítulo 10 Definição do Tamanho da Amostra


Um aspecto de soberba importância nos estudos epidemiológicos é o tamanho da amostra que será obtida para respondermos a pergunta que temos em mente. O tamanho da amostra vai definir a capacidade de discriminação do teste, já que quanto maior a amostra, menor o erro aleatório contido nesta amostra por ser menor a incerteza contida na população não-amostrada. Se assumirmos uma população infinita, nosso erro aleatório devido à amostragem diminuiria gradativamente com o número de animais coletados/amostrados. Torna-se claro que, de um ponto de vista estritamente epizootiológico, o ideal seria capturarmos e analisarmos todos os animais pertencentes a esta população infinita, de forma a minimizarmos o erro aleatório e maximizarmos nossas possibilidades de discriminação entre a aprovação da hipótese Nula ou da Alternativa. Observe que a partir de um determinado número de animais analisados, mesmo em populações infinitas, nós já conseguimos obter uma capacidade de discriminação dentro dos limites que discutimos no Capítulo 9. Assim, precisamos adequar nossa intenção de captura ao número de animais que precisamos para discriminar a Hipótese Nula da Alternativa, sempre no contexto dos dois fatores limitantes básicos de qualquer empreendimento: o tempo e dinheiro disponíveis para realizá-lo.

No que tange ao tempo, somos limitados porquê para cada animal que vamos coletar material biológico, para cada amostra e técnica que utilizaremos na análise, uma determinada quantidade de tempo é gasta. Esta quantidade de tempo gasta, se exagerarmos até o tamanho infinito de determinada população animal, somente o tempo gasto em coleta também seria infinito. Mas mesmo se nos mantivermos mais no limite de uma realidade diária, durante um dia normal de trabalho nós temos 6-12 horas de tempo de trabalho para efetivarmos as coletas de material biológico, tempo que pode até ser estendido além destes limites por curtos espaços de tempo, mas nunca indefinidamente. Além desta limitação diária, tempos limitações de dias sucessivos de trabalho, onde qualquer pesquisador deve descansar. Ambos limites geralmente são legalmente estabelecidos nos códigos de legislação trabalhista país a país. Esta limitação do tempo gasto em coleta de material biológico deve ser multiplicado pelo tempo a ser gasto analisando-o no laboratório. Esta análise deve ser realizada em tempo hábil antes que ocorra degradação do material biológico, inevitável na maior parte dos casos, com raras exceções. Assim, mesmo que pudéssemos coletar um número infinito de amostras, não conseguiríamos analisá-las a tempo antes da degradação.

À estas limitações de tempo somam-se sempre as limitações de dinheiro. Cada coleta de material biológico, cada análise laboratorial, cada técnica de pesquisa empregada requer recursos financeiros para execução. Estes recursos financeiros para pesquisa científica são tradicionalmente limitados por vários fatores, obrigando ao uso eficiente para que os pesquisadores atinjam a consecução de seus projetos de pesquisa. Assim, é comum que parte majoritária do dinheiro investido em pesquisa seja alocado na parte dos exames laboratoriais, para que o máximo de informação científica seja extraído de cada amostra coletada. Um bom planejamento é fator preponderante para um experimento bem sucedido.

Por último, mas não menos importante, a preocupação com o bem-estar do animal utilizado para pesquisa científica cresceu gradativamente desde o final do século XIX. Hoje em dia esta preocupação está estabelecida em um corpo de legislação que visa assegurar o bem-estar do animal de pesquisa. Mas não só bem-estar é a preocupação, há hoje em dia o entendimento claro que o bem estar do animal de pesquisa é fundamental para a obtenção de resultados fidedignos dos experimentos realizados. Animais mal nutridos, mal alojados, com más condições de saúde ou submetidos a maus tratos não são unidades experimentais adequadas para testes científicos, já que estes fatores introduzem outras fontes de variação ao experimento e desviando os resultados obtidos. Assim, é consenso que o uso de animais para pesquisa científica deve sempre ser minimizado, através do atendimento a alguns princípios básicos, resumidos (na língua inglesa) pela sigla 3R (Russell and Burch 1959):

  • Replacement: Substituição do uso de animais na pesquisa científica sempre que houver um meio alternativo, além do estímulo ao desenvolvimento e inovação em técnicas de substituição de anmais.
  • Reduction: Redução do uso de animais na pesquisa científica, através do planejamento do experimento, controle do uso dos animais, garantia de qualidade de ambiente e saúde para evitar perdas experimentais.
  • Refinement: Refinamento da metodologia experimental e do uso dos animais no experimento, através da pesquisa e inovação no desenvolvimento de técnicas de análise clínica e laboratorial, além de técnicas de análise estatística, que permitam a redução do estresse, da dor e do sofrimento na experimentação, também contribuindo com o aumento da quantidade e qualidade de informação científica obtida de cada animal utilizado.

Em linhas gerais o pesquisador deve sempre tentar substituir o animal na pesquisa quando houver tal possibilidade, deve tentar utilizar a melhor metodologia científica que possibilite utilizar sempre o menor número de animais possível para responder à sua pergunta científica (Richter, Muche, and Mayer 2018). Note que um experimento que não consiga chegar a alguma conclusão porquê o poder de seu teste era baixo, devido a ele ter utilizado um número de animais pequeno demais nos grupos experimentais, também é falta ética, porquê o pesquisador submeteu os animais à pesquisa e não respondeu pergunta ou atingiu a objetivo algum (Button et al. 2013).

Assim, é pergunta básica para qualquer formulário de concessão de licença ética para experimentação animal quantos animais serão envolvidos no experimento. Esta pergunta deve ser respondida claramente e substanciada pelo pesquisador com literatura e informação científica pertinente. Em algumas situações, principalmente em experimentos pilotos, pré-experimentos e experimentos iniciais, o pesquisador pode subsidiar sua definição de tamanho amostral em trabalhos prévios da mesma área de pesquisa ou de área correlata. A ideia é que haja uma repetição das condições experimentais utilizadas em experimentos prévios que demonstraram capazes de caracterizar o efeito estudado. Esta estratégia é interessante quando deseja-se comprovar ou refutar afirmações ou achados feitos por estes experimentos prévios. Entretanto a justificativa para utilização desta ou daquela metodologia não deve recair sobre o trabalho prévio. É errado dizer “baseei minha metodologia no trabalho do autor X”. É correto dizer “baseei minha metodologia nos autores A, B e/ou C, que também embasaram o trabalho do autor X”. Assim, o embasamento é sobre os os autores A, B e C que estabeleceram a metodologia utilizada pelo autor X, e não sobre este último que a utilizou. Também ajuda a subsidiar uma metodologia baseada em experimentos prévios demonstrar à Comissão de Ética que tal metodologia é corriqueiramente utilizada na área de estudo em questão. Tal estratégia deve ser utilizada com certa preucação para não sobrecalcularmos o número de animais necessários, já que a coleta é exploratória. Estes experimentos preliminares permitem a geração de médias e desvios padrão dos parâmetros de interesse, os quais podem ser utilizadas para subsidiar posteriores cálculos em experimentos mais refinados.

Note que em Medicina Veterinária o tamanho do animal pode ser um fator limitador no estabelecimento de grupos experimentais. Um pré-experimento com dez camundongos ocupa meio metro quadrado de um biotério e ocupa 3 horas por semana de um técnico de biotério para ser cuidado. Já um pré-experimento com dez cavalos…é um experimento por si só, ocupando dezenas de metros quadrados de instalações e vários funcionários de manejo. Assim, uma estimativa acurada de tamanho amostral que permita caracterizar com poder adequado o efeito de um fator sobre uma variável é vital para a viabilidade de realização de um experimento.

Para que o pesquisador estime matematicamente quantos animais ele precisa capturar, examinar ou coletar material biológico, normalmente ele precisa definir duas características e estimar outras duas características da população submetida ao teste (Dell, Holleran, and Ramakrishnan 2002). De escolha do pesquisador, em que pese que valores fixos são comumente utilizados, são:

  1. O nível de significância: quanto menor, menor nossa probabilidade de cometer Erros de Tipo I, ou seja de refutar um hipótese Nula que é verdadeira, aceitando portanto uma hipótese Alternativa que é falsa na realidade. É usual em testes biológicos a utilização de níveis de \(\alpha = 0,05\) ou \(\alpha= 0,01\). Quanto mais exigente o teste (alfas menores), maior será o tamanho amostral requerido ou mais repetições serão necessárias.

  2. O poder que desejamos que o teste tenha: define o quanto seremos exigentes quanto a cometer erros de tipo II, já que como vimos \(Poder_{teste}=1-\beta\). Quanto maior o poder do teste mais ele é capaz de identificar uma hipótese Nula falsa como tal. Consequentemente, ele consegue detectar o efeito em ele existindo, ou seja caracterizar uma hipótese Alternativa verdadeira. É usual definirmos o poder do teste em pelo menos 80%. Quanto mais poder desejamos, maior o número amostral ou maior o número de repetições necessárias.

Outras duas informações devem ser conhecidas (ou estimados podem ser fornecidos), que por outro lado são características das populações comparadas:

  1. O Tamanho do Efeito: Calculado como o índice d de Cohen, é um estimado da diferença que exista entre a média dos grupos comparados, ou seja, o tamanho do efeito que pensamos que o fator exerça na variável avaliada. O tamanho ou intensidade deste efeito pode ser estimada a partir de experimentos prévios do próprio pesquisador ou de informações de literatura proveniente de trabalhos de colegas da mesma área ou correlata. É também usual estabelecer-se os níveis de efeito em fraco, moderado ou intenso, estabelecidos de acordo com a diferença de média entre o grupo experimental e o grupo controle, na forma da Equação (10.1) Caso o valor do d de Cohen seja menor do que 0,3 (equivalente a dizer que a diferença é de apenas 30% do desvio padrão), o efeito pode ser considerado leve ou desprezível. Valores de 0,5 indicariam um efeito moderado, e acima de 0,8 um efeito intenso. Quanto menor considerarmos que seja a diferença da média da variável (ou proporções, o raciocínio é o mesmo) entre os grupos comparados, maior o tamanho amostral ou as repetições necessárias para caracterizar tal efeito (mantidos os níveis de alfa e beta, evidentmente).

  2. O desvio padrão dos grupos comparados: o qual é a medida de quão dispersos ao redor de suas médias estão os grupos comparados. Tal desvio padrão, assim como a diferença entre os grupos, pode ser gerado a partir de estimados próprios ou oriundo de trabalhos correlatos. Quanto maior o desvio padrão, maior o tamanho amostral necessário para caracterizar ou descartar algum efeito.

\[\begin{equation} d=\frac{(|\mu_e-\mu_c|)}{\sigma}\tag{10.1} \end{equation}\]

Onde d: Índice d de Cohen; \(\mu\): Médias dos grupos experimental e controle; \(\sigma\): Desvio padrão do grupo controle.

De posse destas informações o pesquisador pode agora utilizar algumas estratégias de cálculo para estimar que número de animais experimentais irá conferir a seu experimento o poder que ele escolheu, de caracterizar a significância ou não do fator analisado sobre a população com as características que ele estimou (Lenth 2001). Note que em experimentos com taxas de sucesso baixas os tamanhos amostrais necessários para atingir o objetivo do experimento podem ser altos e difícies de estimar a priori. Cabe ao pesquisador justificar seu tamanho amostral de forma adequada com o uso de alguma das alternativas de cálculo de tamanho amostral apresentadas aqui ou baseado em outras publicações (Dell, Holleran, and Ramakrishnan 2002; Richter, Muche, and Mayer 2018; Stevenson 2021).

O tipo de variável, se é contínua ou se é discreta nominal (dicotômica ou não), definirá o tipo de formulação que utilizaremos para calcular o número de animais/amostras necessárias. Variáveis discretas são dos tipos mais comuns na epizootiologia. Em qualquer experimento que a resposta da variável seja do tipo sim/não, como com os fatores sexo (macho e fêmea), faixa etária (filhote, jovem, adulto, velho), estado infeccioso (infectado ou não), coinfecções (estado infeccioso contingenciado por diferentes taxa de parasitos), entre outros, sejam o ponto final da pesquisa ou da pergunta, os cálculos de tamanho amostral devem seguir os apresentadas na seção 10.1. Veja que títulos de anticorpos, como um exemplo, são variáveis discretas definidas a partir de uma variável contínua. Tais variáveis são uma categorização da resposta imune, onde um espectro uni-caudal de produção de anticorpos (de 0 até o infinito) é categorizado em classes discretas de acordo com a diluição empregada (1:32, 1:64 e assim por diante). É o mesmo caso de de faixa etária (idade contínua tratada como classes), aumento de linfonodos ou palpação de órgãos (quando estes são classificados em baixo, médio e alto aumento). Nestes e em casos semelhantes, tais variáveis devem ser tratadas como variáveis discretas, e não contínuas.

Variáveis contínuas são comuns também em epizootiologia. Para estas, as distribuições Normal e Poisson são mais frequentemente utilizadas. Toda a vez que alguma medida biométrica, clínica, laboratorial é feita sobre algum sistema animal (exemplos são peso, tamanho linear, níveis séricos de enzimas e proteínas), uma variável contínua está sendo mensurada. Variáveis abióticas inseridas em modelos de predição ou em análises geoespaciais também são contínuas na maior parte das vezes (como área analisada, temperatura ambiente, pluviosidade, concentração de microminerais em alimentos e água).

Apresenteremos aqui os tipos de cálculos mais simples. Para desenhos de estudo experimentais mais complexos com animais a publicação de Stevenson (2021) apresenta um bom conjunto de alternativas para cálculo de tamanho amostral em tais desenhos. Os métodos de cálculo baseados em simulações matemáticas também aplicam-se bem a tais desenhos complexos.

10.1 Variáveis dicotômicas, uma população

O caso mais simples de uma amostragem é quando o Médico Veterinário precisa saber quantos animais/amostras ele precisa analisar para ser capaz de detectar um determinado nível de prevalência, uma característica clínica, ou qualquer outra variável dicotômica do tipo sim/não, em uma única população animal ou grupo. Nesses casos o experimento deseja encontrar com um grau de certeza determinado a característica de interesse. Note que em alguns casos o pesquisador deseja afirmar que a característica NÃO está presente na população com determinado grau de certeza, utilizando o mesmo cálculo de tamanhno amostral.

Para determinar o número mínimo de amostras que ele precisa analisar o profissional precisa definir qual seu nível de \(\beta\) aceitável (proporção de falsos negativos) ele admitirá em seu diagnóstico, e consequentemente qual seu poder de detecção. Ele também precisa definir qual a prevalência mínima (\(p\)) que ele deseja detectar. De posse destas informações, nós podemos utilizar a Equação (10.2). \[\begin{equation} n = \frac{\log{\beta}}{\log{pn}}\tag{10.2} \end{equation}\]

Onde n: Tamanho amostral; log \(\beta\): Logaritmo da probabilidade de erros de tipo II; log pn: Log da proporção da amostra sem a característica de interesse (pn = 1-p).

Veja que com o método de cálculo acima a pergunta do pesquisador é voltada para a detecção do parasito/característica, ou na certeza de que a frequência de ocorrência é acima ou abaixo do que um determinado limite. Se a pergunta do pesquisador é voltada para estimar a frequência de ocorrência de alguma variável do tipo sim/não com um determinado grau de certeza, ele precisa estabelecer dois parâmetros de importância neste cálculo: o nível de prevalência que estima-se exista na população (\(p\)) e a precisão que ele deseja obter em seu experimento (\(d\)), no caso dos métodos propostos por Cochran (1991). Neste caso enquadram-se as pesquisas para estimar qual é o nível de prevalência de algum parasito em uma população, qual a frequência de ocorrência de alguma característica clínica, ou mesmo quantos entrevistas preciso analisar para sabermos se determinada prática zootécnica está sendo adotada por uma cooperativa de criadores. De posse daquelas duas informações (ou estimados) o pesquisador pode utilizar-se da Equação (10.3): \[\begin{equation} n = \frac{4pq}{d^2}\tag{10.3} \end{equation}\]

Onde n: Tamanho amostral; p e q: Prevalência ou frequência estimada da característica na população (p), e sua diferença para 1 (q=1-p); d: Precisão desejada; o valor do intervalo considerado acima ou abaixo da prevalência estimada (\(p \pm d\)).

Veja que quando a prevalência estimada estiver entre 30% e 60%, e a precisão desejada de 5% (ou seja, \(p \pm 5\)) o valor de n será máximo, e por volta de 400 indivíduos/amostras. Já quando as prevalências estimadas estiverem abaixo ou acima destes limites os valores de n irão reduzir, desde que mantida a mesma precisão.

Um último aspecto que deve ser levado em consideração é que os cálculos acima são estabelecidos para populações infinitas. Muitas vezes as populações que trabalhamos são menores, e o cálculo acima estabelecido pode ser ajustado. Consideramos então o \(n\) calculado como um \(n_0\), e calculamos o atual \(n\) também conforme Cochran (1991), conforme a Equação (10.4): \[\begin{equation} n = \frac{n_o}{1+(n_0-1)/N}\tag{10.4} \end{equation}\]

Onde n: Tamanho amostral; \(n_0\): Tamanho amostral calculado para população infinita; N: Tamanho da população conhecida.

10.2 Variáveis dicotômicas, duas populações

Já quando queremos estimar o tamanho amostral em um experimento que compara o proporção de ocorrência de uma variável entre duas populações ou grupos nós podemos utilizar a Equação (10.5). Esta equação leva em consideração que iremos comparar a proporção das categorias da variável analisada (infectado/não infectado, positivo/negativo) em relação do total de resultados obtidos em cada população, grupo ou fator considerado (controle/experimental, machos/fêmeas). Assim, a proporção de cada categoria (sim/não) em cada grupo (controle/experimental) seria equivalente a: \[Pcg = \frac{Ncg}{Tg}\] Onde Pcg: Proporção de cada categoria (sim ou não) dentro de cada grupo (controle ou experimental); Ncg: Número de resultados de cada categoria dentro de cada grupo; Tg: Total de resultados dentro de cada grupo.

Se considerarmos a categoria ‘Sim’ da variável como nossa resposta de interesse dentro de cada grupo, a proporção da categoria ‘não’ tem que ser \(Pc_{n\tilde{a}o}g=1-Pc_{sim}g\). A hipótese Nula do teste estatístico assume então que tal proporção de ‘Sim’:‘Não’ é igual entre populações, enquanto a hipótese Alternativa, evidentemente, assume que há diferença na proporção das duas categorias entre elas: \[\begin{align*} H_o: (P{c_{sim}g_c} - P{c_{sim}g_e}) &= 0 \\ H_a: (P{c_{sim}g_c} - P{c_{sim}g_e}) &\neq 0 \end{align*}\] Para calcularmos o tamanho amostral nestes casos o pesquisador escolhe, como dito na seção anterior, os índices de \(\alpha\) e \(\beta\). Além disso ele informa, no caso atual, o tamanho do efeito, na forma da diferença de proporção da categoria entre os grupos que ele espera encontrar, valores que serão utilizados na Equação (10.5) Fleiss, Levin, and Paik (2003). \[\begin{equation} n = C\times\frac{(P{c_{sim}g_c}\times P{c_{n\tilde{a}o}g_c}) + (P{c_{sim}g_e}\times P{c_{n\tilde{a}o}g_e})}{{d}^2} + \frac{2}{d} + 2\tag{10.5} \end{equation}\]

Onde n: Tamanho amostral; C: Correção relativa às probabilidades de cometer Erros de Tipo I e II; Pcsimgc: Proporção de ocorrência da categoria ‘Sim’ no grupo controle. Iidem para a categoria ‘Não’ e para o grupo experimental; d: Módulo da diferença entre a proporção da categoria ‘Sim’ entre as duas populações d= (|Pcsimgc-Pcsimge|).

Nesta equação a constante C é uma correção relativa justamente aos valores de \(\alpha\) e \(\beta\) escolhidos pelo pesquisador. A Tabela 10.1 reúne os valores de C gerados a partir do quadrado da soma dos escores Z relativos aos valores de \(\alpha\) e \(\beta\), como em \(C={(Z_{1-\alpha/2} + Z_{1-\beta})}^2\). Estes valores podem ser utilizados então na Equação (10.5) para o cálculo final do número amostral, um rearranjo que facilita o cálculo baseado em Cohen (1988).
Tabela 10.1: Valores da constante de correção C calculados com base nos valores de Alfa e Beta para cálculo de tamanho amostral em variáveis dicótomas em dois grupos distintos.
Poder = (1 - Beta)
95% 90% 80% 50%
Valores de Alfa
0,1% 10.82 8.56 6.18 2.71
0,05% 12.99 10.51 7.85 3.84
0,025% 15.77 13.02 10.04 5.41
0,01% 17.81 14.88 11.68 6.63
Nota: Valores calculados com base em \(C = (Z_{1-\\alpha/2} + Z_{1-\\beta})^2\)

10.3 Variáveis dicotômicas, mais de duas populações

No caso de querermos compararmos uma variável do tipo sim/não entre multíplas populações, a ideia é que estabeleçamos qual das comparações gerará o menor efeito detectável e a partir desta comparação estabelecer o tamanho amostral por grupo. Tendo com base a formulação da Equação (10.5), o tamanho amostral estabelecido para tal dupla de comparação de menor expectativa de diferença seria então multiplicado pelo número de comparações efetuadas.

10.4 Variáveis contínuas, duas populações

Com relação a variáveis contínuas a abordagem é similar, com adaptações para o tipo de distribuição das variáveis sob análise. Geralmente a análise estatística que será realizada será um teste \(t\) de Student, ou uma ANOVA unifatorial (os quais são equivalentes). Nestes casos o tamanho amostral pode ser calculado utilizando-se a Equação (10.6) (Snedecor and Cochran 1989; Dell, Holleran, and Ramakrishnan 2002) na qual também são inseridos valores de \(C\) de acordo com a Tabela 10.1. \[\begin{equation} n=1+2C \left( \frac{s}{d}\right)^2\tag{10.6} \end{equation}\]

Onde n: Tamanho amostral; C: Valor da soma dos limites de Z para os Erros de Tipo I e II; s: Desvio padrão da variável estudada; d: Magnitude da diferença que deseja-se detectar (tamanho do efeito).

Alguns autores propõem soluções simplificadas para o cálculo do tamanho amostral (Lehr 1992), que podem ser utilizadas principalmente em pré-experimentos e experimentos exploratórios. A Equação (10.7) também é um exemplo de tais simplificações do cálculo do tamanho amostral, baseado na Equação (10.6) (Dell, Holleran, and Ramakrishnan 2002), e fornece valores compatíveis com os obtidos por ela: \[\begin{equation} n=20\times \left(\frac{s}{d}\right)^2\tag{10.7} \end{equation}\]

Onde n: Tamanho amostral; ; s: Desvio padrão da variável estudada; d: Magnitude da diferença que deseja-se detectar (tamanho do efeito).

Alguns autores advertem quanto à excessiva simplificação no cálculo do tamanho amostral (Lenth 2001), o que pode acarretar perdas de informação ou excesso de animals desnecessariamente.

10.5 Variáveis contínuas, mais de duas populações

Neste tipo de análise, apresentarei aqui a formulação proposta por Sokal and Rohlf (1995b). Neste caso, poderemos ter a comparação de uma variável contínua frente a várias populações ou grupos, quando analisados por Análise de Variância, método comum para tal comparação entre vários grupos. O tamanho amostral precisa refletir então a perda de graus de liberdade para cada grupo experimental que inserimos na comparação. Observe que a correção (que chamamos de \(C\) nos métodos anteriores), que era baseada nos valores limites da distribuição \(z\), agora é feita com base nos valores limite da distribuição \(t\), tendo como referência os graus de liberdade totais do experimento em questão. Assim, se meu experimento tem 4 grupos com 5 indivíduos cada, meu Grau de Liberdade dentro dos grupos é \(GL_g = n-1 = 5-1 = 4\), os Graus de Liberdade entre os grupos (do Fator) é \(GL_f = nf-1 = 4-1 =3\), resultando em que os Graus de Liberdade total são \(v=GL_t = GL_g \times GL_f = 4\times3=12\). Os valores limites de \(t\), conforme a Equação (10.8) são obtidos com base em 12 GL para este experimento em particular. Usualmente é efetuado um teste para um cálculo para uma distribuição bi-caudal. Entretanto, quando já se sabe eventualmente a direção do efeito que existe entre os níveis de contraste, pode-se e deve-se efetuar um cálculo considerando uma distribuição uni-caudal, o que refletirá positivamente na diminuição do número de animais experimentais necessários para demonstrar efeito (Richter, Muche, and Mayer 2018).

Note também que este método é tido como progressivo, onde o pesquisador gera um estimado inicial baeseado em pura estimativa e experiência prévia, e ajusta tal estimado com base nos valores limite que ele estabeleceu, readequando o tamanho amostral gradativamente conforme o indicado pelos resultados. Este procedimento pode ter que ser repetido até que obtenha-se um resultado mais parcimonioso. A Equação (10.8) apresenta a formulação que considera estes fatores. \[\begin{equation} n\geq 2\times \left(\frac{\sigma}{\delta}\right)^2 \times \{t_{\alpha[v]} +t_{2(1-P)[v]}\}^2\tag{10.8} \end{equation}\]

Onde n: Tamanho amostral; \(\sigma\): Desvio padrão verdadeiro da variável estudada; \(\delta\): Diferença mínima que deseja-se detectar; \(\{t_{\alpha[v]} + t_{2(1-P)[v]}\}^2\): Quadrado da soma dos valores \(t\) limite correspondentes aos níveis de significância \(\alpha\) e \(\beta\) com o Grau de Liberdade \(v\).

10.6 Variáveis contínuas, estudos pareados

Um estudo é denominado pareado quando acompanha os resultados de uma ou mais variáveis em um animal antes e após algum tipo de alteração de categoria ou intervenção experimental sobre este animal. Estes tipos de estudo tem grande poder pois tendem a permitir menores erros padrão por eliminar a variação individual em um grupo experimental. Destarte, utilizando-se a Equação (10.9) podemos determinar o tamanho da amostra necessária em tais estudos. Observe que na atual Equação (10.9) uma multiplicação pelo fator de correção C é utilizada, ao invés de 2C, como é o caso da Equação (10.6), um reflexo do maior poder dos testes pareados. Como nos métodos anteriores, é necessário que determinemos nossos limites de \(\alpha,\ \beta\), e também que informemos a dispersão \(s\) da variável (desvio-padrão) e a diferença \(d\) que desejamos detectar. \[\begin{equation} n=2+C\left(\frac{s}{d} \right)^2 \tag{10.9} \end{equation}\]

10.7 Correlações entre variáveis contínuas

Em determinadas situações o pesquisador Médico Veterinário deseja averiguar se há correlação entre duas variáveis contínuas de um organismo biológico animal. Ele pode desejar correlacionar peso corporal com a concentração sérica de colesterol, volume ou peso do coração com a concentração sérica de creatina quinase cardíaca, ou a produção de testosterona com a concentração espermática, ou qualquer outra variável contínua que possa vir a explicar algum fenômeno biológico. Nestes casos é possível utilizar-se a formulação da Equação (10.10) (Dell, Holleran, and Ramakrishnan 2002), a qual leva em consideração os mesmos valores limites para C da Tabela 10.1. Os valores de \(r\) e \(r_0\) são os que os coeficientes de correlação de Pearson que o pesquisador deseja considerar como padrão de contraste (\(r_0\)) e coeficiente de correlação esperado (\(r\)). \[\begin{equation} n=3+\frac{4C}{\left[\ln\left(\frac{1+r}{1-r}\times \frac{1-r_0}{1+r_0} \right)\right]^2} \tag{10.10} \end{equation}\]

10.8 Simulações matemáticas

Uma estratégia que tem tornado-se mais e mais comum, por estar-se demonstrando cada vez mais adequada e prática de utilizar, são as simulações matemáticas do tipo Monte Carlo via cadeia de MarkoV (Markov chain Monte Carlo no inglês; Allgoewer and Mayer (2017)), uma abordagem frequentemente utilizada em estatística Bayesiana. Neste tipo de estratégia sorteios aleatórios são efetuados em cascata dentro de uma população de dados animais gerada aleatoriamente com uma função de distribuição pré-definida. Assim, quanto mais sorteios são aleatoriamente realizados, mais a distribuição dos valores do sorteio se aproximará da distribuição pré-definida. Destarte, um pesquisador pode determinar com qual número de animais ele atingiria a capacidade de detecção e precisão que ele deseja. Estes métodos cresceram em importância no final do século XX, pois foram desenvolvidos a partir da física de partículas, e vêm sendo cada vez mais empregados pela praticidade e acerto das estimativas que eles propiciam. Os sorteio Monte Carlo por cadeia de Markov são ligeiramente mais sofisticados matematicamente e podem ser melhor estudados nos trabalhos de Hamra, MacLehose, and Richardson (2013) e Ravenzwaaij, Cassey, and Brown (2018).

10.9 Uso de tabelas ou sítios de internet

Uma última estratégia que pode e deve ser utilizada pelo pesquisador de Epizootiologia é o recurso a tabelas pré-calculadas, sejam elas impressas ou disponíveis na internet. O recurso da internet inclusive tornou-se superior às tabelas pré-calculadas, por permitirem ao pesquisador a entrada de dados pré-determinados (os mesmos de sempre geralmente: probabilidades de cometer erros de Tipo I e Tipo II, dispersão dos dados e diferença que deseja-se detectar) em campos de formulário que calculam o tamanho amostral. Assim o pesquisador facilmente pode ver quantos animais ele necessitaria para o experimento dele frente a diferentes cenários dos fatores acima citados. Ao final deste capítulo você pode ver as URLs de sítios de internet que eu considero adequado indicar ao leitor. Entretanto, meu conselho é que o pesquisador compreenda e domine as técnicas de estabelecimento de tamanho amostral, mesmo que ele recorra a recursos da web para facilitar sua determinação de tamanho amostral.

References

Allgoewer, Andreas, and Benjamin Mayer. 2017. “Sample Size Estimation for Pilot Animal Experiments by Using a Markov Chain Monte Carlo Approach.” Alternatives to Laboratory Animals 45 (2): 83–90. https://doi.org/10.1177/026119291704500201.
Button, Katherine S., John P. A. Ioannidis, Claire Mokrysz, Brian A. Nosek, Jonathan Flint, Emma S. J. Robinson, and Marcus R. Munafò. 2013. “Power Failure: Why Small Sample Size Undermines the Reliability of Neuroscience.” Nature Reviews Neuroscience 14 (5): 365–76. https://doi.org/10.1038/nrn3475.
Cochran, William G. 1991. Sampling Techniques. 3rd ed. New York: Wiley, John; Sons, Incorporated, New York, N.Y. https://www.wiley.com/en-us/Sampling+Techniques%2C+3rd+Edition-p-9780471162407.
———. 1988. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. New York: Routledge. https://doi.org/10.4324/9780203771587.
Dell, Ralph B., Steve Holleran, and Rajasekhar Ramakrishnan. 2002. “Sample Size Determination.” ILAR Journal 43 (4): 207–13. https://doi.org/10.1093/ilar.43.4.207.
Fleiss, Joseph L., Bruce Levin, and Myunghee Cho Paik. 2003. Statistical Methods for Rates and Proportions Wiley Series in Probability and Statistics. 3rd ed. Hoboken, New Jersey: John Wiley & Sons, Inc. https://onlinelibrary.wiley.com/doi/book/10.1002/0471445428.
Hamra, Ghassan, Richard MacLehose, and David Richardson. 2013. “Markov Chain Monte Carlo: An Introduction for Epidemiologists.” International Journal of Epidemiology 42 (2): 627–34. https://doi.org/10.1093/ije/dyt043.
Lehr, Robert. 1992. “Sixteen S-Squared over D-Squared: A Relation for Crude Sample Size Estimates.” Statistics in Medicine 11 (8): 1099–1102. https://doi.org/10.1002/sim.4780110811.
Lenth, Russell V. 2001. “Some Practical Guidelines for Effective Sample Size Determination.” The American Statistician 55 (3): 187–93. https://doi.org/10.1198/000313001317098149.
Ravenzwaaij, Don van, Pete Cassey, and Scott D. Brown. 2018. “A Simple Introduction to Markov Chain MonteCarlo Sampling.” Psychonomic Bulletin & Review 25 (1): 143–54. https://doi.org/10.3758/s13423-016-1015-8.
Richter, Veronika, Rainer Muche, and Benjamin Mayer. 2018. “How Much Confidence Do We Need in Animal Experiments? Statistical Assumptions in Sample Size Estimation.” Journal of Applied Animal Welfare Science 21 (4): 325–33. https://doi.org/10.1080/10888705.2018.1423972.
Russell, W. M. S, and Rex Leonard Burch. 1959. The Principles of Humane Experimental Technique. London: Methuen.
Snedecor, George W., and William G. Cochran. 1989. Statistical Methods. 8th edition. Ames, Iowa: Iowa State University Press.
———. 1995b. “Single-Classification Analysis of Variance.” In Biometry, 3rd ed., 207–71. New York: W. H. Freeman; Co.
Stevenson, Mark A. 2021. “Sample Size Estimation in Veterinary Epidemiologic Research.” Frontiers in Veterinary Science 7: 1115. https://doi.org/10.3389/fvets.2020.539573.