Capítulo 6 Coletando Dados para Pesquisas

A cada capítulo do nosso livro ficamos mais familiarizados com o universo da ciência de dados. Aqui trataremos de um dos conceitos mais fundamentais da estatística que é base para formulação de muitos algoritmos das Ciências de Dados e base para reflexão sobre os resultados que obtemos a partir deles.

Avançamos no aprendizados de ciência de dados de forma intuitiva, confundindo com as experiências da vida moderna que nos fornece muitos dados ´para tomarmos decisões.

A realização de pesquisas podem ser motivadas por muitos interesses. Ao se dedicar a uma pergunta que se concentra em problemas ligados especificamente a química, física, matemática, biologia etc., em geral, os métodos científicos utilizados não incluem os aspectos humanos, são constituídos de experimentos ou raciocínio lógicos indutivos ou dedutivos. Há um grupo de pesquisas científicas que não estão focadas em questões elementares da natureza, são àquelas relacionadas prioritariamente ao comportamento humano, envolvendo a sua percepção, opinião, declaração de intenções etc. É importante considerar neste casos o uso de instrumentos mais amplos, que sejam capazes de extrair respostas de alguns indivíduos e agregar dados e informações às avaliações das investigações. Um dos recursos frequentemente utilizado para este fim é chamado de Pesquisa Amostral. Nas próximas seções dedicaremos à compreensão deste instrumento de pesquisa, quais são os principais conceitos da estatística que norteiam a sua estrutura, e quais problemas devem ser considerados na sua interpretação.

6.1 Como é realizado a coleta de dados

Já parou para pensar como os números aparacem nas revistas, sites, propagandas etc? Hum, se não pensou agora chegou o dia que não pode mais evitar este assunto. Somos bombardeados diariamente por muitas informações que foram organizadas, analisadas e publicadas por alguém, mas por quem? E também devemos nos perguntar quais eram os objetivos desses números, para qual fim será utilizado? E para quem eles eram endereçados? Todas essas perguntas são fundamentais para interpretar os números estatísticos que aparecem no nosso dia-a-dia.

Sons para o bebê

Figura 6.1: Sons para o bebê

Para entender a motivação dessas perguntas, faremos um passeio primordial. Retornaremos ao ventre das nossas respectivas mães.
Mesmo antes de nascer estamos experimentando, por exemplo, os sons aos quais somos frequentemente submetidos ao longo do nosso crescimento. Cada feto estará sujeito a diferentes estímulos, alguns moram numa casa onde há música alta, outros estarão sujeitos aos sons de carros passando numa rua. Se a mãe trabalha numa escola, terá o som misturado de várias vozes durante os intervalos das aulas e se trabalha num restaurante o feto ouvirá sons metálicos de talheres ao tocar o prato, numa fábrica ouvirá ruídos fortes de bombas, compressores e vapores. Mas devemos imaginar também que se cada bebê pudesse descrever o que ouviu enquanto estava no útero, não seria um relato exato sobre os sons que podemos conhecer, as reações deles são ainda de surpresa em relação a muitos sons, exceto em relação ao som da voz de sua mãe, que ele experimenta diariamente ao longo da gestação depois da formação do seu aparelho auditivo e conexão com campo do cérebro responsável por está função. Mas o que diferencia os sons externos que os fetos ouviram do som da voz das suas mães? Bem, esse é um dos pontos fundamentais da nossa trajetória ao longo deste capítulo.

Façamos o seguinte raciocínio, pensamos a priori que a voz da gestante além de agradar ao feto é provavelmente o som que mais frequentemente é escutado, aquele que ele se familiariza ao longo de algumas semanas que antecedem o seu nascimento, enquanto outros sons são menos frequentes e além disso podem ser menos agradáveis.

Agora pensamos o que ocorreu para reconhecer a voz da mãe. O bebê não teve que escutar tudo o que a ela falou durante toda a vida, nem mesmo o feto teve acesso a tudo o que a mãe falou durante a gestação, no início da gestação se quer havia formado o aparelho auditivo. Ou seja, para ele foi o suficiente uma parte dessa informação dos sons. A esta parcela de sons que o feto utilizou para reconhecer a voz da mãe, a estatística chama de amostra.

Assim como os bebês que aprendem a reconhecer a voz da mãe na presença de vários ruídos ao longo da gestação, utilizando apenas uma amostra dos sons da mãe e do meio externo, a estatística nos mostra que em diversas situações podemos conhecer e aprender sobre um determinado sistemas ou problemas com apenas uma parcela das informações, ou seja, precisamos conhecer apenas a amostra.

Nas próximas seções vamos aprofundar sobre este conceito que apresentamos intuitivamente, mas que tem algumas considerações adicionais para sua aplicação em problemas de interesse das ciência de dados.

A partir deste conceito de amostra, tão elementar, é possível explorarmos a ideia de pesquisa amostral, que é um instrumento de ampla aplicação para diversas áreas do conhecimento. Assim, estabeleceremos alguns objetivos:

  • Compreender a aplicação de pesquisas amostrais;
  • Diferenciar pesquisa amostral de censo;
  • Aprofundar o debate acerca das etapas de desenvolvimento de uma pesquisa amostral;
  • Debater potenciais vieses encontrados na elaboração de pesquisas amostrais e finalmente desenvolver habilidades que ajudem a aperfeiçoar as perguntas estatística

A coleta de dados é uma etapa central da Ciência de Dados. A visão que há sobre esta etapa também tem alterado ao longo do tempo. Esta perspectiva que temos sobre esta etapa, que constitui boa parte dos procedimentos científicos, depende de muitos fatores, como:

  • o tempo disponível para fazer as análises ou medições;
  • a capacidade de processamento destes dados;
  • nível de incerteza;
  • preservação do objeto de investigação etc.

Todos estes fatores estão profundamente ligados a representatividade da amostra. Por isso, nas próximas seções nos aprofundaremos na ideia de amostragem, viés amostral e questões éticas na construção de banco de dados.

6.2 Pesquisa amostral

O grupo alvo ou população alvo, refere-se àquele grupo sobre o qual deseja-se realizar alguma avaliação. No ano de 2022, o Instituto Brasileiro de Geografia e Estatística (IBGE) está realizando um procedimento diferente da amostragem, chamado de censo. O Censo consiste na consulta de todos os indivíduos de uma população alvo, enquanto a pesquisa amostral faz consulta apenas a uma parte representativa da população com recorte específico da pesquisa. O principal desafio de realizar uma pesquisa amostral é garantir a represantividade da população por meio da amostra. Amostras que apresentam desvio de representatividade da população possuem viés amostral, tema da nossa próxima seção.

O procedimento de amostragem é um conjunto de práticas fundamentadas na estatística, que permitem obter dados de uma população a partir de um subconjunto representante dessa população, chamado de amostra. Para entender um pouco melhor como pensamos a amostragem, podemos representá-los com diagrama a seguir:

Diagrama esquemático baseado em Gelman e Nolan (2009).

Figura 6.2: Diagrama esquemático baseado em Gelman e Nolan (2009).

Neste diagrama, representamos a população alvo pelo quadro com linha verde. Este grupo é aquele sobre o qual desejamos responder alguma pergunta. Contudo, o método da pesquisa amostral só precisa de um pequena parte de desse grupo, que é chamado população amostrada. Mas pesquisas sempre estão sujeitas à algumas incertezas oriundas da seleção incorreta do grupo de amostragem. Se a pesquisa desvia do seu foco, ele pode gerar um grupo de pessoas que se negam a responder, chamados de não repondentes. É possível que o instrumento de pesquisa amostral incorra em outro tipo de incerteza, devido a presença de pessoas inelegíveis, um grupo de pessoas externas à população alvo.

Segundo OECD (2012) para alcançar um bom resultado de pesquisa amostral é necessário cumprir as seguintes etapas:

  1. Definir objetivos da pesquisa e o grupo alvo:

A definição do objetivo é fundamental para conduzir adequadamente o restante do desenvolvimento da pesquisa amostral. Se sua a pesquisa tenta por exemplo descobrir a opnião dos moradores de um bairro sobre o sistema de coleta de resíduos, é importante ter clareza o que se pretende responder com este instrumento. É importante estar atento que a pesquisa amostral é apenas uma parte de uma ampla investigação científica ou um instrumento de pesquisa para apoiar decisões de uma empresa ou instituição pública. Por tanto, no nosso exemplo, num grande sistema buscando a melhoria contínua do sistema de coleta de resíduos de Salvador, podemos ter um objetivo específico em agradar a população e para isto precisamos entender qual é o melhor horário para a realização da coleta de resíduos. Portanto, o nosso objetivo é:

  • Identificar qual o melhor horário de coleta de resíduos na perspectiva dos moradores do bairro.
Objetivo

Figura 6.3: Objetivo

  1. Rascunhar as questões:

A partir do objetivo traçado, é importante elencar uma série de questões que devem aperfeiçoar a obtenção das respostas. Em debate com os moradores da comunidade nas associações de bairros e por meio de diálogos exploratórios com comerciantes, é delineado um primeiro conjunto de perguntas que devem compor o nosso questionário, podemos listar um conjuntos de perguntas ligadas ao objetivo principal:

  • Quem é o responsável pela coleta do resíduo na sua residência ou negócio?
  • Qual turno você costuma colocar o vasilhame de resíduos na rua?
  • Qual a frequência que você coloca resíduos na rua? Uma vez por dia? 4 vezes por semana? Ou no máximo 3 vezes pro semana?
  • Você gostaria que a coleta de resíduos ocorresse em qual turno? Pela manhã, tarde, noite ou pela madrugada?
  • Qual o motivo para você escolher este turno? É o mesmo que você coloca o resíduo na rua? É aquele que você pegar o vasilhame de volta? Para evitar ruídos dos caminhões de coleta em horários noturnos?

Deve-se atentar que além das perguntas centrais é preciso: identificar o respondente, possivelmente por idade, sexo ou gênero, qual o papel da pessoa no domicílio etc.

Elaboração de perguntas

Figura 6.4: Elaboração de perguntas

  1. Realizar teste e reajustar o questionário;

A partir do rascunho do questionário é possível aplicá-lo para realizar a primeira avaliação da qualidade do instrumento. Essa fase é muito rica, pois ajuda a identificar as falhas das alternativas propostas (viés de resposta), se há viés produzido pela pergunta realizada etc. A partir das primeiras repostas é possível corrigir o quetionário.

Elaboração de perguntas

Figura 6.5: Elaboração de perguntas

  1. Selecionar os respondentes e definir o método de coleta dos dados:

É necessário definir estratégias para atrair os respondentes corretos, aqueles que de fato representam o população alvo, ou seja, moradores e negociantes de um determinado bairro que são responsáveis pela coleta dos resíduos. Se o bairro tem uma intensidade comercial grande como a Barroquinha, Calçada ou Iguatemi os respondentes podem não representar bem a amostra, pois podem ser apenas clientes daquele local e sua pesquisa pode ter repondentes inelegíveis e provocar viés de seleção da amostra.

Elaboração de perguntas

Figura 6.6: Elaboração de perguntas

  1. Realizar pesquisa;

Um dos pontos relevantes para etapa de realização da pesquisa (submissão dos questionários ou mesmo entrevista direta com as pessoas) é a avaliação do público que identificamos como não respondentes. A partir desta identificação temos elemento adicional para reconhecer se pessoas elegíveis, representantes do população alvo, não se interessam pela pesquisa amostral em curso. Ou seja, pessoas que são responsáveis pela coleta de resíduos que se negaram a responder, enquanto que outras que apenas passavam pelo bairro decidiram responder livremente, contudo são inelegíveis. A qualidade da etapa de análise de dados depende profundamente dessas observações e condução da pesquisa.

  1. Analisar os resultados.

Finalmente, alcança-se a etapa sobre a qual os dados são reunidos, são identificados repostas que devem ser censuradas, ou seja, não compõem diretamente nos computos dos resultados finais como direcionador de decisões, exceto pela avaliação da qualidade da execução da própria pesquisa. Logo são resultados que auxiliem na definição do grau de incerteza da pesquisa realizada.

Elaboração de perguntas

Figura 6.7: Elaboração de perguntas

6.3 Viés

Vimos na seção anterior que a pesquisa amostral exige uma série de etapas para que seja realizada uma coleta de dados que de fato ajude na investigação do problema. Nos apegamos nesta seção à palavra investigação pois é muito similar a ideia de resolução de um problema. Quando desejamos resolver algum problema, por exemplo, uma luz que não acende, traçamos uma estratégia para descobrir o motivo. Alguns dos possíveis motivos são então elencados:

  • A lâmpada está queimada;
  • Não há fornecimento de energia elétrica;
  • O interruptor está quebrado.
Problemas e soluções

Figura 6.8: Problemas e soluções

Para investigar estas possibildades é traçada uma estratégia. Pode ser definido um conjunto de passos que ajudem a diminuir o número de hipóteses, para finalmente compreender o que ocorreu. Uma das estratégias mais comuns neste caso é avaliar se os outros aparelhos elétricos estão funcionando. Se sim, o próximo passo talvez seja trocar a lâmapada e avaliar se ela acende ao acionar o interruptor. Em geral, este caminho te ajudará a reduzir o número de hipóteses. Reduzir o número de hipóteses plausíveis é equivalente à redução da incerteza sobre a causa de um determinado problema.

O nosso problema da lâmpada que não acende tem características muito específicas e o motivo para sua falha é único, exato. Enquanto que para problemas que envolvem um público alvo, deve-se entender que cada indivíduo pode ter uma opinião, preferência ou escolha. Problemas que possuem vários indivíduos frequentemente são constituídos de muitas respostas diferentes. Assim, como no problema da lâmpada, quando perguntamos a opnião de alguém sobre a qualidade de determinado serviço por exemplo, temos ideias sobre as possíveis respostas, “excelente”, “bom”, “regular”, “ruim” e “péssimo”. Contudo, diferente da especificidade do problema da lâmapada, quando há vários indivíduos não chegamos a uma reposta especifica seguindo apenas passos meramente lógicos, ou seja, não podemos esperar que todos os indivíduos optem por “excelente”. É necessário definir um critérios para sintetizar caracteristicas gerais das respostas, por exemplo, qual resposta foi mais votada e assim selecioná-la como mais representativa para aquele grupo.

Este processo ainda pode ter outras incertezas, mesmo que definamos um critério para o valor mais representativo da rsposta. Ao longo da realização das pesquisas e possível ocorrer alguns tipos de devios na obtenção dos dados. Estes desvios ou viéses ocorrem por diferentes motivos, como:

  • viés de seleção ou amostragem, aquele que o grupo de pessoas não é representativo da população alvo;
  • viés de resposta, relacionado ao direcionamento a determinado conjunto de reposta devido à dificuldade de interpretação da pergunta ou mesmo a predileção por determinado conjunto de respostas por ser mais aceito socialmente.
  • viés de não repondentes, ocorre com determinado grupo que faz parte da população alvo e decide não participar, evita a participação.
  • viés do entrevistador, ocorrem pelo comportamento pouco imparcial do entrevistador, induzido as respostas do núcleo da pesquisa.
  • viés do pesquisador, principalmente presente na etapa de interpretação dos resultados, o pesquisador pode se desviar do método devido a sua relação com as hipóteses previamente estabelecidas na pesquisa, ficando inclinado a reforçar tais posições.

O IBGE realiza diversas pesquisas amostrais, entre as mais conhecidas está a Pesquisa Nacional de Amostra a Domonicílo Contínuas (PNADc). Estas pesquisas objetivam a compreensão do desenvolvimento socioeconômico do país com regularidade mensal, trimestral ou anual e com diferentes níveis geográficos. Podem ser exploradas
aspectos da força de trabalho observados segundo o sexo do entrevistado, o nível de escolaridade, o número de moradores da residência e as faixas salariais dos integrantes da residência. Para conhecer a forma como os questionários são construídos por esta pesquisa basta acessar o documento Questionário PNADc. Os questionários são apresentados nas seguintes seções:

  • PARTE 1 – IDENTIFICAÇÃO E CONTROLE;
  • PARTE 2 – CARACTERÍSTICAS GERAIS DOS MORADORES;
  • PARTE 3 – CARACTERÍSTICAS DE EDUCAÇÃO DAS PESSOAS DE 5 ANOS OU MAIS DE IDADE;
  • PARTE 4 – CARACTERÍSTICAS DE TRABALHO DAS PESSOAS DE 14 ANOS OU MAIS DE IDADE;
  • PARTE 5 - RENDIMENTOS DOMICILIARES.

Especialmente realizada nas escolas para preservar a privacidade dos estudantes e garantir respostas com maior veracidade, a Pesquisa Nacional da Saúde do Escolar PeNSE foi realizada nos anos 2009, 2012, 2015 e 2019. O principal objetivo é conhecer fatores de risco e proteção à saúde do adolescente.

Até aqui conhecemos dois tipos de sistemas de pesquisa amostral, PNAD e PeNSE, que aplicam seus questionários respectivamente nos domicílios e nas escolas. Estes duas diferentes formas são compatíveis com os objetivos de cada pesquisa. Portanto, fortalecem os resultado por minimizar os efeitos do viés de seleção durante a amostragem, que neste caso materiza-se pela aplicação dos questionários.

Uma particularidade da PeNSE é que o estudante da turma selecionada para realizar a pesquisa é responsável pelo uso do Dispositivo Móvel de Coleta (DMC). Este procedimento evita possíveis constrangimentos ao responder questões sensíveis presentes nos questionários. Para saber mais sobre esta pesquisa é possível conhecer um vídeo produzido pelo IBGE para jovens estudantes:

6.4 Análise de resultados

Em 2015, foi realizada na região metropolitana de Salvador uma pesquisa amostral para atender ao Plano de Mobilidade Urbana Sustentável de Salvador (PlanMob Salvador). A pesquisa tinha como principal objetivo:

Produzir informações sobre a qualidade de vida e a visão de futuro que a população da Região Metropolitana de Salvador (RMS) tem em relação à sua capital, fornecendo subsídios para a elaboração do Plano Salvador 500 para orientar o desenvolvimento econômico, social e urbano ambiental da capital baiana, tendo como horizonte o ano de 2049, quando completar 500 anos da sua fundação.

Nesta pesquisa foram entrevistadas 3600 pessoas que exerciam a função de chefe de família, sendo \(56,4\%\) do sexo masculino e \(43,6\%\). Dada esta primeira informação, podemos explorar o aspecto do tamanho da amostra, segundo o próprio Relatório Analítico Geral - documento preparado após a aplicação da pesquisa - foi estimado que o número de famílias na RMS é maior que \(1,2\) milhões de famílias. Logo, a amostra de \(3600\) representantes chefes de famílias corresponte a aproximadamente a \(0,3\%\), apesar de parecer um número pequeno, corresponde à resposta a vida de mais de \(10\)mil pessoas que pertencem a estas famílias. Apesar de algumas questões de qualidade de vida estejam associadas ao gênero do chefe de família, o questionário se detém ao sexo biológico. Percebemos ainda que ao apresentar ao entrevistado as opções dos 3 principais problemas observados em Salvador não são elencados problemas ligados às dificuldades que mulheres e pessoas LGBTQIA+ enfrentam em Salvador (ver figura 6.9).

Questão 26 - Questionário: QUALIDADE DE VIDA E VISÃO DE FUTURO EM SALVADOR

Figura 6.9: Questão 26 - Questionário: QUALIDADE DE VIDA E VISÃO DE FUTURO EM SALVADOR

Os resultados da aplicação da questão 26 apontou que mais de \(60\%\) das pessoas na função de chefes de família apontam que Segurança Pública/violência é o problema mais citado entre as escolhas dos três maiores problemas observados em Salvador. Este resultado reforça o argumento apresentado no parágrafo anterior. Esta característica demonstra que é necessário aprofundar neste grupo de problemas. Explicitá-los em termos da segurança do transporte para mulheres como apontado no texo da “A Pública“.

Problemas RMS (Total) Salvador Outros municípios da RMS
Segurança pública/violência 59.9 62.9 50.7
Saúde (atendimento médico-hospitalar) 46.7 54.5 22.9
Tráfico de drogas 35.7 37.7 29.9
Desemprego 31.5 33.3 25.9
Trânsito (engarrafamentos) 22.5 17.6 37.5
Encostas (deslizamentos) 21.6 16.1 38.4
Educação (escola pública) 17.2 19.9 8.8
Transporte público 10.6 11.4 7.9
Coleta de lixo/ limpeza urbana 9.1 7.9 12.8
Esgoto/ saneamento básico 7.0 6.2 9.5
Pavimentação/ conservação das ruas 5.7 5.1 7.7
Degradação ambiental (poluição do ar/água/desmatamento) 4.6 4.8 4.3
Habitação popular 4.4 4.4 4.7
Poluição sonora 4.2 4.3 3.8
Falta de praças; quadras e áreas de lazer 3.6 4.4 1.2
Praias (infraestrutura/desordem da orla/poluição) 3.1 2.8 3.8
Iluminação pública 2.2 2.4 1.5
Não sei 1.2 0.2 4.1
Passeios 0.8 0.7 0.9
Nenhum 0.0 0.0 0.0

O texto da “Em Salvador mulheres não sentem seguras para circular pela cidade“ baseia-se em muitos argumentos e incluí na sua construção uma pesquisa amostral. Sugerimos que após a leitura até este ponto do livro, que seja formado um grupo e discuta este texto e os argumentos apresentados frente ao tamanho da amostragem, forma como foi aplicado o questionário e que tipo de viés é mais importante.

6.5 Pesquisa amostral em tempos de bigdata e aspectos éticos

A pesquisa amostral é um instrumento projetado de maneira muito objetiva, pensando sobre o seu público alvo. Consistindo de uma reflexão sobre as potenciais respostas, deixando em aberto ou mesmo estabelecendo de forma direta quais respostas objetivas o repondente pode escolher durante a aplicação da etapa de entrevista ou submissão ao do questionário presencial ou online. Contudo, atualmente é possível extrair informações a partir de dados disponibilizados em sistemas utilizados em celulares, tablets ou computadores pessoais autorizados pelos próprias pessoas.

Pensamos por exemplo no caso de uma farmácia, na nossa cidade existem muitas delas espalhadas por todos os lados. Salvador é uma cidade que a maior parte do tempo as temperaturas são elevadas e haveria portanto um motivo para sempre utilizar protetor solar. Porém não devemos ser tão apressados e recomendar para uma farmácia que preencham seus estoques de protetor solar apenas pelo motivo do consumo total de protetores aumentar no verão. É preciso ser mais específico, é necessário em muitas situações conhecer mais a fundo as características específicas do seu potencial consumidor. Tem que realizar um conjunto de perguntas que extraiam as características dos seus entrevistados, neste caso, potenciais clientes que podem ser usuários de protetor solar e que fariam a compra na farmácia. Contudo, se a farmácia é dona de um sistema de dados que possui sistemas de fidelização do cliente, haverá ali um conjunto de informações sobre:

  • a idade;
  • raça/cor;
  • lista de remédios anterirormente comprados com suas respectivas marcas;
  • valores gastos regularmente;
  • haverá inclusive um nível de especificidade como antibióticos especialmente dedicados para aquela pessoa.

Ao se fidelizar ao sistema de dados, o cliente pode ou não estar autorizando o uso para exploração estatística e para tomada de decisões das fármácias dessa determinada franquia.

Assim, se uma farmácia tem por objetivo: Ampliar as vendas de protetores solar.

Com este objetivo a farmácia pode optar pela construção de uma pesquisa amostral bem planejada. Este planejamento pode ser fortalecido pela investigação do grande volume de dados disponíveis nos sitemas de banco de dados das fármácias, desde que autorizado pelo cliente e devidamente respeitando os limite da Lei Geral de Proteção dos Dados Individuais (LGPD). E assim, investigar quais melhores formas de ampliar a venda de produtos de proteção de pele.

Agora vejamos os riscos éticos entorno desse abordagem; o primeiro trata-se do armazenamento das informações dos clientes num sistema com o cpf, conhecendo todo seu históricos de doenças, suas principais predileções a fármacos e outros produtos de uso corporal comercializados em farmácias, como shampos, condicionadores, hidratantes, enxaguantes bucais, fraldas etc. O acesso e uso indiscriminado dos dados do público pode se tornar altamente influenciador do consumo. Outro aspecto importante é a promoção de produtos que não necessariamente beneficiam o cliente, e isto pode ser realizado pelo simples fato de dominar o comportamento do cliente.

É portanto necessário que haja governança sobre os bancos de dados e a forma pelas quais eles são construídos.

Deve-se considerar que conhecer os seus clientes pelo seu histórico de dados não necessariamente está relacionado ao comportamento dele em relação aos novos produtos e a suas reais necessidades. Logo, uso equilibrado que faz uso de grandes bancos de dados aliado a uma pesquisa amostral bem direcionado pode fortalecer a estratégia de atender os clientes e ser mais competitivo.

6.6 Pesquisas amostrais e formas modernas de apresentação de resultados

Uma pesquisa amostral sobre a cultura do país coordenada por João Leiva e Ricardo Meirelles chamada de Cultura nas Cidades, entrevistou mais de \(10\)mil pessoas, enriquecendo com váriaveis como:

  • cor da pele;
  • sexo;
  • orientação sexual;
  • religião e
  • acesso a internet.

É importante destacar a forma de disponibilização dos dados, demonstrando rastreabilidade e a forma moderna de visualização dos dados, por meio de dashboard, com o cruzamento de dados da entrevistas com os perfis socioeconômico dos entrevistados. Permitindo portanto alta difusão dos resultados e flexibilidade para o leitor ou responsável por decisões na área de cultura. Conheça este material e discuta com seu grupo de estudos de ciências de dados quais benefícios de apresentação de resultados de pesquisas amostrais com estas estruturas digitais.