Capítulo 2 - Por que usar o R?
Tio, por que todo mundo quer que eu use este tal de R, hein??
Algumas boas razões para se usar o R
Por Marcos Vital, do LEQ-UFAL
Este material foi construído com a ajuda de muitas pessoas que acreditam no LEQ e em Ciência Livre. Muito obrigado!
Para mais material, visite o Cantinho do R
Capítulo atualizado em 2017-01-07
Pois é, a pergunta do título é importante e recorrente. Afinal, por que um monte de professores, pesquisadores, alunos de pós e mais um monte de gente está super fissurada com o R, e por que eu deveria gastar meu tempo aprendendo a usá-lo? Não seria mais fácil partir para um programinha de estatística mais amigável, cheio de ícones bonitinhos e menus simples de se entender? Será que todo mundo endoidou?!
Bom, podemos até ter endoidado um pouquinho (afinal, essa vida acadêmica não é pra gente assim tão normal), mas eu espero que, com este texto, eu consiga mostrar um pouco dos motivos que fazem o R ser o maior barato, e ser uma ótima opção para se analisar dados, criar gráficos, fazer mapas e lavar roupa. Não, pera. Este último não; ainda não…
Mas bora lá. Antes de começar a usar o tal do R, então, vamos começar batento um papo sobre ele. E aí, logo depois, partiremos para o próximo capítulo e colocamos a mão na massa (ou nos teclados, né?)!
1 - Sim, ele é grátis. E é mais do que isso!
Não, ele não te dá dinheiro. Mas ele é mais do que gratuito: é livre. O R faz parte de um movimento, uma filosofia, visão de mundo ou o que você preferir. Ele é um software open source, o que em português costumamos de chamar de software livre, ou de código aberto. E o que isso quer dizer, você pergunta?
Bom, pra começar, ele realmente não custa nada. E se você pensa que isto não é relevante, saiba que existem muitos programinhas de estatística por aí que são bem caros. Mas o fato dele ser livre quer dizer outras coisas também. Você pode usá-lo para o que quiser, pois não está preso a uma licensa de uso criada pelo “dono” do programa. Existem softwares gratuitos que não são livres, e ao usá-los e concordar com seus termos de uso (aquelas letras miúdas que você não leu, onde poderia muito bem estar vendendo a sua alma sem nem saber) você pode estar restrito sobre para quais propósitos poderá usá-lo (tmm programas que podem, por exemplo, te proibir de vender algo gerado a partir dele). Mas é mais ainda do que isso! :D A ideia central do “código livre” é que qualquer pessoa pode acessar, modificar e redsitribuir a própria base do programa.
Mas eu não sei programar, não tenho interesse em alterar o programa. Qual é a vantagem disso pra mim?
Ah, aí é que está a coisa legal: tem montes de pessoas trabalhando com o R, nos mais variados níveis de experiência e intensidade. Uma parte destas pessoas está super engajada em melhorar o programa, fazendo ele ser mais rápido, mais confiável, mais flexível, mais um monte de coisas. E essa é a parte legal por trás dos softwares livres. Se você tem pessoas o suficiente trabalhando e se interessando por eles, eles crescem e melhoram o tempo todo. Quanto mais gente, mais melhorias e mais rápido - e no caso do R temos um monte, mas um monte bem grandão de gente trabalhando. ;)
Isso nos leva a algumas consequências que são outros ótimos motivos para usá-lo!
2 - É super flexível, e quase um faz tudo no mundo da estatística
Não existe um único programa de estatística que seja capaz de fazer todos os testes, análises e gráficos que existem. Mas se existisse um, com certeza seria o R!
O que acontece é o seguinte: como o R é livre e acumulou um monte de gente trabalhando com ele, o seu progresso em termos de “o que ele pode fazer” é bem rápido e dinâmico. Melhor: nesse montão de gente trabalhando, está uma quantidade imensa de cientistas de diversas áreas. Então, na medida em que novos métodos são criados em certas áreas de pesquisas, rapidamente você vai ter pessoas trabalhando para implementá-los no R. Na verdade, aliás, a coisa chegou a tal ponto que quado alguém desenvolve um novo método de análise de dados, há um chance enorme de ele ser desenvolvido e disponibilizado no R. A fórmula aqui é simples: já que muita gente usa o R, se eu desenvolvo um novo método já prontinho para ser usado nele, isso aumenta em muito a chance de outros pesquisadores usarem o que eu desenvolvi. ;)
Hoje, a comunidade de usuários de R é imensa, então você terá sempre a oportunidade de usar os métodos mais novos e atuais da sua área de pesquisa. E por falar na comunidade:
3 - Muita gente legal e um monte de material disponível!!!
Um dos aspectos mais legais do R, que também é uma consequência da “filosofia” do software livre, é que temos uma comunidade imensa de usuários que formam, literalmente, uma comunidade online ativa e engajada. Na prática, isto quer dizer duas coisas principais: muito material disponível e muita gente disposta a ajudar. :)
Da mesma forma que eu estou aqui escrevendo esta apostila, um monte de gente, de diferentes áreas de pesquisas, com diferentes estilos e públicos alvo, está produzindo ou já produiu algum material bacana pra te ajudar a usar o R. Tutoriais, vídeos no youtube, postagens em blogs, etc. Como o R é livre, existe um impulso para produzir material livre pra ele, e a quantidade de material disponível na internet é impressionante. Entre no google e busque por algo como “ANOVA no R”, por exemplo, e você vai achar uma quantidade fantástica de material.
E esta comunidade, esse bando de gente meio doida que realmente gosta e se diverte com o R, tem bastante disposição para ajudar. Existem muitos fóruns e listas de emails para mandarmos as nossas dúvidas e termos ajuda. E as pessoas gostam de ajudar! Muitas estão aprendendo, e ao ajudar acabam avançando mais. Outras já sabem um bocado, e tem o maior prazer em ajudar os pobres coitados iniciantes. ;) O fato é que o espírito do software livre afeta muitos dos usuários neste sentido também, e isso funciona como um substituto fantástico (e muito superior, diga-se de passagem) a qualquer suporte técnico que você poderia obter de uma empresa que produz um software pago.
4 - Se ele não faz o que você precisa, você pode ensinar! ;)
O R não é apenas um programa de estatística, ele é uma linguagem de programação. Mais adiante na apostila eu vou falar mais sobre isso, mas por enquanto o fundamental é entender que ele pode “aprender” a fazer novas coisas com bastante facilidade. Então, se você tem uma nova ideia de análise, gráfico ou seja lá o que for, a pergunta nunca vai ser “será que o R faz?”, e sim “como faço isso no R?”. E aí, se você não sabe absolutamente nada de programação, lembre-se que existe toda aquela comunidade pra te ajudar. :D
Este é um ponto que precisa ser absorvido com o tempo. Na medida em que uma pessoa aprende a usar mais e mais do R, ela começa a sacar que todo este lance de linguagem de programação é muito interessante, e deixa o programa muito flexível. Se você ainda não conseguiu entender exatamente o que isso quer dizer, deixe a ideia de molho na cabeça, pois com o tempo ela vai fazer sentido.
5 - O R facilita a repetição, reprodução, correção e vários outros “ãos”
Esse é mais um ponto que precisa ser absorvido na medida em que a pessoa começa a usar o R, mas é algo bem importantão. O que acontece é o seguinte: o R funciona, na esmagadora maior parte do tempo, com você escrevendo na famosa “linha de comando”. Isso pode parecer complicado no começo, mas com o tempo vai ficando super tranquilo. E tem algumas consequências bem legais, pois se você fizer tudo direitinho (e esta apostila deve te ensinar a fazer isso), tudo o que você faz fica registrado.
Ou seja: fez uma análise? Legal, você vai ter um arquivo chamado de script que tem todos os passos da sua análise. Então precisa voltar a trás e conferir o que foi feito? Sem problemas, basta abrir o script no R e mandar ele executar, que tudo acontece de novo! Isso é muito legal! Imagine um cenário: você pegou um programa “comum” de estatística, abriu seus dados, bavegou pelos menus e fez a sua análise. Depois, quando seu orientador (ou um revisor chato) está olhando os resultados, rola uma dúvida sobre as etapas da análise. Como resgatar isso? Como ter certeza de que foi tudo feito corretamente, e que de repente você não clicou sem querer no ícone errado? Pois é, com o script, tá tudo lá.
Um script facilita, então, o processo de reprodução de uma análise quando isso se faz necessários. Ele também facilita, e muito, a reprodução desta análise em outras situações: coletou novos dados, precisa fazer o mesmo tipo de análise de novo? Sem problemas, abra aquele primeiro script e use como base. :D
E o script permite, claro, fácil correção de erros nesta etapa de análise de dados. Como ele registra cada passo, uma outra pessoa que conhece o R pode ler, reproduzir, detectar erros e corrigir.
E aí, é claro, usando o R é muito fácil compartilhar as suas análises. Isso é uma mão na roda para a colaboração entre cientistas, e faz a vida de todos no meio acadêmico muito mais feliz.
6 - O R é mais fácil de usar do que você está pensando. Sério.
Pois é, se tem uma coisa da qual o R tem fama, é de ser difícil. Muita gente morre de medo dele, acha que é uma complicação imensa e impossível de usar pra quem não sabe programar. Eu espero, ao longo dessa apostila, de mostrar que não, não e não. Não é tão difícil, é apenas meio diferente do que você está acostumado. Não é tão complicado, a não ser que você esteja já partindo para as análises que são de fato mais complicadas. E não é apenas pra quem sabe programa: você pode aprender a programar se quiser, mas isso não é um requisito pra se usar o R.
7 - E tem mais? Tem, sim senhor!
Mas fica pra depois. Além de todos estes motivos, é sempre legal ver o R funcionando na prática, pra “sentir” como a coisa funciona de verdade e enxergar, de maneira concreta, algumas vantagens. Mas fica pra um outro capítulo, beleza? Prometo voltar nisso depois.
Mas Marcos, seja sincero, tem coisas ruins e pontos fracos?
Mas é claro que tem! Também vou escrever sobre isso por aqui, e chamar a atenção para as principais fraquezes e pontos negativos do R. Mas fica pra depois, vamos ter um pouquinho de ação primeiro, e depois voltamos a bater papo, pode ser?
Abraços!
Este documento faz parte do material que disponibilizo no meu blog, o “Cantinho do R”, e foi foi criado utilizando o software R, o programa RStudio, a linguagem Markdown e o publicado com a ajuda do pacote Bookdown. Para saber mais sobre eles, acesse:
Quer comentar ou perguntar? Faça isso na página da apostila, aqui