Pengantar

Assalamu’alaikum warohmatullohi wabarokatuh…

Alhamdulillahi robbil’aalamiin…

Segala puji dan syukur hanya untuk Alloh Subhanahu Wa Ta’ala karena atas rahmat dan ridho-Nya buku ini dapat diselesaikan masih dalam penyusunan. Buku ini ditulis untuk menuangkan ide berbagi pengetahuan berdasarkan hasil belajar, pengalaman melakukan pekerjaan dan penelitian di beberapa bidang bisnis sebagai konsultan analisis data, maupun karyawan di sebuah perusahaan.

Tentang buku ini?

Buku ini disusun dengan menggunakan R versi 4.0.1 (2020-06-06) 64bit pada Windows 10, RStudio versi 1.3.959, RMarkdown dan bookdown. Tujuan utama dari buku ini adalah untuk membantu Anda yang ingin belajar analisis data menggunakan R melalui pendekatan bisnis ataupun Anda yang ingin belajar bahasa pemrograman R dari dasar. Contoh kasus yang disajikan diharapkan dapat memperdalam pemahaman pembaca mengenai materi dari sisi permasalahan bisnis yang dapat diselesaikan. Contoh script yang digunakan lebih banyak menggunakan tidyverse.

Yang dibahas pada buku ini

Di dalam buku ini lebih ditekankan pada penggunaan R sebagai tools untuk analisis data. Buku ini juga akan membahas cara Anda berinteraksi dengan R melalui RStudio mulai dari download dan install hingga membuat data-driven product berupa dashboard.

Di Bab 1 akan membahas sedikit mengenai bisnis, perkembangan analisis data, dan beberapa contoh umum penerapan analisis data dalam bisnis dan beberapa contoh kendala yang pernah saya temui. Bab 2 akan membahas pengenalan cara install dan penggunaan R dan RStudio. Kemudian di Bab 3 akan menjelaskan secara cukup detil apa saja yang perlu Anda ketahui dan kuasai tentang bahasa pemrograman R. Pada Bab 4 akan dibahas tentang strukture kendali (if-then-else) dan pengulangan (looping). Di Bab 5 akan belajar cara import data dari file eksternal, database dan jenis data lainnya. Bab 6 akan mulai lebih menyenangkan karena akan membahas cara membuat dan menampilkan hasil eksplorasi dan analisis data dengan visualisasi.

Bab 7 hingga Bab 11 akan mulai membahas penggunaan machine learning untuk mengatasi masalah atau untuk memenuhi kebutuhan bisnis. Bab 7 akan membahas penerapan analisis gerombol (cluster analysis) untuk segmentasi pelanggan. Di Bab 8 akan membahas association rules dengan contoh pada bisnis swalayan. Kemudian Bab 9 membahas analisis regresi linier. Bab 10 akan membahas analisis regresi logistik biner sebagai dasar dari pemodelan machine learning pada kasus klasifikasi. Dan di Bab 11 akan memabahas pembuatan model menggunakan algoritma advanced seperti decision tree dan random forest. Bab 12 hingga Bab 16 akan membahas penerapan metode machine learning yang sudah dipelajari menggunakan kasus yang terjadi pada bisnis. Dan Bab 17 hingga Bab 21 akan membahas reporting, proses berkala menggunakan scheduler, web scraping, visualisasi interaktif hingga membuat sebuah dashboard.

Yang tidak dibahas di buku ini

Dalam buku ini tidak akan dibahas secara detail dari suatu teori atau algoritma. Juga tidak akan membahas teori statistika, peluang, ataupun bisnis yang digunakan secara mendalam. Pembuatan model dengan tunning hyperparameter juga tidak akan dibahas di buku ini.

Package yang digunakan

Untuk pengenalan terhadap R akan menggunakan base R, yang sudah ada ketika Anda selesai menginstallnya tanpa perlu install package tambahan di Bab 2 dan Bab 3. Di bab selanjutnya akan menggunakan package tambahan yang umum digunakan. Perlu dicatat bahwa package-package tersebut bisa saja berubah sesuai dengan penyesuaian yang dilakukan oleh pengembangnya. Maka dari itu buku ini juga akan diperbarui ketika memungkinkan.

rvest, nycflights13, shiny, tidyverse, dplyr, tidyr, stringr, ggplot2, bs4Dash, shinyalert, shinyjs, shinymanager