Pengantar R

Apa itu R dan RStudio?

R adalah bahasa pemrograman yang digunakan untuk komputasi statistik dan visualisasi data. Salah satu keunggulan R adalah gratis dan open source. RStudio adalah Integrated Development Environment (IDE) untuk mempermudah pengguna dalam menggunakan R. Beberapa keunggulan R dibandingkan program komputasi yang lain yaitu:

  • Gratis dan open source

  • Tersedia banyak package

  • Mudah dalam melakukan transformasi dan pemrosesan data

  • Mempu menghasilkan banyak grafik yang menarik

  • Reproducible report

  • Dapat membuat aplikasi interaktif/ dashboard berbasis web

Dalam isu penelitian global saat ini kita menjumpai salah satu proses dalam penelitian yang disebut dengan reproducible research. Reproducible research adalah proses penelitian seyogyanya dapat di reproduksi ulang oleh penelitian atau oleh peneliti yang lain. Dalam konteks ini dapat menyediakan platform yang sesuai dengan kebutuhan proses reproducible research.

R adalah bahasa pemrograman, sedangkan RStudio adalah antarmuka pengguna grafis (GUI) untuk R.

Berikut ini penjelasan singkat mengenai apa itu R

Download dan Install R

R dapat di download melalui install-r. Pilih versi R sesuai dengan komputer yang Anda miliki, kemudian ikuti petunjuk untuk menyelesaikan instalasi R.

Packages dan Functions dalam R

Tersedia ribuan packages yang dapat digunakan untuk menjalankan tugas tertentu dan memungkinkan untuk menemukan, menggunakan, serta memperbaruinya dengan mudah. Setiap packages memuat fungsi dan beberapa data yang bisa untuk digunakan untuk belajar/praktik. Functions merupakan kumpulan perintah untuk melakukan pekerjaan.

Cara mengetahui nama dan deskripsi singkat packages yang tersedia dalam R bisa dengan membuka packages-r. Selain itu, informasi tentang paket R juga dapat dilihat dengan menjalankan perintah library (help = "stats"). Perintah tersebut akan memberikan daftar fungsi-fungsi yang ada pada paket stats.

Fungsi Dasar R

Kalkulator

R memiliki fungsi dasar sebagai kalkulator. Kita bisa menggunakan R untuk melakukan operasi matematika seperti penjumlahan, pengurangan, perkalian, pembagian, dan sebagainya. Di bawah ini merupakan contoh penggunaan R sebagai kalkulator sederhana.

5+3
[1] 8
(12*3)^2+90/3
[1] 1326
10-2+(12*15)
[1] 188
Tips

R bisa digunakan sebagai kalkulator layaknya kalkulator scientific

Membuat vektor

Vektor harus memiliki tipe data yang sama, baik semua numerik atau semua karakter.

x <- c(1:5)
x
[1] 1 2 3 4 5
y <- c("a", "b", "c", "d", "e")
y
[1] "a" "b" "c" "d" "e"

vektor x merupakan vektor dengan tipe data numerik, sedangkan vektor y merupakan vektor dengan tipe data karakter.

math <- c(350, 400, 480, 501, 380)
math
[1] 350 400 480 501 380
new <- c(360, 420, 500, 450, 300)
new_math <- c(math, new)
new_math
 [1] 350 400 480 501 380 360 420 500 450 300

Missing value

names(new_math) <- c("a", "b", "c", "d", "e", "f", "g", "h", "i")

new_math
   a    b    c    d    e    f    g    h    i <NA> 
 350  400  480  501  380  360  420  500  450  300 
is.na(new_math)
    a     b     c     d     e     f     g     h     i  <NA> 
FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE 
is.na(names(new_math))
 [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE

Missing value dalam data dapat dihapus menggunakan fungsi na.omit().

data <- na.omit(new_math)

Matriks

y <- matrix(c(1:6), nrow = 3)
y
     [,1] [,2]
[1,]    1    4
[2,]    2    5
[3,]    3    6
y <- matrix(c(1:6), ncol = 2)
y
     [,1] [,2]
[1,]    1    4
[2,]    2    5
[3,]    3    6

Membuat dataset

Selain sebagai kalkulator, R juga bisa digunakan untuk membuat dataset. Fungsi yang digunakan untuk membuat dataset di dalam R adalah fungsi c(). Kemudian fungsi yang digunakan untuk membuat data frame adalah data.frame(). Berikut ini merupakan contoh kode untuk membuat dataset.

data_1 <- c(89, 90, 78, 69, 93, 85, 88, 75, 69, 71)
data_2 <- c(85, 71, 78, 100, 90, 87, 69, 63, 58, 70)

data_3 <- data.frame(data_1, data_2)

data_3
   data_1 data_2
1      89     85
2      90     71
3      78     78
4      69    100
5      93     90
6      85     87
7      88     69
8      75     63
9      69     58
10     71     70

data_3 merupakan data frame yang terdiri dari data_1 dan data_2.

Membaca data

Fungsi R yang digunakan untuk membaca data harus menyesuaikan format data yang akan dipakai. Misalnya read.csv merupakan fungsi untuk memanggil data dengan format .csv. Selain format .csv, terdapat beberapa data yang memiliki format berbeda, seperti .sas, .sav, .xls, dan lain sebagainya. Fungsi read harus menyesuaikan format data yang digunakan supaya terbaca oleh kode atau perintah.

pisa <- read.csv("dataset/pisa_idn_sample.csv")

Menampilkan data

head(pisa)
  X CNTRYID CNTSCHID age sex    ESCS          SES     MATH growth
1 1     360 36000195  16   0  0.0585  1.447420060 466.4017      1
2 2     360 36000038  16   1 -2.2463 -0.765447819 306.7464      0
3 3     360 36000340  16   0 -2.1281 -0.651962491 496.6418      1
4 4     360 36000184  16   1 -1.4426  0.006194803 298.4413      0
5 5     360 36000341  16   1 -0.4207  0.987334028 349.7686      0
6 6     360 36000263  16   0 -1.4396  0.009075141 463.1726      1

Menampilkan struktur data

str(pisa)
'data.frame':   1297 obs. of  9 variables:
 $ X       : int  1 2 3 4 5 6 7 8 9 10 ...
 $ CNTRYID : int  360 360 360 360 360 360 360 360 360 360 ...
 $ CNTSCHID: int  36000195 36000038 36000340 36000184 36000341 36000263 36000331 36000124 36000313 36000020 ...
 $ age     : int  16 16 16 16 16 16 16 16 16 16 ...
 $ sex     : int  0 1 0 1 1 0 0 1 1 0 ...
 $ ESCS    : num  0.0585 -2.2463 -2.1281 -1.4426 -0.4207 ...
 $ SES     : num  1.44742 -0.76545 -0.65196 0.00619 0.98733 ...
 $ MATH    : num  466 307 497 298 350 ...
 $ growth  : int  1 0 1 0 0 1 1 0 1 0 ...

Membuat plot

pisa |> 
  select(ESCS, MATH) |> 
  plot()

Quiz

  1. Fungsi menampilkan 6 baris data?



  1. Fungsi untuk membuat data frame?



  1. Package untuk membaca data excell?



Presentasi

View slides in full screen