Skip to main content

Transformasi Data Mining

Transformasi data adalah merubah skala  data kedalam bentuk lain sehingga data memiliki distribusi yang diharapkan. Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita merubah semua data untuk menjaga perbedaan perbedaan antar data relatif tetap. Jika data kita memiliki lebih dari satu variabel, maka kita memiliki lebih dari satu variabel, maka kita mentransformasikan semua variabel agar hubungan antar data tidak berubah. Ada beberapa jenis transformasi data yang sering digunakan, diantaranya :

  1. Transformasi kuadrat, berarti kita mengoprasikan pangakat dua data variabel.
  2. Transformasi kubik, berarti kita mengoprasikan pangkat tiga pada data variable asli.
  3. Transformasi akar, berarti kita mnegoprasikan akar pada data variabel asli. Berguna untuk memperbaiki data yang terdistribusi positive skewness dan unequal viriance (data tidak memenuhi asumsi kehomogenan). Dapat digunakan untuk data persentase, jika nilainya kebanyakan kecil maka sebaiknya gunakan transformasi akar.
  4. Transformasi invers/kebalikan, melakukan operasi balikan baik balikan pangkat atau pun tidak seperti 1/x. 1/(x^2), dan lain-lain.
  5. Transformasi logaritma, berarti kita mengoprasikan data asli kebentuk logaritma. Digunakan untuk data yang terdistribusi positive skewness dan unewual variance. Ada beberapa hal yang perlu diperhatikan, Jika pada data asli menunjukan nilai kurang dari 10 atau mendekati 0, maka sebaiknya dikalian 10 lalu dilogaritmakan atau log(10x).
  6. Transformasi Arcsin, berarti kita mnegoprasikan data asli kebentuk Arcsin (balikan sinus). Disebut juga transformasi Angular yang digunakan bila data dinyatakan dalam bentuk percentase atau proporsi. Biasanya memiliki sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, Apabila data asli memiliki nilai antara 30% – 70% maka tidak membutuhkan transformasi; bila memiliki nilai 0%-3% dan 70%-100% maka lakukan transformasi Arcsin dan bila banyak bernilai nol maka gunakan transformasi arcsin akar(%+0,5).
  7. Transformasi invers skor, digunakan dalam data yang terdapat nilai negatif dan akan menggunakan transformasi berikutnya. Berguna untuk memperbaiki data yang terdistribusi positive Skew dan Uneqal Variance.

Pada umumnya untuk menentukan jenis transformasi mana yang paling tepat digunakan adalah dengan memplot data kira dan melihat trend dari data tersebut atau berdasarkan histogram dari data tersebut. Berikut adalah beberapa bentuk trend dari plot data/histogram :
normal8
Setelah mengetahui pola trend data, maka data dapat ditransformasi berdasarkan karakteristiknya, Sebagai berikut

Bentuk Pola Data Bentuk Jenis Transformasi
Moderate positive Kuadrat (x²)
Substansial positive Logaritma (Ln(x))
Substansial Positive jika data mengandung nilai nol Logaritma (Ln( x + 1))
Moderate Negative Kuadrat dari ( k – x )
Substansial negative Logaritma (Ln( k – x))
Severe negative Kuadrat dari ( k- x)

 
 

Konsultasi Sekarang
Hmm, dilihat dari raut wajahnya sepertinya kaka lagi pusing masalah skripsi / tesis nih. Lagi bingung dimana kak? Belum punya judul? Stuck di proposal? Atau coding/ Algoritma? Klik di sini untuk mendapatkan bantuan dan konsultasi GRATIS.