fbpx

Transformasi Data Mining

By November 27, 2019 Algoritma, Data Mining, Landasan Teori

Transformasi data adalah merubah skala  data kedalam bentuk lain sehingga data memiliki distribusi yang diharapkan. Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita merubah semua data untuk menjaga perbedaan perbedaan antar data relatif tetap. Jika data kita memiliki lebih dari satu variabel, maka kita memiliki lebih dari satu variabel, maka kita mentransformasikan semua variabel agar hubungan antar data tidak berubah. Ada beberapa jenis transformasi data yang sering digunakan, diantaranya :

  1. Transformasi kuadrat, berarti kita mengoprasikan pangakat dua data variabel.
  2. Transformasi kubik, berarti kita mengoprasikan pangkat tiga pada data variable asli.
  3. Transformasi akar, berarti kita mnegoprasikan akar pada data variabel asli. Berguna untuk memperbaiki data yang terdistribusi positive skewness dan unequal viriance (data tidak memenuhi asumsi kehomogenan). Dapat digunakan untuk data persentase, jika nilainya kebanyakan kecil maka sebaiknya gunakan transformasi akar.
  4. Transformasi invers/kebalikan, melakukan operasi balikan baik balikan pangkat atau pun tidak seperti 1/x. 1/(x^2), dan lain-lain.
  5. Transformasi logaritma, berarti kita mengoprasikan data asli kebentuk logaritma. Digunakan untuk data yang terdistribusi positive skewness dan unewual variance. Ada beberapa hal yang perlu diperhatikan, Jika pada data asli menunjukan nilai kurang dari 10 atau mendekati 0, maka sebaiknya dikalian 10 lalu dilogaritmakan atau log(10x).
  6. Transformasi Arcsin, berarti kita mnegoprasikan data asli kebentuk Arcsin (balikan sinus). Disebut juga transformasi Angular yang digunakan bila data dinyatakan dalam bentuk percentase atau proporsi. Biasanya memiliki sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, Apabila data asli memiliki nilai antara 30% – 70% maka tidak membutuhkan transformasi; bila memiliki nilai 0%-3% dan 70%-100% maka lakukan transformasi Arcsin dan bila banyak bernilai nol maka gunakan transformasi arcsin akar(%+0,5).
  7. Transformasi invers skor, digunakan dalam data yang terdapat nilai negatif dan akan menggunakan transformasi berikutnya. Berguna untuk memperbaiki data yang terdistribusi positive Skew dan Uneqal Variance.

Pada umumnya untuk menentukan jenis transformasi mana yang paling tepat digunakan adalah dengan memplot data kira dan melihat trend dari data tersebut atau berdasarkan histogram dari data tersebut. Berikut adalah beberapa bentuk trend dari plot data/histogram :

normal8

Setelah mengetahui pola trend data, maka data dapat ditransformasi berdasarkan karakteristiknya, Sebagai berikut

Bentuk Pola DataBentuk Jenis Transformasi
Moderate positiveKuadrat (x²)
Substansial positiveLogaritma (Ln(x))
Substansial Positive jika data mengandung nilai nolLogaritma (Ln( x + 1))
Moderate NegativeKuadrat dari ( k – x )
Substansial negativeLogaritma (Ln( k – x))
Severe negativeKuadrat dari ( k- x)

 

 

Open chat
1
Hei ka, perkenalkan saya Amel salah satu pembimbing skripsi di Dosbing.id. Hmm, dilihat dari raut wajah kakanya, sepertinya kaka lagi pusing skripsi nih. Chat saya untuk dibantu skripsinya dari Pencarian Judul sampai Lulus.
Powered by