Transformasi data adalah merubah skala data kedalam bentuk lain sehingga data memiliki distribusi yang diharapkan. Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita merubah semua data untuk menjaga perbedaan perbedaan antar data relatif tetap. Jika data kita memiliki lebih dari satu variabel, maka kita memiliki lebih dari satu variabel, maka kita mentransformasikan semua variabel agar hubungan antar data tidak berubah. Ada beberapa jenis transformasi data yang sering digunakan, diantaranya :
- Transformasi kuadrat, berarti kita mengoprasikan pangakat dua data variabel.
- Transformasi kubik, berarti kita mengoprasikan pangkat tiga pada data variable asli.
- Transformasi akar, berarti kita mnegoprasikan akar pada data variabel asli. Berguna untuk memperbaiki data yang terdistribusi positive skewness dan unequal viriance (data tidak memenuhi asumsi kehomogenan). Dapat digunakan untuk data persentase, jika nilainya kebanyakan kecil maka sebaiknya gunakan transformasi akar.
- Transformasi invers/kebalikan, melakukan operasi balikan baik balikan pangkat atau pun tidak seperti 1/x. 1/(x^2), dan lain-lain.
- Transformasi logaritma, berarti kita mengoprasikan data asli kebentuk logaritma. Digunakan untuk data yang terdistribusi positive skewness dan unewual variance. Ada beberapa hal yang perlu diperhatikan, Jika pada data asli menunjukan nilai kurang dari 10 atau mendekati 0, maka sebaiknya dikalian 10 lalu dilogaritmakan atau log(10x).
- Transformasi Arcsin, berarti kita mnegoprasikan data asli kebentuk Arcsin (balikan sinus). Disebut juga transformasi Angular yang digunakan bila data dinyatakan dalam bentuk percentase atau proporsi. Biasanya memiliki sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, Apabila data asli memiliki nilai antara 30% – 70% maka tidak membutuhkan transformasi; bila memiliki nilai 0%-3% dan 70%-100% maka lakukan transformasi Arcsin dan bila banyak bernilai nol maka gunakan transformasi arcsin akar(%+0,5).
- Transformasi invers skor, digunakan dalam data yang terdapat nilai negatif dan akan menggunakan transformasi berikutnya. Berguna untuk memperbaiki data yang terdistribusi positive Skew dan Uneqal Variance.
Pada umumnya untuk menentukan jenis transformasi mana yang paling tepat digunakan adalah dengan memplot data kira dan melihat trend dari data tersebut atau berdasarkan histogram dari data tersebut. Berikut adalah beberapa bentuk trend dari plot data/histogram :
Setelah mengetahui pola trend data, maka data dapat ditransformasi berdasarkan karakteristiknya, Sebagai berikut
Bentuk Pola Data | Bentuk Jenis Transformasi |
Moderate positive | Kuadrat (x²) |
Substansial positive | Logaritma (Ln(x)) |
Substansial Positive jika data mengandung nilai nol | Logaritma (Ln( x + 1)) |
Moderate Negative | Kuadrat dari ( k – x ) |
Substansial negative | Logaritma (Ln( k – x)) |
Severe negative | Kuadrat dari ( k- x) |