Skip to main content

Apa saja proses tahapan data mining?

Banyak teknik dan metode yang ada untuk melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama data mining: Predictive ModelingDiscovery, dan Deviation Detection.
Data mining merupakan salah satu dari rangkaian Knowledge discovery In Database (KDD).
KDD berhubungan dengan tekhnik integrasi dan penemuan ilmiah, interpretasi dan visualisasi dari pola-pola sejumlah data.
Serangkaian proses tahapan data mining tersebut memiliki tahap sebagai berikut (Tan, 2004):

  1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise)
  2. Integrasi data (penggabungan data dari beberapa sumber)
  3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
  4. Aplikasi teknik Data Mining, proses ekstraksi pola dari data yang ada
  5. Evaluasi pola yang ditemukan (proses interprestasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan)
  6. Presentasi pengetahuan (dengan teknik visualisasi)

Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Langkah terakir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna.

Knowledge Discovery In Database (KDD)

Knowledge Discovery In Database (KDD) sendiri adalah proses yang dibantu oleh komputer untuk mencari dan meneliti sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna. Data mining tools memperkirakan perilaku dan tren masa depan, memungkinkan bisnis untuk menciptakan keputusan yang proaktif dan menurut pengetahuan. Data mining tools dapat menjawab persoalan bisnis yang secara tradisional terlampau lama guna diselesaikan. Data mining tools menjelajah database untuk menggali pola tersembunyi, menemukan infomasi yang prediktif yang barangkali dilewatkan semua pakar sebab berada di luar ekspektasi mereka.
Perbedaan antara data mining dengan KDD (knowledge discovery in data base), yaitu data mining menggunakan berbagai perangkat lunak untuk menemukan pola dan relasi agar dapat digunakan untuk membuat prediksi dengan tepat sedangkan KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisai dari pola-pola sekumpulan data.
Referensi:
Judul : Data Mining
http://en.wikipedia.org/wiki/Data_mining
Penulis : Jiawei Han, Micheline Kamber
Judul : Data Mining: Concept and Techniques
Publisher : Academic Press Sand Diego, CA, 2001

Konsultasi Sekarang
Hmm, dilihat dari raut wajahnya sepertinya kaka lagi pusing masalah skripsi / tesis nih. Lagi bingung dimana kak? Belum punya judul? Stuck di proposal? Atau coding/ Algoritma? Klik di sini untuk mendapatkan bantuan dan konsultasi GRATIS.