Asal-Usul Data Mining

Artikel ini q kutip dari file ppt-nya mas Taufiq Hidayat, MCS.
Machine Learning/ Pengenalan Pola + Statistik/ai + DBS = Data Mining

Kenapa data harus di mining?
Karena data kalo kelamaan bisa numpuk dan cuma tersimpan di data warehouse (gudang data). Sayang kan kalo data cuma numpuk tanpa arti,, jadi sampah aja n menuh-menuhin space hdd?! Padahal, di dalam tumpukan or timbunan data itu ada banyak informasi yang bermanfaat. Nah, dengan data mining bisa dihasilkan informasi pada tumpukan data tersebut tanpa harus nganalisa secara manual,, dibandingin gitu antar data,, disort dan search satu2,,, kapan kelarnya???? Lama!!! udah gitu, kalo manual mah kemungkinan ada data yang kelewat untuk dianalisis.
Metode Data Mining 1 — Prediksi
- Menggunakan beberapa variable untuk memprediksi suatu nilai yang akan datang
- Proses2 yang ada di metode prediksi :
- Klasifikasi : Proses untuk menemukan model/fungsi yang menjelaskan/membedakan konsep (kelas data) untuk memprediksi kelas dari objek yang labelnya tidak diketahui
- contoh : Mendeteksi Penipuan – memprediksi kasus kecurangan credit card
- pendekatan :
- Dengan transaksi credit card, lihat informasi dari atribut account holder : kapan customer membeli, dengan cara apa dia membayar, sesering apa membayar tepat waktu?
- Namai/tandai setiap transaksi,, mana yang curang dan mana yang baik —> atribut class
- Pelajari model utk class transaksi
- Model nomor 3 digunakan untuk mendeteksi kecurangan dengan meneliti setiap transaksi credit card apad tiap account.
- Decision Tree : salah satu model klasifikasi yang mudah diinterpretasikan
- contoh :
- identifikasi pada pembeli komputer
- contoh :
- Analisis Time Series
- Regresi : Memetakan data dengan prediksi atribut bernilai real
- contoh :
- Prediksi jumlah penjualan produk baru pada pengeluaran iklan
- Prediksi kecepatan memutar pada fungsi temperatur, tekanan udara
- contoh :
- Prediksi
- Jaringan Saraf Tiruan
- Klasifikasi : Proses untuk menemukan model/fungsi yang menjelaskan/membedakan konsep (kelas data) untuk memprediksi kelas dari objek yang labelnya tidak diketahui
KDD (Knowledge Discovery in Database)
- Data Cleaning :
- membuang noise (kesalahan yang terjadi secara acak/ karena variasi dalam pengukuran variable)
- membuang inconsistence data
- menangani missing value (nilai yang hilang)
- “Pada umumnya dalam database memiliki isian yang tidak sempurna, seperti data hilang, invalid data, atribut yang tidak relevan Atribut yang tidak relevan sebaiknya dibuang, karena akan mengurangi akurasi dari hasil mining” (indo-dm)
- Data Integration : menggabungkan database dari beberapa sumber yang berbeda
- “Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan bahkan menyesatkan pengambilan aksi nanatinya. Contoh, intergrasi data berdasarkan jenis produk ternyata menggabungkan produk dari kategori yang berbeda maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada.”(indo-dm)
- Data Selection : menyeleksi data yang dibutuhkan dan sesuai dengan analisis proses data mining yang disimpan dalam suatu berkas yang terpisah dari database operasional, menciptakan himpunan data target, memilih himpunan data tersebut
- Data Transformation : mengubah data menjadi bentuk yang sesuai dengan data mining
- “Beberapa teknik dami membutuhkan format yang khusus sebelum bisa diaplikasikan. Contoh, teknik analisis asosiasi dan clustering hanya bisa menerima input data kategorial. Karena itu, data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval (proses binning). Disini juga dilakukan pemilihan data yang diperlukan oleh teknik yang dipakai. ” (indo-dami)
- Data mining : mengolah data menjadi pola2 informasi
- Pattern Evaluation : mengevaluasi pola2 untuk mendapatkan pola yang bernilai
- Knowledge Presentation : mempresentasikan pengetahuan dari pola2 tersebut
Ta’aruf sama Data Mining
Awal mulany ak kenalan sama data mining,, gini.. waktu ak les oracle d Telkom PDC,, guru lezku Pa John ngebahas tentang data mining alias Dami… ummm, apaan tuh data mining? tambang data? diapain dan buat ap??? …
trus dijelasin deh,, oh, data mining itu mengolah kumpulan data dari database berskala besarrrr yang disimpan dalam gudang data,, diolah gt pake engine data mining,,, and dihasilkan pola2 yang berarti informasi penting yang sebelumnya informasi tersebut tidak diketahui kalo aja data2 itu gak di mining.. getho.. Read more »
-
Recent
- Buah KESOMBONGAN
- long trip to ‘kawah putih’ ciwidey
- semakin kecil, semakin terang cahayanya
- beRibaDah yuk? jaNgan banyak aLasaN…!
- i think i can’t leave them
- Mati itu terlalu sakit, di dalam kubur sangatlah sempit
- BAHAYA TIDUR PAGI
- kesiangan!!!!
- Sampaikan kami pada Ramadhan-Mu Ya Allah…
- have i changed?!!!
- Multiple Sclerosis
- me and my self only,, i love my self
-
Links
-
Archives
- November 2009 (1)
- September 2009 (4)
- August 2009 (18)
-
Categories
-
RSS
Entries RSS
Comments RSS

