Post 2: CRISP - DM (Cross-Industry Standart Process Data Mining)

Pengertian CRISP - DM  


CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah kerangka kerja yang digunakan dalam pemrosesan data untuk membantu pengguna memahami dan mengelola proyek data mining secara sistematis. 

CRISP-DM terdiri dari enam tahap utama:

1.    Pemahaman Masalah Bisnis: Memahami tujuan bisnis dari proyek dan kebutuhan data yang diperlukan.

2.    Pemahaman Data: Mempelajari data yang tersedia dan memahami kualitas, distribusi, dan karakteristik data.

3.    Persiapan Data: Membersihkan dan mempersiapkan data untuk pemodelan, termasuk transformasi, penghapusan outlier, dan pemilihan fitur.

4.    Pemodelan: Membangun model atau teknik analisis data yang sesuai untuk memecahkan masalah bisnis yang ditentukan.

5.    Evaluasi: Mengevaluasi model atau teknik analisis data dan mengukur seberapa baik itu bekerja untuk memecahkan masalah bisnis.

6.    Penerapan: Mengimplementasikan solusi dan memastikan bahwa model atau teknik analisis data berfungsi dengan baik dalam lingkungan produksi.


Fungsi CRISP-DM:

1.    Prediksi (Prediction): Menemukan pola untuk memprediksi variabel lain yang tidak diketahui.

2.         Deskripsi (Description): Menemukan karakteristik penting dari data.

3.        Klasifikasi (Classification): Membuat model untuk menggambarkan kelas atau konsep dari data.

CRISP-DM menjadi standar yang banyak digunakan dalam pengembangan proyek data mining dan knowledge discovery. 

Komentar