Post 2: CRISP - DM (Cross-Industry Standart Process Data Mining)
Pengertian CRISP - DM
CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah kerangka kerja yang digunakan dalam pemrosesan data untuk membantu pengguna memahami dan mengelola proyek data mining secara sistematis.
CRISP-DM terdiri dari enam tahap utama:
1. Pemahaman Masalah Bisnis: Memahami tujuan bisnis dari proyek dan kebutuhan data yang diperlukan.
2. Pemahaman Data: Mempelajari data yang tersedia dan memahami kualitas, distribusi, dan karakteristik data.
3. Persiapan Data: Membersihkan dan mempersiapkan data untuk pemodelan, termasuk transformasi, penghapusan outlier, dan pemilihan fitur.
4. Pemodelan: Membangun model atau teknik analisis data yang sesuai untuk memecahkan masalah bisnis yang ditentukan.
5. Evaluasi: Mengevaluasi model atau teknik analisis data dan mengukur seberapa baik itu bekerja untuk memecahkan masalah bisnis.
6. Penerapan: Mengimplementasikan solusi dan memastikan bahwa model atau teknik analisis data berfungsi dengan baik dalam lingkungan produksi.
Fungsi CRISP-DM:
1. Prediksi (Prediction): Menemukan pola untuk memprediksi variabel lain yang tidak diketahui.
2. Deskripsi (Description): Menemukan karakteristik penting dari data.
3. Klasifikasi (Classification): Membuat model untuk menggambarkan kelas atau konsep dari data.
CRISP-DM menjadi standar yang banyak digunakan dalam pengembangan proyek data mining dan knowledge discovery.

Komentar
Posting Komentar