Skip to content

dezssertsoul/customer-segmentation-clustering

Repository files navigation

Machine Learning: Clustering & Dimensionality Reduction Project

Project Overview

Proyek ini dikerjakan sebagai bagian dari perjalanan saya sebagai AI Engineer Cohort di Pijak in collaboration with IBM Skillbuild dan diselesaikan melalui kurikulum Dicoding. Fokus utama proyek ini adalah mengidentifikasi pola tersembunyi dalam data melalui teknik Unsupervised Learning dan memvalidasinya menggunakan Supervised Learning.

Tech Stack

  • Language: Python
  • Libraries: Pandas, Scikit-Learn, NumPy, Matplotlib
  • Environment: Jupyter Notebook / Google Colab

Workflow

  1. Preprocessing & Cleaning: Mengolah data mentah menggunakan scaling dan encoding (disimpan dalam df_used).
  2. Dimensionality Reduction: Menerapkan PCA untuk efisiensi komputasi tanpa menghilangkan variansi data penting.
  3. Clustering: Mengelompokkan data untuk membentuk label target baru.
  4. Classification & Evaluation: Membangun model Decision Tree untuk memprediksi klaster dan mengevaluasinya menggunakan Precision, Recall, dan F1-Score.

File Structure

  • notebook_proyek.ipynb: Dokumentasi kode lengkap dari awal hingga evaluasi.
  • data_clustering.csv: Dataset hasil preprocessing yang siap digunakan untuk modeling.

Future Insights

Teknik deteksi pola dan anomali dalam proyek ini sangat relevan untuk diimplementasikan dalam pengawasan integritas sistem dan keamanan operasional digital.

About

Implementasi Clustering dan Principal Component Analysis (PCA) menggunakan Python. Proyek ini mengeksplorasi pengelompokan data dan validasi model klasifikasi sebagai bagian dari perjalanan AI Engineer Cohort di Pijar

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors