Proyek ini dikerjakan sebagai bagian dari perjalanan saya sebagai AI Engineer Cohort di Pijak in collaboration with IBM Skillbuild dan diselesaikan melalui kurikulum Dicoding. Fokus utama proyek ini adalah mengidentifikasi pola tersembunyi dalam data melalui teknik Unsupervised Learning dan memvalidasinya menggunakan Supervised Learning.
- Language: Python
- Libraries: Pandas, Scikit-Learn, NumPy, Matplotlib
- Environment: Jupyter Notebook / Google Colab
- Preprocessing & Cleaning: Mengolah data mentah menggunakan scaling dan encoding (disimpan dalam
df_used). - Dimensionality Reduction: Menerapkan PCA untuk efisiensi komputasi tanpa menghilangkan variansi data penting.
- Clustering: Mengelompokkan data untuk membentuk label target baru.
- Classification & Evaluation: Membangun model Decision Tree untuk memprediksi klaster dan mengevaluasinya menggunakan Precision, Recall, dan F1-Score.
notebook_proyek.ipynb: Dokumentasi kode lengkap dari awal hingga evaluasi.data_clustering.csv: Dataset hasil preprocessing yang siap digunakan untuk modeling.
Teknik deteksi pola dan anomali dalam proyek ini sangat relevan untuk diimplementasikan dalam pengawasan integritas sistem dan keamanan operasional digital.