Text
SKRIPSI OPTIMASI KLASIFIKASI DATA TIDAK SEIMBANG DENGAN HYBRISMOTE-TOMEK LINKS DAN ALGORITMA RANDOM FOREST PADADATA KELULUSAN MAHASISWA
Kelulusan mahasiswa merupakan aspek penting dalam evaluasi mutu akademik
perguruan tinggi. Kelulusan dapat diprediksi berdasarkan data akademik
mahasiswa, tetapi distribusi yang tidak seimbang antara mahasiswa lulus tepat
waktu, lulus terlambat, dan tidak lulus sering menurunkan kinerja model klasifikasi.
Penelitian ini mengusulkan penggunaan metode Synthetic Minority Oversampling
Technique (SMOTE) dan Hybrid SMOTE-Tomek Links yang dikombinasikan
dengan algoritma Random Forest untuk mengatasi masalah tersebut. Hasil
penelitian menunjukkan bahwa model Random Forest dengan data asli
menghasilkan akurasi 94%, recall pada kelas minoritas (Lulus Terlambat) hanya
38%. Penerapan SMOTE meningkatkan akurasi menjadi 95% serta memperbaiki
recall kelas Lulus Terlambat menjadi 62%. Hybrid SMOTE-Tomek Links
memberikan hasil terbaik dengan akurasi 96%, precision tinggi pada kelas Tidak
Lulus sebesar 95% dan Lulus Terlambat sebesar 100%, serta recall meningkat
signifikan menjadi 95% untuk kelas Tidak Lulus dan 62% untuk kelas Lulus
Terlambat. Kombinasi SMOTE-Tomek Links dan Random Forest terbukti lebih
efektif dalam menangani data tidak seimbang, khususnya dalam meningkatkan
prediksi pada kelas minoritas.
Tidak tersedia versi lain