Text
SKRIPSI DETEKSI KEMIRIPAN JUDUL SKRIPSI SECARA KONTEKSTUAL DENGAN INDOBERT
Deteksi kemiripan judul skripsi merupakan aspek penting dalam dunia
akademik karena dapat membantu meminimalkan potensi penelitian berulang.
Proses identifikasi kemiripan tidak dapat hanya mengandalkan metode berbasis
kesamaan kata secara leksikal, sebab pendekatan tersebut belum mampu
menangkap makna kontekstual secara menyeluruh. Penelitian ini bertujuan
mengembangkan model untuk mendeteksi kemiripan antara judul skripsi secara
semantik menggunakan pendekatan klasifikasi biner. Dataset dikembangkan
dengan membandingkan dua judul skripsi dan pelabelan dengan menghitung
tingkat kemiripan semantiknya menggunakan BERTScore. IndoBERT sebagai
model berbasis arsitektur Transformers digunakan untuk lebih memahami konteks
dari judul, kemudian dilakukan Fine-Tuning untuk membedakan apakah dua judul
terindikasi mirip (1) atau tidak (0). Penelitian dilakukan dengan pendekatan CRISP
DM dengan tahapan mulai dari Pengumpulan Data, Data Preparation, Pemodelan,
Evaluasi, hingga Deployment menggunakan Gradio. Model “indobert-base
uncased” dari IndoLEM yang dilatih pada 3168 baris data pelatihan, menggunakan
parameter batch size 64, learning rate 3e-5, loss function Sparse Categorical Cross
Entropy, dan optimizer Adam menghasilkan Accuracy 96,57%, Precision 98,83%,
Recall 94,56%, dan F1-score sebesar 96,47% pada 990 baris data uji.
Tidak tersedia versi lain