Analisa Metode Boolean dalam Machine Learning untuk Pencarian Dokumen Batan Dataset dengan Algoritma K-Nn dan TF-IDF
Abstract
Salah satu sarana untuk memenuhi kebutuhan pencarian informasi adalah dengan mesin pencarian dokumen. Mesin pencarian informasi dokumen adalah serangkaian program komputer yang dirancang untuk melakukan pencarian dokumen yang terdapat di dalam koleksi dokumen atau dataset. Penelitian ini memiliki tujuan untuk memperoleh kecocokan sumber informasi dalam pencarian yang bersifat eksplorasi yang efektif. Untuk mencari sumber keaktifan data atau konten dalam pencarian publikasi dataset Batan (Badan Tenaga Nuklir Nasional) untuk menemukan topik tertentu. Penelitian ini menggunakan pendekatan metode Boolean dan ekstraksi TF-IDF (Term Frequency-Inverse Document Frequency) dengan membandingkan hasil query. Metode Boolean menggunakan notasi AND dan NOT, namun belum bisa untuk memperingkat dokumen yang dihasilkan. Maka dari itu, menggunakan metode Extend Boolean merupakan gabungan keduanya. Terdapat dua proses yang dilakukan pada penelitian ini, yaitu proses penentuan indeks dan proses pencarian. Proses penentuan indeks mengekstraksi dokumen yang telah dilakukan proses preprocessing kemudian disimpan ke dalam database. Proses pencarian data dengan menggunakan TF-IDF menghasilkan daftar dokumen yang terurut. Hal ini dapat diketahui berdasarkan hasil pengujian dokumen yang relevan pada dokumen publikasi Batan dataset. Klasifikasi yang dibentuk dengan bantuan algoritma K-Nn dengan jenis kata kunci yang serupa untuk menumakn kata yang berdekatan satu sama lain dan mendapatkan hasil akurasi sebesar 84%.
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2024 Jurnal Teknik Informatika dan Desain Komunikasi Visual

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.