Analisa Metode Boolean dalam Machine Learning untuk Pencarian Dokumen Batan Dataset dengan Algoritma K-Nn dan TF-IDF

Authors

  • Tresi Aprilia Universitas Selamat Sri , Universitas Selamat Sri
  • Taufik Hidayat Universitas Selamat Sri
  • Muhammad Khozin Universitas Selamat Sri

Abstract

Salah satu sarana untuk memenuhi kebutuhan pencarian informasi adalah dengan mesin pencarian dokumen. Mesin pencarian informasi dokumen adalah serangkaian program komputer yang dirancang untuk melakukan pencarian dokumen yang terdapat di dalam koleksi dokumen atau dataset. Penelitian ini memiliki tujuan untuk memperoleh kecocokan sumber informasi dalam pencarian yang bersifat eksplorasi yang efektif. Untuk mencari sumber keaktifan data atau konten dalam pencarian publikasi dataset Batan (Badan Tenaga Nuklir Nasional) untuk menemukan topik tertentu. Penelitian ini menggunakan pendekatan metode Boolean dan ekstraksi TF-IDF (Term Frequency-Inverse Document Frequency) dengan membandingkan hasil query. Metode Boolean menggunakan notasi AND dan NOT, namun belum bisa untuk memperingkat dokumen yang dihasilkan. Maka dari itu, menggunakan metode Extend Boolean merupakan gabungan keduanya. Terdapat dua proses yang dilakukan pada penelitian ini, yaitu proses penentuan indeks dan proses pencarian. Proses penentuan indeks mengekstraksi dokumen yang telah dilakukan proses preprocessing kemudian disimpan ke dalam database. Proses pencarian data dengan menggunakan TF-IDF menghasilkan daftar dokumen yang terurut. Hal ini dapat diketahui berdasarkan hasil pengujian dokumen yang relevan pada dokumen publikasi Batan dataset. Klasifikasi yang dibentuk dengan bantuan algoritma K-Nn dengan jenis kata kunci yang serupa untuk menumakn kata yang berdekatan satu sama lain dan mendapatkan hasil akurasi sebesar 84%.

Downloads

Download data is not yet available.

Downloads

Published

2024-07-31

How to Cite

Analisa Metode Boolean dalam Machine Learning untuk Pencarian Dokumen Batan Dataset dengan Algoritma K-Nn dan TF-IDF . (2024). Jurnal Teknik Informatika Dan Desain Komunikasi Visual, 3(2), 158-165. https://jtd.uniss.ac.id/index.php/journals/article/view/91