Implementasi Metode TextRank dan Named Entity Recognition Untuk Ekstraksi Kata Kunci Pada Media Online Berita

Penulis

  • Muhammad Theofany Aulia Anwar Universitas Brawijaya, Malang
  • Satrio Hadi Wijoyo Universitas Brawijaya, Malang
  • Widhy Hayuhardhika Nugraha Putra Universitas Brawijaya, Malang

DOI:

https://doi.org/10.25126/justsi.v5i1.401

Abstrak

Kata kunci adalah bagian penting untuk memahami isi berita secara singkat dan mendukung indeksasi serta pencarian, proses identifikasi kata kunci yang efisien dan akurat sering kali menjadi tantangan dalam pengelolaan konten digital. Penelitian ini bertujuan untuk meningkatkan proses identifikasi kata kunci yang relevan dalam artikel berita online dengan memanfaatkan metode TextRank dan Named Entity Recognition (NER). NER digunakan untuk mengenali dan mengklasifikasikan entitas penting dalam teks, sementara TextRank, yang merupakan algoritma berbasis graf, digunakan untuk menentukan pentingnya kata berdasarkan struktur jaringan mereka. Gabungan dari kedua metode ini diharapkan dapat meningkatkan akurasi ekstraksi kata kunci. Teknik NER yang diimplementasikan adalah model bahasa Indonesia pada spaCy, yang dilatih khusus untuk tujuan ini. Selain itu, TF-IDF (Term Frequency-Inverse Document Frequency) digunakan untuk pembobotan kata dalam penerapan algoritma TextRank. Pada penelitian sebelumnya telah dilakukan ekstraksi kata kunci menggunakan kombinasi TextRank dan NER dalam bahasa Inggris, penelitian ini mengarah pada penggunaan kedua metode tersebut untuk mengekstraksi kata kunci dalam bahasa Indonesia, menggunakan data berita online dari Times Indonesia. Dari penelitian ini dapat dibuktikan, kinerja gabungan metode TextRank dan NER dalam mengekstraksi kata kunci dari artikel berita lebih baik dibandingkan dengan penggunaan TextRank secara tunggal. Hal ini dapat dilihat dari nilai rata-rata recall, precision, f-measure, dan accuracy yang dihasilkan dari eksperimen dengan 300 artikel dan weight multiplier 2 dengan nilai masing-masing 0.652, 0.645, 0.648, 0.505. Secara kesimpulan, integrasi TextRank dan NER dapat secara signifikan meningkatkan kualitas ekstraksi kata kunci dari artikel berita online.

##submission.downloads##

Diterbitkan

2024-08-29

Cara Mengutip

Theofany Aulia Anwar, M. ., Hadi Wijoyo, S. ., & Hayuhardhika Nugraha Putra, W. . (2024). Implementasi Metode TextRank dan Named Entity Recognition Untuk Ekstraksi Kata Kunci Pada Media Online Berita. Jurnal Sistem Informasi, Teknologi Informasi, Dan Edukasi Sistem Informasi, 5(1), 34-41. https://doi.org/10.25126/justsi.v5i1.401

Terbitan

Bagian

Artikel