Created by: Bayu Erfianto
Doctoral School of Informatics, Telkom University, 2025
Bibliometrik analisis dengan Structure Topic Modeling (STM) adalah metode yang digunakan untuk mengidentifikasi dan mengelompokkan topik dalam berdasarkan struktur database publikasi Scopus dengan mempertimbangkan metadata (misalnya, penulis, tahun, atau jenis publikasi). Dengan menambahkan STM pada bibliometrik analisis, maka dapat membantu proses literature review untuk menemukan topik tersembunyi dalam database Scopus, dan juga memahami bagaimana topik-topik tersebut terdistribusi berdasarkan metadata yang tersedia. Sebelum menggunakan aplikasi ini, pengguna harus terlebih dahulu mendonlod file database Scopus berdasarkan keysearch tertentu sesuai topic of interest.
Aplikasi ini merupakan aplikasi versi web dari Systematic Mapping Study (SMS) menggunakan analisis bibliometrik dengan unit analisis author keywords dari database Scopus. Salah satu tujuan analisis bibliometrik adalah membantu mengidentifikasi tren topik penelitian dan memahami bagaimana hubungan antara topik-topik tersebut dalam dalam sebuah database publikasi riset. Aplikasi ini berbasis standalone web browser dengan input database scopus yang sudah didonlod dalam file CSV. Aplikasi ini terdiri dari 5 step: 1. generate wordcloud untuk memvisualisasikan author keywords. 2. Visualisasi paper distribution dalam 10 tahun terakhir. 3. Topic Modeling dengan Algoritma Laten Dirichlet Allocation (LDA). 4. Visualisasi Tren Topic hasil topic modeling dengan LDA. 5. List 20 paper terkait pada database Scopus yang didonlod dengan proportion tertinggi terkait topic yang dibangkitkan oleh LDA.
Bagian ini menampilkan wordcloud sebagai representasi visual dari author keywords yang sering muncul dalam dataset Scopus. Author keyword yang sering muncul akan ditampilkan dengan ukuran lebih besar dibandingkan keyword yang jarang muncul. Wordcloud sering digunakan untuk menganalisis teks secara visual agar mendapatkan gambaran cepat mengenai keyword yang dominan dalam sebuah dokumen, dalam hal ini dataset Scopus.
Paper distribution bertujuan untuk menganalisis dan memahami tren publikasi ilmiah berdasarkan author keywords tertentu dalam 10 tahun terakhir. Grafik dalam stakced bar ini membantu melihat bagaimana jumlah publikasi sesuai key search berkembang dari tahun ke tahun.
Latent Dirichlet Allocation (LDA) adalah salah satu metode probabilistic topic modeling yang digunakan untuk menemukan struktur topik dalam kumpulan teks. LDA mengasumsikan bahwa setiap dokumen (dalam hal ini, daftar author keywords dari publikasi Scopus) merupakan gabungan dari beberapa topik, dan setiap topik memiliki distribusi kata-kata tertentu.
Setiap dokumen merupakan kombinasi dari beberapa topik. Setiap topik terdiri dari sekumpulan kata yang sering muncul bersama dalam konteks tertentu. LDA menggunakan pendekatan unsupervised learning untuk mengelompokkan kata-kata ke dalam topik-topik yang paling mungkin. Untuk keperluan systematic mapping study, LDA cukup powerful dan dapat digunakan untuk menganalisis author keywords dari dataset Scopus, membantu dalam menemukan pola dan tren topik.
Tabel yang dihasilkan dari Topic Modelling menunjukkan hasil ekstraksi topik menggunakan LDA. Setiap baris mewakili satu topik yang ditemukan oleh model LDA. Setiap kolom berisi kata-kata yang paling relevan untuk topik tersebut. Topik diberi nomor (Topic 1, Topic 2, dll.), yang merupakan hasil dari algoritma LDA dalam mengelompokkan kata-kata yang sering muncul bersama dalam kumpulan teks. Pada aplikasi ini LDA hanya dibatasi untuk menghasilkan 15 topik
Makna Setiap Topik. Berdasarkan kata-kata kunci dalam setiap topik, kita bisa menginterpretasikan tema yang muncul, misalnya:
Topik 1: Kata kunci: tremor, control, parkinsons, suppression, frequency, disease, vibration
Interpretasi: Topik ini berfokus pada metode pengendalian (control) tremor, termasuk teknik supresi tremor dan bagaimana tremor terkait dengan frekuensi getaran pada penyakit Parkinson.
Bagian ini menjelaskan tren dari setiap topik hasil STM dengan LDA. Tren divisualisasikan dengan plot disertasi regresi linear yang diterapkan pada proporsi kemunculan suatu topik dari tahun ke tahun.
Regresi linear digunakan untuk memodelkan tren jangka panjang dari proporsi suatu topic dalam database publikasi. Pada grafik, titik-titik biru adalah data aktual proportion mewakili proporsi topik di setiap tahun. Proporsi menyatakan distribusi suatu topik dalam kumpulan dokumen dataset Scopus. Proporsi sekitar 0.1–0.14 berarti bahwa sekitar 10-14% dari publikasi di tahun tertentu membahas topik ini. Jika proportion meningkat dari tahun ke tahun, artinya topik tersebut semakin banyak dibahas dalam database penelitian.
Garis merah putus-putus adalah trend line hasil regresi linear yang menunjukkan kecenderungan suatu topik naik atau turun. Area abu-abu adalah Confidence Interval (CI) yang menunjukkan rentang ketidakpastian dari model regresi, memberikan indikasi seberapa yakin model terhadap tren yang diprediksi.
Interpretasi slope. Slope positif (naik) menunjukkan bahwa proporsi publikasi tentang suatu topik mengalami peningkatan dari waktu ke waktu. Nilai slope yang sangat kecil menunjukkan bahwa kenaikan topik ini cukup lambat.
Contoh Interpretasi:
Topik 1 terdiri dari kata kunci utama: tremor, hand, classification, disease, parkinsons, signal, sensor, acceleration, feature, learning. Berdasarkan kata kunci tersebut, topik ini berkitan dengan penggunaan sensor dan pembelajaran mesin (machine learning) dalam deteksi dan klasifikasi tremor, khususnya pada penyakit Parkinson.
Garis tren merah menunjukkan tren sedikit meningkat dengan slope 0.00087. Hal ini berarti topik tersebut mengalami peningkatan proporsi dalam publikasi ilmiah, meskipun tidak signifikan. Titik-titik biru menunjukkan bahwa ada fluktuasi dalam proporsi kemunculan topik dari tahun ke tahun.
Dengan demikian, Topik 1 yang terkait deteksi tremor dengan machine learning dan sensor mengalami sedikit peningkatan dalam penelitian selama dekade terakhir. Tren tersebut mengindikasikan bahwa Topik 1 tetap relevan dan kemungkinan akan terus berkembang.
Bagian ini menjelaskan penelusuran judul dari artikel / makalah yang berkaitan dengan topik yang sesuai dengan yang dipilih (tren meningkat, terdapat keyword yang relevan sesuai topic of interest). Silakan mencari judul tersebut pada dikumen dataset Scopus, kemudian cari DOI atau link ke Scopus untuk mendonlod paper dengan judul yang dimaksud untuk dipelajari lebih lanjut atau digunakan untuk keperluan Sytematic Literature Review.