Karya Mahasiswa


Karya Mahasiswa S2-Teknologi Informasi ISTTS

EKSTRAKSI INFORMASI BERBASIS RULE UNTUK PROCEEDING, JURNAL, DAN TECHNICAL REPORT DENGAN MEMANFAATKAN ATTRIBUT FONT DAN PARAGRAF

213210396-Indonesia
Christian Aditya Santoso (213210396)
Pembimbing : Dr. Ir. Gunawan, M.Kom.

Abstrak

Digital library merupakan solusi yang baik untuk dunia edukasi. Hal ini
disebabkan karena buku yang telah berevolusi menjadi digital. Awalnya dalam
bentuk fisik sekarang dalam bentuk digital dengan ekstensi PDF. Namun untuk
membangun sebuah digital library merupakan sistem yang besar dan kompleks,
sehingga diperlukan bagian yang banyak. Penelitian ini mengambil satu bagian dari
pengembangan sistem digital library, yaitu pada bagian pre-processing atau
persiapan sumber data digital library.
Penyediaan sumber data digital library sangat luas dan banyak. Fokus dari
penelitian ini adalah penyediaan data dimana data tersebut adalah jurnal, prosiding
dan paper. Dokumen tersebut dipilih karena dinilai memiliki manfaat yang besar
untuk edukasi karena peneliti mendokumentasikan hasil penelitian pada dokumen
tersebut. Dalam sebuah paper tentunya ada bagian yang menjadi kunci yang
menggambarkan intisari dari penelitian tersebut. Pada penelitian ini diambil
informasi Judul, Abstrak, Penulis dan Kata Kunci. Informasi tersebut dipercaya
mampu menggambarkan intisari dari suatu paper.
Proses dilakukan dengan terbagi menjadi 3 (tiga) bagian besar yaitu
konversi file mentah dengan ekstensi PDF menjadi file JSON, proses pengambilan
fitur dan proses ekstraksi informasi. Ekstraksi informasi pada penelitian ini
menggunakan kumpulan rule yang diimplementasikan pada software. Rule
diperoleh dari hasil pengamatan selama penelitian. Hasil dari penelitian dilakukan
penghitungan dengan memberikan bobot dimana hal yang terberat memiliki
pengaruh yang lebih besar. Ketelitian yang dicapai adalah 85.91% dimana dari
hipotesa awal pada ketelitian 80%. Namun masih banyak pengembangan yang bisa
dilakukan agar lebih baik lagi pada penelitian selanjutnya.