Ekstraksi Informasi Pada Tabel Dengan Head Background Warna Dan Tanpa Head Menggunakan Decision Tree
Penelitian ini mengembangkan sebuah metode preprocessing untuk menentukan meaningfulness dari sebuah tabel untuk ekstraksi informasi dari tabel pada internet. Suatu tabel dapat memberi petunjuk pada text mining karena tabel berisi data yang memiliki arti yang ditampilkan dalam baris dan kolom. Tetapi, tabel digunakan pada internet baik untuk knowledge structuring maupun document design. Karena itu, peneliti tertarik untuk menentukan apakah sebuah tabel memiliki meaningfulness yang dihubungkan pada informasi sruktural yang disajikan pada abstraction level pada table head.Langkah yang dilakukan pada penelitian ini adalah: 1) meneliti jenis-jenis tabel yang ada pada dokumen HTML, 2) mengembangkan fitur yang membedakan tabel yang meaningful dan yang tidak, 3) menyusun sebuah training data set mengunakan fitur yang telah dikembangkan setelah menyaring decorative table yang jelas, dan 4) menyusun sebuah model klasifikasi menggunakan sebuah decision tree. Kata Kunci: Text Mining, information extraction, table mining