Get SIDoBI at SourceForge.net. Fast, secure and Free Open Source software downloads

SIDoBI 1.4 : Sistem Ikhtisar Dokumen untuk Bahasa Indonesia

Go to http://202.46.5.125/sidobi/ for working demo

Sistem Ikhtisar Dokumen untuk Bahasa Indonesia (SIDoBI) merupakan perangkat lunak berbasis web pertama di Indonesia untuk membuat ikhtisar/ringkasan secara otomatis (automatic summarization) dokumen berbahasa Indonesia. Aplikasi ini dikembangkan oleh BPPT di dalam bahasa PHP dengan memanfaatkan Free/Open Source Software (FOSS).

Abstrak

SIDoBI bekerja dengan mengambil sumber informasi suatu dokumen, mengekstrak isinya dan kemudian menampilkan ringkasan/ikhtisarnya dalam bentuk besaran relatif persentasi ikhtisar maupun jumlah kalimat ikhtisar yang diinginkan sesuai dengan keperluan pengguna.

Perangkat lunak utama yang digunakan dalam pengembangan SIDoBI adalah MEAD, tool untuk membuat ikhtisar secara otomatis. MEAD yang berbahasa Perl dan berjalan di sistem operasi, terhubung ke aplikasi SIDoBI di server web menggunakan antarmuka MeadPHP yang dikembangkan untuk SIDoBI.

Pengembangan SIDoBI dapat dibagi menjadi tiga. Pertama adalah pengembangan kamus IDF (inverse document frequency) bahasa Indonesia yang diperlukan oleh MEAD untuk membuat ikhtisar. Dilanjutkan dengan pengembangan antarmuka MeadPHP, yang bertugas menghubungkan MEAD di sistem operasi dengan aplikasi SIDoBI di server web. Dan terakhir adalah pengembangan aplikasi SIDoBI, yang bertugas menerima masukan dokumen bahasa Indonesia melalui web, menyampaikannya kepada MEAD di sistem operasi, menerima hasil ikhtisar, dan menampilkannya kembali di web.

SIDoBI berbasis FOSS sehingga dapat dimodifikasi dan disesuaikan dengan kebutuhan pengguna. Saat ini SIDoBI dapat berjalan di atas sembarang server web yang mendukung bahasa PHP dengan sistem operasi yang mendukung bahasa Perl, termasuk IGN 2007.

Kata kunci: SIDoBI, MEAD, FOSS, IGOS Nusantara, pembuat ikhtisar otomatis, bahasa Indonesia, berbasis web, PHP, Perl

Fitur

Fungsi SIDoBI dalam sistem pembuatan ikhtisar otomatis adalah sebagai antarmuka web antara pengguna akhir dengan mesin pembuat ikhtisar MEAD. Fungsi ini dapat dikelompokkan menjadi dua bagian. Yang pertama adalah aplikasi berbasis web (SIDoBI) yang berhubungan langsung dengan pengguna akhir melalui web. Yang kedua adalah antarmuka (MeadPHP) yang bertugas menghubungkan MEAD di sistem operasi dengan aplikasi SIDoBI di server web.

    Fitur-fitur dari SIDoBI diantaranya adalah:
  1. Dapat membuat ikhtisar dokumen berbahasa Indonesia.
  2. Dapat menerima masukan melalui <textarea>, sehingga memungkinkan pembuatan ikhtisar secara cepat dengan metode copy-paste.
  3. Dapat menerima masukan berupa file yang di-upload, sehingga memungkinkan pembuatan ikhtisar dokumen panjang di dalam file yang telah ada.
  4. Mendukung tipe file Teks (txt), Adobe PDF (pdf), MS Word (doc) dan Open Office (odt, ods, odp, sxw)
  5. Dapat menerima masukan berupa URL dari sebuah situs, kemudian SIDoBI akan membuat ikhtisar isi situs tersebut, dan mengekstrak URL tautan yang ada untuk dijadikan sebagai masukan berikutnya kepada SIDoBI lagi.
  6. Dapat diatur panjang ikhtisar yang diinginkan baik secara mutlak jumlah kalimat/kata, maupun secara relatif dengan persentasi.
  7. Memiliki struktur program yang modular, sehingga memungkinkan pengembangan lebih jauh dengan mudah.

Kegunaan utama SIDoBI sesuai dengan fungsinya yaitu membuat ikhtisar dari dokumen berbahasa Indonesia secara otomatis. SIDoBI akan sangat bermanfaat bagi pengguna komputer yang sibuk dan tidak memiliki waktu untuk membaca dokumen yang panjang dan membosankan. Metode copy-paste untuk meringkas dokumen pendek dengan cepat dan mudah, metode upload file untuk meringkas dokumen panjang di dalam file, dan metode URL untuk meringkas isi situs secara berkesinambungan.

Mekanisme

Fenomena kelebihan informasi yang menjadi ciri khas masyarakat modern dewasa ini, menjadikan sistem ikhtisar otomatis yang baik dan mudah digunakan menjadi sesuatu yang vital. Sebagaimana yang digambarkan di gambar di atas, sistem ikhtisar otomatis akan meringkas tumpukan dokumen yang demikian banyak, menjadi sebuah ikhtisar yang singkat tetapi berisi bagian-bagian terpenting dari dokumen aslinya.

MEAD: Sistem Ikhtisar

SIDoBI: Antarmuka Web

Sebagaimana ditunjukkan pada gambar di atas, pengembangan program SIDoBI didasarkan pada metodologi sebagai berikut:

  1. Pembuatan kamus IDF bahasa Indonesia

    Kamus IDF bahasa Indonesia diperlukan oleh MEAD untuk mengetahui nilai IDF setiap kata yang digunakan untuk menghitung tingkat kepentingan setiap kalimat. Selanjutnya setiap kalimat akan diperingkatkan berdasarkan tingkat kepentingannya, dan akhirnya ikhtisar disusun menggunakan kalimat-kalimat yang paling penting sampai terpenuhi panjang yang diminta oleh pengguna.

  2. Pembuatan antarmuka MeadPHP

    Mesin pembuat ikhtisar MEAD adalah program Perl yang berjalan di sistem operasi. Supaya aplikasi SIDoBI yang berbasis web dapat menggunakannya, diperlukan antarmuka yang menghubungkan keduanya. Dan MeadPHP dikembangkan khusus untuk tujuan ini, tetapi dengan membuatnya generik tanpa membatasinya hanya untuk SIDoBI saja. Artinya MeadPHP dapat juga digunakan oleh sembarang aplikasi PHP lain yang ingin menggunakan program MEAD.

  3. Pembuatan aplikasi SIDoBI

    Karena pengguna memerlukan akses yang mudah untuk menggunakan sistem pembuat ikhtisar otomatis, maka SIDoBI dibuat sebagai aplikasi berbasis web dengan bahasa PHP. Dengan antarmuka MeadPHP yang dikembangkan secara terpisah, aplikasi SIDoBI dapat dikonsentrasikan penuh untuk memenuhi keperluan kemudahan pengguna akhir. Dengan struktur program yang modular, SIDoBI dapat dikembangkan lebih jauh dengan mudah untuk menambah fitur-fitur lain yang diperlukan.

powered by MEAD 3.11 and these converters

Links: Exchange Forecast | What Date | Free Top App | Puncak Bukit | Jaringan | Asuransiku | Murai Batu | Burung Ocehan | Desain Kaos Sendiri | Blog Kaos101 | Texalyzer: text analyzer | MaximaPHP: matematika simbolik | Iklan Baris Socmed