Selamat Datang

"Lakukanlah apa yang bisa kamu lakukan dan bertindaklah selama kamu masih bisa bertindak"

Sabtu, 21 Juli 2012

Text Mining Ujian Online Bahasa Indonesia Menggunakan Klasifikasi Naive Bayes

BAB I PENDAHULUAN

 1.1. Latar Belakang

 Teknologi komunikasi dan elektronik sudah berkembang sedemikian pesat, sehingga menyebabkan bidang pendidikan juga turut mengalami peningkatan dalam halkualitas, kecepatan, kepraktisan dan juga kemudahan. Ujian konvesional pun bergeser kearah komputerisasi, salah satunya dengan ujian yang bersifat online. Ujian merupakan salah satu cara untuk mengevaluasi proses belajar. Dalam dunia pendidikan ujian dimaksudkan untuk mengukur taraf pencapaian suatu tujuan pengajaran oleh siswa sebagai peserta didik, sehingga siswa mengetahui tingkat kemampuannya dalam memahami bidang studi yang sedang ditempuh. Bila ternyata hasilnya belum maksimal, maka proses belajar harus ditingkatkan baik kualitas maupun kuantitas. Ujian yang bersifat subyekif jarang digunakan untuk proses evaluasi akhir dari proses pembelajaran dikarenakan sulitnya proses pengecekan/koreksi-nya. Text mining adalah salah satu cara dalam mengatasi permasalahan koreksi ujian yang bersifat subyektif/ berbasis teks.
Text mining mengolah data masukan berupa teks. Text mining akan melakukan proses tokenozing, filtering, stemming, tagging, dan analyzing terhadap kata-kata dalam teks sehingga diperoleh keyword. Sedangkan pengukuran tingkat similiritas antar dokumen dilakukan dengan membandingkan suatu keyword dengan dokumen. Agar hasil pengukuran tingkat similiritas dokumen dengan keyword mendapatkan hasil yang optimal maka digunakan algoritma NBC (Naive Bayes Classifier). Algoritma NBC memiliki kecepatan tinggi dalam proses pelatihan dan klasifikasi. Algoritma ini merupakan algoritma yang menerapkan metode probabilistic learning method, yaitu pada saat klasifikasi dengan mencari probabilitas tertinggi melalui masukana tribut. Sehingga dalam penelitian ini digunakanlah metode Naive Bayes Classifier untuk proses klasifikasi dalam mengoreksi jawaban soal ujian subyektif mata pelajaran bahasa Indonesia yang bersifat online.

 1.2. Rumusan Masalah

 Sesuai dengan uraian yang terdapat pada latar belakang diatas permasalahan yang dapatdiangkatdaripenelitihaniniadalah :

  1. Bagaimana membuat aplikasiText miningyang diperlukan untuk klasifikasi jawaban pada ujian subyektif pelajaran Bahasa Indonesia berdasarkan keywords atau terms (istilah) yang sering muncul.
  2. Bagaimana merancangan alur sistem, struktur data, algoritma fungsi, serta interface perangkat lunak yang akan diterapkan dalam tahap implementasi klasifikasi teks.
  3. Bagaimana cara melakukan tokezing, filtering, dan stremming, jawaban soal essaydengan bahasa pemograman PHP.

 1.3. Batasan Masalah

 Batasan masalah dalam pembuatan aplikasi ini adalah sebagai berikut :
  1. Model Soal menggunakan essay.
  2. Soal yang diujikan hanya soal Ujian Tengah Semester Bahasa Indonesia kelas 1 SMK.
  3. Aplikasi ini digunakan oleh tiga user, yaitu siswa, guru dan admin.
  4. Algoritma yang digunakan pada pengklasifikasian ini adalah Naive Bayes Classifier.
  5. Algoritma TF-IDF digunakan untuk menghitung bobot kata pada masing-masing dokumen terhadap kata kunci. 6. Bahasa pemograman yang digunakan adalah PHP.

 1.4. Tujuan

Adapun tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut :
  1.  Otomatisasi proses koreksi/pengecekan jawaban soal yang berbasis teks.
  2.  Mempercepat proses penilaian evaluasi belajar siswa.

 1.5. Manfaat

  1. Memudahkan guru dalam melakukan pengecekan jawaban ujian karena ujian bersifat komputerisasi dan online.
  2. Memberikan kemudahan bagi siswa untuk proses ujian, karena siswa bisa dapat melihat hasilnya secara langsung.

 1.6. Metodologi Penelitian 

Metode yang digunakan dalam penelitian ini adalah waterfall, dengan langkah-langkah penelitian sebagai berikut:

  1. Studi Literatur Metode ini dilakukan sebelum memecahkan masalah dalam pembuatan aplikasi, yaitu dengan mempelajari teori-teori yang menujang dalam penelitian ini.
  2. Pengumpulan Data Metode ini merupakan metode pengumpulan data yang dilakukan dengan wawancara langsung untuk mengetahui permasalahan dan data-data yang di butuhkan. Termasuk didalamnya pengumpulan bank data soal ujian bahasa Indonesia. 
  3. Perancangan Sistem Tahap ini berisi rancangan kerangka global menggunakan flowchart dan sebagainya yang menggambarkan mekanisme dari sistem yang akan dibuat. Termasuk didalamnya perancangan klasifikasi teks bahasa Indonesia menggunakan algoritma Naïve Bayes Classifier. 
  4. Pembuatan Sistem Tahapan ini menerjemahkan hasil perancangan spesifikasi program dari tahapan sebelumnya kedalam baris–baris kode program yang dapat dimengerti oleh komputer. Dalam hal ini digunakan bahasa pemrograman PHP. 
  5. Pengujian Sistem Tahap ini merupakan tahap menguji program yang telah selesai dibuat, apakah sudah sesuai dengan tujuan yang telah ditetapkan.
  6. Pengambilan Kesimpulan dan Pembuatan Laporan Tahap ini merupakan tahap akhir dari pembuatan tugasakhir, yaitu pengambilan kesimpulan perihal aplikasi yang telah dibuat dan pembuatan laporan tentang teori-teori mendasari sistem yang telah dibuat. 

 1.7. Sistematika Penulisan 

Untuk mempermudah dan memahami pembahasan penulisan Penelitihan ini, maka sistematika penulisan disusun sebagai berikut : 

BAB I. PENDAHULUAN 
Pada bab ini dijelaskan tentang latar belakang dari penelitihan klasifikasi dokumen teks, rumusan masalah yang dikaji, batasan masalah, tujuan dan manfaat penelitihan. Pada akhir bab juga dijelaskan mengenai metodologi serta sistematika penulisan.

 BAB II . LANDASAN TEORI
Pada bab ini dijelaskan konsep dasar dan teori-teori yang berkaitan dengan Text Mining, algoritma klasifikasi yaitu Naïve Bayes Classifier. Juga dasar teori yang berkaitan dengan modul pembelajaran bahasa Indonesia. 

BAB III. ANALISIS DAN PERANCANGAN SISTEM 
Pada bab ini dijelaskan mengenai perancangan untuk melakukan klasifikasi dokumen teks. Klasifikasi dilakukan dengan menentukan kategori dari semua dokumen testing yang ada perancangan ini menggunakan text mining dengan klasifikasi dokumen menggunakan algoritma Naive Bayes dan menggunakan pembobotan TF IDF.

 BAB IV. IMPLEMENTASI SISTEM
 Berisi tentang implementasi dan pengujian hasil penelitian dan perancangan yang telah disusun pada bab sebelumnya, serta menampilkan tampilan-tampilan aplikasi (print screen). BAB V . PENUTUP Berisi kesimpulan dari implementasi dan uji caba yang dilakukan. Selain itu berisi pula saran yang diharapkan dapat menjadi masukan untuk pengembangan aplikasi dimasa dating.

1 komentar: