TEXT MINING
Text mining dapat dikatakan sebuah analisis yang mengumpulkan keywords atau temrs (istilah) yang sering muncul secara bersamaan dan kemudian menemukan korelasi atau hubungan asosiasi diantara keywords atau temrs tersebut. Pada sumber lain Text mining adalah proses menambang data berupa teks dengan sumber data biasanya dari dokumen dan tujuannya adalah mencari kata - kata yang mewakili dalam dokumen sehingga dapat dilakukan analisa keterhubungan dalam dokumen. Data teks akan diproses menjadi data numerik agar dapat dilakukan proses lebih lanjut. Sehingga dalam text mining ada istilah preprocessing data, yaitu proses pendahulu yang diterapkan terhadap data teks yang bertujuan untuk menghasilkan data numerik.
Proses preposesing merupakan tahap dimana deskripsi di tangani untuk siap diproses memasuki tahap text mining.