Wednesday, December 17, 2008

Sekilas Stop Words (Kata Sampah)

Apa itu Stop Words? Google, dalam bagian kecil sistem search engine-nya yang kompleks menggunakan algoritma Stop Words. Algoritma ini menganalisis suatu data teks, menyingkirkan kata-kata yang dianggap tidak penting dan menyisakan kata-kata penting untuk dijadikan indeks. Kata-kata tidak penting ini adalah kata-kata yang paling sering muncul dalam suatu tulisan. Contohnya seperti “di”, “ke”, “dari”, “yang”, “satu”, “dua”, dan seterusnya. Daftar kata-kata yang tidak penting inilah yang dinamakan Stop Words.

sumber selengkapnya disini

No comments: