Penelitian ini membahas analisis sentimen masyarakat terhadap batik Madura sebagai salah satu warisan budaya lokal Indonesia yang memiliki keunikan motif dan diminati oleh konsumen lokal maupun internasional. Seiring perkembangan teknologi dan media sosial, khususnya Twitter, muncul berbagai opini publik yang perlu dianalisis untuk mengetahui persepsi positif dan negatif terhadap batik Madura. Penelitian ini bertujuan untuk mengklasifikasikan opini publik tersebut menggunakan metode TF-IDF dan K-Nearest Neighbor (KNN).
Data yang digunakan berjumlah 840 opini publik yang diproses melalui beberapa tahapan praproses teks, yaitu case folding, cleaning, stopword removal, dan stemming. Metode TF-IDF digunakan untuk memberikan bobot pada kata-kata yang dianggap penting, sedangkan algoritma KNN digunakan untuk melakukan klasifikasi sentimen berdasarkan jarak terdekat menggunakan Euclidean distance. Evaluasi sistem dilakukan dengan dua pendekatan, yaitu split data dan k-fold cross validation.
Hasil penelitian menunjukkan bahwa metode split data menghasilkan akurasi terbaik sebesar 95,76% pada perbandingan data latih dan uji 60:40 dengan nilai k = 7, sedangkan pengujian menggunakan k-fold cross validation menghasilkan akurasi tertinggi sebesar 88,2% pada 30 fold dengan k = 5. Faktor-faktor yang memengaruhi akurasi meliputi fitur yang digunakan, rasio pembagian data, serta tahapan praproses. Penelitian ini menyimpulkan bahwa integrasi metode TF-IDF dan KNN mampu memberikan hasil klasifikasi sentimen yang cukup baik, meskipun penggunaan k-fold cross validation tidak menunjukkan peningkatan akurasi yang signifikan. Untuk penelitian selanjutnya disarankan menambah jumlah data, meningkatkan kualitas pelabelan data, serta menerapkan metode seleksi fitur seperti chi-square guna meningkatkan akurasi sistem.





