51动漫

51动漫 Official Website

Prediksi Curah Hujan Kota Surabaya dengan Machine Learning

Ilustrasi hujan (Foto: Sinar Harian)

Curah hujan, atau yang secara ilmiah disebut presipitasi, adalah kuantitas air yang jatuh dari atmosfer ke permukaan bumi, baik dalam bentuk cair (hujan) maupun padat (salju dan es). Fenomena ini merupakan bagian krusial dari siklus air, yang diawali dengan penguapan air, diikuti oleh kondensasi menjadi awan, dan diakhiri dengan jatuhnya air kembali ke bumi akibat gravitasi. Jumlahnya diukur dalam satuan milimeter (mm) menggunakan alat penakar hujan, di mana angka tersebut merepresentasikan ketinggian air yang akan terkumpul di permukaan datar jika tidak meresap atau menguap. Berdasarkan volumenya, curah hujan diklasifikasikan berdasarkan intensitasnya, mulai dari ringan hingga ekstrem (di atas 150 mm/hari menurut BMKG), yang menjadi acuan penting untuk peringatan dini bencana. Oleh karena itu, curah hujan memiliki peran ganda yang sangat signifikan: sebagai sumber daya alam vital untuk kehidupan, pertanian, dan ekosistem, sekaligus sebagai pemicu potensial bencana hidrometeorologi seperti banjir dan tanah longsor jika intensitasnya terlalu tinggi.

Sebagai kota yang berada di wilayah pesisir dengan iklim sabana tropis, kondisi curah hujan di Surabaya sangat ditentukan oleh pergantian dua musim yang kontras. Musim hujan, yang biasanya berlangsung dari sekitar bulan November hingga April, didominasi oleh pengaruh angin muson barat yang membawa uap air melimpah, sehingga menghasilkan curah hujan yang sangat tinggi dengan puncaknya pada bulan Januari dan Februari. Hujan pada periode ini seringkali turun dengan intensitas lebat dalam durasi singkat, yang kerap menyebabkan genangan atau banjir lokal di kawasan perkotaan yang padat. Sebaliknya, saat memasuki musim kemarau antara Juni hingga Oktober, angin muson timur dari Australia yang bersifat kering mengambil alih, menyebabkan curah hujan menurun secara drastis, bahkan beberapa bulan bisa hampir tanpa hujan sama sekali, menjadikan cuaca sangat panas dan kering. Pola musiman yang tajam antara periode basah yang intens dan periode kering yang signifikan inilah yang menjadi karakteristik utama sekaligus tantangan hidrologis bagi kota Surabaya.

Suhu yang konsisten tinggi dan durasi penyinaran matahari yang panjang bertindak sebagai mesin penggerak utama, memanaskan permukaan daratan dan Laut Jawa secara intensif untuk memicu penguapan air secara masif. Proses ini menghasilkan tingkat kelembapan (kelembapan udara) yang sangat tinggi, yang menjadi “bahan bakar” krusial bagi pembentukan awan-awan hujan yang tebal. Namun, faktor penentu utama yang mengontrol kapan hujan akan turun adalah kecepatan dan arah angin muson; saat angin muson barat yang lembab berhembus攎eski terkadang tidak terlalu kencang攊a secara efektif mengangkut massa uap air melimpah tersebut ke atas daratan, menyebabkan udara naik, mendingin, dan akhirnya melepaskan hujan dengan intensitas lebat. Sebaliknya, saat angin muson timur dari Australia yang kering dan seringkali lebih kencang mendominasi, ia justru menekan dan menyapu potensi pembentukan awan, sehingga menciptakan periode kemarau yang sangat kering meskipun suhu dan penyinaran matahari tetap tinggi.

Na茂ve Bayes, K-Nearest Neighbor (KNN), dan Random Forest, memprediksi curah hujan dengan memanfaatkan data historis cuaca (seperti suhu, kelembapan, kecepatan angin, dan tekanan udara), namun dengan logika yang fundamentally berbeda. Na茂ve Bayes bekerja berdasarkan probabilitas, di mana model ini menghitung kemungkinan terjadinya hujan dengan asumsi naif bahwa setiap faktor cuaca (misalnya, kelembapan tinggi dan angin kencang) secara independen berkontribusi pada hasil akhir, mirip dengan seorang ahli statistik yang menyimpulkan, “Berdasarkan data masa lalu, kombinasi kondisi seperti ini memiliki probabilitas 80% untuk menghasilkan hujan.” K-Nearest Neighbor (KNN), sebaliknya, menggunakan pendekatan berbasis kesamaan; ia mencari sejumlah ‘k’ hari di masa lalu yang kondisi cuacanya paling mirip dengan hari ini, lalu membuat prediksi berdasarkan mayoritas kejadian pada hari-hari ‘tetangga’ terdekat tersebut攋ika sebagian besar dari mereka hujan, maka hari ini pun diprediksi akan hujan. Sementara itu, Random Forest bertindak seperti sebuah komite ahli dengan membangun ratusan “pohon keputusan” (decision trees) yang masing-masing belajar dari subset data yang berbeda, dan prediksi akhir ditentukan oleh suara mayoritas (voting) dari seluruh pohon tersebut, membuatnya menjadi model yang sangat kuat dan mampu menangkap pola hubungan yang kompleks antar variabel cuaca untuk menghasilkan prediksi yang lebih akurat dan andal.

Berdasarkan perbandingan, meskipun ketiga model擭a茂ve Bayes, K-Nearest Neighbor (KNN), dan Random Forest攎enunjukkan akurasi keseluruhan yang sangat tinggi (antara 93,7% hingga 94,8%), kinerja prediksi mereka ternyata sangat timpang karena masalah ketidakseimbangan kelas (class imbalance) yang signifikan. Menariknya, walaupun memiliki akurasi sedikit lebih rendah, model Na茂ve Bayes menunjukkan kemampuan diskriminatif yang paling unggul dengan skor AUC-ROC tertinggi (0,8040), yang menyiratkan generalisasi yang lebih baik. Oleh karena itu, penelitian ini menyimpulkan bahwa model klasifikasi konvensional tidak cukup andal untuk pola data seperti ini dan menekankan perlunya penggunaan strategi pemodelan yang lebih canggih, seperti teknik resampling atau cost-sensitive learning, untuk meningkatkan kemampuan deteksi kelas minoritas dan keandalan model secara keseluruhan.

Penulis: Dr. Dwi Rantini, S.Si

Informasi detail artikel dapat diakses melalui:

AKSES CEPAT