IMPLEMENTASI CRISP-DM PADA SISTEM REKOMENDASI BERBASIS KONTEN UNTUK PENENTUAN JENIS IKAN HIAS DALAM AKUARIUM
Abstract
Ikan hias air tawar terdiri dari banyak jenis yang biasa dipelihara oleh para penghobi. Penghobi pemula seringkali melakukan kesalahan dalam memilih jenis-jenis ikan yang dapat dicampur dalam sebuah aquarium sehingga jenis-jenis ikan yang dipelihara dalam aquarium yang sama tidak kompatibel antara satu jenis dengan lainnya. Hal ini dapat menyebabkan kematian dini pada ikan yang dipelihara. Sehingga diusulkan sebuah pendekatan berbasis data mining dan machine learning dalam menentukan jenis-jenis ikan hias yang dapat dipelihara secara bersamaan dalam sebuah akuarium. Penelitian ini mengikuti kerangka kerja CRISP- DM yang bertujuan untuk mengembangkan sistem rekomendasi ikan hias air tawar guna membantu para penghobi akuarium, terutama para pemula dalam memilih spesies-spesies ikan yang sesuai untuk akuarium mereka. Sistem ini menggunakan teknik web scraping untuk mengumpulkan data dari fishkeepingworld.com, sebuah platform daring yang berisi artikel tentang ikan hias air tawar. Data yang terkumpul diproses, di- tokenisasi, dan diubah menjadi vektor kata menggunakan Word2Vec. Algoritma k-NN digunakan untuk menemukan spesies ikan serupa atau kompatibel. Akurasi sistem dievaluasi menggunakan Root Mean Square Error (RMSE) dengan menghitung rata-rata RMSE pada seluruh dataset. Pengujian dilakukan dengan memberikan beberapa nilai pada dimensi vektor untuk metode Word2Vec, jumlah K pada metode k-NN, dan metode perhitungan jarak pada k-NN. Sistem menghasilkan nilai RMSE terbaik dengan nilai 0.1329 pada K=3, jumlah vektor 400, dan perhitungan jarak dengan manhattan distance. Sistem rekomendasi yang dihasilkan diharapkan memberikan panduan yang bermanfaat bagi pengguna dalam meningkatkan pengalaman dalam hobi akuarium.
Kata Kunci: CRISP-DM, ikan hias, sistem rekomendasi, k-NN.
Freshwater ornamental fish consist of various species commonly kept by enthusiasts. Beginner hobbyists often make mistakes in selecting fish species that can coexist in the same aquarium, leading to compatibility issues and potential early mortality of the fish. Therefore, a data mining and machine learning-based approach is proposed to determine compatible ornamental fish species for simultaneous cohabitation in an aquarium. This research follows the CRISP-DM framework, which aims to develop a freshwater fish recommendation system to assist aquarium enthusiasts, especially beginners, in choosing suitable and compatible fish species for their aquariums. The system utilizes web scraping techniques to gather data from fishkeepingworld.com, an online platform featuring articles about exotic freshwater fish. The collected data is processed, tokenized, and transformed into word vectors using Word2Vec. A k-NN algorithm is employed to find similar or compatible fish species. The system's accuracy is evaluated using Root Mean Square Error (RMSE) by calculating the average RMSE across the entire dataset. Testing is conducted by providing various values for the Word2Vec vector dimensions, the number of neighbors (K) in the k-NN method, and the distance calculation method in k-NN. The system achieves the best RMSE value of 0.1329 at K=3, 400 vector dimensions, and using the Manhattan distance calculation method. The resulting recommendation system hopefully provides valuable guidance for users, enhancing their aquarium hobby experience.
Keywords: CRISP-DM, ornamental fish, recommendation system, k-NN.
Keywords
Full Text:
PDFReferences
Anamisa, D. R., Jauhari, A., & Ayu Mufarroha, F. (2023). K-Nearest Neighbors Method for Recommendation System in Bangkalan’s Tourism. ComTech: Computer, Mathematics and Engineering Applications, 14(1), 33– 44. https://doi.org/10.21512/comtech.v14i1.7993
Bayu Anwari, V., & Yuliazmi. (2022). Implementasi Algoritma K-Nearest Neighbors Pada Analisis Sentimen Masyarakat Terhadap Penerapan Pemberlakuan Pembatasan Kegiatan Masyarakat. Sistem Komputer Dan Teknik Informatika , 5(1), 72–81. https://doi.org/10.36080/skanika.v5i1. 2912
Farhan, M., Purbolaksono, M. D., & Astuti, W. (2023). Sentiment Analysis of Practo App Reviews using KNN and Word2Vec. Building of Informatics, Technology and Science (BITS), 5(1). https://doi.org/10.47065/bits.v5i1.3598 Fellman, S. (2021). THE AQUARIUM AS AN ECOSYSTEM: AN OLD IDEA THAT SOMEHOW ALWAYS SEEMS NEW. https://tanninaquatics.com/blogs/the- tint-1/the-aquarium-as-an-ecosystem- an-old-idea-that-somehow-always- seems-new
Golon, C. (2014). Tips for Freshwater Aquarium Success. https://www.vetstreet.com/our-pet- experts/tips-for-freshwater-aquarium- success
Gumantung Gusti, I., Nasrun, M., Astuti Nugrahaeni, R., & Komputer, T. (2019). REKOMENDASI SISTEM PEMILIHAN MOBIL MENGGUNAKAN K-NEAREST NEIGHBOR (KNN) COLLABORATIVE FILTERING. In Jurnal TEKTRIKA (Vol. 4, Issue 1). https://doi.org/10.25124/tektrika.v4i1. 1846
Hendrawan Rifky, I., Utami, E., & Hartanto Dwi, A. (2022). Analisis Perbandingan Metode Tf-Idf dan Word2vec pada Klasifikasi Teks Sentimen Masyarakat Terhadap Produk Lokal di Indonesia. Smart Comp: Jurnalnya Orang Pintar Komputer, 11(3). https://doi.org/10.30591/smartcomp.v1 1i3.3902
INJAF. (2017). Raising your concerns. https://injaf.org/the-think-tank/raising- your-concerns/
Khumaidi, A. (2020). DATA MINING FOR PREDICTING THE AMOUNT OF COFFEE PRODUCTION USING CRISP-DM METHOD. Jurnal Techno Nusa Mandiri, 17(1), 1–8. https://doi.org/10.33480/techno.v17i1. 1240
Mondi, R. H., Wijayanto, A., & Winarno. (2019). RECOMMENDATION SYSTEM WITH CONTENT-BASED FILTERING METHOD FOR CULINARY TOURISM IN MANGAN APPLICATION. ITSMART: Jurnal Ilmiah Teknologi Dan Informasi, 8(2). https://doi.org/10.20961/itsmart.v8i2.35008
Nur Ghaniaviyanto Ramadhan. (2021). Indonesian Online News Topics Classification using Word2Vec and K- Nearest Neighbor. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(6), 1083–1089. https://doi.org/10.29207/resti.v5i6.3547 Prasetya, C. S. D. (2017). Sistem Rekomendasi Pada E-Commerce Menggunakan K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer, 4(3), 194. https://doi.org/10.25126/jtiik.2017433 92
Ramadhanti, N. R., & Mariyah, S. (2019). Document Similarity Detection Using Indonesian Language Word2vec Model. 2019 3rd International Conference on Informatics and Computational Sciences (ICICoS), 1–6. https://doi.org/10.1109/ICICoS48119.2019.8982432
Rosita, A., Puspitasari, N., & Kamila, V. Z. (2022). REKOMENDASI BUKU PERPUSTAKAAN KAMPUS DENGAN METODE ITEM-BASED COLLABORATIVE FILTERING. Sebatik, 26(1), 340–346. https://doi.org/10.46984/sebatik.v26i1.1551
Sahbuddin, M., & Agustian, S. (2022). Support Vector Machine Method with Word2vec for Covid-19 Vaccine Sentiment Classification on Twitter. JOURNAL OF INFORMATICS AND TELECOMMUNICATION ENGINEERING, 6(1), 288–297. https://doi.org/10.31289/jite.v6i1.7534
Sharpe, S. (2021). Common Mistakes When Starting a New Aquarium. https://www.thesprucepets.com/comm on-new-aquarium-mistakes-1380712
Sterling, I. (2022b). Why Do My Fish Keep Dying? 11 Reasons & How to Prevent It. https://fishlab.com/why-your-fish- are-dying/
Tommy, L., Kirana, C., & Lindawati, V. (2019). RECOMMENDER SYSTEM DENGAN KOMBINASI APRIORI DAN CONTENT-BASED FILTERING PADA APLIKASI PEMESANAN PRODUK. Jurnal Teknoinfo, 13(2), 84. https://doi.org/10.33365/jti.v13i2.299
DOI: http://dx.doi.org/10.32497/orbith.v19i3.5257
Refbacks
- There are currently no refbacks.
This work is licensed under a Creative Commons Attribution 4.0 International License. View My Stats