Algoritma C4.5 Berbasis Forward Selection Untuk Klasifikasi Bidang Minat Studi Mahasiswa Teknik Informatika

Sirli Fahriah, Wiktasari Wiktasari

Abstract


Pada fakultas ilmu komputer di sebuah Universitas terdapat program studi sarjana Teknik Informatika yang dibagi menjadi dua bidang minat yaitu sistem cerdas dan rekayasa perangkat lunak design. Untuk pemilihan bidang minat, mahasiswa kesulitan menentukan bidang minat mereka. Dalam menangani hal ini, perlu adanya gagasan yang dapat merekomendasikan mahasiswa untuk memilih bidang minat mereka. Pada kasus ini, diperlukan metode atau algoritma yang tepat berdasarkan kriteria data yang akan digunakan sebagai variabel. Metode atau algoritma yang akan dipakai pada penelitian ini adalah algoritma C4.5 berbasis forward selection. Algoritma C4.5 merupakan Algoritma Klasifikasi dari cabang ilmu Data mining. Metode klasifikasi akan memberi keputusan berdasarkan atribut data yang dipilih. Hasil dari klasifikasi pemilihan bidang minat menggunakan data yang sudah seimbang dan atribut yang telah di seleksi beberapa fiturnya serta dilakukan iterasi pada cross validation sehingga menghasilkan akurasi yang tepat. Berdasarkan hasil pengujian dengan dua metode, pengujian hanya menggunakan Algoritma C4.5 menghasilkan akurasi 84.33% dan untuk algoritma C4.5 berbasis forward selection menghasilkan akurasi 85.00%. Terdapat peningkatan akurasi dengan penambahan fitur seleksi.

 

Kata kunci: Data Mining, Klasifikasi, Algortima C4.5; feature selection, bidang minat

 

 

 

Abstract

 

At the faculty of computer science at a university there is an undergraduate program of Informatics Engineering which is divided into two areas of interest, namely intelligent systems and software engineering design. For the selection of areas of interest, students have difficulty determining their areas of interest. In dealing with this, it is necessary to have ideas that can recommend students to choose their area of interest. In this case, an appropriate method or algorithm is needed based on the data criteria to be used as a variable. The method or algorithm that will be used in this research is the C4.5 algorithm based on forward selection. The C4.5 algorithm is a classification algorithm from the branch of data mining. The classification method will make decisions based on the selected data attributes. The results of the classification of the selection of areas of interest use balanced data and attributes that have been selected for several features and cross validation iteration is carried out to produce the right accuracy. Based on the results of testing with two methods, testing using only the C4.5 algorithm produces an accuracy of 84.33% and for the C4.5 algorithm based on forward selection it produces an accuracy of 85.00%. There is an increase in accuracy with the addition of a selection feature.

 

Keywords: Data Mining, Classification, Algorithm C4.5; feature selection, areas of interest.



Full Text:

PDF

References


Musrofi M. (2010). Melesatkan Prestasi Akademik Siswa. Yogyakarta: Pedagogia.

S. Liliana, "Penerapan Algoritma C4.5 untuk penentuan Informatika dan Komputer (STMIK) Indonesia," Jurnal GEMA AKTUALITA, vol. 2, no. 1, Juni 2013.Sukardi, Dewa Ketut. (2003). Analisis Tes Psikologi. Jakarta: Rineka Cipta.

F. A. Prastya, "Penerapan Algoritma C4.5 untuk Prediksi Jurusan Siswa SMAN 3 Rembang," Skripsi Teknik Informatika Universitas Dian Nuswantoro Semarang, 2015.

Z. Quan, G. Lin-gang, W. Chong-jun, W.-j. and C. Shi-fu, "Using An Improved C4.5 for Imbalanced Dataset of Intrusion," National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210093.

A. Syamsudin, "Kebutuhan Penelitian di Bidang Ilmu Pendidikan.," 2004.




DOI: http://dx.doi.org/10.32497/jtet.v10i1.2502

DOI (PDF): http://dx.doi.org/10.32497/jtet.v10i1.2502.g107302

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.