IMPLEMENTASI METODE C4.5 UNTUK PREDIKSI RISK-LEVEL KEKAMBUHAN KANKER TIROID TERDIFERENSIASI

Hesti Ifada Mustio, Hasbi Firmansyah, Wahyu Asriani

Abstract


Abstrak
Kanker tiroid terdiferensiasi (Differentiated Thyroid Cancer/DTC) umumnya berprognosis baik, namun sebagian pasien tetap mengalami kekambuhan sehingga diperlukan stratifikasi risiko yang objektif dan mudah diinterpretasi. Penelitian ini bertujuan membangun dan mengevaluasi model klasifikasi berbasis algoritma C4.5 untuk memprediksi tingkat risiko kekambuhan DTC (Low, Intermediate, High) menggunakan dataset “Differentiated Thyroid Cancer Recurrence” dari UCI Machine Learning Repository. Dataset ini merupakan kohort retrospektif 383 pasien dengan follow-up 10 tahun yang memuat 16 fitur klinikopatologis. Algoritma C4.5 dipilih karena mampu menangani atribut numerik dan kategorik, memodelkan hubungan nonlinier, serta menghasilkan pohon keputusan dan aturan if–then yang mudah ditelusuri sehingga sesuai untuk prototipe sistem pendukung keputusan klinis. Tahapan penelitian meliputi prapemrosesan dan pengkodean atribut, pembagian data menjadi data latih dan uji, pelatihan pohon keputusan C4.5 dengan pruning, serta evaluasi menggunakan akurasi, error klasifikasi, presisi tertimbang, dan recall tertimbang. Pada 116 data uji, model menghasilkan akurasi 81,03%, error klasifikasi 18,97%, presisi tertimbang 78,11%, dan recall tertimbang 78,77%. Kesalahan klasifikasi terutama terjadi antara kelas Low dan Intermediate, sementara sebagian besar pasien berisiko tinggi teridentifikasi dengan baik. Temuan ini menunjukkan bahwa C4.5 andal memetakan pola klinis dan berpotensi dimanfaatkan sebagai alat bantu awal dalam stratifikasi risiko kekambuhan DTC.

Kata Kunci : Kanker tiroid terdiferensiasi; Kekambuhan; Stratifikasi risiko; Pohon keputusan C4.5; Data mining; Sistem pendukung keputusan klinis



Abstract

Kanker tiroid berdiferensiasi (DTC) umumnya memiliki prognosis yang baik, namun beberapa pasien mengalami kekambuhan, sehingga stratifikasi risiko yang objektif dan dapat diinterpretasikan menjadi sangat penting. Studi ini bertujuan untuk mengembangkan dan mengevaluasi model berbasis C4.5 untuk memprediksi tingkat risiko kekambuhan DTC (Rendah, Menengah, Tinggi) menggunakan dataset “Kekambuhan Kanker Tiroid Berdiferensiasi” dari UCI Machine Learning Repository. Dataset tersebut mencakup 383 pasien dengan tindak lanjut selama 10 tahun dan 16 fitur klinikopatologis. C4.5 dipilih karena kemampuannya untuk menangani atribut numerik dan kategorikal, menangkap hubungan nonlinier, dan menghasilkan pohon keputusan yang dapat dilacak dan aturan if-then yang sesuai untuk pembuatan prototipe dukungan keputusan klinis. Alur kerja terdiri dari pra-pemrosesan data, pengkodean atribut, pemisahan data menjadi set pelatihan dan pengujian, pelatihan pohon keputusan C4.5 yang dipangkas, dan evaluasi kinerja menggunakan akurasi, kesalahan klasifikasi, presisi tertimbang, dan recall tertimbang. Pada 116 contoh pengujian, model tersebut mencapai akurasi 81,03%, kesalahan klasifikasi 18,97%, presisi tertimbang 78,11%, dan recall tertimbang 78,77%. Sebagian besar kesalahan klasifikasi terjadi antara kelas Rendah dan Menengah, sementara pasien berisiko tinggi sebagian besar diidentifikasi dengan benar. Temuan ini menunjukkan bahwa C4.5 dapat menangkap pola klinis dan menjanjikan sebagai alat awal untuk stratifikasi risiko kekambuhan DTC.

 

Kata kunci: Kanker tiroid berdiferensiasi; Kekambuhan; Stratifikasi risiko; Pohon keputusan C4.5; Penambangan data; Sistem pendukung keputusan klinis.




Full Text:

PDF [1-20]

References


L. Tang, et al., “A machine learning-based model for predicting recurrence in intermediate- and high-risk differentiated thyroid cancer: insights from a retrospective single-center study of 2388 patients,” Frontiers in Endocrinology, vol. 16, 2025, doi: 10.3389/fendo.2025.1552479.

L. Giovanella, L. Milan, W. Roll, M. Weber, S. Schenke, M. Kreissl, et al., “Thyroglobulin measurement is the most powerful outcome predictor in differentiated thyroid cancer: a decision tree analysis in a European multicenter series,” Clinical Chemistry and Laboratory Medicine (CCLM), 2024, doi: 10.1515/cclm-2024-0405.

L. He, J. Xiang, and H. Zhang, “Rethinking the prognosis model of differentiated thyroid carcinoma,” Frontiers in Endocrinology, vol. 15, 2024, doi: 10.3389/fendo.2024.1419125.

H. Donmez, et al., “Predicting thyroid cancer recurrence using supervised CatBoost: A SHAP-based explainable AI approach,” Medicine, vol. 104, 2025, doi: 10.1097/MD.0000000000042667.

F. F. Atay, F. Yağın, C. Çolak, E. Elkiran, N. Mansuri, F. Ahmad, and L. P. Ardigò, “A hybrid machine learning model combining association rule mining and classification algorithms to predict differentiated thyroid cancer recurrence,” Frontiers in Medicine, vol. 11, 2024, doi: 10.3389/fmed.2024.1461372.

Y. Li, J.-Y. Tian, K. Jiang, Z. Wang, S. Gao, K. Wei, A. Yang, and Q. Li, “Risk factors and predictive model for recurrence in papillary thyroid carcinoma: a single-center retrospective cohort study based on 955 cases,” Frontiers in Endocrinology, vol. 14, 2023, doi: 10.3389/fendo.2023.1268282.

P. Ruchong, H. Tang, and X. Wang, “A five-gene prognostic nomogram predicting disease-free survival of differentiated thyroid cancer,” Disease Markers, 2021, doi: 10.1155/2021/5510780.

Y. M. Park and B.-J. Lee, “Machine learning-based prediction model for papillary thyroid carcinoma recurrence,” Scientific Reports, vol. 10, 2020, doi: 10.21203/rs.3.rs-113105/v1.Clinical Chemistry and

Laboratory Medicine (CCLM), 2024, doi: 10.1515/cclm-2024-0405.

C. Zhang and Y. Ma, “An improved C4.5 decision tree algorithm for medical data classification,” IEEE Access, vol. 9, pp. 137955–137965, 2021. doi: 10.1109/ACCESS.2021.3119134

M. M. Rahman, M. S. Islam, and M. Ahmed, “Decision support systems in healthcare: Trends, techniques, and challenges,” Artificial Intelligence in Medicine, vol. 129, p. 102320, 2022. doi: 10.1016/j.artmed.2022.102320

J. Han, J. Pei, and M. Kamber, Data Mining: Concepts and Techniques, 4th ed. Cambridge, MA: Morgan Kaufmann, 2022. doi: 10.1016/C2018-0-02071-0




DOI: https://doi.org/10.31326/sistek.v8i1.2635

Refbacks

  • There are currently no refbacks.


JOURNAL IDENTITY

Journal Name:  Journal Information System and Science Technology

Jurnal Sistem Informasi dan Sains Teknologi


e-ISSN: 2684-8260
Publisher: Program Studi Sistem Informasi, Universitas Trilogi, Jakarta Selatan, Indonesia
Publication Schedule: February and August
Language: Indonesian and English
APC: Free of charge (submission, publishing) 
Indexing:  Google Scholar, Garuda, Neliti, One Search, Base, DRJI, Road, Crossref, Index CopernicusWorldCat, ScilitDimensions (find by DOI article)
OAI addresshttp://trilogi.ac.id/journal/ks/index.php/SISTEK/oai?verb=ListRecords&metadataPrefix=oai_dc
Collaboration Partners: Indonesian Association of Higher Education in Informatics and Computing (APTIKOM)

Contactsistek@trilogi.ac.id (Whatsapp Number: +628192454119)

license :
Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Journal Information System and Science Technology (Jurnal Sistem Informasi dan Sains Teknologi) is Published by Information System Department Trilogi University, South Jakarta, Indonesia. 

Under license CC-BY from Creative Commons Attribution.