Шукати за:
Забезпечення точності та стабільності кластеризації багатовимірних даних методом самоорганізаційних карт Кохонена на основі автоматичної редукції даних
Повний текст (PDF)
УДК: 004.855.5:519.237.8
Мова публікації: Українська
Stuc. intelekt. 2026; 31; (1):71-89
Анотація: У статті досліджено метод підвищення точності та стабільності кластеризації багатовимірних даних шляхом поєднання самоорганізаційних карт Кохонена з процедурою автоматичної редукції ознак. Запропоновано метод вилучення малозначущих ознак з використанням алгоритму міжквартильного розмаху, інтегрованого у створений програмний додаток для побудови SOM. Проведено порівняння результатів кластеризації до та після редукції за незмінних параметрів навчання і фіксованого значення seed – параметра, що визначає початковий стан генератора випадкових чисел та забезпечує відтворюваність ініціалізації вагових коефіцієнтів нейронів. Засвідчено, що вилучення ознак із низькою варіативністю не порушує топологічну структуру SOM, зберігає стабільність кластерного поділу та зменшує обчислювальні витрати. Підтверджено високий ступінь відповідності між даними до та після редукції на основі статистичного аналізу. Встановлено, що запропонований метод підвищує ефективність SOM і є придатним для аналізу великих багатовимірних вибірок.
Ключові слова: SOM, редукція даних, малозначущі ознаки, кластеризація, міжквартильний розмах, програмний додаток
Посилання:
- Dimensionality Reduction using Self Organizing Maps. [Online]. Available:https://stackoverflow.com/questions/27086222/dimensionality-reduction-using-self-organizing-maps/
- Zabielin S. Big Data Analysis via Model Reduction Methods // System Research and Information Technologies. – 2018. – № 2. – pp. 35-41. doi:https://doi.org/10.20535/SRIT.2308-8893.2018.2.04
- Vayssieres M. Master Kohonen Self-Organizing Maps: A Hands-On Guide to Data Exploration with Python. [Online]. Available:https://medium.com/@MahounaVAYSSIERES/master-kohonen-self-organizing-maps-a-hands-on-guide-to-data-exploration-with-python-fb92f8ebd6f6
- Agboka K. M., Abdel-Rahman E. M., Salifu D., Kanji B., Ndjomatchoua F. T., Guimapi R. A. Y., Ekesi S., Landmann T. Towards combining self-organizing maps (SOM) and convolutional neural network (CNN) for improving model accuracy: Application to malaria vectors phenotypic resistance // MethodsX. – 2025. – Vol. 14. – 103198. doi: https://doi.org/10.1016/j.mex.2025.103198
- Salap-Ayca S. Self-organizing maps as a dimension reduction approach for spatial global sensitivity analysis visualization // Transactions in GIS. – 2025. – Vol. 26. – № 4. – pp. 1718-1734. doi: https://doi.org/10.1111/tgis.12963
- Silva R. G., Wilcox S. J. Feature evaluation and selection for condition monitoring using a self-organizing map and spatial statistics // Artificial Intelligence for Engineering Design, Analysis and Manufacturing. – 2018. – Vol. 33. – pp. 1-10. doi: 10.1017/S0890060417000518.
- Khacef L., Rodriguez L., Miramond B. Improving Self-Organizing Maps with Unsupervised Feature Extraction // The International Conference on Neural Information Processing. – 2020. doi: https://doi.org/10.48550/arXiv.2009.02174
- Fan X., Zhang S., Xue X., Jiang R., Fan S., Kou H. An Improved Self-Organizing Map (SOM) Based on Virtual Winning Neurons // Symmetry. – 2025. – Vol. 17. – № 3. – pp. 449. doi: 10.3390/sym17030449
- Starkey A., Akpan U. I., Al Hosni O., Pullissery Y. Class-Level Feature Selection Method Using Feature Weighted Growing Self-Organising Maps // arXiv Preprint. – 2025. doi: https://doi.org/10.48550/arXiv.2503.11732
- Benabdeslem K., Lebbah M. Feature Selection for Self-Organizing Map // 29th International Conference on Information Technology Interfaces. – Cavtat, Croatia. – 2007. – pp. 45-50. doi: https://doi.org/10.1109/ITI.2007.4283742
- Ceylan O., Taskin Kaya G. Feature Selection Using Self Organizing Map Oriented Evolutionary Approach // IEEE International Geoscience and Remote Sensing Symposium (IGARSS). – Brussels, Belgium. – 2021. – pp. 4003-4006. doi:https://doi.org/10.1109/IGARSS47720.2021.9553491
- Pratiwi D. The Use of Self Organizing Map Method and Feature Selection in Image Database Classification System // International Journal of Computer Science. – 2012. – № 9.
- Khelil M. I., Ladjal M., Brik Y., Ouali M. A. Self-Organizing Maps-Based Features Selection with Deep LSTM and SVM Classification Approaches for Advanced Water Quality Monitoring // International Journal of Intelligent Engineering and Systems. – 2022. – Vol. 15. – № 3. – pp. 90-102. doi: https://doi.org/10.22266/ijies2022.0630.09
- Zang Z., Xu Y., Lu L., Geng Y., Yang S., Li S. Z. UDRN: Unified Dimensional Reduction Neural Network for feature selection and feature projection // Neural Networks. – 2023. – Vol. 161. – pp. 626-637. doi: https://doi.org/10.1016/j.neunet.2023.02.018
- Mwangi B., Tian S. T., Jair C. S. A Review of Feature Reduction Techniques in Neuroimaging // Neuroinformatics. – 2014. – Vol. 12. – № 2. – pp. 229-244. doi: https://doi.org/10.1007/s12021-013-9204-3
- Cheng X. A Comprehensive Study of Feature Selection Techniques in Machine Learning Models // Insights in Computer, Signals and Systems. – 2024. – Vol. 1. – pp. 65-78. doi: https://doi.org/10.70088/xpf2b276
- Rossi R., Murari A., Gelfusa M. A deep learning framework for feature selection and dimensional analysis: Variational explainable neural networks // Knowledge-Based Systems. – 2025. – Vol. 324. – 113940. doi: https://doi.org/10.1016/j.knosys.2025.113940
- Passimier A., Folco P., Raimondi D., Birolo G., Moreau Y., Fariselli P. A quantitative benchmark of neural network feature selection methods onomics data // Scientific Reports. – 2024. – Vol. 14. – 31180. doi: https://doi.org/10.1038/s41598-024-82583-5
- Trelina A., Procházka A. Binary Stochastic Filtering: a Solution for Supervised Feature Selection and Neural Network Shape Optimization // arXiv Preprint. – 2019. doi: https://doi.org/10.48550/arXiv.1902.04510
- Ougiaroglou S., Diamantaras K. I., Evangelidis G. Exploring the effect of data reduction on neural network and support vector machine classification // Neurocomputing. – 2018. – Vol. 280. – pp. 101-110. doi: https://doi.org/10.1016/j.neucom.2017.08.076
- Jia W., Sun M., Liang J., Hou S. Feature dimensionality reduction: a review // Complex & Intelligent Systems. – 2022. – Vol. 8. – pp. 2663-2693. doi: https://doi.org/10.1007/s40747-021-00650-0
- Ivashchenko O., Fedin S. Improving The Som Algorithm To Ensure Stability And Reproducibility Of Data Clustering Results // System Research and Information Technologies. – 2025. – № 4.
- Іващенко О. В., Федін С. С. Оптимізація алгоритму Кохонена для забезпечення відтворюваності результатів кластеризації // Штучний інтелект та інформаційні технології: матеріали Першої міжнародної науково-практичної конференції (3–4 червня 2024 р., Київ, Україна). – Київ: НУХТ. – 2024. – pp. 226-227.
- Bhandari P. How to Find Interquartile Range (IQR) | Calculator & Examples. [Online]. Available: https://www.scribbr.com/statistics/interquartile-range/
- Ivashchenko O., Fedin S. Supporting Decision-Making in the Segmentation of Telecommunications Company Customers Using Specialized Software // Modern Engineering and Innovative Technologies. – 2025. – № 41-01. – pp. 116-136. doi:https://doi.org/10.30890/2567-5273.2025-41-01-002
- Jonatasv. Metrics Evaluation: MSE, RMSE, MPE and MAPE. – 2024. [Online]. Available: https://medium.com/@jonatasv/metrics-evaluation-mse-rmse-mae-and-mape-317cab85a26b
- Shaun Turney. Coefficient of Determination (R²) | Calculation & Interpretation. – 2023. [Online]. Available:https://www.scribbr.com/statistics/coefficient-of-determination/
- Ugur Turan. A Correlation Coefficients Analysis on Innovative Sustainable Development Groups // EUREKA: Social and Humanities. – 2020. – Vol. 1. – № 1. – pp. 46-55. doi: https://doi.org/10.21303/2504-5571.2020.001130