Heterogeneous data are those of various formats and collected from various sources. Such data usually are incomplete and inaccurate, which makes them difficult to process and cluster. In this work, a method for cluster analysis of heterogeneous data using the provisions of fuzzy logic is presented. The simulation models for representing a candidate for a vacant position, which is characterized by heterogeneous data, are provided. The apparatus of algebraic systems has been used to develop simulation models. A method for determining the membership function of fuzzy sets using a probabilistic approach as the most effective when working with heterogeneous data, is described in detail. An example is given of the formation of a base of logical rules for selection of classification features in a set of heterogeneous data of the personnel reserve of a manufacturing enterprise. The selected classification features allow for further accurate and efficient verification and evaluation of information about candidates for a vacant position. The proposed method of cluster analysis of heterogeneous data can be applied in various subject areas that involve the use of incomplete and inaccurate data, for example, socio-economic, technical, and biological systems.
-
Key words:
cluster analysis, heterogeneous data, fuzzy logic, fuzzy sets, membership function
-
Published in:
INFORMATION-COMMUNICATION TECHNOLOGIES
-
Bibliography link:
Shevnina Ju. S., Gagarina L. G., Konyukhov E. V., Kharitonova A. D. Method of cluster analysis of heterogeneous data using the provisions of fuzzy logic. Proc. Univ. Electronics, 2023, vol. 28, no. 4, pp. 537–546. https://doi.org/10.24151/1561-5405-2023-28-4-537-546. – EDN: AVWMTN.
Yulia S. Shevnina
National Research University of Electronic Technology, Russia, 124498, Moscow, Zelenograd, Shokin sq., 1
Larisa G. Gagarina
National Research University of Electronic Technology, Russia, 124498, Moscow, Zelenograd, Shokin sq., 1
Evgeny V. Konyukhov
National Research University of Electronic Technology, Russia, 124498, Moscow, Zelenograd, Shokin sq., 1
Anastasia D. Kharitonova
National Research University of Electronic Technology, Russia, 124498, Moscow, Zelenograd, Shokin sq., 1
1. Шевнина Ю. С. Метод оценки состояния нелинейной системы на основе логического анализа данных // Изв. вузов. Электроника. 2022. Т. 27. № 3. С. 407–415. https://doi.org/10.24151/1561-5405-2022-27-3-407-415
2. Шевнина Ю. С., Буравов А. Н. Автоматизация учета рабочего времени сотрудников предприятия // Программные продукты и системы. 2022. № 1. С. 132–138. https://doi.org/10.15827/0236-235X.137.132-138
3. Шевнина Ю. С., Константинов В. В. Автоматизация оценки профессиональных качеств и компетенций сотрудников предприятия // Вестник Астраханского государственного технического университета. 2021. № 2 (72). С. 7–14. https://doi.org/10.24143/1812-9498-2021-2-7-14
4. Шевнина Ю. С., Гагарина Л. Г. Подходы к автоматизации процессов центров коллективного проектирования микроэлектроники // Информационные технологии и вычислительные системы. 2021. № 4. С. 12–25. https://doi.org/10.14357/20718632210402
5. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы / пер. с пол. И. Д. Рудинского. М.: Горячая линия – Телеком, 2008. 383 с.
6. Методы робастного, нейро-нечеткого и адаптивного управления: учебник / под ред. Н. Д. Егупова. 2-е изд., стер. М.: Изд-во МГТУ им. Н. Э. Баумана, 2022. 744 с.
7. Сервис проверки физических лиц // СберКорус [Электронный ресурс]. URL: https://www.esphere.ru/products/proverka-fiz-litc/ (дата обращения: 05.06.2023).
8. Поиск аффилированности // СПАРК [Электронный ресурс]. URL: https://www.spark-interfax.ru/ru/features/realtions (дата обращения: 05.06.2023).
9. СПО «Справки БК»: Описание специального программного обеспечения (в формате doc) // Госслужба [Электронный ресурс]. URL: https://gossluzhba.gov.ru/anticorruption/spravki_bk (дата обращения: 05.06.2023).
10. Усков А. А., Кузьмин А. В. Интеллектуальные технологии управления: Искусственные нейронные сети и нечеткая логика. М.: Горячая линия – Телеком, 2004. 143 с.