یادگیری مبتنی بر کلاس‌بندی c- میانگین با استفاده از توزیع آمیخته مقیاسی نرمال با اطلاعات گمشده

نوع مقاله : مقاله پژوهشی

نویسندگان

دانشگاه فرماندهی و ستاد آجا، تهران، ایران

چکیده

یکی از پرکاربردترین مدل‌ها برای رده‌بندی‎‎ یا کلاس‌بندی داده‌ها که در سال‌های اخیر مورد توجه بسیاری از پژوهشگران قرار گرفته است، مدل‌های مخلوط متناهی است. بطور کلی رده‌بندی به فرایندی گفته می‌شود که در آن هر یک از مشاهدات به یکی از گروه‌های مشخص شده تعلق گرفته می‌شود. گرچه ایده اصلی در مدل‌های مخلوط بر اساس توزیع نرمال بوده است، اما در سال‌های اخیر با معرفی توزیع‌های دیگر مدل‌های مخلوط بر اساس این توزیع‌ها مورد توجه بسیاری از محققین بوده است. در مقالات از الگوریتم ‎EM‎ و گسترش‌های آن برای برآوردیابی استفاده شده است. با این حال این امکان وجود دارد که الگوریتم ‎EM‎ نتایج مناسبی برای کلاس‌بندی ارایه ندهد‏، زیرا در این روش هر عضو مشاهدات متعلق به یک کلاس است. این محدودیت باعث استفاده از رویکرد کلاس‌بندی فازی در این نوع مسائل شد. در این مقاله یک الگوریتم کلاس‌بندی براساس توزیع مخلوط متناهی‏ آمیخته مقیاسی نرمال‏ ارائه شده است. در این الگوریتم برای کلاس‌بندی از روش یادگیری فازی ‎‎$‎-c‎$‎میانگین استفاده شده است.‎ برای بررسی تاثیر مقادیر گمشده بر کلاس‌بندی داده‌ها‏، داده گمشده نیز در نظر گرفته شده است. از ساختار توزیع مخلوط متناهی‏ آمیخته مقیاسی نرما‎‏ل برای بررسی داده‌های گمشده و کلاس‌بندی داده‌ها استفاده می‌شود. در انتها نیز با استفاده از مثال واقعی و داده‌های شبیه‌سازی شده، مقایسه بین الگوریتم ‎$\text{‎LB-‎FCM}‎$‎‎ و ‎$\text{‎EM}$‎‎ صورت می‌گیرد. از این مقایسه نتیجه شده است که استفاده از این الگوریتم برای کلاس‌بندی داده‎‌ها مناسبتر است.

کلیدواژه‌ها


[1] D.R. Andrews and C.L. Mallows, Scale mixture of normal distributions, J. Roy. Stat. Soc. B 36, 1974, pp. 99–102
 
[2] LA. García-Escudero, F. Greselin and AM. Iscar. “Robust, fuzzy, and parsimonious clustering, based on mixtures of factor analyzers”. Inter. Jou. Appr. Reas., vol. 94, 2018, pp. 60–75.
 
[3] LA. García-Escudero, D. Rivera-García, AM. Iscar and J. Ortega. “Cluster analysis with cellwise trimming and applications for the robust clustering of curves”. Info. Scie. vol. 573, 2021, pp. 100–124.
 
[4] D. E. Gustafson and W.C. Kessel. “Fuzzy clustering with a fuzzy covariance matrix”. IEEE conf. on deci. and conto. inclu. the 17th sympo. on adap. proc., 1979, pp. 761–766.
 
[5] F. Hashemi, M. Naderi and M. Mashinchi. “Clustering right-skewed data stream via Birnbaum–Saunders mixture models: A flexible approach based on fuzzy clustering algorithm”. Appl. Sof. Compu., vol. 82, 2019, 105539.
 
[6] Z. Ju and H. Liu. “Fuzzy gaussian mixture models”. Patt. Recog. vol. 45, 2012, pp. 1146–1158.
 
[7] T. I. Lin, J. C. Lee and H. J. Ho. “On fast supervised learning for normal mixture models with missing information”. Patt. Recog., vol. 39, 2006, pp. 1177–1187.
 
[8] Quost, B., Denoeux, T., 2016. “Clustering and classification of fuzzy data using the fuzzy EM algorithm”. Fuz. Set. and Sys., vol. 286, 2016, pp. 134–156.
 
[9] H. Wang, Q. bing Zhang, B. Luo and S. Wei. “Robust mixture modelling using multivariate t-distribution with missing information”. Patt. Recog., vol. 25, 2004, pp. 701–710.
 
[10] WL. Wang, A. Jamalizadeh, and TI, Lin. “Finite mixtures of multivariate scaleshape mixtures of skew-normal distributions”. Stat Papers, vol. 61, 2020, pp. 2643–2670.
 
[11] M. S. Yang, and Y. Nataliani. “Robust-learning fuzzy c-means clustering algorithm with unknown number of clusters”. Patt. Recog., vol. 71, 2017, pp. 45–59.
 
[12] L. A. Zadeh. “Fuzzy sets”. Info. and cont. vol. 8, 1965, pp. 338–353.