ارائه یک روش انتخاب ویژگی برخط مبتنی بر جریان ویژگی بر اساس انتگرال فازی چوکت

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده مهندسی کامپیوتر،پردیس فنی و مهندسی،دانشگاه یزد، یزد ، ایران

2 گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه لرستان، ایران.

10.22034/jfsa.2022.331660.1116

چکیده

انتخاب ویژگی یک فرایند پیش‌پردازش داده‌ها است که برای مجموعه‌داده‌های با ابعاد بالا قبل از اجرای الگوریتم‌های یادگیری ماشین و داده‌کاوی مورداستفاده قرار می‌گیرد. هدف از انتخاب ویژگی، پیداکردن یک زیرمجموعه‌ی حداقلی و بهینه از مجموعه ویژگی‌ها است. این زیرمجموعه، ویژگی‌های برجسته را شامل می‌شود در حالی که ویژگی‌های غیر‌مرتبط با برچسب کلاس و تکراری در آن قرار نمی‌گیرند. برای انجام این کار، بسیاری از روش‌های انتخاب ویژگی فعلی به کل ویژگی‌ها در ابتدا نیاز دارند و درصورتی‌که ویژگی جدیدی در آینده به مجموعه ویژگی‌ها اضافه شود، الگوریتم باید از ابتدا اجرا شود. به‌دست‌آوردن کل ویژگی‌ها و یا حتی منتظر ماندن برای آن غیر‌ممکن در بسیاری از کاربردهای واقعی ممکن نیست؛ بنابراین برای این‌گونه مسائل که کل فضای ویژگی در ابتدا در اختیار ما قرار ندارد، روش‌های انتخاب ویژگی برخط ارائه شده‌اند. در این مقاله یک روش انتخاب ویژگی برخط با استفاده از مفهوم انتگرال فازی چوکت ارائه شده است. این روش در ابتدا جریان‌های ویژگی را بر اساس چندین معیار فیلتر ارزیابی می‌کند. سپس بر اساس عملگر چوکت نتایج آن‌ها ترکیب و برای حفظ یا نادیده‌گرفتن ویژگی تصمیم‌گیری می‌شود. در گام ارزیابی، عملکرد الگوریتم پیشنهادی با شش روش انتخاب ویژگی برخط و بر اساس دو دسته‌بند مقایسه شده است. روش پیشنهادی بر اساس نتایج به‌دست‌آمده در پنج مجموعه‌داده دنیای واقعی نزدیک دو درصد بهبود نسبت به روش‌های مشابه بر اساس معیارهای دقت دسته‌بندی و امتیاز داشته است. همچنین به دلیل محاسبات ساده در فرایند روش پیشنهادی، ارزیابی ویژگی‌ها در زمان کوتاهی انجام می‌گیرد.

کلیدواژه‌ها