بهبود سرعت طبقه بندی محدود به داده های نامتوازن بین مناطق همپوشانی و غیر همپوشانی با استفاده از الگوریتم های ترکیبی

عنوان انگلیسی مقاله: 

Improving classification rate constrained to imbalanced data between overlapped and non overlapped regions by hybrid algorithms 

چکیده مقاله: جنبه جدیدی از طبقه بندی داده های نامتوازن مورد بررسی قرار گرفت. بر خلاف طبقه بندی داده های نامتوازن کلاسیک که در آن علت مشکل به علت تفاوت اندازه داده ها است، مطالعه ما فقط راجع به وضعیت زمانی مي باشد، که همپوشاني دو کلاس وجود دارد. هنگامی که یک کلاس با کلاس دیگری همپوشانی دارد، سه ناحیه ناشی از همپوشانی بوجود می آیند. منطقه اول منطقه همپوشانی بین دو كلاس است. بقیه قسمت ناحیه غیر همپوشانی هر کلاس است. وضعیت نامتوازن به وضوح ناشی از مقدار مختلف اطلاعات در منطقه همپوشانی و منطقه غیر همپوشانی است. در این وضعیت، تفاوت اندازه داده ها از کلاس های مختلف نگرانی اصلی نیست و هیچ تاثیری بر دقت طبقه بندی ندارد. در این تحقیق، روش ترکیبی، به نام الگوریتم Soft-Hybrid، برای بهبود عملکرد طبقه بندی پیشنهاد شده است. این تکنیک به دو مرحله اصلی تقسیم شد: تعیین منطقه مرزی و الگوریتم هاي طبقه بندی واكنشي برای هر زیرمجموعه. در مرحله اول داده ها به صورت (۱) داده های غیر همپوشانی، (۲) داده های مرزی و (۳) داده های همپوشانی گروه بندی شدند. اطلاعات بدست آمده از فاصله اصلاح شده Hausdorff ،شبکه تابع محوري و تکنیک خوشه بندی K-Means با فاصله Mahalanobis استفاده مي نمايند. سپس، روش اصلاح شده هسته، DB SCAN و شبکه RBF اصلاح شده، برای طبقه بندی داده ها به گروه های مناسب بر اساس مقادیر آماری از مرحله طبقه بندی، اعمال شد. در نهایت، نتایج تمام تکنیک ها ترکیب شدند. نتایج تجربی نشان دادند که روش پیشنهاد شده می تواند موفقيت در طبقه بندی داده های نامتوازن که دارای بخش هايی با بيشترين تداخل بر اساس ضریب انتقال، اندازه گیری F و اندازه گیری میانگین G هستند، را به طور قابل توجهی بهبود ببخشد . علاوه بر این، زمان محاسبه روش پیشنهادی، پایین تر از الگوریتم های استاندارد مورد استفاده برای این نوع از این مشکل بود.

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

توسط
تومان