نوع مقاله : مقاله پژوهشی
نویسندگان
1 مدیریت صنعتی، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران
2 گروه مدیریت صنعتی، دانشکده مدیریت و حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران
3 گروه مدیریت صنعتی، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران
چکیده
طبقهبندی دادهها از مباحث اساسی علم مدیریت است که از رویکردهای مختلفی مورد بررسی قرار گرفته است. روشهای هوش مصنوعی از مهمترین روشهای طبقهبندی هستند که اغلب آنها تابع دقت کل را در ارزیابی عملکرد مد نظر قرار میدهند. از آنجاییکه در دیتاستهای نامتوازن، این تابع، هزینه خطاهای پیشبینی را یکسان در نظر میگیرد، در این پژوهش علاوه بر تابع دقت کل، از تابع حساسیت نیز به منظور افزایش دقت در هر یک از کلاسهای از پیشتعریفشده، استفاده شده است. بهعلاوه، بدلیل پیچیدگی فرآیند کسب اطلاعات از تصمیمگیرنده، از الگوریتم فرا ابتکاری NSGA II جهت استنتاج مقادیر پارامترها، (بردار وزن و سطوح برش بین کلاسها) استفاده گردیده است. در هر تکرار، الگوریتم با استفاده از بردار وزن برآورد شده و دیتاستها، امتیاز هر آلترناتیو را با تابع Sum Product محاسبه نموده و در مقایسه با سطوح برش تخمینی، آن آلترناتیو را به یکی از دستهها تخصیص میدهد. سپس با استفاده از توابع برازش، دسته تخمینی و دسته واقعی را مقایسه نموده و این فرایند تا بهینهسازی پارامترها ادامه مییابد. مقایسه نتایج الگوریتمهای NSGA II و NRGA، نشاندهنده کارایی بالای الگوریتم ارائه شده است.
کلیدواژهها
عنوان مقاله [English]
Developing a classification Method for Imbalanced Dataset Using Multi-Objective Evolutionary Algorithms
نویسندگان [English]
- amir daneshvar 1
- Mahdi Homayounfar 2
- elham akhavan 3
1 Department of Industrial Management, Management Faculty, E-branch, Islamic Azad University,Tehran, Iran
2 Department of Industrial Management, Faculty of Management and Accounting, Rasht Branch, Islamic Azad University, Rasht, Iran
3 Department of Industrial Management, Management Faculty, E-branch, Islamic Azad University,Tehran, Iran
چکیده [English]
Data classification is one of the main issues in management science which took into account from different approaches. Artificial intelligence methods are among the most important classification methods, most of them consider total accuracy function in performance evaluation. Since in imbalanced data sets this function considers the cost of prediction errors as a fix amount, in this research a sensitivity function in used in addition to the accuracy function in order to increase the accuracy in all of the predefined classes. In addition, due to complexity in process of seeking information from decision maker, NSGA II algorithm is used to extract the parameters (Weight vector and cut levels between classes). In each iteration, based on the estimated weight vector and data sets, the algorithm calculate the score of each alternative using Sum Product function and then allocates the alternative to one of the classes, comparing to the estimated cut levels,. Then, using the fitness functions, the estimation class and the actual class will compare by two algorithms and this process will continue since optimizing the parameters. Comparison of the NSGA II and NRGA algorithms show the high efficiency of the proposed algorithm.
کلیدواژهها [English]
- : NSGA II Algorithm
- Multiclass Classification
- imbalanced datasets
- NRGA Algorithm