پایان نامه ارشد مهندسی فناوری اطلاعات: طراحی سیستم دسته‌بند فازی مبتنی بر بهینه سازی ازدحام ذرات برای تشخیص بیماری دیابت

1-3- اهداف تحقیق…………………. 5

1-4- سوالات تحقیق…………………. 6

1-5- فرضیات مسأله………………… 6

1-6- نوآوری‌های تحقیق…………………. 7

1-7- تعریف واژگان………………… 7

1-8- ساختار پایان نامه………………… 8

فصل دوم – ادبیات و پیشینه تحقیق…………………. 10

2-1- مقدمه………………… 11

2-2- داده‌کاوی…………………. 11

2-3- دسته‌بندی…………………. 13

2-4- الگوریتم‌های رایج دسته‌بندی…………………. 15

2-4-1- شبکه‌های عصبی مصنوعی…………………. 15

2-4-2- درخت‌های تصمیم………………… 19

2-4-3- شبکه‌های بیزین…………………. 21

2-4-4- K نزدیک‌ترین همسایه………………… 23

2-4-5- ماشین بردار پشتیبان………………… 24

2-4-6- روش‌های مبتنی بر قانون………………… 28

2-5- الگوریتم بهینه‌سازی ازدحام ذرات………………….. 32

2-5-1- پارامترهای پایه بهینه‌سازی ازدحام ذرات………………….. 35

2-5-2- چالش‌ها و مسائل پیش روی الگوریتم بهینه‌سازی ازدحام ذرات…….. 39

2-5-2-1- مشکل ابعاد بالا………………… 40

2-5-2-2- مشکل همبستگی میان داده‌ها ………………..43

2-5-3- گونه‌های مختلف PSO………………….

2-5-3-1- بهینه‌سازی ازدحام ذرات مبتنی بر شبکه‌های جمعی…………………. 48

2-5-3-1-1- همسایگی مبتنی بر فاصله فضایی…………………. 48

2-5-3-1-2- همسایگی فزاینده……………….. 48

2-5-3-1-3- بهینه‌سازی ازدحام ذرات کاملاً آگاه (FIPS)…………………

2-5-3-2- مدل پیوندی بهینه‌سازی ازدحام ذرات………………….. 50

2-5-3-3- بهینه‌سازی ازدحام ذرات چند جمعیتی…………………. 53

2-6- سیستم‌های فازی…………………. 56

2-6-1- ساختار یک سیستم دسته‌بندی مبتنی بر قوانین فازی……… 57

2-6-2- دسته‌بندی بدون استفاده از درجه قطعیت………………….. 58

2-6-3- دسته‌بندی با بهره گرفتن از درجه قطعیت………………….. 62

2-6-4- استنتاج فازی…………………. 66

2-7- معیار‌های ارزیابی دسته‌بند‌ها……………….. 68

فصل سوم – روش تحقیق…………………. 72

3-1- مقدمه………………… 73

3-2- تبدیل داده‌های حقیقی به ترم‌های فازی…………………. 75

3-3- تولید توابع عضویت و قوانین فازی با بهره گرفتن از الگوریتم بهینه‌سازی ازدحام ذرات…….. 77

3-3-1- کدگذاری توابع عضویت فازی…………………. 78

3-3-2- کدگذاری قوانین فازی…………………. 80

3-3-3- PSO پیشنهادی…………………. 82

3-3-5- توابع برازش کیفیت قوانین…………………. 87

3-5- نتیجه‌گیری…………………. 90

فصل چهارم – محاسبات و یافته‌های تحقیق…………………. 91

4-1- داده‌های مورد استفاده……………….. 92

4-2- تنظیم پارامترها……………….. 94

4-3- روش‌های استفاده شده به منظور مقایسه………………… 97

4-4- نتایج…………………. 98

4-5- نتیجه گیری…………………. 101

فصل پنجم – نتیجه گیری و پیشنهادات…………………. 102

5-1- خلاصه و نتیجه‌ گیری…………………. 103

5-2- پیشنهادات………………….. 103

منابع:……………….. 105

چکیده:

تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. چرا که این بیماری علائم متعددی را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌های دیگر نیز وجود دارند. بنابراین پزشک برای اتخاذ یک تصمیم مناسب، باید نتیجه‌ی آزمایش‌های بیمار و تصمیم‌هایی که در گذشته برای بیماران با وضیعت مشابه گرفته است، را بررسی کند.

در این پایان نامه از یک الگوریتم دسته‌بندی مبتنی بر قانون برای دسته‌بندی بیماران دیابتی استفاده شده است. برای استخراج قوانین فازی از یک الگوریتم بهینه سازی ازدحام ذرات استفاده شده است. این الگوریتم دارای ویژگی‌هایی است که آن را از سایر الگوریتم مورد استفاده متمایز می‌کند. از جمله‌ی این ویژگی‌ها می‌توان به تابع افزایش تنوع ذرات و تکامل هم‌زمان توابع عضویت و قوانین فازی اشاره کرد. برای ارزیابی کارایی الگوریتم از مجموعه داده‌ی دیابت استفاده شده است. نتایج ارزیابی‌ها نشان می‌دهد که الگوریتم برای مجموعه داده‌ی دیابت دارای کارایی بسیار بالایی می‌باشد. همچنین کارایی الگوریتم پیشنهادی به علت بالا بردن قابلیت تفسیرپذیری دسته‌بند (کاهش تعداد قوانین فازی) بسیار مناسب می‌باشد.

فصل اول: مقدمه و کلیات تحقیق

1-1- مقدمه

افزایش استفاده از کامپیوترها در فعالیت‌های کسب و کار، منجر به رشد سریع پایگاه‌های اطلاعاتی و اجتماع داده‌ها توسط بیشتر سازمان‌ها شده است. روزانه حجم عظیمی از داده‌ها تولید شده و در پایگاه‌های مختلف داده ذخیره می‌شود. در سال‌های اخیر تمایل به جستجو برای کشف الگوهای تکرار‌پذیر به منظور بهبود در تصمیم گیری افزایش چشمگیری داشته است. همچنین کاوش در داده‌های تراکنشی جهت یافتن الگوهای پنهان و تکنیک‌های کشف دانش به منظور شناخت دقیق‌تر و بیشتر تراکنش‌ها، اهمیت بسزایی یافته است. [1]. در حوزه پزشکی و سلامت با افزایش استفاده از سیستم‌های جامع درمانی و پرونده‌های الکترونیک بیمار در بیمارستان‌ها و مراکز درمانی حجم انبوهی از اطلاعات مربوط بیماران و انواع بیماری‌ها مهیا می‌شود. [2]. استخراج دانایی از حجم عظیم داده‌های مرتبط با سوابق بیماری و پرونده‌های پزشکی افراد با بهره گرفتن از فرآیند داده‌کاوی می‌تواند منجر به شناسایی قوانین حاکم بر ایجاد، رشد و افت بیماری‌ها گردیده و اطلاعات ارزشمندی را به منظور شناسایی علل وقوع بیماری‌ها با توجه به عوامل محیطی حاکم در اختیار متخصصین و دست اندر کاران حوزه سلامت قرار دهد؛ که این امر در نهایت منجر به افزایش متوسط طول عمر افراد جامعه و ایجاد آرامش می‌گردد. [3].

آنچه مسلم است با افزایش سیستم‌های الکترونیک سلامت حجم داده‌های پزشکی هر روزه در حال افزایش است. اما این مجموعه داده‌های بزرگ به طور خام هیچ کاربردی ندارد برای آنکه بتوان از این داده‌ها ارزشی را استخراج کرد نیاز به تحلیل داده‌ها و تبدیل آن به اطلاعات و دانش، یک نیاز اساسی است. با توجه به چنین حجمی از داده‌ها استفاده از عامل انسانی به عنوان تشخیص دهنده الگوها و تحلیلگر داده‌ها پاسخگو نمی‌باشد؛ لذا داده کاوی روی داده‌های پزشکی از اهمیت بالایی برخوردار است. داده‌کاوی را می‌توان از جنبه‌های مختلف در پیشگیری یا تشخیص انواع بیماری، انتخاب روش‌های درمان بیماری، مدت زمان بستری بیمار و … به کار برد.

2-1- بیان مسأله

دیابت یکی از بیماری‌های رایج در جوامع امروزی است که دارای عوارض خطرناکی می‌باشد. این بیماری اگر چه گونه‌ای از بیماری‌های قلبی محسوب نمی‌شود ولی اغلب سبب بیماری‌های قلبی می‌شود.

تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. چرا که این بیماری علائم متعددی را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌ها نیز وجود دارند. بنابراین پزشک برای اتخاذ یک تصمیم مناسب، باید نتیجه‌ی آزمایش‌های بیمار و تصمیم‌های که در گذشته برای بیماران با وضیعت مشابه گرفته است، را بررسی کند. با توجه به حجم انبوه تعداد بیماران، می‌توان از یك ابزار داده‌كاوی برای شناخت الگوی بیماران قبلی استفاده كرد.

در این پایان‌نامه با توجه به ماهیت مسأله از یك الگوریتم دسته‌بندی برای تشخیص بیماری دیابت استفاده می‌کنیم سپس آن‌را با سایر روش‌ها ارائه شده مقایسه می‌کنیم. روش دسته بندی یک روش یادگیری با نظارت است که داده‌های ورودی به دو بخش داده‌های آموزش و داده‌های آزمون تقسیم می‌شوند. هر الگوریتم کاندید، ابتدا با بهره گرفتن از مجموعه داده آموزش یک مدل را که نشان دهنده الگوی حاکم بر داده‌ها می‌باشد را استخراج می‌کند و سپس با بهره گرفتن از مجموعه آزمون دقت مدل ارائه شده برای دسته‌بندی را بررسی می‌کند.

الگوریتم‌های متعددی برای دسته بندی ارائه شده‌اند که از آن دسته می‌توان؛ به شبکه‌های بیزین [4]، روش‌های مبتنی بر درخت [5]، الگوریتم ماشین بردار پشتیبان [6]، روش‌های مبتنی بر مجموعه فازی [7]، الگوریتم‌های فرا اکتشافی [8] و شبکه‌های عصبی [9] اشاره کرد.

در این نوشتار قصد داریم برای استخراج قوانین فازی از یك الگوریتم آموزش دیده مبتنی بر هوش جمعی، بهینه‌سازی ازدحام ذرات (PSO) استفاده کنیم. خاصیت اصلی الگوریتم‌های هوش جمعی تبادل اطلاعات بین ذرات است که در یافتن حالت بهینه بسیار موثر می‌باشند.

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب