پایان نامه ارشد مهندسی فناوری اطلاعات: طراحی سیستم دستهبند فازی مبتنی بر بهینه سازی ازدحام ذرات برای تشخیص بیماری دیابت |
1-3- اهداف تحقیق…………………. 5
1-4- سوالات تحقیق…………………. 6
1-5- فرضیات مسأله………………… 6
1-6- نوآوریهای تحقیق…………………. 7
1-7- تعریف واژگان………………… 7
1-8- ساختار پایان نامه………………… 8
فصل دوم – ادبیات و پیشینه تحقیق…………………. 10
2-1- مقدمه………………… 11
2-2- دادهکاوی…………………. 11
2-3- دستهبندی…………………. 13
2-4- الگوریتمهای رایج دستهبندی…………………. 15
2-4-1- شبکههای عصبی مصنوعی…………………. 15
2-4-2- درختهای تصمیم………………… 19
2-4-3- شبکههای بیزین…………………. 21
2-4-4- K نزدیکترین همسایه………………… 23
2-4-5- ماشین بردار پشتیبان………………… 24
2-4-6- روشهای مبتنی بر قانون………………… 28
2-5- الگوریتم بهینهسازی ازدحام ذرات………………….. 32
2-5-1- پارامترهای پایه بهینهسازی ازدحام ذرات………………….. 35
2-5-2- چالشها و مسائل پیش روی الگوریتم بهینهسازی ازدحام ذرات…….. 39
2-5-2-1- مشکل ابعاد بالا………………… 40
2-5-2-2- مشکل همبستگی میان دادهها ………………..43
2-5-3- گونههای مختلف PSO………………….
2-5-3-1- بهینهسازی ازدحام ذرات مبتنی بر شبکههای جمعی…………………. 48
2-5-3-1-1- همسایگی مبتنی بر فاصله فضایی…………………. 48
2-5-3-1-2- همسایگی فزاینده……………….. 48
2-5-3-1-3- بهینهسازی ازدحام ذرات کاملاً آگاه (FIPS)…………………
2-5-3-2- مدل پیوندی بهینهسازی ازدحام ذرات………………….. 50
2-5-3-3- بهینهسازی ازدحام ذرات چند جمعیتی…………………. 53
2-6- سیستمهای فازی…………………. 56
2-6-1- ساختار یک سیستم دستهبندی مبتنی بر قوانین فازی……… 57
2-6-2- دستهبندی بدون استفاده از درجه قطعیت………………….. 58
2-6-3- دستهبندی با بهره گرفتن از درجه قطعیت………………….. 62
2-6-4- استنتاج فازی…………………. 66
2-7- معیارهای ارزیابی دستهبندها……………….. 68
فصل سوم – روش تحقیق…………………. 72
3-1- مقدمه………………… 73
3-2- تبدیل دادههای حقیقی به ترمهای فازی…………………. 75
3-3- تولید توابع عضویت و قوانین فازی با بهره گرفتن از الگوریتم بهینهسازی ازدحام ذرات…….. 77
3-3-1- کدگذاری توابع عضویت فازی…………………. 78
3-3-2- کدگذاری قوانین فازی…………………. 80
3-3-3- PSO پیشنهادی…………………. 82
3-3-5- توابع برازش کیفیت قوانین…………………. 87
3-5- نتیجهگیری…………………. 90
فصل چهارم – محاسبات و یافتههای تحقیق…………………. 91
4-1- دادههای مورد استفاده……………….. 92
4-2- تنظیم پارامترها……………….. 94
4-3- روشهای استفاده شده به منظور مقایسه………………… 97
4-4- نتایج…………………. 98
4-5- نتیجه گیری…………………. 101
فصل پنجم – نتیجه گیری و پیشنهادات…………………. 102
5-1- خلاصه و نتیجه گیری…………………. 103
5-2- پیشنهادات………………….. 103
منابع:……………….. 105
چکیده:
تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. چرا که این بیماری علائم متعددی را بروز میدهد که بعضی از این علائم در سایر بیماریهای دیگر نیز وجود دارند. بنابراین پزشک برای اتخاذ یک تصمیم مناسب، باید نتیجهی آزمایشهای بیمار و تصمیمهایی که در گذشته برای بیماران با وضیعت مشابه گرفته است، را بررسی کند.
در این پایان نامه از یک الگوریتم دستهبندی مبتنی بر قانون برای دستهبندی بیماران دیابتی استفاده شده است. برای استخراج قوانین فازی از یک الگوریتم بهینه سازی ازدحام ذرات استفاده شده است. این الگوریتم دارای ویژگیهایی است که آن را از سایر الگوریتم مورد استفاده متمایز میکند. از جملهی این ویژگیها میتوان به تابع افزایش تنوع ذرات و تکامل همزمان توابع عضویت و قوانین فازی اشاره کرد. برای ارزیابی کارایی الگوریتم از مجموعه دادهی دیابت استفاده شده است. نتایج ارزیابیها نشان میدهد که الگوریتم برای مجموعه دادهی دیابت دارای کارایی بسیار بالایی میباشد. همچنین کارایی الگوریتم پیشنهادی به علت بالا بردن قابلیت تفسیرپذیری دستهبند (کاهش تعداد قوانین فازی) بسیار مناسب میباشد.
فصل اول: مقدمه و کلیات تحقیق
1-1- مقدمه
افزایش استفاده از کامپیوترها در فعالیتهای کسب و کار، منجر به رشد سریع پایگاههای اطلاعاتی و اجتماع دادهها توسط بیشتر سازمانها شده است. روزانه حجم عظیمی از دادهها تولید شده و در پایگاههای مختلف داده ذخیره میشود. در سالهای اخیر تمایل به جستجو برای کشف الگوهای تکرارپذیر به منظور بهبود در تصمیم گیری افزایش چشمگیری داشته است. همچنین کاوش در دادههای تراکنشی جهت یافتن الگوهای پنهان و تکنیکهای کشف دانش به منظور شناخت دقیقتر و بیشتر تراکنشها، اهمیت بسزایی یافته است. [1]. در حوزه پزشکی و سلامت با افزایش استفاده از سیستمهای جامع درمانی و پروندههای الکترونیک بیمار در بیمارستانها و مراکز درمانی حجم انبوهی از اطلاعات مربوط بیماران و انواع بیماریها مهیا میشود. [2]. استخراج دانایی از حجم عظیم دادههای مرتبط با سوابق بیماری و پروندههای پزشکی افراد با بهره گرفتن از فرآیند دادهکاوی میتواند منجر به شناسایی قوانین حاکم بر ایجاد، رشد و افت بیماریها گردیده و اطلاعات ارزشمندی را به منظور شناسایی علل وقوع بیماریها با توجه به عوامل محیطی حاکم در اختیار متخصصین و دست اندر کاران حوزه سلامت قرار دهد؛ که این امر در نهایت منجر به افزایش متوسط طول عمر افراد جامعه و ایجاد آرامش میگردد. [3].
آنچه مسلم است با افزایش سیستمهای الکترونیک سلامت حجم دادههای پزشکی هر روزه در حال افزایش است. اما این مجموعه دادههای بزرگ به طور خام هیچ کاربردی ندارد برای آنکه بتوان از این دادهها ارزشی را استخراج کرد نیاز به تحلیل دادهها و تبدیل آن به اطلاعات و دانش، یک نیاز اساسی است. با توجه به چنین حجمی از دادهها استفاده از عامل انسانی به عنوان تشخیص دهنده الگوها و تحلیلگر دادهها پاسخگو نمیباشد؛ لذا داده کاوی روی دادههای پزشکی از اهمیت بالایی برخوردار است. دادهکاوی را میتوان از جنبههای مختلف در پیشگیری یا تشخیص انواع بیماری، انتخاب روشهای درمان بیماری، مدت زمان بستری بیمار و … به کار برد.
2-1- بیان مسأله
دیابت یکی از بیماریهای رایج در جوامع امروزی است که دارای عوارض خطرناکی میباشد. این بیماری اگر چه گونهای از بیماریهای قلبی محسوب نمیشود ولی اغلب سبب بیماریهای قلبی میشود.
تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. چرا که این بیماری علائم متعددی را بروز میدهد که بعضی از این علائم در سایر بیماریها نیز وجود دارند. بنابراین پزشک برای اتخاذ یک تصمیم مناسب، باید نتیجهی آزمایشهای بیمار و تصمیمهای که در گذشته برای بیماران با وضیعت مشابه گرفته است، را بررسی کند. با توجه به حجم انبوه تعداد بیماران، میتوان از یك ابزار دادهكاوی برای شناخت الگوی بیماران قبلی استفاده كرد.
در این پایاننامه با توجه به ماهیت مسأله از یك الگوریتم دستهبندی برای تشخیص بیماری دیابت استفاده میکنیم سپس آنرا با سایر روشها ارائه شده مقایسه میکنیم. روش دسته بندی یک روش یادگیری با نظارت است که دادههای ورودی به دو بخش دادههای آموزش و دادههای آزمون تقسیم میشوند. هر الگوریتم کاندید، ابتدا با بهره گرفتن از مجموعه داده آموزش یک مدل را که نشان دهنده الگوی حاکم بر دادهها میباشد را استخراج میکند و سپس با بهره گرفتن از مجموعه آزمون دقت مدل ارائه شده برای دستهبندی را بررسی میکند.
الگوریتمهای متعددی برای دسته بندی ارائه شدهاند که از آن دسته میتوان؛ به شبکههای بیزین [4]، روشهای مبتنی بر درخت [5]، الگوریتم ماشین بردار پشتیبان [6]، روشهای مبتنی بر مجموعه فازی [7]، الگوریتمهای فرا اکتشافی [8] و شبکههای عصبی [9] اشاره کرد.
در این نوشتار قصد داریم برای استخراج قوانین فازی از یك الگوریتم آموزش دیده مبتنی بر هوش جمعی، بهینهسازی ازدحام ذرات (PSO) استفاده کنیم. خاصیت اصلی الگوریتمهای هوش جمعی تبادل اطلاعات بین ذرات است که در یافتن حالت بهینه بسیار موثر میباشند.
فرم در حال بارگذاری ...
[پنجشنبه 1398-07-11] [ 12:44:00 ق.ظ ]
|