پایان نامه کارشناسی ارشد رشته نرم افزار کامپیوتر: مخازن نرم افزاری |
مفید استخراج شود. در این تحقیق روشی برای سرعت بخشیدن به رفعخطای جدید با استفاده از اطلاعات موجود در مخازن خطای نرمافزار، ارائه شدهاست. مدلهای زیادی تا بهحال ارائهشده که یا مکمل هم بوده یا از الگوریتمهای جدید استفاده شدهاست. مدلهای پیشنهادی با استفاده از تشابه متن همگی از الگوریتمهای معمولی و ساده استفاده کرده اند. در این مدل ها به این نکته مهم کمتر توجه شده که مخازن حجم بالا و پیچیدهای از اطلاعات را شامل میشوند، که بعضاً تشابه بین کلمات و معانی مختلف یک جمله نتیجهگیری را سختتر میکند. پس نیاز به الگوریتمهای معنایی در بررسی تشابه متن احساس میشود. همچنین باید به این نکته مهم توجه کرد که الگوریتم معنایی انتخاب شده بهینه است و قادر باشد میان این حجم اطلاعات که از سوی کاربران مختلف ثبت میشود، بهترین جواب با تشابه بیشتر را انتخاب کند. اگرچه تا بهحال روشهای بسیاری برای تکمیل مخازن خطا و استفاده از دانش نهفته در آن صورتگرفته اما میتوان گفت که ضرورت اهمیت به تشابه معنایی بین دادهها در نظر گرفته نشده است. در این تحقیق سعی شده که این ضعف در جستجو و بهرهگیری دانش نهفته در این مخازن داده پوشش داده شود.
مدل ارائه شده در اینجا ابتدا لیستی از خطاهای مشابه خطای جدید با استفاده ازیک الگوریتم تشابه معنایی مناسب، با توجه به اطلاعات متنی ذخیرهشده ارائه میدهد. در مرحله بعد این خطاها براساس چرخه عمر خطا با استفاده از روش خوشهبندی K-means، خوشه بندی میشوند.
همچنین میانگین تشابه هر دسته به خطای جدید، گروه منتخب را مشخص می کند. خطاهای موجود در این گروه، راه حلهای پیشنهادی برای هر کدام، کمکی برای تسهیل و تسریع در رفع خطا است و میانگین طولعمر گروه تخمینی بر پیچیدگی و زمان حلمشکل خواهد بود.
3-1- پیشینه تحقیقاتی
شاید بتوان گفت که بنیان MSR و نرمافزارهای ردیابیخطا[7]با تولید [8]GNATS در سال1992 نهاده شد. پس از آن نرمافزارهایمتعددی به یاری مهندسی نرم افزار شتافت هاست. در این مدت سعی و اهتمام محققان بر تکمیل مدلها و موتورهایجستجو مورد استفاده در این نرمافزارها بوده است. در سال 2000 مدلی با استفادهاز رگرسیون فازی[9] برای تخمین تعداد خطاهای موجود در نرمافزار ارائهشد]6[. در]5[ همین کار با استفاده از شبکههایعصبی انجامشد. درسال 2007 LucasD.Panjerدادهکاوی را برای تخمین زمانخطا با مقایسه پنج الگوریتم دستهبندی دادهها مطرح کرد]7[. Suma.V و همکارانش به سراغ روشهای خوشهبندی رفته و ثابتکردند که روش K-mean در میان روشهای مورد بررسی آنها بهینهتر بوده است]8[. CathrinWeiß و همکارانش از روش نزدیکترین همسایه و تشابه جملات با استفاده از موتورارزیابیLucene[10] استفاده کردند]9[.Lucene خود از SVM و یک مدل بولی[11] برای جستجو و ارزیابی متون استفاده میکند. Nagwani نیزدرمدلهای مختلفی از الگوریتم های دادهکاوی متعددی برای اهداف مختلف استفادهکرد]10[،]11[،]12[. اما همه این روشها یا به جنبه معنایی تشابه متون و کلمات توجه نداشتند. یا برای استخراج ضریب تشابه دو متن از الگوریتمهای مناسب برای این محیط بهره نبردند. الگوریتمهای استفاده شده بیشتر به تاثیر یک متن و یافتن ضریب تشابه آنها با متن کاربرتوجه داشتند، معمولا استاتیک بودند و هرگز به بهرهوری روش در محیط با حجم بالا توجه نداشتند. نوآوری کار تحقیقاتی ارائهشده نسبت به مدلهای قبلی استفاده از یک الگوریتم بهینه با دقت بیشتر در اندازهگیری تشابه میان دو متن است بهطوریکه با حجم زیاد مستندات و کلمههای مشابه در مخازن نرمافزاری سازگار باشد. این الگوریتم تشابه جملات و تشابه معنایی بین کلمات را با هم ترکیب میکند. بهطوریکه، مشابهترین جملات را، با توضیحات دادهشده برای خطا از سوی کاربر، از میان دادههای قبلی در مخزن استخراج کند.
4.1. فرضیه های تحقیق
مخازن خطای هر نرم افزار منابع ارزشمند دانش هستند.
اطلاعات ثبت شده در مخازن خطا به پیشبرد سریعتر و کم هزینه تر فرآیند تولید نرم افزار کمک می کند
ثبت روش حل مشکل یا خطا در طول فرآیند تولید می تواند به توسعه دهنده پروژه برای حل خطا جدید کمک کند.
برای پیش بینی قسمتی از زمان انجام پروژه و هزینه آن می توان از این اطلاعات استفاده کرد.
5.1. اهداف تحقیق
از آنجا که در روش ارائه شده در این تحقیق سعی بر آن شده تا کاستیهای موجود در روشهای قبلی به نوعی پوشش داده شود ، بهدنبال بهترین و مناسب ترین الگوریتم برای جستجو و محاسبه تشابه متون و مستندات در یک مخزن با حجمعظیمداده هستیم. به طوریکه با بالارفتن این حجم دچار مشکل پیچیدگیمحاسبه و بالارفتن زمانپاسخگویی نشود. همچنین تشابه بین دو متن باید شامل تشابهمعنایی باشد. بهجز تشابه بین کلمات تشابه به صورت مجموعه کلمات. یعنی جملات باید بررسی شود. با توجهبه مطالب ذکرشده یافتههای اصلی این تحقیق را میشود در مطالب زیر خلاصه کرد.
ارائه یک روش برای کاوش مخازن خطای نرمافزار که کاستیهای روشهای قبلی در اندازهگیری میزان تشابه بین نمونه و خطا را پوششدهد.
یافتن خطاهای مشابه با خطای جدیدواستفاده از آنها برای تخمین زمان لازم برای رفعخطا
تعیین میزان پیچیدگی خطای جدیدبا محاسبه میانگین طول عمر خطاهایی با شباهت بیشتر
استفاده ازراهکارهای رفع خطا با جستجوی خطاهایی با ضریب تشابه بالاتر با خطای جدید
هدف نهایی کاهش هزینههای مالی پروژههای نرمافزاری و تسریع درفرآیند مهندسینرمافزار است.
6.1. نوآوری تحقیق
آنچه بیش از همه به عنوان نوآوری در کار و بهبود روشهای گذشته مطرح است:
استفاده از یک الگوریتم معنایی مناسب بههمراه تشابه خطی در مرحله اول
استفاده از الگوریتمهای خوشهبندی در مرحله دوم.
در این تحقیق برای بالا بردن دقت و سرعت در استفاده از اطلاعات از الگوریتم پیشرفته تر نسبت به کارهای قبلی استفاده شده است. الگوریتم ترکیبی که به جنبه معنایی تشابه نیز توجه داشته باشد. همچنین نتایج نهایی برای بررسی راحت تر و دقیق تر با استفاده از یک روش بهینه خوشه بندی طبقه بندی میشوند، تا دسترسی کاربر به اطلاعات نهایی راحتر و سریعتر باشد. به بیانی ساده تر اطلاعات نهایی خوانا وجامع باشند.
7.1. ساختار پایان نامه
این تحقیق شامل 5 فصل است که ترتیب فصول و موضوعات مطرح شده بهصورت کلی در زیر بیان شدهاست:
1.7.1. فصل اول: کلیات(همین فصل)
فرم در حال بارگذاری ...
[پنجشنبه 1398-07-11] [ 12:38:00 ب.ظ ]
|