مفید استخراج شود. در این تحقیق روشی برای سرعت بخشیدن به رفع­خطای جدید با استفاده از اطلاعات موجود در مخازن خطای نرم­افزار، ارائه شده­است. مدل­های زیادی تا به­حال ارائه­شده که یا مکمل هم بوده یا از الگوریتم­های جدید استفاده شده­است. مدل­های پیشنهادی با استفاده از تشابه متن همگی از الگوریتم­های معمولی و ساده استفاده کرده اند. در این مدل ها به این نکته مهم کمتر توجه شده که مخازن حجم بالا و پیچیده­ای از اطلاعات را شامل می­شوند، که بعضاً تشابه بین کلمات و معانی مختلف یک جمله نتیجه­گیری را سخت­تر می­کند. پس نیاز به الگوریتم­های معنایی در بررسی تشابه متن احساس می­شود. همچنین باید به این نکته مهم توجه کرد که الگوریتم معنایی انتخاب ­شده بهینه است و قادر باشد میان این حجم اطلاعات که از سوی کاربران مختلف ثبت می­شود، بهترین جواب با تشابه بیشتر را انتخاب کند. اگرچه تا به­حال روش­های بسیاری برای تکمیل مخازن خطا و استفاده از دانش نهفته در آن صورت­گرفته اما می­توان گفت که ضرورت اهمیت به تشابه معنایی بین داده­ها در نظر گرفته نشده ­است. در این تحقیق سعی شده که این ضعف در جستجو و بهره­گیری دانش نهفته در این مخازن داده پوشش داده ­شود.

مدل ارائه ­شده در اینجا ابتدا لیستی از خطا­های مشابه خطای جدید با استفاده ازیک الگوریتم تشابه معنایی مناسب، با توجه به اطلاعات متنی ذخیره­شده ارائه می­دهد. در مرحله بعد این خطا­ها براساس چرخه ­عمر خطا با استفاده از روش خوشه­بندی K-means، خوشه بندی می­شوند.

همچنین میانگین تشابه هر دسته به خطای جدید، گروه منتخب را مشخص می کند. خطاهای موجود در این گروه، راه حل­های پیشنهادی برای هر کدام، کمکی برای تسهیل و تسریع در رفع خطا است و میانگین طول­عمر گروه تخمینی بر پیچیدگی و زمان حل­مشکل خواهد بود.

3-1- پیشینه تحقیقاتی

شاید بتوان گفت که بنیان MSR و نرم­افزارهای ردیابی­خطا[7]با تولید [8]GNATS در سال­1992 نهاده ­شد. پس از آن نرم­افزارهای­متعددی به یاری مهندسی ­نرم­ افزار شتافت ه­است. در این مدت سعی و اهتمام محققان بر تکمیل مدل­ها و موتورهای­جستجو مورد ­استفاده در این نرم­افزارها بوده ­است. در سال 2000 مدلی با استفاده­از رگرسیون ­فازی[9] برای تخمین تعداد خطا­های ­موجود در نرم­افزار ارائه­شد]6[. در]5[ همین کار با استفاده از شبکه­های­عصبی انجام­شد. در­سال 2007 LucasD.Panjerداده­کاوی را برای تخمین زمان­خطا با مقایسه پنج الگوریتم دسته­بندی داده­ها مطرح کرد­]7[. Suma.V و همکارانش به سراغ روش­های خوشه­بندی رفته و ثابت­کردند که روش K-mean در میان روش­های مورد بررسی آنها بهینه­تر بوده ­است]8[. CathrinWeiß و همکارانش از روش نزدیکترین همسایه و تشابه جملات با استفاده از موتور­ارزیابیLucene[10] استفاده­ کردند]9[.Lucene خود از SVM و یک مدل بولی[11] برای جستجو و ارزیابی متون استفاده ­می­کند. Nagwani نیزدرمدل­های­ مختلفی از الگوریتم ­های داده­­کاوی متعددی برای اهداف مختلف استفاده­­کرد]10[،]11[،]12[. اما همه این روش­ها یا به جنبه­­ معنایی تشابه متون و کلمات توجه نداشتند. یا برای استخراج ضریب ­تشابه دو متن از الگوریتم­های­ مناسب برای این محیط بهره ­نبردند. الگوریتم­های   برای دانلود متن کامل پایان نامه ها اینجا کلیک کنید استفاده­ شده بیشتر به تاثیر یک متن و یافتن ضریب ­تشابه آنها با متن کاربرتوجه داشتند­، معمولا استاتیک بودند و هرگز به بهره­وری روش در محیط با حجم بالا توجه نداشتند. نوآوری کار تحقیقاتی ارائه­شده نسبت به مدل­های قبلی استفاده از یک الگوریتم بهینه با دقت بیشتر در اندازه­گیری تشابه میان دو متن است به­طوری­که با حجم زیاد مستندات و کلمه­های مشابه در مخازن نرم­افزاری سازگار باشد. این الگوریتم تشابه جملات و تشابه ­معنایی بین کلمات را با هم ترکیب می­کند. به­طوری­که­، مشابه­ترین جملات را، با توضیحات داده­شده برای خطا از سوی کاربر، از میان داده­های قبلی در مخزن استخراج کند.

4.1. فرضیه های تحقیق

مخازن خطای هر نرم افزار منابع ارزشمند دانش هستند.
اطلاعات ثبت شده در مخازن خطا به پیشبرد سریعتر و کم هزینه تر فرآیند تولید نرم افزار کمک می کند
ثبت روش حل مشکل یا خطا در طول فرآیند تولید می تواند به توسعه دهنده پروژه برای حل خطا جدید کمک کند.
برای پیش بینی قسمتی از زمان انجام پروژه و هزینه آن می توان از این اطلاعات استفاده کرد.
5.1. اهداف تحقیق

از آنجا­ که در روش ارائه ­شده در این تحقیق سعی ­بر آن شده تا کاستی­های موجود در روش­های قبلی به ­نوعی پوشش داده ­شود ، به­دنبال بهترین و مناسب ­ترین الگوریتم برای جستجو و محاسبه تشابه متون و مستندات در یک مخزن با حجم­عظیم­داده هستیم. به ­طوری­که با بالا­رفتن این حجم دچار مشکل پیچیدگی­محاسبه و بالا­رفتن زمان­پاسخ­گویی نشود. همچنین تشابه بین دو متن باید شامل تشابه­معنایی باشد. به­جز تشابه بین کلمات تشابه به­ صورت مجموعه کلمات. یعنی جملات باید بررسی شود. با توجه­به مطالب ذکر­شده یافته­های اصلی این تحقیق را می­شود در مطالب زیر خلاصه ­کرد.

ارائه یک روش برای کاوش مخازن خطای نرم­افزار که کاستی­های روش­های قبلی در اندازه­گیری میزان تشابه بین نمونه و خطا را پوشش­دهد.
یافتن خطا­های مشابه با خطای­ جدیدواستفاده از آنها برای تخمین زمان لازم برای رفع­خطا
تعیین میزان پیچیدگی خطای­ جدیدبا محاسبه میانگین طول عمر خطا­هایی با شباهت بیشتر
استفاده ازراه­کارهای رفع ­خطا با جستجوی خطا­هایی با ضریب تشابه بالاتر با خطای ­جدید
هدف نهایی کاهش هزینه­های مالی پروژه­های نرم­افزاری و تسریع درفرآیند مهندسی­نرم­افزار است.

6.1. نوآوری تحقیق

آنچه بیش از همه به ­عنوان نوآوری در کار و بهبود روش­های گذشته مطرح است:

استفاده از یک الگوریتم معنایی مناسب به­همراه تشابه خطی در مرحله اول
استفاده از الگوریتم­های خوشه­بندی در مرحله دوم.
در این تحقیق برای بالا بردن دقت و سرعت در استفاده از اطلاعات از الگوریتم پیشرفته تر نسبت به کارهای قبلی استفاده شده است. الگوریتم ترکیبی که به جنبه معنایی تشابه نیز توجه داشته باشد. همچنین نتایج نهایی برای بررسی راحت تر و دقیق تر با استفاده از یک روش بهینه خوشه بندی طبقه بندی میشوند، تا دسترسی کاربر به اطلاعات نهایی راحتر و سریعتر باشد. به بیانی ساده تر اطلاعات نهایی خوانا وجامع باشند.

7.1. ساختار پایان نامه

این تحقیق شامل 5 فصل است که ترتیب فصول و موضوعات مطرح ­شده به­صورت کلی در زیر بیان شده­است:

1.7.1. فصل اول: کلیات(همین فصل)

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...