فروش پروژه افزایش نرخ تشخیص و پیشگیری از جرائم فیشینگ در بانکداری اینترنتی با C4.5 با نرم افزار R
کد پروژه: 2984
عنوان پروژه: فروش پروژه افزایش نرخ تشخیص و پیشگیری از جرائم فیشینگ در بانکداری اینترنتی با C4.5 با نرم افزار R
قالب بندی: R – داکیومنت کامل
دسته: کامپیوتر – R
قیمت: 100.000 تومان
قابلیت اجرا در نرم افزار: R
شرح مختصر:
فروش پروژه افزایش نرخ تشخیص و پیشگیری از جرائم فیشینگ در بانکداری اینترنتی با C4.5 با نرم افزار R
در این تحقیق الگوریتم های مختلف داده کاوی بررسی و بر روی دیتاست داده های مربوط به فیشینگ که در چند مرحله فرآیند پیش پردازش و تجزیه تحلیل بر روی آن انجام شده است، اعمال میشود و خروجی الگوریتم های مختلف با پارامترهای خروجی متنوع همچون میزان دقت و صحت و همچنین عدد کاپا تجزیه و تحلیل شده است. در این تحقیق، انوع مختلف مشخصه های فیشینگ و پنج الگوریتم برای طبقه بندی و پیش بینی وب سایت های فیشینگ ارائه شده است و نتایج آن ها با هم مقایسه شده اند. فرآیند نرمال سازی و انتخاب مجموعه داده های موثر بر طبقه بندی پیش از اجرای الگوریتم های داده کاوی برای اجرای درست طبقه بندی و پیش بینی وب سایت های فیشینگ مورد استفاده قرار گرفته اند.
الگوریتم C4.5 توسط Quinlan در سال 1993 پیشنهاد شده است. این یک الگوریتم استتنتاجی درخت تصمیم گیری و یک جانشین از الگوریتم ID3 (Iterative Dichotomiser 3) است. الگوریتم استتنتاجی الگوریتم درخت تصمیم گیری تحت دسته بندی الگوریتم طبقه بندی (classification) قرار می گیرد. در الگوریتم طبقه بندی دو مرحله وجود دارد. اولین مرحله یادگیری است که در آن مدل طبقه بندی ساخته می شود. مرحله دوم مرحله ای است که در آن مدل برای پیش بینی برچسب های کلاس با داده های داده شده استفاده می شود. مجموعه داده های آزمایشی مورد استفاده در مقاله شامل 300 وب سایت است. از میان آنها 200 وب سایت فیشینگ هستند که 154 آن به عنوان فیشینگ توسط مدل طبقه بندی ذخیره شده پیش بینی شده است و 100 وب سایت قانونی هستند که 94 مورد از آن توسط مدل پیش بینی شده است. پس از پیش بینی ماتریس سردرگمی تولید می شود و میزان موفقیت آن 0.826 و نرخ خطا 0.173 است. بنابراین دقت مدل سازنده که با 750 نمونه آموزش دیده شده است دقت 82.6٪ را دارد. میزان صحت الگوریتم C4.5 از نرخ تقریبی 82 درصد تشخیص داده شده در مقاله پایه به نرخ تقریبی 96 درصد در این تحقیق رشد پیدا کرده است.
نه تنها الگوریتم های داده کاوی، بسیاری از پژوهش ها تلاش کرده اند تا الگوریتم های داده کاوی را اصلاح کنند تا قابلیت تشخیص فیشینگ این الگوریتم ها را بهبود بخشد. PRISM الگوریتم جفت گرا صفت-ارزش است. الگوریتم PRISM به طریقی اصلاح می شود که در یک زمان حداقلی تمام قوانین کامل سعی در تولید شود. نتایج به دست آمده برای الگوریتم پیشنهادی حاکی از آن است که الگوریتم های استخراج داده ها می توانند برای تشخیص فیشینگ مورد استفاده قرار گیرند به عنوان الگوریتم پیشنهادی، 87 درصد از سایت های فیشینگ به درستی شناخته شده است. ما در این تحقیق با نرخ صحت بیش از 90 درصد وب سایت های فیشینگ را به درستی تشخیص دادیم و با الگوریتم های مختلف بر روی دیتاست استاندارد مورد استفاده در چند مقاله مقایسه را انجام دادیم.
مزایا و معایب: الگوریتم بهبود یافته C4.5 در اکثر موارد میزان خطای کمتری نسبت به روش سنتی C4.5 دارد. الگوریتم بهبود یافته C4.5 در تعداد متغیرهای بالا و تعداد مشخصه های زیاد، بهینه عمل می کند. قوانین استخراج شده از خروجی الگوریتم بهبود یافته C4.5 بسیار دقیق تر است و میزان فضای حافظه ای که مصرف می شود، بسیار کمتر است. تعداد برگ های تولید شده توسط الگوریتم بهبود یافته C4.5 کمتر از روش سنتی C4.5 میباشد. الگوریتم بهبود یافته C4.5 در دیتاست هایی با داده های نویز بالا بهینه عمل نمی کند و میزان خطای اجرای الگوریتم بهبود یافته C4.5 افزایش پیدا می کند.
عكس خروجی برنامه
عکس 1
عکس 2
عکس 3
عکس 4
عکس 5
عکس 6
برای خرید این پروژه با شماره 09360703858
یا آدرس ایمیل nn4e@aol.com در تماس باشید.