فایل ارائه داده کاوی در نرم افزار SQL SERVER درقالب 30 اسلاید قابل ویرایش+50 صفحه فایل ورد مستندات و داکیومنت
داده کاوی به کمک SQL SERVER
فایل ارائه داده کاوی در نرم افزار SQL SERVER درقالب 30 اسلاید قابل ویرایش+50 صفحه فایل ورد مستندات و داکیومنت
مطالب این پست : پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی
با فرمت ورد word ( دانلود متن کامل پایان نامه )
پایان نامه دوره کارشناسی کامپیوتر
گرایش نرم افزار
موضوع:
بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی
دانشگاه آزاد قوچان
استاد راهنما : دکتر عباسعلی رضایی
پژوهشگر : فاطمه بهادری مقدم
عنوان:
بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
چکیده
بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.
در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.
کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین
1-1–مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش[2] بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی[3] یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
اصلی ترین دلیلی که باعث شده داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها,اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی مورد استفاده قرار می گیرد.
داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها.
تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم.
ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ها را کشف می کنند که می توان از آن در کاربردهایی نظیر تعیین استراتژی برای کسب و کار، پایگاه دانش[4] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم .
1
-3-داده کاوی و مفهوم اکتشاف دانش (K.D.D)
با حجم عظیم داده های ذخیره شده در فایلها، بانکهای اطلاعاتی و سایر بانک های داده ای، توسعه ی ابزارهایی برای تحلیل و شاید تفسیر چنین داده هایی و برای استخراج علوم شگفت انگیزی که می توانند در تصمیم گیری مفید باشند، امری بسیار مهم و ضروری است. داده کاوی با عنوان کشف دانش در پایگاه های داده (KDD) شناخته میشود. کشف علومی که قبلا ناشناخته بودهاند و اطلاعاتی که در بانکهای اطلاعاتی موجود بوده و ذاتا بالقوه و مفید هستند.
با وجود آنکه داده کاوی و کشف دانش در پایگاههای داده مترادف همدیگر هستند، ولی در اصل، داده کاوی ذاتاً بخشی و تنها قسمتی جزئی از فرآیند کشف دانش است. فرآیند کشف دانش در بر گیرنده ی چندین مرحله می باشد که از اطلاعات خام، گونه هایی از علوم جدید را بدست می دهد. مراحل کشف دانش به قرار زیر است:
1- پاکسازی داده ها : در این فاز داده های اضافی و نامربوط از مجموعه داده ها حذف می شوند.(داده های ناکامل) [2]
2-یکپارچه سازی داده ها[5] : چندین منبع داده ترکیب می شوند،
3-انتخاب داده ها : انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آنها در داده کاوی مورد نیاز نیستند . برای فرایند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند . به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی ، اطلاعاتی در مورد خرید مشتریان ، خصوصیات آماری آنها ، تامین کنندگان ، خرید ، حسابداری و … وجود دارند . برای تعیین نحوه چیدن قفسه ها تنها به داده ها یی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است . حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه نیست بلکه ممکن است به منظور کاهش هزینه عملیات ، نمونه هایی از عناصر انتخاب و کاوش شوند .
4-تبدیل داده ها : هنگامی که داده های مورد نیاز انتخاب شدند و داده های مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است. نوع تبدیل به عملیات و تکنیک داده کاوی مورد استفاده بستگی دارد، تبدیلاتی ساده همچون تبدیل نوع داده ای به نوع دیگر تا تبدیلات پیچیده تر همچون تعریف صفات جدید با انجام عملیاتهای ریاضی و منطقی روی صفات موجود.
5-داده کاوی : بخش اصلی فرایند ، که در آن با استفاده از روش ها و تکنیک های خاص ، استخراج الگو های مفید ، دانش استخراج می شود.
6-زیابی الگو[6] : مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه گیری.
7-زنمایی دانش : در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.
[1] Data Mining
[2] Knowledge Discovery
[3] Data Mining
[5] Data integration
[6] Pattern evaluation
متن کامل را می توانید دانلود کنید چون فقط تکه هایی از متن این پایان نامه در این صفحه درج شده است (به طور نمونه)
ولی در فایل دانلودی متن کامل پایان نامه
همراه با تمام ضمائم با فرمت ورد word که قابل ویرایش و کپی کردن می باشند
موجود است
زبان مقاله : انگلیسی
تعداد صفحات : 33 صفحه
فقط 500 تومان
فرمت فایل : word(قابل ویرایش)تعداد صفحات120
چکیده
داده کاوی و کشف دانش در پایگاه داده ها از جمله موضوع هایی هستند که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه 80 برای جستجوی دانش در داده ها شکل گرفت.
شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود. همزمان با او پژوهشگران و متخصصان علوم رایانه، آمار، هوش مصنوعی، یادگیری ماشین و . . . نیز به پژوهش در این زمینه و زمینه های مرتبط با آن پرداخته اند.
هدف از انجام این پروژه ایجاد یک وب سایت فروشگاه اینترنتی با قابلیت ارزیابی مشتری به کمک الگورینم رگرسیون است. همچنین به بررسی دیگر الگوریتمها نیز پرداخته شده است.
کلمات کلیدی:
Data mining, ajax, silverligh, asp.net , data access layer, CART, nearest neigbour, regression logic,DataBase
فهرست مطالب
عنوان صفحه
مقدمه.................................................... 1
فصل یکم – داده کاوی ...................................... 2
1-1- مقدمه ای بر داده کاوی ................................ 2
1-2- چه چیزی سبب پیدایش داده کاوی شده است ؟ ............... 4
1-3- فرآیند داده کاوی .................................... 7
1-4- مراحل کشف دانش ....................................... 8
1-5- داده کاوی و انبار داده ها ........................... 13
1-6- خلاصه سازی و به تصویر در آوردن داده ها................. 15
1-7- مدل های پیش بینی داده ها ............................. 16
1-7-1- Classification .......................................... 16
1-7-2- Regression ............................................ 16
1-7-3- Time Series.......................................... 17
1-8- مدل ها و الگوریتم های داده کاوی ...................... 17
1-8-1- Decision trees ...................................... 17
1-8-2- Rule Induction ...................................... 20
فصل دوم – روش های کاهش داده ها
2-1- کاهش داده ............................................ 21
2-2- ابعاد مجموعه داده های بزرگ............................ 22
2-2-1- زمان محاسبه ......................................... 24
2-2-2- دقت پیشگویانه/توصیفی................................. 24
2-2-3- ارائه مدل داده کاوی.................................. 24
2-3- کاهش ویژگی ها......................................... 26
2-4- تجزیه و تحلیل عنصر اصلی............................... 41
2-5- کاهش مقادیر .......................................... 46
2-6- گسسته سازی ویژگی :تکنیک Chimerge...................... 52
2-7- کاهش موارد (حالات)..................................... 60
فصل سوم- مدیریت ارتباط با مشتری
3-1- تجریه و تحلیل......................................... 67
3-2- توضیح داده ها......................................... 68
3-3- تجزیه و تحلیل داده های به دست آمده.................... 70
3-4- شمای مدل.............................................. 75
3-4-1- مدل های برگشت منطقی.................................. 76
3-4-2- Rdial Basis Function Network................................ 79
3-4-3- مدل های درخت رده بندی................................ 81
3-4-4- مدل های نزدیکترین همسایگی (Nearrest-neighbour............. 88
3-5- مقایسه ی مدل.......................................... 89
فصل چهارم-آجاکس
4-1- معرفی اجاکس........................................... 95
4-2- Httprequest آجاکس..................................... 97
4-3- شی XMLHttpRequest..................................... 97
4-4- ارسال یک درخواست به سرور.............................. 98
4-5- مقایسه معماری Asp.net AJAx Extensionsوsp.net2........ 100
4-5-1- معماری Asp.net AJAX Extention........................ 100
4-5-2- معماری sp.net2..................................... 100
4-6-1- کنترل UpdatePanel.................................... 102
4-6-2- راه اندازها.......................................... 104
4-6-2-1- راه اندازغیرهمگام.................................. 104
4-6-2-2- راه انداز PostBack ................................ 104
4-6-3- Timer................................................ 104
4-6-4- UpdateProgress....................................... 105
فصل پنجم – سیلورلایت
-1- سیلورلایت چیست؟........................................ 108
-2- Does Dom به چه معناست؟................................ 112
-3- توضیحاتی در مورد نسخه سیلورلایت ....................... 113
-4- نصب سیلورلایت plug-in.................................. 115
-5- دریافت Silverlight SDK................................ 119
فصل ششم- توضیحاتی در رابطه با پروژه
6-1- معرفی معماری سه لایه................................... 123
6-2- ایجاد متدهای insert، update، delete به صورت سفارشی .......... 126
6-3- ایجاد کلاسهای BLL ..................................... 130
6-3-1-1- افزودن کارمند به لیست کارمندان..................... 132
6-3-1-2- ویرایش پروفایل کارمند............................. 132
6-3-2- OrdersBLL............................................ 133
6-3-2-1- ایجاد پروسیجر WickerBasket ....................... 133
6-3-2-2- افرودن پروسجر به DataSet و ایجاد TableAdapter.......... 134
6-3-3- استفاده از WickerbasketTableadapter در OrderBLL ............ 137
6-3-3-1- افزودن به سبد خرید................................. 137
6-3-3-2- حدف از سبد خرید.................................... 137
6-4- طراحی لایه ی ارائه...................................... 138
6-4-1- صفحه اصلی (HomePage)................................. 138
6-4-2- صفحه عضویت مشتری.................................... 142
6-4-3- صفحه کالاهای موجود................................... 143
6-4-4- صفحه نمایش سبد خرید................................. 145
6-4-5- صفحه پرداخت هزینه................................... 146
6-4-6- صفحه ورود کالا....................................... 148
6-4-7- صفحه ثبت اپراتور.................................... 148
6-4-8- ارزیابی مشتری با روش رگرسیون......................... 149
6-5- DataBase.............................................. 153
6-5-1- جدول مشتری..........................................
6-5-2- جدول اپراتور.........................................
6-5-3- جدول سفارشات........................................
6-5-4- جدول محصولات......................................... 156
6-5-5- جدول غرفه ها.........................................
6-5-6- جدول پرداخت.......................................... 157
6-5-7- جدول پرداخت هزینه................................... 158
6-5-8- جدول متطقه.......................................... 158
6-5-8- جدول Admin.......................................... 158
فصل هفتم-نتیجه گیری........................................ 160
منابع...................................................... 161
فهرست شکلها
عنوان صفحه
شکل1-1- داده کاوی به عنوان یک مرحله از فرآیند کشف دانش..... 5
شکل 1-2- فرآیند داده کاوی.................................. 7
شکل 1-3- سیر تکاملی صنعت پایگاه داده....................... 10
شکل 1-4- معماری یک نمونه سیستم داده کاوی................... 11
شکل 1-5- استخراج داده ها از انبار داده ها.................. 14
شکل 1-6- استخراج داده ها از چند پایگاه داده................ 15
شکل 1-7- درخت تصمیم گیری................................... 18
شکل2-1 گسسته سازی ویژگی سنی................................ 47
شکل 3-1- شرایط توزیع a میزان پرداختی (b) میزان محصول خریداری شده........................................................ 74
شکل 3-2- تکامل سرعت پایین شبکهRBF.......................... 80
شکل 3-3-ارزیابی دقت بی نظمی برای درخت بی نظمی با افزایش شماره ی سطح................................................ 82
شکل 3-4- درخت انتخاب CHAID................................. 87
شکل 4-1- کنترل های Server و اتصال کننده سرویس های کاربردی و ارتباطات ناهمزمان..........................................
شکل 4-2- Page Framework و کنترلهای سرور و سرویس های کاربردی...
شکل 5-1- تعامل بین مرورگر وب پلیر سیلورلایت و XAML و HTML
شکل5-2- معماری سیلورلایت....................................
شکل5-3- مقایسه ی سیلورلایت 1.0 و 1.1..........................
شکل 5-4- نصب استاندارد سیلورلایت............................
شکل 5-5- کلیک بر روی نصب سیلورلایت.........................
شکل 5-6- نمایشی از انیمیشن سیلورلایت........................
شکل5-7- نصب in-place..........................................
شکل 5-8- نمایش لینک SDK....................................
شکل 5-9- نمایش فلودرهایی برای نصب SDK......................
شکل 6-1- چگونگی ارتباط لایه دستیابی به داده ها و پایگاه داده و رابط کاربر...............................................
شکل 6-2- انتخاب پابگاه داده مورد نظر.......................
شکل 6-3- پیکربندی TabelAdapter................................
شکل 6-4- ویزارد مربوط به table adapter..........................
شکل 6-5-تنظیم متد Update....................................
شکل 6-6-انتخاب نام برای متد................................
شکل 6-7-تایید صحت عملیات پیکربندی TableAdapter................
شکل 6-8- شمایی از معماری سه لایه............................
شکل 6-9-کلاسهای موجود در لایه ی نجاری........................
شکل 6-10- انتخاب پروسیجر ..................................
شکل 6-11-انتخاب پروسیجر WickerBasket..........................
شکل 6- 12- TabelAdapter با نام WickerBasket......................
شکل 6- 13- انتخاب ObjectDataSource بعنوان رابط دیتابیس.........
شکل 6- 14- انتخاب متد SelectCategories() جهت نمایش داده ها.......
شکل 6- 15- صفحه ی اصلی.....................................
شکل 6- 16 –انتخاب CategoriesBLL به عنوان کلاس مرتبط با ObjectDataSource
شکل 6- 17- صفحه عضویت مشتری................................
شکل 6- 18- صفحه ی کالاهای موجود در غرفه 3....................
شکل 6-19- صفحه ی نمایش سبد خرید............................
شکل 6- 20 – صفحه ی پرداخت هزینه(از طریق شماره حساب)........
شکل 6- 21 – صفحه ی پرداخت هزینه (در هنگام تحویل)...........
شکل 6- 22- صفحه ی ورود کالا.................................
شکل 6-23- صفحه ثبت اپراتور.................................
شکل 6-42- صفحه ی معیارهای ارزشیابی.........................
فهرست جدولها
عنوان صفحه
جدول 2-2 ماتریس همبستگی برای داده های Iris................. 43
جدول2 – 3 مقادیرویژه برای داده های Iris...................... 45
جدول 4-2 مجموعه داده ها بر روی ویژگی مرتب شده پیوسته با کلاس های متناظر 55
جدول 5-2 یک جدول احتمال برای داده ها دسته بندی.............. 56
جدول -26 جدول احتمال برای فواصل [7.5,8.5] و[8.5,10].............. 57
جدول -27جدول احتمال برای فواصل [0,7.5] و[7.5,10]................ 59
جدول -28 جدول احتمال برای فواصل [0,10] و [10,42]............... 61
جدول 3-1- متغیرهای مورد استفاده مشتری...................... 70
جدول 3-2- توزیع متغیرهای پاسخگو............................ 72
جدول 3-3- توزیع شرطی متغیرهای تشریحی، روی متغیرهای socio..... 72
جدول 3-4– احتمال دسته بندی متغیرپاسخگو و متغیر قسط......... 72
جدول 3-5-داده های بررسی شده............................. 77
جدول 3-6- انتخاب مدل بازگشت منطقی.......................... 78
جدول 3-7- قانون ها در درخت بی نظمی......................... 83
جدول 3-8- ماتریس بهم ریختگی برای مدل بازگشت منطقی.......... 90
جدول 3-9- ماتریس بهم ریختگی برای درخت بی نظمی CART.........
جدول 3-10- ماتریس بهم ریختگی در شبکه ی RBF.................
جدول 3-11- ماتریس بهم ریختگی در مدل nearest-neigbour ............
جدول 3-12- خلاصه ای از مقایسه ی misclassification خطاها.......... 94
جدول5-1- لیست سیستم عامل هاو مرورگرهای پشتیبانی شده توسط سیلورلایت .................................................. 112