مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده های ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده ار پرسش های ساده درSQLو ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .
از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحات به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند.
در این تحقیق ما به بررسی جنبه های مختلف داده کاوی در وب معنایی یا به اصطلاح وب کاوی میپردازیم.
چکیده
وب، همچون مغز بیکران همگانی است. مغزی که بسیار بیشتر از آنچه مغز یک انسان میتواند در خود جای دهد در خاطر دارد. خرد انباشته شده در وب ما را قادر میسازد تا ابعاد تازهای را تجربه کنیم. وب به عنوان بزرگترین بستر ضبط خلاقیت بشر مطرح است. ورود اینترنت به زندگی انسان و استفاده از آن به عنوان بستری برای تبادل، ذخیره و بازیابی اطلاعات، فرصتهای بسیاری از جمله ذخیره اطلاعات در محیطی نامحدود و بازیابی آن در این محیط را در اختیار انسان قرار داده است. امّا سیل روز افزون تولید اطلاعات و گوناگونی محتوای موجود در وب به عنوان عمدهترین خدمت موجود بر روی آن، بازیابی اطلاعات را با مشکل مواجه ساخته است. انسان با تلاش برای کنترل اطلاعات موجود در این اقیانوس بیکران اطلاعات و این مغز همگانی، سعی در بدست آوردن مربوط ترین اطلاعات موجود در این محیط دارد و این خود بزرگترین چالش عصر حاضر است.
رشد مجموعه های متن الکترونیک (برای مثال کتابخانههای دیجیتال، وب و اینترانت) شدیداً دشواری یافتن اسناد مربوط را افزایش داده است. برای مثال رشد توانی اندازه وب، مطرح کننده نیازهای جدید به فنون بازیابی اطلاعات جاری بوده است.
در این تحقیق و پژوهش، ضمن بیان برخی مفاهیم، میکوشم با توجه به افزایش میزان تولید اطلاعات در وب، و تعدد نظامهای بازیابی موجود در وب، به رویکردهایی که عمدتاً این نظامها پیش گرفتهاند تا میزان جامعیت و مانعیت را برای کاربر مهار پذیر نمایند اشاره کنم. شایان ذکر است که رویکردهای خاص که توسط برخی نظامها دنبال میشود ذکر نشده و تنها رویکردهای عمومی که تقریباً تمامی نظامهای بازیابی وب مدار از آنها بهره میبرند بیان میشود.
تعداد صفحات انگلیسی : 0
تعداد صفحات فارسی : 86
نوع فایل های ضمیمه : Pdf+Word
تحقیق داده کاوی و وب Data Mining in Semantic Web