- آخرین فایل ها
- پرفروشترین فایل ها
- پربازدیدترین فایل ها
مقدمه ای بر دادهکاوی
در دو دهه قبل توانايي های فنی بشر در برای توليد و جمع آوری دادهها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند [۱].
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. اين رشد انفجاری در دادههای ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين، شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ، بازيابی اطلاعات ، محاسبات سرعت بالا و بازنمايی بصری داده . داده کاوی در اواخر دهه ۱۹۸۰ پديدار گشته، در دهه ۱۹۹۰ گامهای بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد [۲].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان يک فرآيند در شکل۱-۱ نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند [۱]. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.
۱-۱ چه چيزی سبب پيدايش داده کاوی شده است؟
اصلی ترين دليلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگيرد، مساله در دسترس بودن حجم وسيعی از داده ها و نياز شديد به اينکه از اين داده ها اطلاعات و دانش سودمند استخراج کنيم. اطلاعات و دانش بدست آمده در کاربردهای وسيعی از مديريت کسب و کار وکنترل توليد و تحليل بازار تا طراحی مهندسی و تحقيقات علمی مورد استفاده قرار می گيرد.
داده کاوی را می توان حاصل سير تکاملی طبيعی تکنولوژی اطلاعات دانست، که اين سير تکاملی ناشی از يک سير تکاملی در صنعت پايگاه داده می باشد، نظير عمليات: جمع آوری داده ها وايجاد پايگاه داده، مديريت داده و تحليل و فهم داده ها. در شکل۱-۲ اين روند تکاملی در پايگاه های داده نشان داده شده است
فهرست
1-1 چه چيزی سبب پيدايش داده کاوی شده است؟. 4
1-3 جایگاه داده کاوی در میان علوم مختلف... 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12
1-5 داده کاوی و انبار داده ها 13
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15
2- توصیف داده ها در داده کاوی... 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها 15
3- مدل های پیش بینی داده ها 17
4 مدل ها و الگوریتم های داده کاوی... 18
4-3 Multivariate Adaptive Regression Splines(MARS). 24
4-5 K-nearest neibour and memory-based reansoning(MBR). 26
دانلود پاورپوینت آمارتولید ومصرف انواع دیرگداز ها در ایران وجهان
حجم:10840KB | بازدید :3588
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می...
دانلود پاورپوینت مديريت انرژي در بخش تجاري و عمومي
حجم:10184KB | بازدید :2613
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می...
حجم:9444KB | بازدید :4702
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می...
دانلود پاورپوینت آشنايي با شيطانپرستي
حجم:9338KB | بازدید :2986
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می رسد. شیطان پرستی به جای اطاعت از قوانین خدایی یا قوانین طبیعی و اخلاقی، عموماً بر پیشرفت فیزیکی خود با راهنماییهای موجودی مافوق یا قوانینی فرستاده شده تمرکز دارد. به همین دلیل بسیاری از شیطان پرستان معاصر از...
حجم:9202KB | بازدید :4031
دانلود پاورپوینت مد و مدگرایی این فایل در سایت های دیگر با قیمت های بالاتری به فروش می رسد. پاورپوینت درباره آشنایی با مد و مدگرایی فرمت فایل: power point (لینک دانلود پایین صفحه) تعداد اسلاید: 17 اسلاید بخشی از اسلایدها: دیوید رایزمن (محقق و جامعه شناس) : جوامع...
دانلود پاورپوینت تغذیه سالم، فعالیت جسمانی،کنترل وزن
حجم:8351KB | بازدید :3241
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می...
حجم:8235KB | بازدید :3835
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می رسد. كلمه قاچاق يك كلمه تركي است و به معناي گريزاندن ميباشد و از مجموع قوانين و مقررات مربوط چنين استنباط ميشود كه قاچاق عبارت است از فراردادن مال، خواه آن مال مربوط به درآمد دولت بوده و يا ورود و خروج، توليد...
حجم:8234KB | بازدید :2858
این فایل در سایت های دیگر با قیمت های بالاتری به فروش می رسد. فایل ورد قابل ویرایش درمتون تاریخی پس از اسلام به نام لرستان فیلی بر می خوریم که معرب پهلوی است واین سرزمین از همدان تا خانقین و ممدلی امتداد دارد. و زبان شعر های باباطاهر راپهلوی یاهمین لری امروز دانسته...