ماهیت داده کاوی

خلاصه
1397/06/27

ماهیت داده کاوی در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده‌اند. در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده‌ها می‌سازد

ماهیت داده کاوی


در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده‌اند. در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده‌ها می‌سازد معرفی گردیده است و در برخی دیگر، تعاریف دقیق‌تر که درآنها به کاوش در داده‌ها توجه می‌شود موجود است. برخی از این تعاریف عبارت‌اند از:
•    داده کاوی عبارت است از فرایند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه داده‌های بزرگ و استفاده از آن در تصمیم گیری در فعالیت‌های تجاری مهم. [۱]
•    اصطلاح داده  کاوی ، به فرایند نیمه خودکار تجزیه و تحلیل پایگاه داده‌های بزرگ به منظور یافتن الگوهای مفید اطلاق می‌شود [۲].
•    داده کاوی یعنی جستجو در یک پایگاه داده‌ها برای یافتن الگوهایی میان داده‌ها. [۳]
•    داده کاوی یعنی استخراج دانش کلان، قابل استناد و جدید از پایگاه داده‌های بزرگ.
•    داده کاوی یعنی تجزیه و تحلیل مجموعه داده‌های قابل مشاهده برای یافتن روابط مطمئن بین داده‌ها.
همانطوری که در تعریف های  گوناگون داده کاوی مشاهده می‌شود، تقریباً در تمامی تعاریف به مفاهیمی چون استخراج دانش، تحلیل و یافتن الگوی بین داده‌ها اشاره شده است.
عبارت داده کاوی مترادف با یکی از عبارت‌های استخراج دانش، برداشت اطلاعات، وارسی داده‌ها و حتی لایروبی کردن داده‌هاست که در حقیقت کشف دانش در پایگاه داده‌ها ۱۱ (KDD) را توصیف می‌کند. بنابراین ایده ای که مبنای داده کاوی است یک فرآیند با اهمیت از شناخت الگوهای بالقوه مفید، تازه و درنهایت قابل درک در داده‌هاست. واژه کشف دانش در پایگاه داده‌ها در اوایل دهه ۸۰ در مراجعه به مفهوم کلی، گسترده، سطح بالا و به دنبال جستجوی دانش در اطلاعات شکل گرفته است. داده کاوی کاربرد سطح بالای فنون و ابزار بکار برده شده برای معرفی و تحلیل داده‌های تصمیم گیرندگان است. اصطلاح داده کاوی را آمار شناسان، تحلیل گران داده‌ها و انجمن سیستم‌های اطلاعات مدیریت به کار برده‌اند در حالی که پژوهشگران یادگیری ماشین و هوش مصنوعی از KDD بیشتر استفاده می‌کنند. در ادامه چند تعریف از داده کاوی ارائه می‌شود.
«داده کاوی یا به تعبیر دیگر کشف دانش در پایگاه داده‌ها، استخراج غیر بدیهی اطلاعات بالقوه مفید از روی داده‌هایی است که قبلاً، ناشناخته مانده‌اند. این مطلب برخی از روش‌های فنی مانند خوشه بندی، خلاصه سازی داده‌ها، فراگیری قاعده‌های رده بندی، یافتن ارتباط شبکه‌ها، تحلیل تغییرات و کشف بی قاعدگی را شامل می‌شود» (پیاتتسکی شاپیرو، ماتئوس کریستوفر)
«داده کاوی در حقیقت کشف ساختارهای جالب توجه، غیر منتظره و با ارزش از داخل مجموعه وسیعی از داده‌ها می‌باشد و فعالیتی است که اساساً با آمار و تحلیل دقیق داده‌ها منطبق است» هند (۱۹۹۸)
«داده کاوی فرآیند کشف رابطه‌ها، الگوها و روندهای جدید معنی داری است که به بررسی حجم وسیعی از اطلاعات ذخیره شده در انبارهای داده با فناوری‌های تشخیص الگو (مانند ریاضی و آمار) می‌پردازد».
 کشف دانش در پایگاه داده‌ها در جهت کشف اطلاعات مفید از مجموعه بزرگ داده‌هاست. دانش کشف شده می‌تواند قاعده ای باشد تا ویژگی‌های داده‌ها، الگوهایی که به طور متناسب رخ می‌دهند، خوشه بندی موضوع‌های درون پایگاه داده‌ها و غیره را توصیف می‌کند.