داده ها منبع بسیار غنی از اطلاعات پنهان هستند که می توان به کمک این اطلاعات تصمیمات هوشمندی را اتخاذ کرد. در این میان دسته بندی یا طبقه بندی و تخمین یا پیش بینی دو شکل از تحلیل دادها محسوب می شوند که می توان به کمک آن ها مدلی جهت توصیف و تشریح داده ها استخراج نمود. در کنار توصیف و تشریح داده ها می توان برای داده های بعدی جهتی متصور شد. در این مجموعه داده یک فروشگاه اینترنتی بررسی شده است و احتمال خرید کالا توسط مشتری در آینده نزدیک بررسی شده است. در واقع مساله اصلی در این دیتاست پیش بینی یا تخمین زمان خرید محصول توسط مشتری است. این مجموعه داده شامل اطلاعات 662 مشتری با 11 ویژگی است. در کنار آن یک مجموعه تست به تعداد 474 مشتری نیز ارائه شده است که می توان برای آزمایش مدل ایجاد شده مورد استفاده قرار گیرد. توضیحات ویژگی ها این دیتاست توسط تیم دیتاهارت تهیه شده است. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید.
جایگاه مجموعه داده(دیتاست) در داده کاوی
مقالات فارسی برای یادگیری داده کاوی
برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید. این دیتاست در دو فرمت محبوب داده کاوان یعنی فرمت اکسل و فرمت csv عرضه شده است.