یکی از معروف ترین دیتاست های موجود که برای تحقیقات مرتبط با دسته بندی (Classification) استفاده می شود، مجموعه داده تایتانیک است. تایتانیک، یک کشتی بخار بسیار بزرگ بود که در سال 1912 در هنگام سفر از بندر ساوتهمپتون بریتانیا به نیویورک آمریکا به علت برخورد با کوه یخی غرق شد و 15144 نفر از مسافران و خدمهٔ آن جان خود را از دست دادند و یکی از تراژدی ترین اتفاقات تاریخ رقم خورد. علاوه بر اقتباس های هنری از این تراژدی، تعدادی از دانشمندان علم داده نیز با جمع آوری اطلاعات و ویژگی های 1000 نفر از مسافران کشتی، یک دیتاست نسبتا جامع و شامل برای فعالیت هایی نظیر دسته بندی (Classification) ایجاد کرده اند. این دیتاست مجموعا دارای 1000 داده و 12 ویژگی است که به دو بخش داده های آموزشی و تست تقسیم شده است.
جایگاه مجموعه داده(دیتاست) در داده کاوی
مقالات فارسی برای یادگیری داده کاوی
اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.