امروزه در دانش پزشکی شاهد جمع آوری داده های فراوان در مورد بیماری های مختلف هستیم . تحقیق روی این داده ها و بدست آوردن نتایج و الگو های مفید در رابطه با بیماری ها یکی از اهداف استفاده از این داده ها است. در این مجموعه داده بیماری سرطان سینه مورد بررسی قرار گرفته است. 286 خانم بر اساس ویژگی های زیر مورد بررسی قرار گرفته است.
مقالات فارسی برای یادگیری استفاده از داده کاوی برای تشخیص و پیش بینی بیماریها
مقالات فارسی برای یادگیری داده کاوی
اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. محققین داده کاوی سلامت مخاطبین اصلی این دیتاست هستند.
1. کلاس: عدم ابتلا بیماری، ابتلا به بیماری
2. سن: 10-19، 20-29، 30-39، 40-49، 50-59، 60-69، 70-79، 80-89، 90-99.
3. یائسگی: lt40، ge40، premeno.
4.اندازه تومور : 0-4، 5-9، 10-14، 15-19، 20-24، 25-29، 30-34، 35-39، 40-44،
45-49، 50-54، 55-59.
5. INV-گره: 0-2، 3-5، 6-8، 9-11، 12-14، 15-17، 18-20، 21-23، 24-26،
27-29، 30-32، 33-35، 36-39.
6. گره کلاه در سینه : داشته، نداشته
7. DEG-malig: 1، 2، 3.
8. پستان: چپ، راست.
9. پستان چهار: چپ بالا، چپ پایین، راست بالا، راست پایین، مرکزی.
10. irradiat: بله، نه.
این مجموعه داده برای کسانی که در زمینه داده کاوی سلامت تحقیق می کنند مفید می باشد. در این مجموعه داده می توان بین ویژگی های یاد شده و احتمال بروز سرطان سینه دانش نهفته را کشف کرد. در واقع بر اساس پیش فرض علم داده کاوی باید یک رابطه معنا دار بین ویژگی ها و ستون اول که به وقوع یا عدم وقوع سرطان سینه اشاره دارد وجود داشته باشد که کار داده کاوان شناسایی این رابطه نهفته است.
این دیتاست در فرمت های اکسل و csv برای استفاده محققین عرضه شده است.