امروزه در دانش پزشکی شاهد جمع آوری داده های فراوان در مورد بیماری های مختلف هستیم . تحقیق روی این داده ها و بدست آوردن نتایج و الگو های مفید در رابطه با بیماری ها یکی از اهداف استفاده از این داده ها است. در این پروژه برای بدست آوردن روابط مفید بین عوامل خطر زا در بیماری قلبی استفاده کرده ایم. این بیماری با توجه به شیوه و سهمی که در مرگ و میر انسانها دارد از اهمیت بالایی برخوردار است.
مقالات فارسی برای یادگیری استفاده از داده کاوی برای تشخیص و پیش بینی بیماریها
مقالات فارسی برای یادگیری داده کاوی
با اعمال داده کاوی روی این داده های مربوط به 300 بیمار مهم ترین متغیرها در ارتباط با Thal ، Cp Thalach، Exang و Ca می باشد . در قسمت زیر درباره ویژگی های مختلف این مجموعه داده توضیحات کاملی ارائه شده است. از این دیتاست می توان برای انجام پروژه های داده کاوی بهره جست. دیتاهارت این مجموعه داده را در اختیار علاقه مندان قرار می دهد. در واقع می توان با استفاده از ویژگی های یاد شده در جدول زیر برای پیش بینی ستون آخری مدل داده کاوی ارائه داد.
نام صفت |
توضیحات |
مقادیر فیلد ها |
age |
سن بیمار |
عددی |
sex |
جنسیت |
1 = male; 0 = female |
Cp |
نوع درد قفسه سينه |
1: typical angin 4: asymptomatic |
testbps |
فشار خون فرد در حالت ايستا |
عددی |
chol |
كلسترول خون |
عددی |
fbs |
قند خون |
1 = true; 0 = false |
restecg |
نتایج نوار قلب در حال استراحت |
0: normal 1: having ST-T wave abnormality 2: left ventricular hypertrophy |
thalach |
حداكثر ضربان قلب ثبت شده |
عددی |
exang |
آیا ورزش باعث افزایش آنژین شده |
1 = yes; 0 = no |
Oldpeak |
در ST ميزان تورفتگي موج هنگام ورزش در مقايسه با زمان استراحت |
عددی |
slope |
شیب بلندترین نقطه موجST در هنگام ورزش(نشان دهنده توان قدرتی فرد) |
1: upsloping |
ca |
تعداد رگ هاي اصلي قلب كه ماده رنگي در آنها تزريق شده |
0-3 value |
Thal |
نشان دهنده نتايج آنژيوگرافي |
Normal=3 fixed =6 reversable defect=7 |
diagnosis |
تشخيص قلبي |
Positive -2 Negative -1 |