دیتا هارت

دیتا هارت

مرجع مجموعه داده ها و مجموعه مقالات فارسی در تمامی رشته ها

این مجموعه داده شامل حاشیه نویسی پیشنهادی برای وظیفه استخراج کلمه کلیدی خودکار است. مجموعه داده شامل یک سند (.txt) و لیست متن های مربوط به متن متنی مربوط به آن است.

دارای 1174 خبرنامه کامل فارسی با حداقل 4 کلمه کلیدی استاندارد طلا است که توسط نویسندگان اخبار حاشیه نویسی شده است. این مجموعه داده از 20،000 خبر خبری از موضوع چندگانه تهیه شده است.

این مجموعه داده توسط آقای حبیب زاده تهیه شده است.