متن کاوی حوزه مطالاعاتی است که به دنبال ارائه راه حل هایی برای کشف دانش است. طبقه بندی متون یکی از این زیر مجموعه های متن کاوی است. تیم فنی دیتاهارت در این مجموعه داده اخبار انگلیسی بی بی سی را در گروه های مختلف ارائه کرده است. در این دیتاست 5 گروه خبری وجود دارد از جمله اخبار تجاری، تفریحی، سیاسی، ورزشی و تکنولوژی. این مجموعه داده برای کسانی که به دنبال ارائه تحقیقی بر روی طبقه بندی متون هستند بسیار مفید است.
مقالات فارسی برای یادگیری متن کاوی
مقالات معتبر انگلیسی در مورد متن کاوی
مجموعه داده مناسب طبقه بندی متون فارسی(دیتاست همشهری)
اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.