در این مجموعه داده 21578 نمونه متن وجود دارد که در شش گروه طبقهبندیشده است. این متون اخبارهایی هستند که از طریق رویترز منتشرشدهاند. در این مجموعه داده متنهای با موضوعات متفاوت جمعآوریشده است. این مجموعه داده برای کسانی که به دنبال متنکاوی و طبقهبندی متون هستند مفید میباشد. این دیتاست توسط دیتاهارت برای علاقه مندان عزیز ارائه شده است.
مقالات فارسی برای یادگیری متن کاوی
مقالات معتبر انگلیسی در مورد متن کاوی
مجموعه داده مناسب طبقه بندی متون فارسی(دیتاست همشهری)
اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.