تشخیص زبان متن حوزهای است که به دنبال شناسایی اتوماتیک زبان مورد استفاده در یک متن است بهطور مثال با ارائه یک متن به سیستم شناسایی زبان مشخص می شود که این متن به چه زبانی نوشتهشده است. در این مجموعه داده، متنی حجیم به زبان فارسی عرضه شده است که برای محققین تشخیص زبان متن مفید می باشد. از این مجموعه داده می توان برای ایجاد مدل های تشخیص زبان متن بهره جست.
مقالات فارسی برای یادگیری متن کاوی
مقالات معتبر انگلیسی در مورد متن کاوی
مجموعه داده مناسب طبقه بندی متون فارسی(دیتاست همشهری)
اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید.