دیتاست هزار خبر فارسی با مشخصات هر خبر
مجموعه داده اخبار و نظرات اخبار در وب سایت الف
مجموعه داده  کامل همشهری نسخه 1 شامل 166 هزار سند در فرمت اکسل و csv
مجموعه داده توییت های طعنه دار و بدون طعنه فارسی برای طعنه کاوی
مجموعه داده ایست واژه فارسی دیتاست همشهری
مجموعه داده پردازش شده پرسیکا ( دیتاست طبقه بندی متون خبری فارسی)
مجموعه داده اسپم مربوط به پیامک های انگلیسی
مجموعه داده اخبار انگلیسی بی بی سی
مجموعه داده موجودیت های  نامدار در زبان فارسی
مجموعه داده مسابقه هوش مصنوعی پیش بینی انتخابات ریاست جمهوری ایران
مجموعه داده مقالات فارسی و کلمات کلیدی هر مقاله
لیست کلمات ایست واژه فارسی
مجموعه داده مقالات پذیرفته شده در کنفرانس AAAI
مجموعه داده متن کاوی رویترز
مجموعه داده متن فارسی برای پروژه های تشخیص زبان متن
مجموعه داده متن انگلیسی برای پروژه های تشخیص زبان متن
مجموعه داده تشخیص اسپم در ایمیل های فارسی
مجموعه داده رزومه اساتید دانشگاه بابل
مجموعه داده تشخیص اسپم در ایمیل ها
مجموعه داده اخبار فارسی منتشر شده در خبرگزاری های ایران
دیتاست (مجموعه داده) ایمیل های هیلاری کلینتون