دیتا هارت

دیتا هارت

مرجع مجموعه داده ها در تمامی رشته ها

  • مجموعه داده توییت های طعنه دار و بدون طعنه فارسی برای طعنه کاوی
  • مجموعه داده توییت های طعنه دار و بدون طعنه فارسی برای طعنه کاوی
  • مجموعه داده توییت های طعنه دار و بدون طعنه فارسی برای طعنه کاوی
  • مجموعه داده توییت های طعنه دار و بدون طعنه فارسی برای طعنه کاوی

طعنه، از طعنت به معنای نیزه زدن ریشه گرفته است. ( دهخدا) . طعنه در زبان انگلیسی به‌صورت Sarcasm خوانده می‌شود. طعنه به سخنی تلخ، بابیان برنده و تمسخر و دست انداختن گفته می‌شود که در فرهنگ‌هایی که آزادی در تفکر و بیان کمتر است بیشتر نمود دارد. طعنه کاوی یکی از زیرمجموعه‌های متن‌کاوی است که به دنبال متن طعنه‌دار  بدون طعنه است. تشخیص طعنه کار بسیار مشکلی است زیرا شدیداً وابسته به فرهنگ و محیط سخن است. در این مجموعه داده ( دیتاست) که از توییتر فارسی جمع‌آوری‌شده است 600 توییت طعنه دار و 600 توییت بدون طعنه وجود دارد. در این مجموعه داده توییت های خام و پیش پردازش شده نیز وجود دارند. این مجموعه داده برای دانشجویانی که به دنبال تحقیق در حوزه طعنه کاوی هستند توسط دیتاهارت تهیه شده است. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.