دیتا هارت

دیتا هارت

مرجع مجموعه داده ها و مجموعه مقالات فارسی در تمامی رشته ها

  • مجموعه داده ایست واژه فارسی دیتاست همشهری
کد : 3479

مجموعه داده ایست واژه فارسی دیتاست همشهری

گروه : متن کاوی
قیمت : رایگان

مراحل پیش پردازش در علوم متن کاوی دارای اهمیت بسیاری هستند یکی از مراحل متن کاوی، حذف ایست واژه هاست. ایست واژه های کلماتی هستند که بار مفهومی زیادی را حمل نمی کنند بنابراین در مرحله پیش پردازش حذف می شوند. در این قسمت لیست ایست واژه های فارسی برای علاقه مندان معرفی می شود. پیدا کردن لیست کامل ایست واژه های فارسی برای محققین داخلی از دیرباز مشکل آفرین بوده است مجموعه دیتاهارت در مجموعه داده کد 3413 یک نمونه ایست واژه ارائه کرده بود که مورد استقبال بسیار محققین قرار گرفت و بیش از ده هزار بار دانلود شد نظر به این استقبال در این مجموعه داده ایست واژه کامل تری شامل 814 ایست واژه که در پروژه دیتاست همشهری جمع آوری شده است ارائه می گردد. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.