دیتا هارت

دیتا هارت

مرجع مجموعه داده ها و مجموعه مقالات فارسی در تمامی رشته ها

  • دیتاست نام های محل در زبان فارسی

تشخیص موجودیت‌های نامدار یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. این پیکره  شامل 317 هزار نام محل است.

متن کاوی چیست؟

 مقالات فارسی برای یادگیری متن کاوی  

مقالات معتبر انگلیسی در مورد متن کاوی

مجموعه داده مناسب طبقه بندی متون فارسی(دیتاست همشهری)

عملیات برچسب زنی توسط برچسب زن انسانی صورت گرفته است و بازبینی نهایی برچسب ها توسط تیم خبره انجام شده است. 

این مجموعه داده می تواند برای متخصصین پردازش زبان طبیعی بسیار کاربرد داشته باشد. استخراج موجودیت ها یکی از مراحل بسیاری از روش های متن کاوی و پردازش زبان طبیعی است. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید.