کلمات کلیدی در هر مقاله برای شناسایی بهتر موضوع اصلی مقاله تعریف می شود. نویسندگان با مشخص کردن کلمات کلیدی هر مقاله سعی می کنند خوانندگان را با موضوع اصلی مقاله آشنا کنند. در واقع این کلمات کلیدی دادن آدرس به خوانندگان درباره موضوع اصلی مقاله است. در این مجموعه داده 500 مقاله و کلمات کلیدی آنها جمع آوری شده است. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید.
مقالات فارسی برای یادگیری متن کاوی
مقالات معتبر انگلیسی در مورد متن کاوی
مجموعه داده مناسب طبقه بندی متون فارسی(دیتاست همشهری)
در این دیتاست بیش از 500 مقاله موجود می باشد که در هر فایل تکس عنوان، خلاصه مقاله و کلمات کلیدی آن وجود دارد. این مجموعه داده برای کسانی که بر روی متون فارسی متن کاوی انجام می دهند مفید است. این 500 مقاله درباره 6 موضوع اصلی می باشند. یکی از دو زیر شاخه اصلی داده کاوی و متن کاوی، خوشه بندی است. این دیتاست برای خوشه بندی بسیار مناسب است و پژوهشگرانی که در این حوزه فعالیت می کنند می توانند از این دیتاست برای تحقیقات خود استفاده نمایند.