دیتا هارت

دیتا هارت

مرجع مجموعه داده ها در تمامی رشته ها

  • مجموعه داده مسابقه هوش مصنوعی پیش بینی انتخابات ریاست جمهوری ایران
  • مجموعه داده مسابقه هوش مصنوعی پیش بینی انتخابات ریاست جمهوری ایران
  • مجموعه داده مسابقه هوش مصنوعی پیش بینی انتخابات ریاست جمهوری ایران
کد : 3459

مجموعه داده مسابقه هوش مصنوعی پیش بینی انتخابات ریاست جمهوری ایران

گروه : متن کاوی
قیمت : 49000 تومان

نقش فضای مجازی در سمت و سوی نظرات مردم انکار ناپذیر است. در دنیا سیستم های هوش مصنوعی بزرگی در این زمینه وجود دارند. مسابقه بزرگ پیش بینی انتخابات ریاست جمهوری ایران با همکاری مرکز فن آفرینی نوتک و نت ماین ، مسابقه ای چالش بر انگیز و جذاب برای برنامه نویسان بود که هدف این مسابقه ارتقای سطح دانش هوش مصنوعی و شناسایی افراد مستعد جهت حمایت های مالی و پرورشی است. به نفرات اول تا سوم این مسابقه جوایز ارزنده ای اهدا گردید. اگر در زمینه نحوه استفاده از این دیتاست برای تحقیقات خود ابهاماتی دارید می توانید از آکادمی داده مشاوره بگیرید. برای آگاهی از دیتاست های منتشر شده توسط دیتاهارت می توانید به کانال تلگرامی ما بپیوندید. 

این مجموعه داده برای کسانی که می خواهند بر روی این اطلاعات کار کنند تهیه شده است. این مجموعه داده شامل نزدیک 1.5 میلیون پیام مرتبط به انتخابات است که می تواند برای دانشمندان داده مفید باشد.  داده های مسابقه شامل پیام های انتخاباتی از 1 فروردین به بعد می باشد.
داده های مسابقه در 4 سطح کلمات و در پکیج های حداکثر 10000 پیامی و به فرمت json در اختیار تیم ها قرار می گیرد.
سطح یک کلمات شامل مهمترین پیام ها و حاوی کلمات زیر می باشند. 
{"جهانگیری", "روحانی", "میرسلیم", "میر سلیم", "رئیسی", "رییسی", "هاشمی ‌طبا", "هاشمی‌طبا", "قالیباف", "انتخابات", "رای", "نامزد", "کاندیدا", "مناظره", "جهانگيري", "روحاني", "ميرسليم", "مير سليم", "رئيسي", "رييسي", "هاشمي ‌طبا", "هاشمي‌طبا", "قاليباف", "راي", "کانديد"}
نام فایل های این دسته از کلمات به صورت telemine_key1_*.json می باشد.که * نشان دهنده شماره پکیج می باشد.در ادامه می توانید به این داده ها دسترسی داشته باشید.

سطح دو داده ها شامل پیام هایی با اولویت کمتر از سطح یک است و حاوی کلمات زیر می باشند. 
{"حزب", "اصول گرا", "اصلاح طلب", "اعتدالگرا", "اعتدال گرا", "مؤتلفه", "کارگزاران", "جامعهٔ روحانیت", "جامعه روحانیت", "ریاست جمهوری", "رئیس جمهور", "رییس جمهور", "جمنا", "پیشرفت و عدالت", "جامعهٔ روحانيت", "جامعه روحانيت", "رياست جمهوري", "رئيس جمهور", "رييس جمهور", "پيشرفت و عدالت"}
نام فایل های این دسته از کلمات به صورت telemine_key2_*.json می باشد.که * نشان دهنده شماره پکیج می باشد.

سطح سه داده ها شامل پیام هایی با اولویت کمتر از سطح یک و دو است و حاوی کلمات زیر می باشند. 
{"خامنه ای", "رفسنجانی", "خمینی", "احمدی نژاد", "موسوی", "خاتمی", "شورای نگهبان", "دوازدهمین", "خامنه اي", "رفسنجاني", "خميني", "احمدي نژاد", "موسوي", "خاتمي", "شوراي نگهبان", "دوازدهمين"}
نام فایل های این دسته از کلمات به صورت telemine_key3_*.json می باشد.که * نشان دهنده شماره پکیج می باشد.

سطح چهار داده ها شامل پیام هایی با اولویت کمتر از سطح یک، دو و سه است و حاوی کلمات زیر می باشند. 
{"مجلس", "سیاست", "سیاسی", "خبری", "اخبار", "شورا"}
نام فایل های این دسته از کلمات به صورت telemine_key4_*.json می باشد.که * نشان دهنده شماره پکیج می باشد.