شناسـایی سـاختار یـک فرآینـد در پیشبینـی، کنتـرل، تجزیـه و تحلیل و ارزیابـی آن امری حیاتی اسـت. در اقتصـاد کلان، تأثیـر عواملـی هم چـون: سیاسـت، خط مشـی شـرکتها، شـرایط اقتصـادی، انتظـار سـرمایهگذاران در تغییـرات بـازار، نیـاز بـه یـک مدلسـازی صحیـح، سـازمانیافته و دارای قـدرت، صحـت پیشبینـی را بـه یـک ضـرورت اجتنـاب ناپذیـر بدل میکنـد. با رشد دادهکاوی، تحلیلها و پیشبینیها رنگ و بوی علمیتر و واقعبینانهتری به خود گرفته است.
بیشتر بخوانید: علم اقتصاد || مقالات فارسی برای یادگیری داده کاوی
بیشتر بخوانید: مقالات فارسی اقتصاد و علوم مالی|| مجموعه داده های مناسب برای تحقیقات در زمینه اقتصاد
امروز مجموعه دادهای مناسب برای پیشبینی بازار سهام با توجه به اتفاقات رخ داده در جهان برای عزیزان تدارک دیده شده است که امیدواریم مورد توجه واقع گردد .
این مجموعه داده به جمعآوری ۲۵ خبر برتر بر اساس رایهای کاربران سایت reddit و شاخص داو جونز از تاریخ ۲۰۰۸/۰۸/۰۸ تا ۲۰۰۱۶/۰۷/۰۱ پرداخته است.
این مجموعه داده شامل سه بخش زیر است :
RedditNews.csv : این فایل شامل دو ستون است که در ستون اول تاریخ اخبار و در ستون دوم عنوان اخبار وجود دارد.
DJIA_table.csv : این فایل شامل اطلاعات مربوط به شاخص داو جونز است.
Combined_News_DJIA.csv : این فایل شامل ۲۷ ستون است که در ستون اول تاریخ خبر، ستون دوم برچسب تخصیص یافته است
( ۰ : ارزش Adj Close بالا برود و یا ثابت بماند. ۱ : ارزش Adj Close پایین برود ) و در بقیه ستونها اخبار برتر گنجانده شده است.
نام ویژگی | توضیحات |
ساختار فایل | Csv |
تعداد رکورد | سه بخش به مجموع ۷۷۵۸۸ رکورد |
زبان | انگلیسی |
حجم فایل | ۶ مگابایت |
نمونههایی از قابلیتهای استفادهی دیتاست:
- پیشبینی روند بازاربورس با توجه به اخبار پربازدید