✅ بهترین دیتاستها برای پروژههای علوم داده📄 16 منبع برای دسترسی به انواع دیتاستها👨🏻💻 اگه تا حالا دنبال دادههای با کیفیت برای پروژههاتون بودین و نمیدونستین از کجا پیداشون کنین، من اینجا براتون بهترین دیتاستهای ممکن رو جمع آوری کردم!
💸 قراره با هم
16 تا از بهترین منابع دیتاست رو بررسی کنیم که میتونن پروژههاتون رو به سطح جدیدی ببرن. از دیتاستهای معروف کگل گرفته تا منابع آماری اتحادیه اروپا. پس اگه دنبال داده برای پروژههاتون هستین، این لیست قطعاً به کارتون میاد.
👌
1️⃣ وبسایت Kaggle✏️ کگل یه پلتفرم معروف توی جامعه علم دادهست که دیتاستهای متنوعی از حوزههای مختلف مثل سلامت، هنر، ورزش و غیره داره. استفاده ازش آسونه و یه انجمن فعال داره که میتونی سوالاتت رو بپرسی.
2️⃣ وبسایت UCI ML Repository✏️ این مخزن که توسط دانشگاه کالیفرنیا پر از دیتاستهای مناسب برای یادگیری ماشینه. برای تمرین و بهبود مهارتهاتون توی یادگیری ماشین، یه منبع عالیه.
3️⃣ وبسایت StrataScratch✏️ این وبسایت دیتاستهایی از شرکتهای واقعی داره که برای آماده شدن برای مصاحبههای علم داده خیلی مفیده.
4️⃣ وبسایت Google Dataset Search✏️ این ابزار مثل گوگل یه سرچ معمولیه، ولی فقط روی پیدا کردن دیتاستها تمرکز داره. از منابع مختلف مثل مقالات علمی و دیتابیسهای دولتی دادهها رو براتون پیدا میکنه.
5️⃣ وبسایت AWS Public Datasets✏️ برنامه دیتاستهای عمومی AWS آمازون یه عالمه اُپن دیتا داره که میتونی با سرویسهای ابری AWS ترکیب کنی. اگه پروژههات به منابع محاسباتی بیشتری نیاز داشته باشه، اینجا خیلی کاربردیه.
6️⃣ وبسایت Data.gov✏️ این سایت دیتاستهای مختلفی از سازمانهای آمریکایی داره. از کشاورزی و سلامت عمومی گرفته تا آموزش و محیط زیست، هرچی بخوای اینجا میتونی پیدا کنی.
7️⃣ وبسایت FiveThirtyEight✏️ این وبسایت دادهها و کدهای مربوط به مقالات و گرافیکهای خودش رو به اشتراک میذاره. اگه به داستانسرایی داده و پروژههای مرتبط با رویدادهای جاری علاقه داری، اینجا جای توست.
8️⃣ وبسایت The World Bank Open Data✏️ این بانک داده از بانک جهانی شامل اطلاعات توسعه جهانیه. دادههای اقتصادی، محیطزیستی و اجتماعی از کشورهای مختلف رو اینجا میتونی پیدا کنی.
9️⃣ وبسایت GitHub✏️ گیتهاب فقط برای اشتراکگذاری کد نیست. خیلی از سازمانها و کاربران دیتاستهای خودشون رو اینجا قرار میدن که همراه با مستندات و کدهای تحلیلی هست.
1️⃣ وبسایت OpenML✏️ این پلتفرم آنلاین برای یادگیری ماشین، نزدیک به ۵۴۰۰ دیتاست داره و به اشتراکگذاری، سازماندهی و بحث درباره دادهها و نتایج تجربیات یادگیری ماشین میپردازه.
1️⃣ وبسایت Reddit Datasets✏️ این سابردیت یه منبع داده جامعهمحوره. مردم اینجا دیتاستها رو به اشتراک میذارن و درخواست میدن.
1️⃣ وبسایت Eurostat✏️ دفتر آماری اتحادیه اروپا، دادههای آماری با کیفیتی درباره کشورهای عضو اتحادیه داره. از اقتصاد و جمعیت گرفته تا سلامت و تجارت، هر چی بخوای اینجا پیدا میکنی.
1️⃣ وبسایت The HDX✏️ این پلتفرم باز توسط دفتر هماهنگی امور انسان دوستانه سازمان ملل مدیریت میشه و دادههای مربوط به بحرانها و شرایط اضطراری انسانی رو از سراسر جهان فراهم میکنه.
1️⃣ وبسایت The CDC✏️ مرکز کنترل و پیشگیری از بیماریها، دادههای مرتبط با سلامت رو داره. اگه به موضوعات سلامت عمومی علاقه داری، اینجا پر از دادههای کاربردیه.
1️⃣ وبسایت The Bureau of Labor Stat✏️ سایت BLS دادههای زیادی درباره شرایط اقتصادی آمریکا، بازار کار، تغییرات قیمتی و کیفیت زندگی داره. اگه به این موضوعات علاقه داری، اینجا پر از دادههای کاربردیه.
1️⃣ وبسایت The NASA✏️ ناسا بیشتر از 10000 دیتاست در زمینه هوافضا، علوم زمین، دادههای خام و نرمافزار داره. اگه به این موضوعات علاقه داری، اینجا برات یه دنیا داده هست.
🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir📱 پیج اینستاگرام:
📊 @DataScience_fa