💾LLM Datasets v2.0🚀Updated Repository for Phi-4 Inspiration!
یه مجموعه فوقالعاده از modern, high-quality datasets for post-training، آماده شده که نهتنها به درد پروژههای آموزشی میخوره، بلکه ابزار و مشاورههای عالی هم داره.
🔍 این مجموعه، بعد از فیلترینگ قوی، بهترینها رو در ۸ دسته ارائه میده:
1. General Purpose
2. Math
3. Code
4. Instruction Following 🆕
5. Multilingual
6. Agent & Function Calling
7. Real Conversations 🆕
8. Preference Alignment 🆕💡 اگر در حال تولید datasets هستید یا دنبال داده برای training run بعدی خودتون میگردید، حتماً یه نگاهی بهش بندازید! 😎لینک ریپو:https://github.com/mlabonne/llm-datasets
#هوش_مصنوعی
📣👨💻@AlgorithmDesign_DataStructuer