دوره معرفی مدلهای زبانی بزرگ (LLMs)
این دوره شامل مباحث زیر است:
1️⃣معرفی معماری ترنسفورمر (Transformer)2️⃣ مقاله معروف Attention is All You Need3️⃣ مکانیزم Self-Attention و نحوه عملکرد آن
4️⃣توجه چندسری (Multi-Headed Attention)5️⃣ مفاهیم Teacher Forcing و Masked Attention6️⃣کدگذاری موقعیتی (Positional Encoding)7️⃣ بررسی دقیق لایه دیکودر (Decoder)
8️⃣ استفاده از کدگذاری سینوسی (Sinusoidal Encoding)
9️⃣نرمالسازی دستهای (Batch Normalization)🔟نرمالسازی لایهای (Layer Normalization)
و...
https://www.youtube.com/playlist?list=PLZ2ps__7DhBbaMNZoyW2Hizl8DG6ikkjo
#هوش_مصنوعی
📣👨💻@AlgorithmDesign_DataStructuer