View in Telegram
razinkov.ai
Добрый вечер! Четвертая часть разбора Llama 3.1. Reward model & supervised fine-tuning:
https://youtu.be/4aUYhAgW5h4
YouTube
Llama 3.1: разбор статьи. Часть 4. Reward modeling & SFT
Разбираем статью "The Llama 3 Herd of Models" (2024) со слушателями нашей AI-школы.
Таймкоды:
00:00 Приветствие
01:13 4.1.2 Reward Modeling
34:28 4.1.3 Supervised Finetuning
В следующий раз мы начнем с раздела 4.1.4 Direct Preference Optimization
Плейлист…
Share
Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global
Find friends or serious relationships easily
Start