Пре-трейн Grok 3 завершен!
На пре-трейн этап тренировки модели ушло более 200 миллионов H100 часов - самый большой трейнинг ран в истории. Это более чем 6x компьюта Llama 3.1 405B и 70x компьюта DeepSeek V3.
Сейчас модель тюнят (там тоже может быть несколько этапов). Релиз в массы обещают "скоро".
@ai_newz