Очень дорогой этап обучения нейросетей — RLHF, дообучение с... / AI круто / Telegram Center

Очень дорогой этап обучения нейросетей — RLHF, дообучение с человеческим фидбэком, я про него уже писал в разлетевшемся посте про слово delve. Если вы им занимаетесь, то вот вам идея: наймите в команду когнитивного психолога. У нас десятки подходов, которые позволяют сделать этот этап быстрее и лучше. Вот вам примерное направление мысли: - Всего две статьи про использование сигнала из айтрекинга для rlhf (обе плохие). ~~Вот бы была компания с мощнейшей нейронкой и огромной юзербазой айтрекеров в их виар шлемах~~ - НОЛЬ статей про использование имплицитных методов. Тут не буду подробно распинаться, буквально миллионы долларов закопаны, надеюсь, кое-что сделаем в этой области на работе в ближайшее время.

AI круто

Почему ChatGPT постоянно использует слово «delve»?

Всё началось с кеков: Пол Грэм твитнул что-то вроде «видишь бездушное письмо @ замечаешь, что в нём есть слово delve»

Илон Маск подтвердил.

Джереми Нгуен просканировал пабмед, и обнаружил, что упоминаемость…

https://t.center/humanagentinteraction/16

260 viewsedited Nov 27 at 17:12

Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global

Бот для знакомств