Время Валеры

Канал

23,08 тыс.

подписчиков

Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://www.linkedin.com/in/venheads

Время Валеры

Кофаундер датабрикса, помимо работы СТО в компании, еще и статьи пишет - WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH BLOCKWISE RINGATTENTION

Выглядит как отчёт о работе нормальных инженеров, которые решили попробовать что-то новое и описали результаты на arXiv.

Берут Blockwise Ring Attention, аннотируют данные (включая видео и текст) по-разном, постепенно скармливают всё это в модель, увеличивают контекст до миллиона токенов и радуются.

Из интересного – используют Masked Sequence Packing.

Предположим, у нас есть текст длиной 500 токенов, видео длиной 1 000 токенов и книга длиной 10 000 токенов. Вместо того чтобы обрабатывать каждую последовательность отдельно (с огромным количеством padding), модель объединяет их в один батч и добавляет маску, чтобы в каждый момент времени была видна только соответствующая часть каждой последовательности.

Затем лосс от каждого токена перевзвешивают по длине секции. Без этого самая длинная последовательность перевесила бы всё остальное. И радуются жизни.

В целом прорыва нет, просто разумная инструкция

8.4K views06:34

Время Валеры

Нашел зал по ММА в Куала-Лумпуре.

Зал довольно неплохой, его сделали выступающие в ONE FC бойцы. Например, тренер по борьбе — парень из Ирана, а по джиу-джитсу выписывают специалистов из Бразилии.

Сегодня моим тренером был бразилец, который всего 15 дней как переехал в КЛ. После спарринга спрашиваю: как думаешь, какой у меня пояс? Он говорит: белый? Правда, по-английски он почти не понимает, не знает, как будет «пятнадцать», и часто отвечает «Si».

Поэтому я сказал «Si», и он с уважением пожал мне руку.

11.2K views14:30

Время Валеры

Forbes did it again

An AI startup CEO on a Forbes '30 Under 30' list has been charged with defrauding investors out of $10 million

Yahoo Tech

An AI startup CEO on a Forbes '30 Under 30' list has been charged with defrauding investors out of $10 million

Joanna Smith-Griffin is the latest Forbes 30 Under 30 alum facing criminal charges, joining Sam Bankman-Fried, Charlie Javice, and Martin Shkreli.

14.7K views02:52

Время Валеры

Please open Telegram to view this post

VIEW IN TELEGRAM

14.7K viewsedited 08:10

Время Валеры

Кстати, если кто-то проживает в Куала Лумпуре

Можно устроить встречу, ужин, митап

Я как раз сейчас там, до 7 декабря

13.2K views08:19

Время Валеры

Please open Telegram to view this post

VIEW IN TELEGRAM

13.4K views03:08

Время Валеры

Кажется, нет более ненадежной вещи в мире, чем тренера по Джиу Джитсу. Однажды вышло так, что у меня должно было быть три персональных тренировки в один день, каждая - с разным тренером.

За день до, один из них слился, и я подумал - ну и слава богу, три - многовато. Но удар пришел откуда не ждали, на следующий день слились два оставшихся, что превратило интенсивный день - в день отдыха. Надо сказать что все три - те с кем я регулярно тренируюсь, а не случайные чуваки

19.2K views15:17

Время Валеры

Please open Telegram to view this post

VIEW IN TELEGRAM

20.6K views07:42

Время Валеры

Кажется меня раскрыли

25.7K views11:25

Время Валеры

Вышло видео, где обсуждаю свои карьерные планы

YouTube

Валера Бабушкин: выйдет GPT-5, и я стану плотником! | Революция ИИ | Ошибки ML-инженеров

Поговорили с Валерой Бабушкиным — экспертом в области ML и анализа данных, автором книги о проектировании ML-систем.

Обсудили будущее машинного обучения, сложности с поиском хороших инженеров и менеджеров, несовершенство собеседований и специфику работы…

25.7K views08:37

Время Валеры

По итогам 3 месяцев ледяной бочки - жим лёжа сдвинулся со 180*1 до 180*3

Осталось два вопроса

1. Стал ли я стат значимо в три раза сильнее
2. Значит ли это, что по итогам 9 месяцев стоит ожидать жима 180*9

29.0K views10:45

Время Валеры

В детстве нас учили не брать конфеты у незнакомых дядек. Многие даже следовали этому совету.

Однако раз в году наступает момент, когда дети приходят к незнакомым дядькам и требуют с них конфеты.
Сегодня наступил именно такой день и первый раз, когда я встречаю его в собственном дому в роли незнакомого дядьки

Закупил 160 мини сникерсов, твиксов и скитлс
90 мини M&M
85 пакетиков мармелада маленьких
24 пакетика мармелада больших

До украшательства дома, я конечно еще не дошел, но тыкву купил
Кажется, надо прикупить еще пару коробок больших сникерсов и выдавать их за особо крутые костюмы

25.5K views10:06

Время Валеры

Определилось расписание на месяц путешествий.

18 ноября: Лондон - Куала Лумпур
8 Декабря: Куала Лумпур - Бангалор
11 Декабря: Бангалор - Пуне
18 Декабря: Пуне - Мумбай
20 Декабря: Мумбай - Лондон

Из неприятного - 4 декабря планировал получить пурпурный пояс по БЖЖ, придется пропустить грейдинг и ждать ещё полгода

Жаль, с пурпурного пояса можно уже учить других, была бы запасная профессия, после того как ИИ заменит таких как я

27.6K views08:19

Время Валеры

Please open Telegram to view this post

VIEW IN TELEGRAM

25.5K views13:16

Время Валеры

Хорошая обзорная статья от Lilian Weng - Thinking about High-Quality Human Data

1. Как размечать данные, особенно когда задача разметчика - максимально быстро прокликать ваши задания, а ваша - получить максимально качественную разметку. От создания процесса, до оценки (Majority Voting, Multi-Annotator Competence Estimation, Descriptive vs Prescriptive). Есть даже таксономия того, по каким причинам разметчики могут между собой не соглашаться

2. Если датасет уже размечен, как выявить ошибку разметки автоматически? Сюда входят различные трюки с уверенностью модели в предиктах. Самый простой пример - если семпл тяжко учится, может быть это потому, что он некорректно размечен?

Из более сложных - AUM (Area under the Margin), насколько общий поток градиента спорит с конкрентым сэмплом

В целом - рекомендую ознакомиться, особенно тем, кому предстоит размечать данные в автоматическом режиме через людей

lilianweng.github.io

Thinking about High-Quality Human Data

[Special thank you to Ian Kivlichan for many useful pointers (E.g. the 100+ year old Nature paper “Vox populi”) and nice feedback. 🙏 ]
High-quality data is the fuel for modern data deep learning model training. Most of the task-specific labeled data comes…

30.3K viewsedited 20:37

Время Валеры

Вышло исследование рынка продуктовых и дата аналитиков от new HR - у них всегда приятная инфографика и вменяемые вопросы. От зарплаты - до экспертов.

А также топ и анти топ по компаниям, где люди хотят и не хотят работать. Выглядит так, что у Сбера, ВК и Ростелекома большие проблемы с HR Брендом, а у Яндекса, Авито и Авиасейл - все неплохо. Х5 держит баланс по Дао

UPD: Сейчас оказывается собирают информацию для нового исследования

newhr.org

Исследование рынка продуктовых и дата аналитиков: Рейтинги работодателей и анализ зарплат

28.3K viewsedited 15:15

Время Валеры

Поездка в Баку прошла неплохо

Встретился пару раз с местным дата комьюнити
Выступил в университете
Встретился с СТО и синьором из стартапа в Дубае, где они будут работать на пике технологий gen AI
Дал, как минимум, три полезных совета
Съездил в Гобустан
Выступил на конференции и затем пообщался с ребятами из местного гиганта
Сходил в офис БиПи, много говорил
Ел лучшие помидоры в мире

Оценка Баку - очень хорошо, надо приезжать ещё.
Вкусно, приятно, хорошие люди.

Из минусов - пробки и воздух.

Теперь можно наконец-то то разобрать залеж статей с февраля этого года. Из следующего - заплыв в KL и Индию в ноябре/декабре

27.2K views21:00

Время Валеры

Стою в лобби конгресс центра перед выступлением. Мимо проходят две девушки и парень.

У девушки на сумке огромные буквы fendi. Слышу краем уха, что она говорит про некое выступление в 2 часа дня и что там будет Бабушкин, который знает про Data Science

Видимо придется идти

26.4K views09:40