Жёлтый AI

Channel

7.26K

subscribers

Подпольный филиал https://t.center/kod_zheltyi AI/ML-related news by T-Bank AI teams Чат: https://t.center/zheltyi_aimeetup

Жёлтый AI

Последний в этом году выпуск Жёлтого Club Talks 🎄

Поговорили с @anatoliipotapov и @llm_ceo о релизе T-Lite и T-Pro – прошлись по самым частым вопросам, которые можно было встретить в комментариях:
- Почему наш подход – нечто большее, чем просто fine-tuning
- Откуда такой большой результат на CheGeKa
- Когда ждать новых релизов и многое другое

Смотрите в VK или YouTube

VK Видео

Желтый Club Talks — T-Lite и T-Pro: философия подхода и ответы на популярные вопросы

Этот выпуск особенный по двум причинам. Во-первых, это предновогодний спешл, а во-вторых, речь пойдет про недавний релиз двух больших языковых моделей — T-Lite и T-Pro. Ведущий выпуска — Даниил Гаврилов, руководитель Research-команды Т-Банка. В гостях: —…

2.8K views16:03

Жёлтый AI

И в завершении этой насыщенной недели — еще одна статья, но уже от команды RecSys📱

Артем Карасюк занимается рекомендательными системами для автоматизации обслуживания клиентов. Его команда развернула кастомизированную модель на базе трансформера, об этом и рассказ в статье.

Всем выходных🫰🏼

Хабр

Как мы развернули трансформер на событиях интерфейса операторов поддержки

Привет всем! Я Артем Карасюк, руковожу ML-командой в RecSys-отделе AI Центра Т-Банка, которая занимается рекомендательными системами для автоматизации обслуживания клиентов. Расскажу о том, как мы...

5.2K views16:02

Жёлтый AI

Запустили open-source модели на 7 и 32 миллиарда параметров

Сегодня мы выложили в открытый доступ две большие языковые модели на русском языке: T-Pro на 32 млрд параметров и обновленную T-Lite на 7 млрд параметров. Они построены на базе моделей Qwen 2.5 и дообучены на русский язык.

T-Pro заняла второе место по бенчмарку MERA среди всех моделей, включая проприетарные, и первое место среди открытых. А T-Lite стала лучшей русскоязычной open-source моделью в классе «до 10 миллиардов параметров» по ряду индустриальных бенчмарков.

🎄Скачать модели можно с huggingface.
🎄Больше подробностей и бенчмарки — здесь.

16.2K viewsedited 06:22

Жёлтый AI

🎄

5.4K views21:52

Жёлтый AI

17 декабря в 19:00 в Санкт-Петербурге пройдет T-Meetup: Computer Vision

🐊 обсудим текущий уровень развития VisualLM и основные инсайты по их обучению
🦫 рассмотрим технологии Text2Img-моделей через призму задачи переноса стиля
🦍 узнаем, как квантовать модели для edge-устройств, сохраняя высокую точность

Регистрируйтесь и будем вас ждать!

Т-Банк Митапы

Митап T-Meetup: Computer Vision

Встречаемся на митапе по машинному обучению: в программе — эксперты Т-Банка и Smart Engines, которые приготовили для вас три доклада о компьютерном зрении

7.2K views10:01

Жёлтый AI

Вышли записи с нашего недавнего митапа Hyper NLP Research! Если вы не смогли прийти на него, теперь можно наверстать упущенное

🦍 Mechanistic Interpretability – VK, YouTube
🐖 Как находить темы для исследований в условиях высокой конкуренции – VK, YouTube

7.3K views10:02

Жёлтый AI

Вышел новый выпуск Жёлтого Club Talks, в котором с @a_samigullin пообщались про то, что происходит в мире применений LLM – что с ними делаем в Т-Банке, и что делают другие люди 🦍

Ютуб: https://youtu.be/H_fxb4lmTJs?si=0VPpM2aTaCerEnUH
ВК: https://vk.com/video-151223562_456239606

YouTube

Желтый Club Talks — Что происходит в мире LLM-приложений и тулинга?

А у нас – новый выпуск! Даня Гаврилов встретился с Артуром Самигуллиным. В этой серии разговоры про практическое применение LLM (и не только): как появилось направление LLM-тулинга, что происходит в тулинге и какие проблемы существуют, что происходит в точки…

8.3K views09:30

Жёлтый AI

Новости из солнечного Абу-Даби.

Прошла IEEE Inertantional Conference on Image Processing 2024, на которой @st_dereka выступил с нашей свежей статьей Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy – в ней поставили SoTA на ряде бенчмарков для out-of-distribution (OOD) детекции.

Благодаря новому методу ансамбли становятся еще более устойчивыми и надежными, что супер важно в реальных применениях 🎯

Please open Telegram to view this post

VIEW IN TELEGRAM

7.5K views08:32

Жёлтый AI

Скоро пройдет митап Hyper NLP Research, на котором мы снова расскажем про наши свежие исследования. А чтобы сделать доклады более насыщенными и хардкорными, в этот раз их будет два:

🦍 Mechanistic Interpretability – на котором @nlp_ceo расскажет про переизобретенную область интерпретируемости моделей; о том, что ищут другие исследователи в ней, и что удалось найти нам

🐖 Как находить темы для исследований в условиях высокой конкуренции – доклад про AI Alignment от @borisshapa, в котором обсудим изменения в области за последние 2 года; как и что в ней делаем мы, и что ждет alignment в будущем

Митап пройдет в нашем офисе по адресу Грузинский Вал д. 7, 11 ноября в 19:00 – если вам интересна хардкорная составляющая NLP, то регистрируйтесь и будем вас ждать!

7.9K viewsedited 14:02

Жёлтый AI

А вот и подробности по статье с ACM RecSys 2024🔥

Revisiting BPR: A Replicability Study of a Common Recommender System Baseline

Одна из самых популярных RecSys моделей – Bayesian Personalized Ranking (BPR) насчитывает как минимум 9 реализаций в open source, каждая из которых работает по-разному 👹

В нашей работе мы сравнили все из них, а также предложили свою реализацию, которая работает лучше всего, так что если вы захотите взять BPR, чтобы решать им свои задачи, то можно больше не беспокоиться о том, какую именно версию использовать.

– GitHub
– arxiv

6.3K views08:00

Жёлтый AI

На некоторых ивентах мы уже рассказывали о нашей библиотеке turbo-alignment с инструментами для полного цикла работы над LLM.

С тех пор в ней появилось много нового, так что, готовы рассказать об этом и здесь! Если вы разрабатываете продукты на базе LLM или экспериментируете с их обучением, то это точно для вас 🦍

🌸 Уже реализовали и проверили в боевых условиях необходимые методы для обучения языковых моделей под продуктовые задачи.

🌸 Добавили в репозиторий инструменты для анализа методов алаймента — это супер упрощает не только продуктовую разработку, но и научные исследования в LLM.

🌸 Обучить и протестировать языковую модель можно, запустив несколько команд в консоли. Библиотекой можно пользоваться даже если у вас нет глубокой экспертизы в LLM.

🌸 Никаких single-file implementation и jupyter ноутбуков. Все эксперименты полностью конфигурируются и воспроизводятся, поэтому проверять много гипотез просто. Особенно если у вас много GPU.

🌸 Уже есть реализация пайплайнов SFT, RM, RAG, разных оффлайн методов алаймента (DPO, KTO, ASFT, ORPO, SlicHF, RSO и др). С помощью turbo-alignment можно обучать и тестировать мультимодальные архитектуры, которые понимают картинки и аудио (например LLaVA и HoneyBee). Скоро добавим поддержку онлайн методов алаймента. Подробнее об этом можете почитать в README репозитория.

Уверены, что turbo-alignment и модель T-lite, о которой мы писали недавно, помогут всем построить светлое будущее с самыми крутыми LLM.

А пока — будем благодарны вашим issue, чтобы сделать библиотеку еще круче 👽

Please open Telegram to view this post

VIEW IN TELEGRAM

6.8K views15:15

Жёлтый AI

Мы на ACM RecSys 2024!

Наша RecSys-команда приехала на главную конференцию по рекомендациям. В прошлом году был Сингапур, а в этот раз — Италия. Здесь тепло, вкусно и ну оооочень красиво🌚 А еще много интересных идей по рекомендательным системам и людей со всего мира, которые толкают их развитие вперед.

Сегодня презентация нашей статьи, о которой расскажем чуть позже (stay tuned).

Поэтому, если вы в эти дни тоже здесь, подходите пообщаться!

6.9K views13:50

Жёлтый AI

Вышли записи с митапа по Time Series! Смотреть можно в VK и YouTube

🌸

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Time Series

Share your videos with friends, family, and the world

7.6K views15:35

Жёлтый AI

Вышел свежий выпуск Жёлтого Club Talks, в котором в этот раз поболтали с @nlp_ceo и @murkyfella – о том, как ребята съездили на ACL 2024 рассказать о своей статье, как они смотрят на исследования в NLP, и голограммах 🐖

YouTube

Желтый Club Talks — Про ACL, идеи для исследований и конкуренцию в ресерче

Ребята из команды Research Т-Банка совсем недавно вернулись из Бангкока, где рассказывали на ACL 2024 о своей научной статье.

В этом выпуске Даниил Гаврилов пообщался с ними о том, как устроены исследования в NLP сегодня и чего можно ждать в будущем.

Ведущий…

9.2K views08:01

Жёлтый AI

Вчера прошел митап по Time Series 🦍
Пока мы готовим записи докладов, просим тех, кто пришел лично, поделиться мнением об ивенте, чтобы мы могли делать их еще лучше!

7.3K views14:07

Жёлтый AI

В свежем исследовании от ИТМО мы вошли в топ-3 компаний, вкладывающихся в Open Source в AI! В честь этого хочется еще раз упомянуть некоторые из наших разработок:

🏂T-Lite – наша LLM (а также Instruct версия)
⚡️ETNA – мульти-тул для Time-Series
🐊Research – множество репозиториев, которыми мы подкрепляем наши научные исследования
🐖Turbo Alignment – библиотека LLM alignment с реализацией широкого спектра методов

Если вы вдруг что-то из этого пропустили, то самое время накинуть звездочек и попробовать заиспользовать у себя.

Исследование опубликовано здесь.

11.5K views16:04

Жёлтый AI

24 сентября в 19:00 пройдет наш очередной митап, посвященный временным рядам.

От нас расскажем про оффлайн мониторинг и эмбеддинги в time series, а наш дорогой друг из ecom.tech расскажет про прогнозирование спроса на товары 🦫

Всё произойдет в нашем офисе по адресу Грузинский Вал д.7. Приходите послушать доклады и пообщаться с командой!

meetup.tinkoff.ru

Митапы

Создаем встречи для неравнодушных к миру IT. Объединяем профессионалов, делимся знаниями и храним воспоминания.

8.9K views12:03