Здравствуйте, дорогие подписчики!
Уже в это воскресенье (26 мая) мы организуем секцию OptimalDL на DataFest2024. Секция будет в онлайне, чтобы можно было поприсутствовать на докладах где бы вы не находились! На секции планируются следующие доклады:
Докладчик:
Дмитрий Раков
Описание
Расскажет о своем опыте ускорения нейронной сети SegFormer для задачи сегментации в ЖД домене. Докладчик разработал собственный фреймворк для data aware прунинга данной архитектуры, и смог получить ускорение в 1,5 раза при незначительной потере точности.
Докладчик:
Дмитрий Иванов
Описание
Сделает обзор области оптимизации нейронных сетей, а именно методов прунинга и квантования. Доклад охватывает направления исследований от Lottery ticket hypothesis до 4ех битного квантования LLM.
Докладчик:
Алексей Гончаров
Описание
Поделится опытом оптимизации расходов на инференс LLM с применением квантования, дообучения моделей, LoRA адаптеров и низкоуровневых фреймворков инференса.
Докладчик:
Григорий Алексеев
Описание
Расскажет об опыте написания собственного CUDA-kernel-а для оптимизации Flash Attention
Докладчик:
Андрей Щербин
Описание
Поведает о том, как мы принимали участие в конкурсе LPCV2023 и получили самое точное среди быстрых решений