ClearerVoice-Studio
#grokaem_audio
code
Новенький инструмент для:
- enhancement,
- speaker separation,
- target speaker extraction
Также отдельно представляется код для тренировки всех моделей, а также подсчет скоров. Из необычных поддержка множества метрик по reverbation, DNSMOS (speech quality, background noise quality, overall quality, P808_MOS.
Для моих семплов для speaker separation и target speaker extractions сработало очень плохо, но я проверяла на русском. Возможно, будет работать гораздо лучше с английским.
😎Про enhancement😎
А вот enhancement сработал на удивление приятно и быстро. Но сегодня посмотрим на него еще и с другом стороны - не навреди.
Подарили мне тут данные из игр (да вот такие подарки). Я прогоняю через мой базовый
пайплайн, про который мы говорили вот тут и не слышу речи вовсе. Неожиданно и не приятно.
Бенчи по моделям