Тут у Т-Банка есть и про голосовую верификацию, и про синтез. Но мне показалось любопытным про применения voice conversion:
В контакт центрах он позволяет:
✔️Ослабить акцент
✔️Повысить конверсионность прозвона
✔️Деперсонализировать диктора.
Ну и для бренда можно существенно сэкономить на работе диктора, служащего его рекламным лицом.
Говорят, что учится на 30 минутах. Если при этом реально превосходит синтезы по естественности и отсутствию артефактов - наверно, есть смысл.
#ml #speech #voice_conversin