Посмотрела еще одну нейронку для переозвучивания видео:
Rask. Для наглядности сравнения с Elevenlabs начала
с того же видосика из кафе в Твин Пикс.
Общие впечатления:
- Движок для перевода более продвинутый. Впрочем, на выходе все равно получаем подстрочник.
- Озвучка категории "ну такое", в экспрессивных сценах - уровня плинтуса.
- В отличие от Elevenlabs, где нет никаких промежуточных этапов и редактуры, Rask - достаточно гибкий инструмент. Нейросетка сначала делает перевод в виде субтитров, помечая слишком длинные фразы. Затем можно править текст, тайминг и количество спикеров.
- Можно скачать не только видео, но и аудиодорожку (отдельно с фоновыми звуками либо только озвучку) или сгенерированные субтитры (оригинал или перевод с таймингами).
В целом это выглядит как инструмент, который мог бы быть полезен АВПшникам. Но все разбивается об подход "охватить необъятное" и ценовую политику. Платить такие деньги не сможет ни переводчик (которому не нужна нейро-озвучка), ни студия (учитывая поток контента на озвучку и ограничения на хронометраж - нет смысла платить втридорога за очень посредственный результат).
НО если Rask сделает облегченную версию, которая будет
- распознавать речь и генерировать субтитры
- позволять работать с переводом реплик, редактировать спикеров
- отслеживать слишком длинные или короткие фразы
- экспортировать результат в разных форматах (субтитры, диалоговый лист)
- делать черновой перевод (и то опционально, потому что выйдет баш на баш - столько же времени в итоге уйдет на правки, как мы знаем)
И при этом сделает подписку доступной, как это делает Elevenlabs (думаю, что $20-30 в месяц - нормальная цена), то это действительно ускорит работу АВ-переводчиков, ведь основное время отъедает как раз оформление листов, проставление таймингов и прочая техническая возня. Давайте вот это автоматизируем, а мы сосредоточимся на творчестве, mkay? Было бы славно.
Интересны такие обзоры? Так-то у меня длинный список нейроинструментов. Вот такой примерно:
🥛🥛🥛🥛🥛🥛🥛#иипереводит