ruaccent-turbo3.1 - улучшение модели в случаях с несколькими одинаковыми омографами
В предыдущих версиях руакцента была одна проблема - модель в случаях с двумя и более одинаковыми омографами (например "на горе стоит замок, а на его двери висит замок.") всегда ставила один и тот же (в нашем примере зам+ок). Также существовала проблема, что модель иногда путает контексты для омографа. В обновленной версии tiny2.1 и turbo3.1 над этими проблемами была проделана работа.
Метрики моделей (на усложненном датасете):
ruaccent-turbo3 -> 95.86%
ruaccent-turbo3.1 -> 95.98%
А вот на tiny качество выросло значительно:
tiny2 -> 90.18%
tiny2.1 -> 95.31%
Говоря о значительном росте и улучшениях, нельзя не отметить, что сегодня у меня особенный день - мой день рождения! Как и в работе над моделями руакцента, каждый новый год жизни приносит свои улучшения, опыт и достижения.
Бтв, я сегодня на AI Conf, так что если хотите поболтать, велком к зоне "Онтико AI Музыка". Я здесь со своим другом
@varfolomeefff.
GitHub:
https://github.com/Den4ikAI/ruaccent
Донат:
https://pay.cloudtips.ru/p/b9d86686