Бывало, что вы перепечатывали свои рукописные заметки из блокнота и мечтали, чтобы за вас это сделал кто-то другой? Над такой функцией как раз работают в службе компьютерного зрения Яндекса.
ML-инженер Женя Карташев учит нейросеть усваивать написанный от руки текст. И рассказал нам о подробностях этого процесса.
✍️ Первый этап — это всегда распознавание текста в виде букв, слов или целых строк. Эти данные затем передаются нейронке.
✍️ Далее идёт предварительное обучение системы, где она разбирает алфавиты и разные написания символов.
✍️ Третий этап — декодирование признаков и предсказание. Здесь нейросеть учится понимать, как все элементы связаны друг с другом.
И наконец наступает постпроцессинг: перевод данных в готовый текст. И ещё анализ результата, чтобы пофиксить слабые места модели.
🤔 — это сложнее, чем кажется
😎 — элементарно!