Вход в личный кабинет

Распознавание офлайн-рукописных текстов на казахско-русском языке на основе моделей глубокого обучения

ISSN 2709-4707

УДК 004.93
Рубрики: Информационно-коммуникационные технологии

Оцифрованный текст рукописных заметок позволяет автоматизировать бизнес-процессы многих компаний и упрощает работу человека. В статье рассматривается распознавание письменной рукописи на русском и казахском языках с использованием моделей углубленного обучения. Поскольку почерк каждого человека уникален и нет возможности создавать общие образцы рукописного текста, отчет о распознавании текста в автономном режиме считается более сложным, чем отчет о распознавании в Интернете. В работе используются различные подходы к глубокому обучению при разработке моделей распознавания рукописного ввода на казахско-русском языке, касающихся кириллической графики. Важным элементом успешного глубокого обучения является доступность данных, вычислений, программных платформ и времени выполнения, что упрощает создание и выполнение моделей нейронных сетей для их создания. Обсуждались концепции глубокого обучения, конкурентоспособной, динамично развивающейся отрасли, предлагающей быстрые, количественные и справедливые инструменты для анализа и сравнения различных подходов и методов обучения. Были проанализированы популярные модели глубокого обучения, такие как Abdallah, Bluche, Flor и PUIGCERVER, а результаты экспериментов были проанализированы на основе гистограммы. Эксперименты проводились на основе большой базы данных офлайнрукописных текстов на казахском языке под названием Kazakh Offline Handwritten Text Dataset (KOHTD). Создан телеграм-бот, созданный специально для сбора рукописных данных на казахском языке. Инструмент для проверки информации и исправления ответов, введенный этим телеграмботом, был создан на основе нейронной сети.

Ключевые слова: почерк, глубокое обучение, нейронная сеть, KOHTD, наборы данных.