В настоящее время, в связи с переходом на цифровое хранение данных, существует необходимость в реализации распознавания рукописного текста, который представляет собой автоматический перевод рукописных символов в машинный формат. Распознавание рукописного ввода осложняется тем фактом, что существует много языков, и один и тот же символ можно писать по-разному. В связи с этим мы провели исследование модели машинного обучения для распознавания рукописных символов с использованием баз данных казахского языка. Мы обучили модель глубокого обучения ResNet50+ Transformer, используя две опубликованные базы данных казахского языка: KOHTD и HKR. В ходе исследования эти базы данных были изучены с компонентной и качественной сторон со сравнением результатов валидации обученной модели. В результате база данных KOHTD показала результаты в виде CER-9,46% и WER-20,18%, в то время как база данных HKR показала результаты в виде CER-6,08% и WER-15,51%.
Ключевые слова: ResNet50, Transformer, HTR, KOHTD, HKR, CNN, казахский HTR.