Жеке кабинетке кіру

ResNet50+Transformer: қазақ тіліндегі қолжазба мәтінді оқшау режимде тану

УДК 004.8

ISSN 2709-4707

Айдарлар: Ақпараттық технологиялар

Қазіргі уақытта деректерді сандық сақтауға көшуге байланысты қолмен жазылған мәтінді тануды жүзеге асыру қажет, бұл қолмен жазылған таңбаларды машина форматына автоматты түрде аудару болып табылады. Қолжазбаны тану көптеген тілдердің болуымен және сол таңбаны әртүрлі жолмен жазуға болатындығымен қиындайды. Осыған байланысты біз қазақ тілінің дерекқорын пайдалана отырып, қолжазба таңбаларын тануға арналған машиналық оқыту моделіне зерттеу жүргіздік. Біз қазақ тілінің жарияланған екі: KOHTD және HKR дерекқорларын пайдалана отырып, resnet50+ Transformer тереңдетіп оқыту моделін оқыттық. Зерттеу барысында бұл мәліметтер базасы дайындалған модельдің валидация нәтижелерін салыстыра отырып, компоненттік және сапалық жағынан зерттелді. нәтижесінде KOHTD дерекқоры CER9,46% және WER-20,18% нәтижелерін көрсетті, ал HKR дерекқоры CER-6,08% және WER-15,51% нәтижелерін көрсетті.

Түйін сөздер: ResNet50, Transformer, HTR, KOHTD, HKR, CNN, қазақша HTR.