Мәтіндік құжаттардан деректерді автоматты түрде алу процесін зияткерлік қамтамасыз ету бойынша зерттеу нәтижелері ұсынылған, бұл көп жұмысты қажет етпей, қайта өңдеусіз және бейімдеусіз үлкен көлемдегі жартылай құрылымдық мәтіндерден алынған құжаттар корпусын құруға және пәндер бойынша сәйкес жұмыс жоспарларын анықтау мүмкіндік береді. Зерттеу пәні оқу нәтижелері мен оқу пәнінің мазмұнын сипаттайтын деректер жиынтығы ретінде анықталған жұмыс оқу жоспарларының (силлабустардың) мазмұны болып табылады. Жұмыстың нәтижесінде авторлар «Ақпараттық жүйелер» білім беру бағдарламасының пәндері бойынша жұмыс оқу жоспарларының құжаттарынан мәтіндер корпусын құрды. Болашақта жұмыс оқу жоспарларының білім беру мазмұны бойынша ұқсас құжаттарды анықтау үшін косинус қашықтықтарының матрицасын алу жоспарлануда.
түйін сөздер: деректерді шығару, құжат корпусы, табиғи тілде өңдеу, құрылымдалмаған деректер, білім беру мазмұны.