Жасанды интеллектіні қазақша сөйлету мүмкін бе? Ғылымдағы қазақ тілінің ахуалы қандай? Осы және өзге сұрақтарды Caravan.kz медиа порталының тілшісі Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығының бас директоры Мақпал Жұмабайға қойып көрген еді.
Мақпал Құрманжанқызы, алдымен оқырмандарымызға «Тіл-Қазына» ғылыми-практикалық орталығын толық таныстырып өтсеңіз? Орталық немен айналысады? Мақсат-міндеті қандай?
— Қазақстан Республикасы Ғылым және жоғары білім министрлігі Тіл саясаты комитетінің «Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығының» негізгі мақсаты – ғылыми зерттеулер, білім беру технологиялары мен қосымша білім беру саласындағы қызметті жүзеге асыру. «Тіл-Қазына» орталығы қазақ тілін үйретудің ғылыми-әдістемелік негіздерін қалыптастыру, қазақ тілін ғылым тілі ретінде жетілдіру, терминологияны біріздендіру, балалар, жасөспірімдер мен ересектерге арналған қазақ тіліндегі контент әзірлеу, қазақ тіліндегі IT бағдарламаларды жүзеге асыру, жасанды интеллект тілін қалыптастыруға атсалысу сияқты іс-шараларды атқарып келеді. Бұған қоса, «Тіл-Қазына» орталығы түрлі салаға бағытталған аннотацияланған, лингвистикалық белгіленім жасалған Тіл корпусын жасақтаумен айналысады. 2024 жылы бұл Корпус 33 млн. сөзқолданысқа жетеді. Осы корпус негізінде мəтіннің қазақ тілі ережелеріне сəйкес дұрыстығын тексеретін құрал – «Qazgramma» платформасы әзірленуде. Бұл жүйе орфографиялық, пунктуациялық, грамматикалық қателерді түзету және сөздің мағынасына синонимдер беру, мәтіннің құрылымын реттеу қызметтерін атқарады.
Тілдік мүмкіндікті инклюзия қоғамында дамыту да – біздің міндеттердің бірі. Мәселен, жуырда ғана, 27 наурыз күні көру қабілеті нашар азаматтарға арналған қазақ тілінде дыбыстау функциясы бар экран дикторын тұтынушыға ұсындық. Бұл мемлекеттік тіл бағытындағы алғашқы инклюзивті жобалардың бірі десек болады. Экран дикторы – көзі көрмейтін азаматтардың интернеттегі мәтіндерді дыбыс арқылы қабылдауына, беруіне, таратуына, қолдануына жол ашатын, әлемдік стандартты қазақ тілі үшін де қолдана алатын бірегей жоба.
Ұлттық тіл моделіне (LLM) тоқталсаңыз
— Иә, Мемлекет басшысы Ұлттық тіл моделін құру мәселесі – басты приоритет екендігін алға тартты. Осы бағыттағы ғылыми қауымдастықтың әр қадамы министр Саясат Нұрбекұлының тікелей жетекшілігімен жүзеге асып жатыр. Ол осы ұлттық деңгейдегі жобаға ғылыми қауымдастық пен жоғары оқу орындарының әлеуетін жұмылдырып, бірлесе жұмыс атқаруын назарда ұстап отыр.
LLM аббревитаурасын тарқатқанда «large language models» деген сөз тіркесі шығады. Оны қазақшаға аударғанда, көлемді тіл моделдері деген мағына береді. Қызметі – адам тіліндегі мәтінді түсініп, түрлендіре алатын машиналық оқыту. Олар тілдің ауқымды деректер жиынын талдау арқылы жұмыс істейді.
Ұлттық LLM жүйесін оқыту үшін сапалы контент қажеттілігі өте зор. Сол үшін де кең көлемдегі ақпараттар үздіксіз құйылып тұратын ортақ мемлекеттік база қалыптастыру жолында қарқынды еңбек етіп жатырмыз. «Тіл-Қазына» орталығы осы жұмыстың корпустық бөлігін жүзеге асырушы ұйым ретінде мемлекеттік деңгейде бекітілді. Бүгінгі күнге дейін 413 млн. сөзқолданыс «Ұлттық ақпараттық технологиялар» АҚ-ға өткізілді. Алдағы уақытта жалпы көлемі кемі 1 млрд. параметр ақпарат жинау көзделіп отыр.
Жасанды интеллектіні ана тілімізде сөйлетудегі қазіргі нәтижелер қандай?
— «Тіл-Қазына» орталығы ҚР Президенті Қасым-Жомарт Тоқаевтың «Ұлттық тіл моделін жүзеге асыру» тапсырмасын жүзеге асырушы мекеменің бірі ретінде ведомствоаралық консорциумға мүше болып, қазақ тіліндегі жасанды интеллектіні дамытуға бағытталған жұмыстарды жүргізуді бастап кетті. Қазіргі кезде орталығымыз «Цифрлық трансформация орталығын» құрып, оның ішінен «Жасанды интеллект» бөлімін ашты. Біздің ұйым осы кезеңге дейін 15 ІТ жобаны әзірлеп, қолданысқа енгізген болатын. Еліміздегі азаматтардың және шетелде тұратын қандастардың үлкен сұранысына ие болып отырған бұл жобаларға кезең-кезеңімен жасанды интеллект мүмкіндіктері кіріктірілуде. Мәселен, Тermincom.kz, яғни қазақ терминологиясының қоры. Жалпы қорда 384 932 термин бар. 2023 жылдан бастап қолға алынған «Шеттілдік термин модельдерін қазақ тілінің заңдылықтарына сәйкес игерудің автоматтандырылған жүйесі» шеттілдік терминдерді тілімізге автоматты түрде бейімдейді. Сонымен қатар, машиналық оқытуға негізделген бұл жүйе аса көп мөлшердегі терминді аз уақытта игеруге жол ашады.
Әлеуметтік желідегі парақшаларыңызда «Қазақ тілін үйретудің заманауи әдістемелері» деген сөйлемді байқап қалдық. Мемлекеттік тілді үйретуде, насихаттауда қандай заманауи әдістемелер жақсы нәтиже көрсетуде?
— Қазақ тілін үйретудің түрлі әдістемелері тәуелсіздік алған отыз жылда әбден сыналып, ең мықтылары біршама сараланып қалды деуге негіз бар. Бұған қатысты жұмыспен «Тіл-Қазынаны» Әдістеме LAB бөліміндегі мамандарымыз айналысады. Олардың уәжіне құлақ түрер болсақ, қазіргі заманда ғылыми-техникалық прогрестің дамуына байланысты оқытудың дәстүрлі деп саналатын ескі формасынан интерактивті, тілдік ортаға бойлау және мобильді деп аталатын формаларға ауысып үлгердік. Сол жаңа, тиімді әдістемелерді сараптауда, ғылыми негіздеуде, оқу құралы етіп шығаруда біздің ұжымның да еңбегі бар. Тиімді әдістемелерді қолданысқа енгізудің өзі оңай шаруа емес, ол үшін оқытушылар мен мұғалімдерді қайта оқыту, біліктілігін арттыру қажет. Сонымен қоса ғалымдардың өзара нетуоркингін, қазақ тілі пәні ұстаздарының ғылыми әдістемелеріне сарапшылық пікір беруді, А1, А2, В1, В2, С1 деңгейлері бойынша грамматикалық және лексикалық минимумдар дайындауды, ғылыми зерттеу жұмыстарын жүргізуді, соның негізінде ғылыми мақалалар жазуды жүзеге асырамыз.
IT саласындағы кез келген кәсіби маман өзінің қазақ тіліндегі IT жобаларын сіздерге ұсына ала ма? Сіздер жеке тұлғалардың жобаларын, идеяларын қаржыландырумен айналысасыздар ма?
— Негізі біздің орталық сөз басында айтып кеткенімдей, Ғылым және жоғары білім министрлігінің, оның ішінде Тіл саясаты комитетіне бағынады. Сәйкесінше мемлекет тарапынан бекітілген күнтізбелік жоспарға сәйкес жұмыс барысын ұйымдастырады. Алайда бұл дегеніміз жекелеген азаматтардың идеяларына жол жоқ дегенді білдірмейді. Өз бағыттарымызға үндес келетін кез келген жеке тұлғаны, әсіресе жаңа технологияны жетік меңгерген, креативті ойлары бар азаматтарды қабылдауға ашықпыз. Олардың кейбірін өз жобаларымызға тартып та келеміз. Мәселен, АҚШ-та білімін жетілдіріп жатқан маман Тимур Бектұрды шақырып, «Qazgramma» жобасын әзірлеп жатырмыз. Ал жақында өзін Қызылордада жасанды интеллектіні қазақша сөйлеткен оқушы баланың ұстазы деп таныстырған, Астана маңындағы Қараөткел елдімекенінде тұратын математик мұғалім Дәуіт Сұрағанмен кездестік. Әлеуметтік парақшамыз арқылы хабарласып, жобаларымызға қызығушылық танытқаны үшін оны шақырып, жүздесіп, идеяларын талқылап, пікір алмастық.
Жалпы қазақ тілінің қоғамдағы мәртебесі туралы жиі айтылады. Ал ғылымдағы қазақ тілінің ахуалы қандай?
— Жалпы алғанда, қазақ тілінің ғылыми әлеуеті зор. Қазақ тілін ғылым тілі етуде зор еңбек сіңірген кешегі Алаш арыстары өз дәрежесінде жаратылыстану және гуманитарлық ғылымдардың негізін қалап беріп кетті. Мәселен, ұлт ұстазы Ахмет Байтұрсынұлы «Әліпби», «Баяншы», «Әдебиет танытқыш» кітаптарын, Мағжан Жұмабайұлы «Педагогиканы», Жүсіпбек Аймауытұлы «Тәрбиеге жетекші» мен «Психологияны», Нәзипа Құлжанова «Мектептен бұрынғы тәрбиені», Иса Тоқтыбай «Бастауыш жағрафияны», Халел Досмұхамедұлы «Жануартану», «Табиғаттану» мен «Адамның тән тірлігін», Файзолла Ғалымжанұлы «Геологияны», Бірмұхамед Айбасұлы «Жаратылыстану құралын», Жұмағали Тілеуліұлы «Гигиенаны» жазды. Ал Міржақып Дулатұлы, Қаныш Сәтпаев, Әлімхан Ермекұлы, Сұлтанбек Қожанұлы, Елдес Омарұлы – математика, геометрия мен физиканы қазақша сөйлетсе, Жұмағали Тілеуліұлы – медицина, Жұмахан Күдеріұлы – биология, Құдайберген Жұбанов пен Қошке Кемеңгерұлы лингвистика және тіл саласына арналған оқулықтар қалдырды.
Уақыт өткен сайын тілдің де бәсекелестігі артуы тиіс, ол анық нәрсе. Ғылым тілі деген мәртебеге ие болу үшін тарихта неміс тілі, француз тілі, одан кейін ағылшын тілі биікке көтерілді. Қазіргі кезде компьютер тілі – ағылшын тілі. Жаңа технология тілі – ағылшын тілі. Сол жолда кемшін қалмау үшін біз де жаңа технология талабына сай болып, қазақ тілін заманауи сұранысқа сай бейімдеп үлгеруіміз шарт. IT мамандар мен қазақ тілі ғалымдарының тізе қосып жұмыс істер шағы туып тұр. Жақында ғана жарық көрген «Оксфорд қазақ сөздігі» (Oxford Qazaq Dictionary) ағылшын-қазақ тілінің арасына тікелей көпір болып, тіліміздің Ортақ ғаламдық тіл корпусына қосылуына себеп болмақ. Заманға сай қазақ тілінің озық процесіне жаңа қарқын берер осындай жобалар көп болған сайын, жастарымыз туған тілін қолданып, оның ғұмырын өміршең етеді деп сенеміз.
Ғылым мен техникада қазақ тіліне деген сұранысты арттыру процесінде кедергі болып жатқан мәселелер бар ма?
— Ғылым және жоғары білім министрлігі жаңа техника тіліне қазақ тілі де дер кезінде ілесіп отыруы үшін озық, тиімді, тың жобалар атқарып жатыр. Елеулі нәтижесін жақын күндері қоғам болып сезіне бастаймыз деп ойлаймын. Сол үлкен миссияның орындалуы үшін педагогтерден бастап, журналистер, тіл ғалымдары, IT мамандары өз дәрежесінде үлес қоса берсе, нұр үстіне нұр болар еді.
Тағы қандай жобаларыңыз бар?
— Бізде жобалар көп. Биылдың өзінде түрлі бағытта 10-ға жуық іргелі жобалар мен көптеген іс-шараны жүзеге асыруды жоспарлап отырмыз. Мәселен, жақында жарияланған журналистерге арналған «Мемлекеттік тіл және БАҚ» байқауы биыл 19-рет өткелі отыр. «Мемлекеттік тіл – тәуелсіздік символы» байқауы да бастау алды, оған барлық аймақтан жиналған түрлі ұлт өкілдері қатысады. Сондай-ақ қазақ ғылымының даму барысы мен жарқын өкілдерін басты қаһарман ететін «Ғылым 2.0» подкастымыз да көрерменге жол тартты. Одан бөлек мемлекеттік тілдің заманауи тынысынан хабардар ететін ғылыми-танымдық, тарихи-танымдық, ақпараттық бейнеблоктар да әлеуметтік желідегі белсенді инфлюенсерлермен ынтымақтастықта жүзеге асып жатыр. Шет елдегі қазақтарға арналған тіл оқыту құралдары, бейнесабақтар, балаларға арналған мемлекеттік тілдегі мобильді ойын – солардың бір парасы ғана. Мемлекеттік тіліміз – қазақ тілінің мәртебесі мен әлеуетін, заманға сай озық технологиямен үндестіре дамыту жолындағы еңбегіміз бұдан әрі де жалғасын таба бермек.
Әңгімеңізге рақмет!