سۋرەت: anatili.kazgazeta.kz
قازىرگى تاڭدا بۇل مودەل قازاق ءتىلىنىڭ لەكسيكا, مورفولوگيا مەن سەمانتيكانىڭ تاعى باسقا سالاسىندا, ونىڭ ىشىندە قازاق تىلىندە ءماتىندى گەنەراتسيالاۋ, پەريفراز جاساۋ, كونتەكسپەن جۇمىس ىستەۋ, ىقشامداۋ, سونداي-اق گرامماتيكالىق جانە پۋنكتۋاتسيالىق قاتەلەردى تۇزەتۋ, فرازەولوگيزمدەردىڭ ءمانىن اشۋ, تەرميندەردى اۋدارۋ سياقتى تاپسىرمالاردى ورىندايدى.
سالالىق «LLM» مودەلى «Hugging Face» پلاتفورماسىنا جۇكتەلدى. ياعني ول بارلىق قولدانۋشىعا قولجەتىمدى. وسى مودەلدى قولدانۋ ارقىلى جاساندى ينتەللەكتىنىڭ كومەگىمەن كوپتەگەن قازاقشا IT ءونىمدى دايىنداۋعا بولادى. بۇل پرەزيدەنت جولداۋىندا ايتىلعانىنداي «جاساندى ينتەللەكتىنى كەڭىنەن قولداناتىن جانە تسيفرلىق تەحنولوگيالاردى دامىتىپ جاتقان ەلگە اينالۋعا» زور مۇمكىندىك بەرەدى.
ء«تىل-قازىنا» ورتالىعىنىڭ ساراپشىلارى مودەلدى جاساۋ بارىسىندا تابيعي ءتىلدى وڭدەۋ الگوريتمىن قولدانىپ, ۇلكەن كولەمدەگى دەرەكتەردى وڭدەگەن. اتاپ ايتساق: ءبىرىنشى – سوزدەردى تەكسەرۋ ماقساتىنا 684 876 سوزقولدانىس (لەكسيكالىق بىرلىك) قولدانىلدى; ەكىنشى – ءسوز تىركەستەرىن تەكسەرۋ جۇيەسىن جەتىلدىرۋ ءۇشىن 20 212 قاتار ءسوز تىركەسىنىڭ دۇرىس جانە قاتە نۇسقالارى قولدانىلدى; ءۇشىنشى – پۋنكتۋاتسيالىق قاتەلەردى تۇزەتۋ ماقساتىندا 5558 ءماتىن تالداندى; ءتورتىنشى – ءماتىن قۇرىلىمىن تۇزەتۋ ءۇشىن 3000 ءماتىننىڭ دۇرىس-بۇرىس نۇسقاسى ازىرلەندى; بەسىنشى – سويلەمدى ىقشامداۋ فۋنكتسياسى ءۇشىن 6000 سويلەمنىڭ تولىق جانە ىقشامدالعان كونتەنت بازاسى جاسالدى; التىنشى – پەريفراز فۋنكتسياسى ءۇشىن 14 790 سينونيمدىك قاتار جيناقتالدى; جەتىنشى – جالپى قازاق ءتىلىنىڭ 35 گب وڭدەلگەن كورپۋسى قولدانىلدى.
بيىل مودەلگە سويلەسۋ (داۋىستىق) فۋنكتسياسى قوسىلىپ, قولدانۋشىلارعا ىڭعايلى ينتەرفەيس ازىرلەنەدى. سونىمەن قاتار جوبا A1, A2 جانە B1 دەڭگەيلەرى بويىنشا ءتىل ۇيرەتۋگە قابىلەتتى بولسا, كەلەسى جىلى B2, C1 دەڭگەيىندە وقىتادى.
جوبانىڭ سوڭعى ناتيجەسى رەتىندە كەز كەلگەن ءتىل ۇيرەنۋشىنىڭ دەڭگەيىنە ساي جەكە وقىتۋ باعدارلاماسىن دايىنداپ, ۇيرەتۋگە قابىلەتتى داۋىستىق كومەكشى جاسالادى. ول «IOS» جانە Android جۇيەلەرىندە جۇمىس ىستەيتىن ءموبيلدى قوسىمشا تۇرىندە ۇسىنىلماق.