Yandex Qazaqstan компаниясы Қазақстан нарығына бірқатар бағдарлама әзірлеген. Компания өкілдері Салтанат пен Алмаз бізге жаңалықтар туралы айтып берді.
— Салтанат, сәлеметсіз бе? Оқырмандарымызға IT саласындағы продакт менеджер қызметкері не істейтінін айтып беріңізші.
— Продакт менеджер ретінде белгілі бір цифрлық сервис пайда болған сәттен бастап, нарыққа шыққанша оның дамуын бақылауға жауаптымын. Қазір Қазақстандағы желіні қолданатындар интернеттее керек ақпаратын тез тауып алуы үшін жұмыс істеп жатырмын. Мен үшін маңызды жобалардың бірі болған — Іздеу бағанынан шығатын жылдам жауаптар. Осы қызметтің арқасында қолданушылар сұрақтарына нақты фактілерге негізделген жылдам жауап ала алады. Қазақстандағы қолданушылар уақытын үнемдей алатыны мен қажет ақпаратын ана тілінде тез таба алатынын жұмысымның нәтижесі деуге болады.
— Келесі сұрағымыз да дәл осы туралы. Жақында Яндекс компаниясы Нейро деген жаңа сервисті таныстырды. Ол қандай қызмет көрсетеді?
— Нейро — қолданушыға сұрағына байланысты көптеген интернет парағын зерттеуге уақыт құртпау мүмкіндік беретін сервис. Оның орнына сервис нәтижелерді өзі талдап, қысқа жауап әзірлеп береді. Бұл бірнеше дереккөзбен жұмыс істегенде өте ыңғайлы.
Сервис ақпаратты сурет арқылы да іздей алады: мысалы, бір ескерткіштің фотосын жүктеп, суреттегі кім екенін сұрасаңыз, нақты жауаппен қатар түрлі қызық тарихи дерек те шығады. Ескерткіш қайда орналасқанын да біле аласыз.
Нейроның басты артықшылығы ретінде оның қазақша және орысша сауалдарды түсінетінін атауға болады. Бұл үшін біз сервисті өте ауқымды дереккөз арқылы оқыттық. Мысалы, ескерткішке оралар болсақ, дәл сол сұрақ қазақша қойылса, іздеу сервисі жауапты қазақша шығарып береді.
— Жаңа сервис қандай технологияларға негізделген? Нейрожүйемен байланысы бар ма?
— Расымен де Нейро қолданыстағы іздеу жүйесі мен ғаламтордағы ақпаратпен жұмыс істей алатын үлкен генеративті модельдерді біріктірді. Қолданушы сауалын енгізгеннен кейін біздің жаңа қызметіміз ақпаратты тауып қана қоймай, мазмұн бойынша ең өзекті дереккөздерді іріктей алады. Содан кейін нейрожелі барлық дереккөзді маңызды екеніне қарай бағалап, ішінен барлық жағынан сәйкес келетін бес бетті қалдырып, соның негізінде қажет жауапты құрастырады.
— Нейро қолданушыға қажет ақпаратты қалай таңдап, талдайды?
— Біріншіден, сервис біздің күнделікті сөйлеу ерекшелегімізді түсінетіндіктен, қолданушының қалауын да жақсы түсінеді. Тілдік модельге әдейі интернеттен бірнәрсе іздеген кезде күрделі тіркесті қолданбауға үйреттік. Қарапайым тілмен айтқанда, енді желіден ақпарат іздеу досыңнан көмек сұрағандай оп-оңай болады.
Нейроны өзіне ұқсайтын өнімдерден ерекшелейтін тағы бір фактор — интернетте бар барлық ақпаратты қолданатыны. Нейрожелі қолданушының сауалына сәйкес келетін ақпаратты сұрыптап, кейін сауалға сәйкес келетін бес жауапты іріктеп алып, қорытынды жауап әзірлейді. Ал Нейроның генеративтік модельдерден бас айырмашылығы — жауапты әзірлеуге қажет барлық деректі интернеттен іздейтіндіктен, үнемі жаңартылып отыратын ақпарат ағынымен жұмыс істейтіні.
— Нейроіздеуді әзірлеп жатқанда қандай да бір қиындық болды ма?
— Нейро қолданушы сауалына жауап бергенде бұған дейінгі сауалдарды өңдегенде жиналған ақпаратты қолданбай, тек қазір қолда бар ақпаратқа сүйеніп, ешқандай артық дерек қоспай жауап беретіндей етіп баптау қиын болды. Генеративті модель әзірлейтіндердің бәоі үшін осы мәселе әлі өзекті болып тұр. Бірақ біз мәселені ақыры шештік.
— Командаларыңыз керемет нәтижеге жеткені анық. Бірақ қолданушыларға әлі де Нейро күнделікті өмірге қалай әсер ете алатыны қызық.
— Бұған дейін айтқанымдай, Нейро бірнеше дереккөзбен жұмыс істеу қажет болғанда өте оңтайлы шешім бола алады. Жүйе сәйкес келетін нәтижелерді анықтап, оны қысқа жауапқа айналдыра алатынының арқасында үнемі нақты әрі өзекті жауапты жылдам ала аласыз. Ал Нейроның жауаптары дереккөздер тізімімен бірге берілетіндіктен, қолданушы қызық тақырыпты тереңінен зерттей алады. Ал тізімдегі ақпарат беттерінің қожайындары осылай қосымша трафикке қол жеткізеді. Сонымен қатар Нейро оқушылар үшін де керемет көмекші болмақ. Қазақстанның әр бесінші тұрғыны мектепте оқиды. Біз де қазақша сауалдардың 70%-і білім саласына және түрлі мектеп бағдарламасына қатысты екенін білеміз. Мысалы, оқушылар қазақ хандығының құрылуы туралы немесе митоз бен мейоз айырмашылығы жайлы көп іздейді.
— Алмаз, қазақ тілі мен цифрландыру жайлы әңгіме қозғадық қой. Осы орайда өзіңіз Алисаны қазақша сөйлетуді қолға алуға Яндексті не түрткі болғанын айтып беріңізші.
— Қазақстандағы қолданушылар күн сайын Алисаға миллион түрлі сұрақ қояды, сұрақтың саны күн өткен сайын артып келеді. Осылай, біз қоғамның сұранысына қарай виртуал көмекшіміз аудиторияға одан әрі ыңғайлырақ етеміз деп шештік.
— Бұл ойды жүзеге асыруға қандай технологиялар көмектесті?
— Командамыз Алисаға қазақ тілін түсініп, қазақша сөйлеуді үйретуге тілдік модельдер саласындағы жетістіктер көмектесті. Назарбаев университетінің ақылды жүйелер мен жасанды интеллект институтының ашық деректерін негізге алдық. Университет командасы телебағдарламалар мен подкастардың 1 200 сағат болатын жазбаларын шифрлап, 600 мың ауызша қазақ тілі фрагменттерінен базалық жинақ әзірлеген.
Сонымен қатар біз қарым-қатынас сценариін құрастыруға және Алисаға шынайы диалог құру үшін белгілі бір жағдайларда сөйлемді дұрыс құрастыруды үйрету үшін тіл мамандарына жүгіндік.
— Смарт құрылғылардағы қазақша сөйлейтін Алисаның аналогтарымен салыстырғанда қандай да бір ерекше мүмкіндігі бар ма?
— Бар, себебі бұрын дыбыстық көмекші құрылғы баптауларында бар тілде ғана жауап беретін. Ал қазір Алиса әңгіме барысында қазақшадан орысшаға ауысып отыра береді.
Бұған қоса виртуал ассистент енді қазақша нұсқауды көбірек түсінетін болды. Енді Алисаға қазақша музыка қос деуге, таймер немесе оятқышты түзе деуге, сонымен қатар ақылды үйді басқаруға көмектес деуге болады.
— Мұны әзірлеп жатқанда команда қандай да бір қиындыққа тап болды ма?
— Қазақша виртуал көмекші дайындау — ұзақ әрі күрделі процесс. Бұған дейін Назарбаев университетіндегі әріптестеріміз телебағдарламалар мен подкастарды зерттей отырып, ауызша қазақ тілінің фрагменттерін жиғанын айттым. Бірақ Алисаны ақылды дыбыс құрылғыларына үйрету үшін қосымша деректер қажет болды. Мысалы, біз дыбыс аппаратына, телефон мен теледидарға әртүрлі қашықтан сөйлейміз, оның үстіне диктор қарапайым адам сияқты сөйлемейді. Сондықтан вирутал көмекші дұрыс жұмыс істеуі үшін қазақша сөйлейтін адамдардың әңгімесінен 1 000 сағат тағы өңдедік. Қазақша тіркестер орысша сияқты құралмайтыны жұмыс істеуді талап етті. Алайда жұмыс нәтижесіне қарап, команданың қолынан келді дей аламын.
— Жаңалықты таныстырғалы біршама уақыт өтті. Қолданушылар кері байланыс беріп жатыр ма, олар жаңалықты қалай қабылдады?
— Қолданушылар оң пікір жазып жатыр. Себебі енді олар сұрақты күнделікті өмірдегідей екі тілде қоя алады. Қолданушыларды пікірін айтып, қандай да бір ақау болып жатса да, кері байланыс қалдыруға шақырамын. Біз сервисті енді ғана іске қосқандықтан, пікірлер оны жақсартуға әрі пайдалырақ етуге көмектеседі.
— Сервисті жақсартуды ойлай бастадыңыздар ма?
— Нейрожелілерді дамыту мен пайдаланудағы жетістіктердің арқасында Алисаны қолданушы сұрауларынан үйрену арқылы үнемі жетілдіріп отыруға тырысамыз. Бұл анонимді сұрау деректері екенін ескеріңіз. Сайып келгенде, біздің виртуал көмекшіміз адам онымен өзінің досымен сөйлескен сияқты сезімде болуы үшін бұдан да ақылды болуы керек.
— Алдағы уақытта Алиса біздің мәдени ерекшеліктеріміз жайлы да білуі мүмкін бе?
— Қазір осы қазақша Алисаның келбеті мәселесі бойынша, оның ішінде әңгіме режимі бойынша да қарқынды жұмыс істеп жатырмыз. Алиса мәдени контексті жақсы түсініп, соның негізінде нені жақсы көретінін белгілей алуы маңызды. Кейіпкерді жасау және оны жетілдіру — күрделі әрі ұзақ процесс. Команда қазірдің өзінде осы бағытқа көп күш салып жатыр. Сонымен қатар біз өз көзқарасын айтқысы келетін креатив редакторлар іздеп жатырмыз.