Яндекстің бұлтты платформасы полиглот-нейрожеліні қазақ тілін «түсінуге» үйретті

None
None
Yandex Cloud бұлтты платформасы машиналық оқыту негізінде бір мезгілде 10-нан астам шет тілін, оның ішінде қазақ және дат, фин және түрік сияқты сирек тілдерді тани алатын модельді әзірледі. Жаңа нейрожелінің көмегімен компаниялар клиенттердің үлкен ағымы бар колл-орталықтары үшін көп тілді дауыстық роботтар мен көп тілді дауыстық көмекшілерді оңай және жылдам жасай алады.

Модель кез келген тақырыптағы және әртүрлі форматтағы сөз орамдарын таниды, оның ішінде қысқа және ұзын сөйлемдер, сондай-ақ атаулар, мекен-жайлар, күндер мен сандар.

Ол тілді бір ағымда автоматты түрде тани алады: нейрожелі кез-келген уақытта бір тілден екінші тілге ауыса алады.

Бұл ретте тану сапасын жақсарту үшін оның «есіне түсіру» мүмкіндігі бар.

Жаңа көп тілді модель Transformer құрылымы негізінде жұмыс істейді. «Трансформерлер» кіріс сөздерін қатар және бір-біріне тәуелсіз өңдейді, соның арқасында олар тез үйренеді.

Басқа тілге ауысқан кезде мәтін үйлесімді және грамматикалық тұрғыдан дұрыс болуы үшін нейрожелі Яндекс сервистері мен қосымшаларының кәсіби датасеттерінен және деректер ауқымынан тұратын ондаған терабайттық мәліметтерде оқытылды.

« Біз Алиса сияқты дауыстық көмекшілерді әзірлеу, клиенттермен жұмысты автоматтандыру, сауалнама жүргізу және сапаны бақылау үшін диалогтік сценарийлерді әр бизнеске қолжетімді етуге тырысамыз. Сөйлеу технологиясына кез-келген фичи-ді енгізу үшін үлкен көлемді мәліметтер, жоғары білікті мамандар және жүздеген сағаттық оқыту қажет. Біз Yandex Cloud-та синтез және тану сервисін үнемі дамытып отырамыз: сөйлеуді барынша табиғи етудеміз, оны тану мүмкіндіктерін кеңейтудеміз және көмекшілердің бірегей дауыстарын жасаудамыз», – деді Yandex SpeechKit әзірлеу жөніндегі басшысы Василий Ершов.

Жаңа нейрожелі Yandex SpeechKit сөйленген сөзді синтездеу және тану сервисінде жұмыс істейді.

Бұл сервисті қазір 1000-нан астам клиент пайдаланады, оның ішінде X5 Retail Group және «Додо Пицца» бар.

Жаңа көп тілді тану Yandex SpeechKit пайдаланушыларының жобалары үшін қолжетімді және API-де стандартты құралдармен бапталады.


Соңғы жаңалықтар