Крупнейшую модель ИИ для распознавания тюркских языков разработали в Казахстане

Казахстанский стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR) для тюркских языков, передает агентство Kazinform со ссылкой на Министерство ИИ и цифрового развития.

Крупнейшую модель ИИ для распознавания тюркских языков разработали в Казахстане
Фото: Министерство ИИ и цифрового развития

Это первая разработка такого масштаба, созданная в Центральной Азии, и первый пример полноценной ИИ-модели, изначально спроектированной под специфику тюркской языковой группы, а не адаптированной из англоязычных решений.

Проект реализован при стратегической поддержке Astana Hub, Министерства искусственного интеллекта и цифрового развития РК на GPU-инфраструктуре Microsoft.

— Разработка Cybernet AI открывает для стран тюркской языковой группы возможность масштабировать цифровые сервисы и клиентское обслуживание на родных языках с применением искусственного интеллекта без потери качества и по доступной стоимости. Для Казахстана это означает переход от роли потребителя глобальных ИИ-решений к роли разработчика собственных технологий, конкурентоспособных на международном уровне, — прокомментировал Танат Ускембаев, управляющий директор Astana Hub.

Модель создана на базе казахского, турецкого, узбекского, кыргызского, азербайджанского и татарского языков, а также корректно распознаёт смешанную тюркско-русскую речь — формат, широко распространённый в реальных диалогах клиентов с бизнесом и при получении государственных услуг.

До настоящего времени Казахстан, как и другие страны региона Центральной Азии, были вынуждены использовать международные ASR-модели, ориентированные, прежде всего, на английский язык. Такие решения слабо учитывают тюркскую фонетику, акценты и смешанную речь, что ограничивало качество голосовых AI-сервисов.

Cybernet AI пошёл по другому пути: компания создала собственную модель внутри региона и для региона, заложив в неё лингвистические особенности современных тюркских языков.

— Мы сознательно отказались от адаптации англоязычных моделей и создали ASR-модель, которая изначально понимает живые, смешанные формы разговорного языка. Это делает разработку не просто очередным технологическим продуктом, а вкладом в формирование локальной экосистемы искусственного интеллекта и технологического суверенитета Казахстана, — отметил Рашид Исмаилов, CTO компании Cybernet AI.

Новая ASR-модель ориентирована на бизнес, который работает с большими объёмами голосовых коммуникаций: банки и финансовые организации, телеком-операторы, контакт-центры различного уровня, логистические и сервисные компании, государственные структуры, оказывающие услуги населению.

Разработчики модели считают, что она поможет снизить расходы в каналах поддержки клиентов, обеспечив круглосуточную доступность клиентского сервиса в наиболее востребованном голосовом формате.

Модель устойчива к шумам, акцентам и переключению языков в одном предложении и демонстрирует одинаково высокую точность в различных сферах применения — от финтеха до госуслуг.

Ранее сообщалось, что по итогам 2025 года почти 1 млн казахстанцев прошли обучение по ИИ.

Сейчас читают