Новости 31 Января, 2023

Ученые Назарбаев Университета разработали технологию по распознаванию речи тюркских языков

Проект был разработан учеными из Института умных систем и искусственного интеллекта Назарбаев Университета (NU ISSAI).

Автоматическое распознавание речи — это технология, которая способна преобразовывать человеческую речь в текст по примеру голосовых помощников Siri и Alexa, виртуальных ассистентов и систем диктовки. Так, в открытом доступе в интернете для большинства тюркских языков существует очень мало речевых данных.

«Используя общие черты тюркских языков с точки зрения лексики, фонологии и морфологии, мы хотели разработать первую общую и надежную многоязычную модель, в которой бы десять тюркских языков взаимно дополняли друг друга», — поясняет Саида Мусаходжаева, аналитик данных NU ISSAI.

По словам разработчиков, технология в процессе распознавания речи совершает минимум ошибок. Ученые отмечают, что для башкирского, казахского, татарского, турецкого, уйгурского и узбекского языков процент ошибок в символах составляет менее 5%. Модель использует преимущества сходства тюркских языков. Ее можно протестировать на сайте Института.

«Мы считаем, что наиболее важным результатом этих проектов является подготовка высококвалифицированных технических экспертов, которые будут не только стимулировать технологическое развитие Казахстана, но и охотно делиться и применять свои профессиональные знания и опыт для продвижения технологий в других странах, создавая возможности для будущих поколений», — рассказывает Хусейн Атакан Варол, директор-основатель ISSAI.

Профессор Варол также отметил, что их команда прилагает значительные усилия для продвижения казахского языка в цифровом мире. Институт намерен стать одним из ведущих научных центров искусственного интеллекта и науки о данных в тюркском мире и Евразии.