SHERKALA: первая революционная AI-модель для казахского языка

6 минут STEPPE
SHERKALA: первая революционная AI-модель для казахского языка
Партнерский

Inception и MBZUAI представили SHERKALA — революционную языковую модель для казахского языка.


Inception (G42), ведущий разработчик AI-решений, совместно с Университетом Искусственного Интеллекта Мохаммеда бин Зайеда (MBZUAI) при поддержке Cerebras объявили о запуске SHERKALA первой высокоточной казахской языковой модели (LLM). Этот инновационный проект направлен на расширение возможностей более 13 миллионов носителей казахского языка, обеспечивая им доступ к передовым технологиям генеративного ИИ.

SHERKALA — это модель с 8 миллиардами параметров, обученная на 45 миллиардах слов. Основное внимание уделено казахскому языку, но также поддерживаются английский, русский и турецкий. В основе модели лежит Llama 3.1, адаптированная для казахского языка с расширением токенизатора на 25%, что повышает эффективность понимания и генерации текста. Обучение модели проходило на Condor Galaxy — одном из самых мощных суперкомпьютеров для ИИ, созданном G42 и Cerebras.

«‎Запуск SHERKALA – это важный шаг в поддержке языковых сообществ, которые раньше были недостаточно представлены в AI. Вместе с MBZUAI мы создали модель, которая поможет носителям казахского языка и изменит рынок LLM, сделав технологии более доступными и эффективными. С моделями JAIS для арабского, NANDA для хинди и теперь SHERKALA для казахского мы продолжаем расширять границы AI и обеспечивать языковое разнообразие в цифровом мире»‎, — отметил д-р Эндрю Джексон, CEO Inception.

SHERKALA задает новый стандарт для казахских языковых моделей, превосходно справляясь с пониманием и созданием текстов. Благодаря эффективной работе с токенами и продвинутым диалоговым возможностям она обходит более крупные модели, включая те, что в несколько раз превышают её по числу параметров.

«‎Мы рады работать с Inception над SHERKALA — передовой казахской AI-моделью. Этот проект способствует развитию рынков, делает AI доступнее, сохраняет язык и поддерживает цифровые сообщества»‎, — заявил профессор Преслав Наков, заведующий кафедрой и профессор обработки естественного языка в MBZUAI.

SHERKALA теперь доступна как open-source модель на Hugging Face:

🔗 SHERKALA на Hugging Face

Еще много интересного

Статьи STEPPE

Казахстанский спектакль «Плот Медузы» покажут на престижном фестивале Avignon-off во Франции

Казахстанский спектакль «Плот Медузы» покажут на престижном фестивале Avignon-off во Франции

Экспериментальный спектакль «Плот Медузы» представляет собой сочетание классической культуры и современности. Созданный...

2 минуты
2 минуты
Тысяча студентов, лайв-кодинг и карьерные инсайты — как прошел Kolesa JunDay’25 в Алматы

Тысяча студентов, лайв-кодинг и карьерные инсайты — как прошел Kolesa JunDay’25 в Алматы

13 апреля в Алматы прошла конференция Kolesa JunDay’25 — крупнейшее в Центральной Азии IT-событие для студентов и начинающих...

2 минуты
2 минуты
Казахстанские ученики — победители международного конкурса NASA

Казахстанские ученики — победители международного конкурса NASA

Ученики Назарбаев Интеллектуальной школы физико-математического направления Алматы добились успеха на мировой арене: их команды...

2 минуты
2 минуты
Где найти реальные инвестиции на стартапы в Кыргызстане?

Где найти реальные инвестиции на стартапы в Кыргызстане?

Central Asia Startup Cup (CASC) 2025 — первое в Кыргызстане международное мероприятие, объединяющее стартап-сообщество...

2 минуты
2 минуты