Президент Казахстана обсудил будущее языковой модели KazLLM

Фото к новости: KazLLM: Искусственный интеллект на распутье — как Казахстан выбирает свой языковой путь в цифровую эпоху

На недавнем расширенном заседании Правительства Казахстана Президент Касым-Жомарт Токаев поднял вопрос о будущем национальной языковой модели KazLLM. Несмотря на то, что проект позиционируется как стратегический, интерес со стороны пользователей остается низким, и многие предпочитают зарубежные сервисы, такие как ChatGPT. Эксперты обсуждают причины этой ситуации и возможности KazLLM в конкурентной среде.

Критика со стороны Президента

Во время заседания Президент Токаев выразил недовольство по поводу низкого спроса на казахстанскую разработку. Заместитель премьер-министра и министр искусственного интеллекта и цифрового развития Жаслан Мадиев сообщил, что KazLLM и AlemLLM внедрены в более чем 40 информационных систем, включая eGov AI, и доступны для студентов и IT-компаний. Однако он отметил, что такие технологии требуют постоянного обновления и улучшения.

Что такое KazLLM?

KazLLM — это большая языковая модель (LLM), обученная на обширных текстовых данных, способная анализировать, генерировать и преобразовывать текст. Она ориентирована на казахский язык и локальный контекст, что отличает её от других глобальных сервисов, таких как ChatGPT и Gemini.

История создания KazLLM

Проект KazLLM был инициирован на государственном уровне и стал частью стратегии по развитию искусственного интеллекта в Казахстане. С 2019 по 2023 год акцент делался на подготовке кадров и запуске образовательных программ, а с 2024 года началась разработка собственных технологических решений. Официальная презентация KazLLM состоялась 11 декабря 2024 года.

Разработка и поддержка

Создание KazLLM было осуществлено Институтом умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете. В проекте участвовали более 140 специалистов из 26 научных институтов и университетов, а контент охватывал 115 дисциплин, включая математику, финансы, историю и медицину. Модель поддерживает казахский, русский и английский языки и доступна для исследовательского использования на платформе Hugging Face.

Экосистема KazLLM

ISSAI разрабатывает не только KazLLM, но и целую линейку решений, включая:

Oylan — мультимодальные модели для работы с текстом, изображениями и аудио.
Beynele — модели генерации и редактирования изображений по текстовому описанию с учетом культурного контекста Казахстана.
MangiSoz — речевые модели для распознавания, перевода и синтеза речи.
TilSync — система субтитрирования и перевода в реальном времени.
Mangitas — защищенные серверные решения для государственных органов и крупных компаний.

Причины низкой популярности

Эксперты указывают на несколько факторов, способствующих низкому интересу к KazLLM. К ним относятся отсутствие массового пользовательского интерфейса, скорость обновлений и недостаточная публичная коммуникация. Также важен так называемый "эффект привычки": пользователи уже привыкли к зарубежным ИИ-сервисам.

Максат Акпаров, эксперт по ИИ, отмечает, что проблема не в уровне инженеров или технологической базе, а в завышенных ожиданиях. По его словам, когда государство объявляет о запуске национальной языковой модели, аудитория начинает сравнивать её с глобальными лидерами, что может привести к разочарованию.

Необходимость в прозрачности и коммуникации

Акпаров подчеркивает, что для повышения доверия к KazLLM необходимо:

проводить открытые сравнительные тесты;
предоставлять прозрачные метрики качества;
разрабатывать понятные прикладные кейсы;
регулярно публиковать отчеты о прогрессе;
налаживать диалог с профессиональным сообществом.

Он также указывает на слабую информационную поддержку проекта, из-за чего многие казахстанцы не знают о KazLLM и не могут оценить его по достоинству.

Стратегия развития

В заключение, Акпаров подчеркивает важность определения основной стратегии для KazLLM. Необходимо честно определить цель: строить ли глобального конкурента или надежный локальный инструмент. Это повлияет на архитектуру проекта, объем инвестиций и восприятие пользователями.

KazLLM: Искусственный интеллект на распутье — как Казахстан выбирает свой языковой путь в цифровую эпоху