На недавнем расширенном заседании Правительства Казахстана Президент Касым-Жомарт Токаев поднял вопрос о будущем национальной языковой модели KazLLM. Несмотря на то, что проект позиционируется как стратегический, интерес со стороны пользователей остается низким, и многие предпочитают зарубежные сервисы, такие как ChatGPT. Эксперты обсуждают причины этой ситуации и возможности KazLLM в конкурентной среде.
Критика со стороны Президента
Во время заседания Президент Токаев выразил недовольство по поводу низкого спроса на казахстанскую разработку. Заместитель премьер-министра и министр искусственного интеллекта и цифрового развития Жаслан Мадиев сообщил, что KazLLM и AlemLLM внедрены в более чем 40 информационных систем, включая eGov AI, и доступны для студентов и IT-компаний. Однако он отметил, что такие технологии требуют постоянного обновления и улучшения.
Что такое KazLLM?
KazLLM — это большая языковая модель (LLM), обученная на обширных текстовых данных, способная анализировать, генерировать и преобразовывать текст. Она ориентирована на казахский язык и локальный контекст, что отличает её от других глобальных сервисов, таких как ChatGPT и Gemini.
История создания KazLLM
Проект KazLLM был инициирован на государственном уровне и стал частью стратегии по развитию искусственного интеллекта в Казахстане. С 2019 по 2023 год акцент делался на подготовке кадров и запуске образовательных программ, а с 2024 года началась разработка собственных технологических решений. Официальная презентация KazLLM состоялась 11 декабря 2024 года.
Разработка и поддержка
Создание KazLLM было осуществлено Институтом умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете. В проекте участвовали более 140 специалистов из 26 научных институтов и университетов, а контент охватывал 115 дисциплин, включая математику, финансы, историю и медицину. Модель поддерживает казахский, русский и английский языки и доступна для исследовательского использования на платформе Hugging Face.
Экосистема KazLLM
ISSAI разрабатывает не только KazLLM, но и целую линейку решений, включая:
- Oylan — мультимодальные модели для работы с текстом, изображениями и аудио.
- Beynele — модели генерации и редактирования изображений по текстовому описанию с учетом культурного контекста Казахстана.
- MangiSoz — речевые модели для распознавания, перевода и синтеза речи.
- TilSync — система субтитрирования и перевода в реальном времени.
- Mangitas — защищенные серверные решения для государственных органов и крупных компаний.
Причины низкой популярности
Эксперты указывают на несколько факторов, способствующих низкому интересу к KazLLM. К ним относятся отсутствие массового пользовательского интерфейса, скорость обновлений и недостаточная публичная коммуникация. Также важен так называемый "эффект привычки": пользователи уже привыкли к зарубежным ИИ-сервисам.
Максат Акпаров, эксперт по ИИ, отмечает, что проблема не в уровне инженеров или технологической базе, а в завышенных ожиданиях. По его словам, когда государство объявляет о запуске национальной языковой модели, аудитория начинает сравнивать её с глобальными лидерами, что может привести к разочарованию.
Необходимость в прозрачности и коммуникации
Акпаров подчеркивает, что для повышения доверия к KazLLM необходимо:
- проводить открытые сравнительные тесты;
- предоставлять прозрачные метрики качества;
- разрабатывать понятные прикладные кейсы;
- регулярно публиковать отчеты о прогрессе;
- налаживать диалог с профессиональным сообществом.
Он также указывает на слабую информационную поддержку проекта, из-за чего многие казахстанцы не знают о KazLLM и не могут оценить его по достоинству.
Стратегия развития
В заключение, Акпаров подчеркивает важность определения основной стратегии для KazLLM. Необходимо честно определить цель: строить ли глобального конкурента или надежный локальный инструмент. Это повлияет на архитектуру проекта, объем инвестиций и восприятие пользователями.