Руководитель Центра по внедрению цифровых государственных технологий, Рустем Бигари, поделился информацией о планах по созданию казахстанской версии искусственного интеллекта, аналогичного ChatGPT, к концу 2024 года.
Рустем Бигари выразил, что для эффективной работы искусственного интеллекта на казахском языке требуется около 13 миллиардов токенов, в то время как текущая база данных ChatGPT от OpenAI содержит лишь 1,5 миллиарда токенов. Это различие в десять раз подчеркивает ограниченность доступных данных на казахском языке и задачу по созданию национальной модели с учетом культурных особенностей и менталитета страны. Бигари обсудил эти планы в ходе брифинга в Службе центральных коммуникаций.
Он также упомянул, что Министерство цифрового развития, инноваций и аэрокосмической промышленности Казахстана готово поддержать разработчиков и предпринимателей в реализации казахстанской версии ChatGPT. Бигари отметил создание двух консорциумов и развитие стартапов и проектов, направленных на поддержку этой инициативы, подчеркнув, что до конца года планируется представление национальной модели.
Разработка национального аналога является сложным и многоэтапным процессом, включающим сбор данных, работу лингвистов и активное участие граждан в процессе разметки языка. Бигари сравнил этот процесс с инициативами других стран, таких как Корея, которые инвестируют значительные средства в развитие собственных языковых моделей.
В начале февраля 2024 года, в рамках открытия мероприятия Digital Almaty, министр цифрового развития, инноваций и аэрокосмической промышленности Багдат Мусин объявил о сотрудничестве с Назарбаев Университетом для создания казахстанского аналога чата GPT. Позже, в конце февраля, MOST Holding анонсировал запуск проекта Irbis GPT, направленного на сохранение и популяризацию казахского языка через интеграцию с искусственным интеллектом, что отражает стремление Казахстана интегрировать национальный язык в современные технологии для развития страны в различных сферах.
Источник: Kapital.kz
Комментарии