Корпус казахского языка для KazLLM разрабатывают более 140 ученых

Kapital.kz

В министерстве науки и высшего образования рассказали, что разработана большая языковая модель KazLLM для развитие искусственного интеллекта (ИИ) на казахском языке, сообщает корреспондент центра деловой информации Kapital.kz со ссылкой на пресс-службу ведомства.

Версия KazLLM с открытым исходным кодом доступна на платформе https://huggingface.co/issai.

«Модель можно использовать в некоммерческих научных и академических целях, при создании чат-ботов, виртуальных помощников, автоматических переводчиков по аналогии с Google Translate», — указали в Миннауки.

Для обеспечения корпуса казахского языка для KazLLM министерство привлекло специалистов Института информационных систем и искусственного интеллекта (ISSAI), научных институтов и высших учебных заведений.

В ведомстве считаю, в условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной, и будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также интеграции казахского языка в современные технологии.

Cвыше 140 учёных и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпуса казахского языка для KazLLM, занимались подготовкой больших объёмов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке.

«Казахский национальный университет имени аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям. Институт математики и математического моделирования занимался составлением данных по направлениям математики. Институт истории и этнологии имени Ш.Уалиханова – контентом по истории, а медицинские университеты – данными в области медицины. Это сотрудничество способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели», — сообщили в министерстве.

Напомним, 1 декабря 2024 года в Астане Президенту Казахстана Касым-Жомарту Токаеву была представлена национальная языковая модель KazLLM. Модель была разработана под руководством Института умных систем и искусственного интеллекта (ISSAI NU) в партнёрстве с Beeline Казахстан и его ИТ-компанией QazCode, а также Astana Hub. В конце года Касым-Жомарт Токаев посетил Международный центр искусственного интеллекта Alem.AI, который создается для трансформации Казахстана в ИИ-ориентированное государство. Главе государства была презентована концепция Центра искусственного интеллекта Alem.AI, который будет расположен в сфере Nur Alem.

Летом 2024 года в Казахстане стала доступна первая национальная языковая модель с открытым исходным кодом IrbisGPT.

Победа Ирана или обман Трампа: что не так с перемирием на Ближнем Востоке

Президент США Дональд Трамп объявил о двухнедельном перемирии с Ираном и начале переговоров ...

  • 08.04.2026

Ильсур Метшин рассказал о том, как заработал свои первые деньги

Первым местом работы нынешнего мэра Казани Ильсура Метшина был молочный завод в Нижнекамске. Об этом ...

  • 08.04.2026

Хаменеи не санкционирует соглашение с США, если они не примут условия Ирана

Верховный лидер Ирана Моджтаба Хаменеи не предоставит согласие на заключение соглашения с Соединенными Ш ...

  • 08.04.2026

В столовых Петербурга и Ленобласти нашли мясо с сальмонеллой и поддельное молоко

САНКТ-ПЕТЕРБУРГ, 8 апреля, ФедералПресс. За два года специалисты Россельхознадзора проверили 4 ...

  • 08.04.2026

Теги