Украина разрабатывает национальную большую языковую модель на основе Google Gemma
Украина создаёт национальную большую языковую модель (LLM) на открытом фреймворке Google Gemma, используя данные более чем 90 государственных учреждений. Проект предусматривает интеграцию в украинскую цифровую инфраструктуру после начального этапа обучения на вычислительных мощностях Google.
Эта инициатива, сообщает Reuters, направлена на повышение качества обработки украинских текстов, улучшение точности систем, работающих с украинским языком, и обеспечение технологической независимости Украины. Планируется усовершенствование украинского токенайзера, что позволит уменьшить количество ошибок в текстах, а также адаптировать ИИ-платформу для различных сценариев использования. Существенное внимание уделяется военному применению: модель будет интегрирована в системы управления и координации на поле боя, а также в инструменты мониторинга.
Украинский проект является частью более широкой государственной стратегии развития искусственного интеллекта, начавшейся с совместной программы с NVIDIA в ноябре 2025 года. Эта инициатива нацелена на создание суверенной ИИ-инфраструктуры, которая будет способствовать укреплению национальной безопасности и защите данных. Министерство цифровой трансформации Украины и «Киевстар» выбрали Gemma 3 от Google в качестве базовой модели. Кроме того, четыре консультативных комитета следят за соблюдением технических, юридических, культурных и языковых стандартов, в частности поддержки крымскотатарского и языков меньшинств.
Целью проекта также является преодоление проблемы, связанной с обработкой местных диалектов, которые нередко смешаны с русским и болгарским языками, особенно на юге страны. Китайские модели, такие как DeepSeek и Qwen, были отклонены из-за вопросов безопасности.
Этапы проекта и их цели:
— Начальное обучение: использование вычислительной инфраструктуры Google.
— Интеграция в украинскую инфраструктуру: операционная независимость и технологический суверенитет.
— Военное применение: интеграция в системы управления и мониторинга.
— Языковое усовершенствование: улучшение обработки украинского языка и местных диалектов.



