Україна у 2026 році розпочне тестування національної мовної моделі на основі даних
Україна навесні 2026 року планує бета-тестування власної великої мовної моделі, навченої на українських даних, задля розвитку штучного інтелекту в країні. Про це повідомив міністр цифрової трансформації Михайло Федоров.
Запуск національної мовної моделі (LLM) є частиною стратегічної мети — входження України до трійки лідерів світу за розвитком штучного інтелекту. Розробку фінансує телекомунікаційна компанія «Київстар», яка виступає технічним партнером проєкту, а після завершення розробки модель буде передана у власність держави. Навчання відбувається на базі моделей Gemma від Google, які адаптуються під українську мову та контекст.
Проєкт перебуває на етапі збору даних, що залучаються з державних установ, медіа, університетів, а також містять матеріали з судових реєстрів та документів про злочини військового часу. Передбачається створення спеціальних бенчмарків для системної оцінки моделі.
Після завершення базового набору даних у січні 2026 року, планується вдосконалення обробки української мови та розробка власних інструментів оцінки якості. Назва для нової мовної моделі буде обрана шляхом голосування через застосунок «Дія».
Проєкт є частиною ширшої ініціативи зі створення суверенного штучного інтелекту, започаткованої в листопаді 2025 року спільно з NVIDIA. Це має посилити технологічну незалежність України і захист даних, що уряд розглядає як питання національної безпеки.
| Етап | Опис | Термін |
|---|---|---|
| Збір даних | Залучення даних з різних джерел для навчання моделі | До січня 2026 |
| Тестування | Перевірка якості та безпеки моделі | Весна 2026 |
| Фінальна оцінка | Випробування та оцінка ефективності | Після весни 2026 |







