Вівторок, 16 Червня, 2026
20.3 C
Kyiv

Від тестів "кіт чи пес" до розв’язання математичних задач: як великі компанії ШІ використовують математику для перевірки своїх моделей

Штучний інтелект успішно вирішує складні математичні задачі

Компанії OpenAI, Anthropic і DeepMind демонструють значний прогрес у розв’язанні математичних задач високого рівня складності за допомогою штучного інтелекту.

Штучний інтелект продовжує вражати своїми досягненнями у сфері математики, вирішуючи завдання, що раніше вважалися непосильними для автоматизованих систем. Компанії OpenAI, Anthropic і DeepMind відмовляються від тестів на розпізнавання зображень і переходять до задач дослідницького рівня, таких як "задачі Ердеша". Ці задачі, створені угорським математиком Пал Ередшем, покривають теорію чисел, комбінаторику та геометрію.

У січні 2026 року, програміст Ніл Сомані використав модель ChatGPT для успішного розв’язання 11 "задач Ердеша", що підкреслило потенціал методів машинного навчання в математиці. Раніше великі мовні моделі вважали недостатньо ефективними для такого складного завдання через ризик "галюцинацій", але нові підходи до розв’язання задач зробили їх точнішими та надійнішими.

Методи, використовувані OpenAI та Google DeepMind, вже дозволили їхнім системам здобути результати, порівнянні з медалями на Міжнародній математичній олімпіаді та студентському чемпіонаті з програмування. У рейтингу Epoch AI OpenAI GPT-5.2 та Google Gemini 3 Pro займають провідні позиції за результатами складних математичних тестів.

Крім математики, AI-лабораторії активно розробляють інструменти програмування з високою точністю. Anthropic просуває систему Claude Code, тоді як DeepMind створила AlphaProof і AlphaGeometry для математичного аналізу.

Попри досягнення, AI все ще не може автономно вирішувати складні математичні проблеми, які вимагають тривалих досліджень. Прогрес у цій галузі вимагає покращення навчальних моделей для безперервної накопичувальної роботи та збереження попередніх знань.

Компанія Інструменти та досягнення
OpenAI Вирішила 11 "задач Ердеша"; лідер рейтингу Epoch AI
Anthropic Розробляє Claude Code, успішний у комерційному застосуванні
DeepMind Створила AlphaProof і AlphaGeometry для складних математичних задач

Популярне цього тижня

Український сервіс електронного врядування Egov.in.ua запустив платформу iGov.fr у Франції

Українська платформа iGov виходить на французький ринок: що це...

Нафта реагує на ескалацію конфлікту на Близькому Сході

Зростання цін на нафту через потрясіння на Близькому...

Разом з людиною, а не замість неї: приклад освіти, як інтерактивний ШІ змінює правила гри — колонка

Інтерактивний штучний інтелект: Від підтримки до інтеграції у навчальний...

Китайські спецслужби застосовують LinkedIn для збору даних від співробітників західних компаній

Китайські спецслужби використовують рекрутингові платформи для шпигунства — попередження...

Теми

Український сервіс електронного врядування Egov.in.ua запустив платформу iGov.fr у Франції

Українська платформа iGov виходить на французький ринок: що це...

Нафта реагує на ескалацію конфлікту на Близькому Сході

Зростання цін на нафту через потрясіння на Близькому...

Разом з людиною, а не замість неї: приклад освіти, як інтерактивний ШІ змінює правила гри — колонка

Інтерактивний штучний інтелект: Від підтримки до інтеграції у навчальний...

Китайські спецслужби застосовують LinkedIn для збору даних від співробітників західних компаній

Китайські спецслужби використовують рекрутингові платформи для шпигунства — попередження...

Бразильська нафта може стати альтернативою іранським поставкам для Азії

Бразилія на шляху до топ-5 світових нафтовиків: видобуток...

Сербія продовжила контракт із Газпромом – ЗМІ

Сербія продовжує співпрацю з Газпромом, шукаючи альтернативи для енергетичної...

Схожі статті

Популярні категорії

Власна керована авіабомба України готова до бойових дій

Україна презентувала нову авіабомбу власної розробки: що відомо про новинку Україна зробила черговий крок у розвитку оборонної промисловості, представивши керовану авіаційну бомбу (КАБ) українського виробництва....

Продуктовий менеджмент в автомобільній галузі: досвід і специфіка роботи в Stellantis

Stellantis інвестує в цифрові інновації: як продукти змінюють автоіндустрію Автомобільні цифрові продукти перетворюються з простих функцій на невід'ємні елементи машин, змінюючи життя мільйонів. Марина Деундяк, старший...

Як позбутися сповіщень про сторіз у Telegram

Telegram запустив формат Stories для всіх користувачів 20 липня 2023 року Telegram офіційно запустив новий формат Stories, відтепер доступний для всіх користувачів. Спочатку функція була...

У Нідерландах поліція конфіскувала 800 серверів, які російські хакери застосовували для...

Нідерландська влада вилучає сервери, пов'язані з російськими кібератаками Влада Нідерландів здійснила масштабні обшуки у дата-центрах і вилучила 800 серверів, які використовували хакерські угруповання для атак...

Інвестиції Baryon Investment Fund у словацьку компанію Airvolute, що створює технології...

Baryon Investment Fund інвестує у розробника безпілотних технологій Airvolute Baryon Investment Fund оголосив про свою інвестицію в компанію Airvolute, яка спеціалізується на розробці програмного та...

OpenAI заперечує появу реклами в ChatGPT: скриншоти фальшиві або це не...

OpenAI спростувала чутки про рекламу в ChatGPT OpenAI офіційно заперечила чутки про впровадження реклами в застосунку ChatGPT, які з'явилися після публікації скриншотів з функцією покупок...