Четвер, 18 Червня, 2026
22.1 C
Kyiv

Від тестів "кіт чи пес" до розв’язання математичних задач: як великі компанії ШІ використовують математику для перевірки своїх моделей

Штучний інтелект успішно вирішує складні математичні задачі

Компанії OpenAI, Anthropic і DeepMind демонструють значний прогрес у розв’язанні математичних задач високого рівня складності за допомогою штучного інтелекту.

Штучний інтелект продовжує вражати своїми досягненнями у сфері математики, вирішуючи завдання, що раніше вважалися непосильними для автоматизованих систем. Компанії OpenAI, Anthropic і DeepMind відмовляються від тестів на розпізнавання зображень і переходять до задач дослідницького рівня, таких як "задачі Ердеша". Ці задачі, створені угорським математиком Пал Ередшем, покривають теорію чисел, комбінаторику та геометрію.

У січні 2026 року, програміст Ніл Сомані використав модель ChatGPT для успішного розв’язання 11 "задач Ердеша", що підкреслило потенціал методів машинного навчання в математиці. Раніше великі мовні моделі вважали недостатньо ефективними для такого складного завдання через ризик "галюцинацій", але нові підходи до розв’язання задач зробили їх точнішими та надійнішими.

Методи, використовувані OpenAI та Google DeepMind, вже дозволили їхнім системам здобути результати, порівнянні з медалями на Міжнародній математичній олімпіаді та студентському чемпіонаті з програмування. У рейтингу Epoch AI OpenAI GPT-5.2 та Google Gemini 3 Pro займають провідні позиції за результатами складних математичних тестів.

Крім математики, AI-лабораторії активно розробляють інструменти програмування з високою точністю. Anthropic просуває систему Claude Code, тоді як DeepMind створила AlphaProof і AlphaGeometry для математичного аналізу.

Попри досягнення, AI все ще не може автономно вирішувати складні математичні проблеми, які вимагають тривалих досліджень. Прогрес у цій галузі вимагає покращення навчальних моделей для безперервної накопичувальної роботи та збереження попередніх знань.

Компанія Інструменти та досягнення
OpenAI Вирішила 11 "задач Ердеша"; лідер рейтингу Epoch AI
Anthropic Розробляє Claude Code, успішний у комерційному застосуванні
DeepMind Створила AlphaProof і AlphaGeometry для складних математичних задач

Популярне цього тижня

Ціни на нафту впали нижче психологічного рівня

Позиція США щодо Ірану знижує ціни на нафту Ринок нафти...

Нідерланди нададуть €500 млн на PURL та закупівлю дронів для України

Нідерланди виділять €500 млн на підтримку України: акцент на...

Російська металургійна галузь зазнає найбільш глибокої кризи з 2000-х років

Російська металургія: відлуння санкцій і економічна стагнація Російська металургія...

Ноам Шазір, співкерівник розробки Gemini, переходить з Google в OpenAI

Ноам Шазір, одна з ключових фігур у світі штучного...

Медіа оцінили вплив нових квот ЄС на українську металургію

ЄС запроваджує нові квоти на імпорт сталі: загроза для...

Теми

Ціни на нафту впали нижче психологічного рівня

Позиція США щодо Ірану знижує ціни на нафту Ринок нафти...

Нідерланди нададуть €500 млн на PURL та закупівлю дронів для України

Нідерланди виділять €500 млн на підтримку України: акцент на...

Російська металургійна галузь зазнає найбільш глибокої кризи з 2000-х років

Російська металургія: відлуння санкцій і економічна стагнація Російська металургія...

Ноам Шазір, співкерівник розробки Gemini, переходить з Google в OpenAI

Ноам Шазір, одна з ключових фігур у світі штучного...

Медіа оцінили вплив нових квот ЄС на українську металургію

ЄС запроваджує нові квоти на імпорт сталі: загроза для...

Трамп обдумує варіанти виробництва зброї в Європі та Україні, повідомляє Bloomberg

США розглядають можливість виробництва зброї в Європі та...

У російських аеропортах запроваджують обмеження на авіапальне

Криза авіапального в Росії: НПЗ під ударом і зростання...

Схожі статті

Популярні категорії

Тім Кук покидає пост генерального директора Apple, його місце займе Джон...

Apple оголосила про призначення Джона Тернуса новим CEO Компанія Apple повідомила про призначення Джона Тернуса на посаду генерального директора, що відбудеться у вересні 2026 року....

Французький стартап Harmattan AI планує залучити $200 млн на розробку бойових...

Harmattan AI планує залучити $200 млн для розвитку виробництва бойових дронів Французький стартап Harmattan AI має намір зібрати $200 мільйонів на ранньому етапі фінансування для...

ZAS Ventures вкладає €50 000 в Upwood: на що стартап планує...

ZAS Ventures інвестує €50 тис. у фінтех-стартап Upwood Венчурний фонд ZAS Ventures оголосив про pre-seed інвестицію в розмірі €50 тис. у стартап Upwood, що спеціалізується...

Sony не планує випускати ігри для PlayStation на ПК більше

Sony змінює стратегію: великі ігри для PlayStation 5 залишаться ексклюзивами Sony Group вирішила відмовитися від випуску своїх великих ігор для PlayStation 5 на ПК, повертаючися...

Українська компанія Skyeton вироблятиме ударні безпілотники Raybird у Великій Британії

Україна та Велика Британія об’єднуються для спільного виробництва ударних дронів Українська компанія Skyeton та британська Prevail Partners створюють спільне підприємство для виробництва дронів Raybird. Виробництво...

8 трендів у сфері eHealth: що сприяє прогресу цифрової медицини –...

Цифрова трансформація охорони здоров’я в Україні: ключові тренди та виклики Починаючи з впровадження медичної реформи, Україна активно розвиває електронну охорону здоров’я (eHealth), яка стає важливим...