Вівторок, 16 Червня, 2026
14.3 C
Kyiv

Розробники створили штучний інтелект, який "живе" у 1930-х: модель Talkie не знає про Другу світову та комп’ютери

Експериментальна мовна модель Talkie-1930-13B досліджує минуле

Команда під керівництвом Алека Редфорда представила Talkie-1930-13B — мовну модель, треновану на текстах до 1931 року, щоб вивчити здатність штучного інтелекту узагальнювати без сучасних знань.

Модель Talkie-1930-13B, розроблену групою під керівництвом колишнього працівника OpenAI Алека Редфорда, натреновано на 260 мільярдах токенів текстів англійською мовою, створених до 1931 року. Вона містить книги, газети, наукові журнали, патенти та юридичні документи. Мета експерименту — зрозуміти, чи може штучний інтелект, позбавлений сучасних знань, самостійно дійти до відкриттів, які людство зробило пізніше.

Модель Talkie-1930 демонструє хороші результати в базових моментах, таких як розуміння мови, логіка та базова математика. Вона навіть здатна написати простий код за умови наявності прикладів, хоча не знає про значні історичні події та сучасні технології через обмеження свого датасету.

Розробники вважають, що такі "вінтажні" моделі можуть допомогти зрозуміти принципи узагальнення даних та здатність штучного інтелекту прогнозувати майбутнє. Також це дозволяє зменшити проблему "забруднення" даних, коли моделі запам’ятовують відповіді замість їхнього генерації.

Проте реалізація проекту пов’язана з викликами. Оцифровані тексти містять багато помилок, що знижує ефективність навчання. Крім того, існує ризик "витоків часу" через потрапляння сучасних знань до датасету, спотворюючи результати експерименту.

У майбутньому розробники планують масштабувати модель до рівня ранніх версій ChatGPT і розширити корпус текстів іншими мовами.

Основні характеристики моделі Talkie-1930-13B
Обсяг текстів 260 млрд токенів
Джерела даних Книги, газети, наукові журнали, патенти, юридичні документи
Особливості Відсутність сучасних знань, здатність до узагальнення
Проблеми Ошибки в датасеті, "витоки часу"

Популярне цього тижня

Український сервіс електронного врядування Egov.in.ua запустив платформу iGov.fr у Франції

Українська платформа iGov виходить на французький ринок: що це...

Нафта реагує на ескалацію конфлікту на Близькому Сході

Зростання цін на нафту через потрясіння на Близькому...

Разом з людиною, а не замість неї: приклад освіти, як інтерактивний ШІ змінює правила гри — колонка

Інтерактивний штучний інтелект: Від підтримки до інтеграції у навчальний...

Китайські спецслужби застосовують LinkedIn для збору даних від співробітників західних компаній

Китайські спецслужби використовують рекрутингові платформи для шпигунства — попередження...

Теми

Український сервіс електронного врядування Egov.in.ua запустив платформу iGov.fr у Франції

Українська платформа iGov виходить на французький ринок: що це...

Нафта реагує на ескалацію конфлікту на Близькому Сході

Зростання цін на нафту через потрясіння на Близькому...

Разом з людиною, а не замість неї: приклад освіти, як інтерактивний ШІ змінює правила гри — колонка

Інтерактивний штучний інтелект: Від підтримки до інтеграції у навчальний...

Китайські спецслужби застосовують LinkedIn для збору даних від співробітників західних компаній

Китайські спецслужби використовують рекрутингові платформи для шпигунства — попередження...

Бразильська нафта може стати альтернативою іранським поставкам для Азії

Бразилія на шляху до топ-5 світових нафтовиків: видобуток...

Сербія продовжила контракт із Газпромом – ЗМІ

Сербія продовжує співпрацю з Газпромом, шукаючи альтернативи для енергетичної...

Схожі статті

Популярні категорії

OpenAI та Broadcom домовилися про розробку власних чипів, виділяючи додаткові мільярди...

OpenAI уклала партнерство з Broadcom для розробки AI-прискорювачів потужністю 10 гігаватів Американські технологічні компанії OpenAI та Broadcom оголосили про стратегічну співпрацю в галузі розробки спеціалізованих...

Україна зайняла 43-тю позицію у світовому рейтингу стартап-екосистем за версією StartupBlink

Україна залишається в топ-50 стартап-екосистем світу: нові «єдинороги» та перспективи Україна зберігає позиції серед провідних стартап-екосистем світу, посівши 43 місце у рейтингу Global Startup Ecosystem...

Gemini дозволить імпортувати чати та особисті налаштування з інших ШІ-додатків

Google запроваджує нові інструменти для імпорту даних у Gemini Google представила нові функції в рамках проекту Gemini, які дозволяють користувачам переносити історію чатів і...

Вертикальні відео та висока якість: ключові оновлення у Veo 3.1 від...

Google DeepMind оновила модель Veo 3.1 для зручності мобільного контенту Google DeepMind презентувала оновлення моделі Veo 3.1, зосереджене на поліпшенні інструменту для створення відео з...

Більше можливостей за нижчу ціну: Spotify запустив оновлену безкоштовну версію

Spotify оновлює безкоштовну версію: інтерактивніше прослуховування музики Spotify представив значні зміни у своїй безкоштовній версії, які надають користувачам більше свободи у виборі та прослуховуванні музики....

Вартість OpenAI досягла $500 мільярдів завдяки продажу акцій SoftBank та іншим...

OpenAI досягла півтрильйонної ринкової вартості після продажу акцій на $6,6 млрд OpenAI значно зросла в ціні, досягнувши ринкової вартості у $500 млрд після успішного продажу...