Субота, 9 Травня, 2026
20.3 C
Kyiv

Розробники створили штучний інтелект, який "живе" у 1930-х: модель Talkie не знає про Другу світову та комп’ютери

Експериментальна мовна модель Talkie-1930-13B досліджує минуле

Команда під керівництвом Алека Редфорда представила Talkie-1930-13B — мовну модель, треновану на текстах до 1931 року, щоб вивчити здатність штучного інтелекту узагальнювати без сучасних знань.

Модель Talkie-1930-13B, розроблену групою під керівництвом колишнього працівника OpenAI Алека Редфорда, натреновано на 260 мільярдах токенів текстів англійською мовою, створених до 1931 року. Вона містить книги, газети, наукові журнали, патенти та юридичні документи. Мета експерименту — зрозуміти, чи може штучний інтелект, позбавлений сучасних знань, самостійно дійти до відкриттів, які людство зробило пізніше.

Модель Talkie-1930 демонструє хороші результати в базових моментах, таких як розуміння мови, логіка та базова математика. Вона навіть здатна написати простий код за умови наявності прикладів, хоча не знає про значні історичні події та сучасні технології через обмеження свого датасету.

Розробники вважають, що такі "вінтажні" моделі можуть допомогти зрозуміти принципи узагальнення даних та здатність штучного інтелекту прогнозувати майбутнє. Також це дозволяє зменшити проблему "забруднення" даних, коли моделі запам’ятовують відповіді замість їхнього генерації.

Проте реалізація проекту пов’язана з викликами. Оцифровані тексти містять багато помилок, що знижує ефективність навчання. Крім того, існує ризик "витоків часу" через потрапляння сучасних знань до датасету, спотворюючи результати експерименту.

У майбутньому розробники планують масштабувати модель до рівня ранніх версій ChatGPT і розширити корпус текстів іншими мовами.

Основні характеристики моделі Talkie-1930-13B
Обсяг текстів 260 млрд токенів
Джерела даних Книги, газети, наукові журнали, патенти, юридичні документи
Особливості Відсутність сучасних знань, здатність до узагальнення
Проблеми Ошибки в датасеті, "витоки часу"

Популярне цього тижня

За даними Reuters, Іран може витримати блокаду США ще протягом 4 місяців

США та Іран можуть відновити переговори в Пакистані...

Відкрито нові невтішні дані про ВВП України

Економіка України у першому кварталі 2026 року скоротилася на...

Новий парламент Болгарії затвердив Радева на чолі Ради міністрів

У Болгарії затвердили новий уряд на чолі з Руменом...

Норвегія знову запускає в експлуатацію старі газові родовища

Норвегія відновить видобуток газу на законсервованих родовищах Норвегія прийняла рішення...

Рекордні кошти на пропаганду: у розвідці повідомили, скільки Росія витратила на вплив за кордоном

Росія збільшує витрати на закордонну пропаганду до рекордних $1,85...

Теми

За даними Reuters, Іран може витримати блокаду США ще протягом 4 місяців

США та Іран можуть відновити переговори в Пакистані...

Відкрито нові невтішні дані про ВВП України

Економіка України у першому кварталі 2026 року скоротилася на...

Новий парламент Болгарії затвердив Радева на чолі Ради міністрів

У Болгарії затвердили новий уряд на чолі з Руменом...

Норвегія знову запускає в експлуатацію старі газові родовища

Норвегія відновить видобуток газу на законсервованих родовищах Норвегія прийняла рішення...

У Франції затримали українця за підозрою в катуваннях у донецькій "Ізоляції"

Франція затримала громадянина України, підозрюваного в злочинах проти...

Шмигаль оголосив про значущу домовленість з Фінляндією

Україна та Фінляндія почнуть розгортання газопоршневої генерації для зміцнення...

Трамп не виключає можливості продовження триденного перемир’я між Україною та Росією

Режим тиші між Україною та Росією: очікується обмін полоненими...

Схожі статті

Популярні категорії

Виконує дії за користувача та підкреслює ключове: Opera презентувала новий браузер...

Opera представила новий браузер Opera Neon з інтеграцією штучного інтелекту Opera анонсувала випуск браузера Opera Neon, першого агентного браузера компанії, який здатний виконувати дії від...

Стартап дня: Di-agnostics — додаток для прогнозування поломок обладнання за звуком

Стартап Di-agnostics: мобільний додаток прогнозує поломки за звуками обладнання Український стартап Di-agnostics розробив мобільний застосунок, який виявляє потенційні несправності обладнання завдяки акустичним даним. Це допомагає...

Українська оборонна технологічна компанія Swarmer подала заявку на IPO

Українська компанія Swarmer готується до IPO на біржі Nasdaq Swarmer, українська Defense Tech компанія, що спеціалізується на ШІ-рішеннях для дронів, подала заявку на проведення IPO,...

Польська ІТ-компанія Euvic дебютувала на Варшавській біржі з оцінкою $250 млн

Польська Euvic Group вийшла на біржу через зворотне поглинання Польська IT-компанія Euvic Group дебютувала на альтернативному ринку NewConnect Варшавської фондової біржі через зворотне поглинання. Цей...

Змагання за таланти у сфері ШІ: як компанії змагаються за фахівців...

Технологічні гіганти активізують боротьбу за таланти в сфері ШІ Meta, Apple та інші технологічні компанії ведуть запеклу боротьбу за найкращих спеціалістів у сфері штучного...

Sky Spy залучила 1,6 млн доларів на запуск першої портативної SIGINT-системи

Компанія Sky Spy залучила $1,6 млн для розробки систем радіорозвідки Українсько-американська компанія Sky Spy отримала $1,6 млн інвестицій для запуску виробництва автономних систем радіорозвідки на...