Лабораторії штучного інтелекту купують корпоративні дані для навчання нових моделей
ШІ-лабораторії активно купують внутрішні дані компаній для навчання своїх моделей, надаючи перевагу реалістичним архівам корпоративних листувань, як-от переписки, баг-репорти та обговорення. Попит на ці дані зростає, і стартапи користуються цим для закриття бізнесу.
Лабораторії штучного інтелекту почали активно закуповувати внутрішні корпоративні дані, такі як архіви зі Slack, Jira і інші робочі комунікації, повідомляє Forbes. Це насамперед пов’язано з потребою розробників у реалістичнішому навчальному матеріалі для створення моделей "агентного ШІ", які можуть виконувати робочі завдання. Раніше основу тренування ШІ складали відкриті джерела, такі як Wikipedia або Reddit, але через специфіку нових завдань саме внутрішні дані дають змогу відтворити реалістичну динаміку робочих процесів.
У результаті виник новий ринок архівних листувань, де компанії, як SimpleClosure, допомагають стартапам, що закриваються, продавати свої дані і заробляти на цьому від $10 тис. до $100 тис. за угоду. Значні кошти вимірюються не тільки обсягом, але й якістю даних, особливо цінуються записи з високим рівнем інтеграції, з медичного чи фінансового секторів.
Попит на такі дані також стимулює розвиток платформ для тренування ШІ-агентів, як-от Anthropic, яка планує витратити до $1 млрд до 2026 року. Водночас аналітики попереджають про ризики конфіденційності: не завжди можна гарантувати анонімність у таких об’ємах даних, що може викликати занепокоєння серед працівників, чиї комунікації можуть бути продані третім сторонам.
| Ключові учасники | Діяльність |
|---|---|
| SimpleClosure | Допомога у продажі внутрішніх даних закритих компаній |
| Sunset | Робота за аналогічною моделлю, як у SimpleClosure |
| Anthropic | Розробка симульованих середовищ для ШІ-агентів |


