Лаборатории искусственного интеллекта покупают корпоративные данные для обучения новых моделей
ИИ-лаборатории активно покупают внутренние данные компаний для обучения своих моделей, предпочитая реалистичные архивы корпоративной переписки, такие как переписки, баг-репорты и обсуждения. Спрос на эти данные растет, и стартапы пользуются этим для закрытия бизнеса.
Лаборатории искусственного интеллекта начали активно закупать внутренние корпоративные данные, такие как архивы из Slack, Jira и другие рабочие коммуникации, сообщает Forbes. Это в первую очередь связано с потребностью разработчиков в более реалистичном учебном материале для создания моделей "агентного ИИ", которые могут выполнять рабочие задачи. Ранее основу обучения ИИ составляли открытые источники, такие как Wikipedia или Reddit, но из-за специфики новых задач именно внутренние данные позволяют воссоздать реалистичную динамику рабочих процессов.
В результате возник новый рынок архивных переписок, где компании, такие как SimpleClosure, помогают стартапам, которые закрываются, продавать свои данные и зарабатывать на этом от $10 тыс. до $100 тыс. за сделку. Значительные средства измеряются не только объемом, но и качеством данных, особенно ценятся записи с высоким уровнем интеграции, из медицинского или финансового секторов.
Спрос на такие данные также стимулирует развитие платформ для обучения ИИ-агентов, таких как Anthropic, которая планирует потратить до $1 млрд к 2026 году. В то же время аналитики предупреждают о рисках конфиденциальности: не всегда можно гарантировать анонимность в таких объемах данных, что может вызвать обеспокоенность среди работников, чьи коммуникации могут быть проданы третьим сторонам.
Ключевые участники — Деятельность
SimpleClosure — Помощь в продаже внутренних данных закрытых компаний
Sunset — Работа по аналогичной модели, как у SimpleClosure
Anthropic — Разработка симулированных сред для ИИ-агентов








