Google анонсирует новое поколение чипов для искусственного интеллекта
Компания Google объявила о разработке нового поколения специализированных процессоров TPU, ориентированных на ускорение ответов моделей искусственного интеллекта. Релиз запланирован на этой неделе на конференции Google Cloud Next.
Новые чипы Google, известные как TPU (tensor processing units), будут сосредоточены на оптимизации так называемого inference — быстрого выполнения запросов уже обученными моделями искусственного интеллекта. Это важное изменение в стратегии Google, поскольку ранее компания фокусировалась на разработке чипов для обучения моделей.
Джефф Дин, главный научный сотрудник Google, отметил, что растущий спрос на мгновенные ответы требует создания более узкоспециализированных чипов для различных этапов процесса. Новые TPU должны значительно уменьшить задержки в ответах ИИ, где в настоящее время доминирует рынок NVIDIA с ее GPU.
Спрос на эти специализированные чипы уже вырос среди технологических компаний, включая Meta, которая заключила соглашение на миллиарды долларов на использование TPU через Google Cloud, а также Anthropic, которая получила доступ к миллиону таких чипов. Это свидетельствует об интенсивной конкуренции за рынок inference.
Однако компания Google недавно столкнулась с вызовами, включая дефицит чипов и сложности в прогнозировании потребностей, так как разработка одного поколения процессоров занимает годы. Дополнительно, нарушения поставок полупроводников из Азии из-за войны на Ближнем Востоке влияют на европейские компании, импортирующие эти компоненты.








