Компания Google интегрировала возможность создания музыкальных треков в своем продукте Gemini, используя генеративную ИИ-модель Lyria 3 от DeepMind. Новая функция позволяет пользователям создавать аудиотреки путем описания идеи или загрузки мультисенсорных медиа, таких как фото или видео.
Модель Lyria 3 предоставляет широкие возможности для музыкального творчества, генерируя тексты песен и позволяя задавать параметры стиля, вокала и темпа. Система может создавать музыкальные композиции продолжительностью до 30 секунд, сопровождаемые обложкой, разработанной Nano Banana. Все сгенерированные треки получают цифровой водяной знак SynthID, что позволяет определить искусственное происхождение аудио.
Представители Google подчеркивают, что эта функция не ставит целью копирование стиля конкретных исполнителей, а предлагает новый инструмент для оригинального творчества. Актуальность этой инновации подтверждается также тем, что она поддерживает несколько языков, включая английский, немецкий, испанский и другие, и доступна пользователям в возрасте от 18 лет. Это совпадает с глобальной тенденцией инкорпорации технологий ИИ в различные сферы человеческой деятельности.



