Искусственный интеллект научился снимать кино и озвучивать видео

113570
На ежегодной конференции для разработчиков (I/O) компания Google представила новую нейросеть Veo 3. Ее главными отличиями от предшественников стали генерация звуков для нейронных видео и способность создавать кинематографические сцены.
По словам вице-президента Google по работе с Gemini Джоша Вудворда, Veo 3 станет новой эрой творчества, ведь искусственный интеллект способен создать максимально реалистичный контент. Veo 3 успешно справляется с генерацией видеороликов до 8 секунд, автоматическим созданием звуков, эффектов и голосов, операторскими приемами (POV, слоу-мо и другие). Кроме того, нейросеть способна создать стиль, монтаж и атмосферу, как в роликах, загруженных для примера. 

Пользователи Сети не оставили без внимания такую новинку и уже протестировали способности новой нейросети. Одним из энтузиастов стала журналистка веб-СМИ The Verge Эллисон Джонсон. Девушка проверила, как работает искусственный интеллект и рассказала о его плюсах и минусах. 

Оказалось, что Veo 3 действительно справляется с озвучиванием нейронного видеоряда без подсказок от пользователя. Нейросеть подбирает реплики, подходящие той или иной ситуации, а также голос, тон и эмоции. Однако и в этот раз искусственный интеллект не обошелся без ошибок: герои сгенерированных роликов не открывают рты во время своих реплик, а при просьбе создать видеоряд с уходящими вдаль ботинками, Veo 3 справилась лишь с одним забавно шуршащим ботинком. 

Кроме того, Veo 3 имеет ограничения в производстве контента. Например, нейросеть не станет генерировать видеоролики на политическую тематику или создавать дипфейки. По словам Эллисон Джонсон, новый искусственный интеллект далек от идеала, а самым подходящим форматом для работы с ним станет конвейерное производство контента на видеоплощадки. 


Последние новости

Архив новостей