Google DeepMind представляет Veo: ИИ, который снимает кино за вас

Новая модель от DeepMind генерирует видео по тексту — сценарии, монтаж и стилизация в одном флаконе.
Помните, как мы мечтали, чтобы нейросеть сама снимала для нас видосики? Google DeepMind, похоже, решила, что ждать больше нечего, и выпустила Veo — генеративную модель, способную создавать видео высокой чёткости по текстовому описанию. И нет, это не просто гифки с котиками.
Veo понимает не только сюжет, но и визуальный стиль. Хотите «киберпанк-нуар с дождём и неоновыми вывесками»? Пожалуйста. Модель выдаёт ролики длительностью до минуты с разрешением до 1080p. Для стартапов и контент-мейкеров это золотая жила: можно наколдовать промо-ролик, не нанимая оператора.
Технически Veo использует продвинутую архитектуру, которая учитывает временную согласованность кадров — персонажи не распадаются на пиксели при движении. Это вам не старый добрый GAN с дрожащим фоном. Пока модель доступна ограниченно через VideoFX, но планы — интегрировать её в экосистему Google.
Комментарий студии METABYTE: Veo — это не просто игрушка, а потенциальный инструмент для быстрого прототипирования видеоконтента. Если вы думаете о внедрении AI-генерации в свои продукты, сейчас самое время присмотреться к API от Google.