Оживление фотографий при помощи искусственного интеллекта — один из заметных трендов этого сезона. Существуют десятки приложений и сервисов, которые превращают статичные изображения в короткие видео.
В этом материале разберём, какими нейросетевыми инструментами удобно пользоваться, чтобы получить живые фотографии. А ещё выясним, можно ли считать такие инструменты полноценной технологией, а не развлечением.

Становится ли работа искусственного интеллекта похожа на работу людей? Давайте разбираться / Фото: unsplash.com
Сегодня существуют десятки и даже сотни приложений, позволяющих оживить фотографии. Однако значительная их часть недоступна для пользователей из России: формально они предлагают бесплатный пробный период, но требуют привязки банковской карты, а российский «пластик» не принимают. В лучшем случае приложение просто не запустится, в худшем — зависнет так, что придётся перезагружать телефон.
В условный «чёрный список» сервисов, которые де-юре работает и имеет пробный период, а де-факто не дают оплатить подписку, попали, например: Pika pika, Cutout Pro, kaiber.ai, Remini (у него есть бесплатная версия с рекламой, но она появляется буквально после каждого действия). Поэтому ниже — только те инструменты, которые действительно работают в России, в том числе в бесплатном режиме.
PixVerse — мобильное приложение, создающее ИИ-видео из фото или коротких роликов по выбранному шаблону. При входе в приложение открывается большая библиотека, из которой можно выбрать подходящий вариант.

Библиотека шаблонов / Иллюстрация: Алиса Смирнова
Есть много разных шаблонов, которые сейчас в тренде. Бешенной популярностью пользуются вариации на темы: «я красавчик, демонстрирую бицепсы и пресс», «вот моя девушка-красавица/бойфренд-краш». Есть и фантазийные запросы: «полет на драконе», «объятия с медведем», «стать куклой». Однако, выбирая необычный шаблон, важно учитывать, что лица в них часто искажаются до неузнаваемости. Полетаем?
Есть режим, в котором можно анимировать изображение без шаблона — по текстовому промту. Вот, например, результат генерации по фотографии и запросу «мать и дочь улыбаются, разглядывают подарок в руках»:
Разрешение итогового ролика — 640×480, длительность — 4 секунды. Генерация занимает около минуты. В бесплатной версии на видео наносится водяной знак. Российскую карту приложение не принимает, но зато здесь каждый день начисляются новые бесплатные кредиты — хватает на две генерации.
Очень неплохой отечественный вариант — Алиса AI. Приложение требует общую подписку «Яндекс Плюс», но дополнительных денег за генерацию не просит и ограничений по числу оживлений нет.
Интерфейс простой и интуитивный. Сервис оживляет фото по текстовому запросу или предлагает собственные варианты анимации. Вот наш результат по запросу «девушка танцует, улыбается в камеру, на переднем плане летят конфетти»
Алиса оживляет фото достаточно долго: генерация занимает от 1 до 10 минут, причем причина колебаний неочевидна. Вероятно, всё зависит от сложности исходного изображения или нагрузки серверов.
Что касается итога — он выглядит достойно. Детализация неплохая, лишние руки-ноги не отрастают, черты лица остаются узнаваемыми, эмоции — довольно естественными. Пожалуй, по работе с лицами Алиса дает самый стабильный результат среди протестированных сервисов.
На выходе — ролики длиной 5 секунд и с разрешением около 500×800. Обратите внимание: в конце оживленного фото Алиса клеит свой логотип, но его легко обрезать в видеоредакторе.
Наш следующий подопытный — homiwork.com. Это онлайн-сервис, не требующий установки приложения. Даёт одну бесплатную тестовую попытку, поддерживает оплату российскими картами.
Работает достаточно долго — до пяти минут. Результат, как и у других нейросетей, разрешением не впечатляет — 720х550.
Для оживления можно задать собственный текстовый запрос или использовать авторежим, в котором ИИ на свой вкус подбирает для снимка уместную анимацию. Эмоции на лицах иногда получаются утрированными, но явных ошибок практически нет. Это, кстати, генерация без запроса — ИИ сам решил, как должны двигаться герои в кадре.
Nero.ai — два в одном: есть и мобильное приложение, и онлайн-сервис на сайте. Новым пользователям дают 10 бесплатных жетонов, которых хватает на пять генераций.
Этот сервис оживляет фото на основе видеошаблона: нужно загрузить фотографию, выбрать шаблон движения из предложенных или загрузить собственное короткое видео — где объект движется так, как должна будет делать фотка. Генерация занимает до 5 минут.
Интерфейс сайта и предпросмотр оживлённого фото:
Результат очень даже неплохой: хорошая детализация, естественная анимация — если не всматриваться специально, можно сразу и не понять, что это генерация искусственного интеллекта.
С другой стороны, этот сервис специализируется именно на легкой анимации крупного портрета: можно заставить свою фотографию улыбаться, качать головой, поднимать брови. В чём ценность такой идеи, не совсем понятно — проще сразу, без ИИ, снять видео с человеком, который выдает всю эту мимику. Если речь, конечно, не об архивных портретах бабушек и дедушек.
Обратите внимание! Экспорт идёт в формате webm; он распространён, но уступает по удобству привычному mp4.
Ещё один онлайн-сервис, у которого есть сайт и мобильное приложение — Hailuo AI. Эта нейросетка также позволяет оживлять фото по текстовому запросу или в авто-режиме. Работает достаточно быстро: оживляет меньше, чем за минуту. Новому пользователю даёт тестовые жетоны, которых хватит на четыре попытки.
По картинке всё неплохо: лица людей сглаживаются, но практически не искажаются.
Hailuo AI — достаточно сложный и многообразный инструмент. Кроме режима быстрых генераций, есть продвинутый Create Video с полноценным редактором, где можно выбрать одну из трех моделей:
То есть функциональность Hailuo AI шире, чем у большинства конкурентов.
Нейросети для оживления фотографий пока остаются скорее развлечением: они подходят для соцсетей, лёгкого контента и забавных роликов для друзей и семьи. Большинство бесплатных моделей заметно искажают лица, ограничены в длительности и разрешении, а качество всё ещё нестабильное.
Тем не менее технологии развиваются быстро. Уже через год-два подобные инструменты могут стать гораздо точнее и пригодиться не только для развлечений, но и для профессиональных задач.