Мультимодальный ввод, система @ссылок, копирование камеры, креативные шаблоны, продление видео и другое.
Помните, с того дня, когда мы могли «рассказывать истории» только с помощью текста и первого/последнего кадра, мы мечтали создать видеомодель, которая действительно понимает ваше выражение. Сегодня она наконец здесь!
JiMeng Seedance 2.0 теперь поддерживает четыре типа входных данных: изображения, видео, аудио и текст — более разнообразные способы выражения и более управляемая генерация.
Вы можете задать визуальный стиль одним изображением, указать движения персонажа и смену ракурсов с помощью видео, задать ритм и атмосферу несколькими секундами аудио… В сочетании с текстовыми подсказками процесс создания становится более естественным, эффективным и по-настоящему «режиссёрским».
В этом обновлении «возможности референса» — главное нововведение:
| 核心维度 | Seedance 2.0 |
|---|---|
| Ввод изображений | ≤ 9 шт. |
| Ввод видео | ≤ 3 шт., общая длительность не более 15 с (с референс-видео стоимость чуть выше) |
| Ввод аудио | Поддержка загрузки MP3, количество ≤ 3, общая длительность не более 15 с |
| Ввод текста | Естественный язык |
| Длительность генерации | ≤ 15 с, свободный выбор от 4 до 15 с |
| Звуковой выход | Встроенные звуковые эффекты / музыкальное сопровождение |
Ограничения взаимодействия: текущий максимум смешанного ввода — 12 файлов. Рекомендуется загружать в первую очередь материалы, наиболее влияющие на изображение или ритм, и разумно распределять файлы между разными модальностями.



Способ 1: Введите «@» для вызова референса





После загрузки материалов изображения, видео и аудио поддерживают предпросмотр при наведении.



Ниже приведены примеры использования и приёмы для различных сценариев, которые помогут вам лучше понять улучшения Seedance 2.0 в качестве генерации, управляемости и креативном выражении. Если вы не знаете, с чего начать, просто посмотрите эти примеры для вдохновения~
Не только мультимодальность — Seedance 2.0 значительно усилен на фундаментальном уровне: более реалистичная физика, более естественные и плавные движения, более точное понимание инструкций, более стабильное сохранение стиля. Модель стабильно справляется со сложными движениями и непрерывным действием, а общее качество видео стало более реалистичным и гладким — это полноценная эволюция базовых возможностей!
Девушка элегантно развешивает бельё, закончив с одной вещью, берёт из корзины следующую и энергично встряхивает её.
Персонаж на картине с виноватым выражением лица оглядывается по сторонам, выглядывает за раму, быстро протягивает руку за раму, хватает колу и делает глоток, после чего на лице появляется довольное выражение. В этот момент слышны шаги, персонаж на картине быстро ставит колу на место. Ковбой в вестерн-стиле берёт стакан с колой и уходит. В финале камера наезжает, фон постепенно темнеет, остаётся только верхний свет, освещающий банку колы, внизу появляется художественный титр и закадровый голос: «Yikou Cola — попробуй обязательно!»
Камера слегка отъезжает (открывая панораму улицы) и следует за героиней. Ветер колышет подол платья героини, идущей по улице Лондона XIX века. По правой стороне улицы проезжает паровой автомобиль, быстро промчавшись мимо, порыв ветра поднимает подол её платья. Героиня в шоке спешно прижимает юбку руками. Фоновые звуки: шаги, шум толпы, звук автомобилей и т.д.
Камера следит за мужчиной в чёрном, стремительно убегающим, за ним гонится толпа. Камера переходит на боковое сопровождение, персонаж в панике сбивает фруктовый лоток на обочине, встаёт и продолжает бежать. Звуки паники толпы.
Seedance 2.0 = мультимодальные возможности референса (можно ссылаться на что угодно) + мощная креативная генерация + точное выполнение инструкций (отличное понимание)
Поддерживается загрузка текста, изображений, видео и аудио — все эти материалы могут быть использованы как объекты или референсы. Вы можете использовать в качестве референса движения, эффекты, стиль, ракурс, персонажей, сцены, звук — всё что угодно, главное чётко описать это в подсказке, и модель поймёт.
Просто опишите естественным языком желаемую картинку и действия, уточнив, что является референсом, а что — редактированием. При большом количестве материалов рекомендуется проверить, что все @-объекты правильно обозначены, чтобы не перепутать изображения, видео и персонажей.
Есть первый/последний кадр? Хотите сослаться на движения из видео?
→ Опишите это в подсказке, например: «@Изображение1 как первый кадр, референс боевых движений из @Видео1»
Хотите продлить существующее видео?
→ Укажите время продления, например «Продлить @Видео1 на 5 с». Обратите внимание: выбранная длительность генерации должна соответствовать «новой части».
Хотите объединить несколько видео?
→ Опишите логику склейки в подсказке, например: «Я хочу добавить сцену между @Видео1 и @Видео2, содержание — xxx»
Нет аудиоматериала? Можно использовать звук прямо из видео.
Хотите сгенерировать непрерывное действие?
→ Добавьте в подсказку описание последовательности, например: «Персонаж из прыжка сразу переходит в кувырок, сохраняя плавность движений» @Изображение1 @Изображение2 @Изображение3...
При создании видео всегда возникают головные боли: лицо персонажа меняется, движения не совпадают, продление видео выглядит неестественно, при правках сбивается весь ритм… Мультимодальные возможности решают все эти «застарелые проблемы» разом. Ниже — конкретные примеры использования.
Вам наверняка знакомы эти проблемы: персонаж выглядит по-разному в разных кадрах, детали товара теряются, мелкий текст размывается, сцена резко меняется, стиль камеры невозможно унифицировать… Все эти типичные проблемы согласованности теперь решаются в версии 2.0. От лиц до одежды и деталей шрифтов — общая согласованность стала стабильнее и точнее.
Мужчина @Изображение1 после работы устало идёт по коридору, замедляет шаг и останавливается у входной двери. Крупный план лица: мужчина делает глубокий вдох, берёт себя в руки, убирает негативные эмоции и расслабляется. Затем крупный план: достаёт ключ, вставляет в замок. Войдя в дом, его маленькая дочка и домашняя собака радостно бегут навстречу с объятиями. В доме очень уютная обстановка, на протяжении всего ролика — естественный диалог.
Заменить девушку из @Видео1 на оперную артистку хуадань, действие происходит на изысканной сцене. Использовать ракурсы и переходы из @Видео1, сопоставляя камеру с движениями персонажа для максимальной сценической эстетики и визуального воздействия.
Использовать все переходы и ракурсы из @Видео1, непрерывный план, начало кадра — шахматная партия.
0–2 секунды: быстрая смена четырёх кадров — красный, розовый, фиолетовый и леопардовый бантики поочерёдно появляются в стоп-кадре.

Выполнить коммерческую видеопрезентацию сумки из @Изображения2, боковая сторона сумки — по референсу @Изображения1, текстура поверхности — по референсу @Изображения3. Требуется показать все детали сумки, фоновая музыка — величественная и масштабная.

Использовать @Изображение1 как первый кадр. Вид от первого лица, ракурс по референсу @Видео1, верхняя сцена — по @Изображению2, левая сцена — по @Изображению3, правая сцена — по @Изображению4.
Раньше, чтобы модель повторила движения камеры, положение персонажей или сложные действия из фильма, приходилось писать массу детальных подсказок, а часто это было просто невозможно. Теперь достаточно загрузить референс-видео — и всё.
Использовать образ мужчины из @Изображения1, он находится в лифте @Изображения2, полностью повторить все ракурсы и мимику главного героя из @Видео1.
Использовать образ мужчины из @Изображения1, он находится в коридоре @Изображения2, полностью повторить все ракурсы из @Видео1.




Планшет из @Изображения1 как главный объект, ракурс камеры по референсу @Видео1.

Актриса из @Изображения1 как главный объект, использовать ракурсы из @Видео1 для ритмичных наездов, отъездов и панорамирования.
Персонаж с копьём по @Изображению1 и @Изображению2, персонаж с двумя мечами по @Изображению3 и @Изображению4, имитировать движения из @Видео1, бой в кленовом лесу из @Изображения5.

Использовать движения персонажей из Видео1, круговой ракурс из Видео2, сгенерировать сцену боя между Персонажем 1 и Персонажем 2.


Использовать ракурсы и ритм смены кадров из Видео1, воспроизвести с красным суперкаром из Изображения1.
Seedance 2.0 умеет не только генерировать изображения и писать истории, но и «копировать по образцу» — креативные переходы, готовые рекламные ролики, фрагменты фильмов, сложный монтаж. Если у вас есть референс-изображение или видео, модель распознает ритм движений, язык камеры и визуальную структуру и точно воспроизведёт результат.
Заменить персонажа из @Видео1 на @Изображение1, @Изображение1 как первый кадр, персонаж надевает виртуальные научно-фантастические очки, ракурс по референсу @Видео1.

Использовать черты лица модели с первого изображения. Модель по очереди надевает одежду из референс-изображений 2–6 и приближается к камере.



Использовать рекламную идею из видео и предоставленные изображения пуховика для создания нового рекламного ролика пуховика с рекламным текстом.
Стиль чёрно-белой туши. Персонаж из @Изображения1 использует эффекты и движения из @Видео1 для исполнения тушью тайцзи-кунфу.
Заменить персонажа в первом кадре @Видео1 на @Изображение1, полностью воспроизвести эффекты и движения из @Видео1.

Начать с потолка из @Изображения1, использовать эффект разрушения пазла из @Видео1 для перехода.


Начало с чёрного экрана, использовать эффект частиц и текстуру из Видео1 — золотые песчинки с позолоченной текстурой.

Персонаж из @Изображения1 повторяет действия и изменения мимики из @Видео1, демонстрируя абсурдный процесс поедания лапши быстрого приготовления.
Оживить @Изображение1 в виде комикса в порядке слева направо, сверху вниз.

По раскадровке из @Изображения1 создать 15-секундную заставку в стиле исцеляющего видео на тему «Времена года детства».

Используя аудио из Видео1, вдохновляясь Изображениями 1–5, создать эмоциональное видео.





Продлить видео на 15 с, по референсу @Изображения1 и @Изображения2 (осёл на мотоцикле), дополнить креативной рекламой.

Продлить видео на 6 с, появляется энергичная музыка электрогитары, в середине видео возникает рекламный текст «JUST DO IT».

Продлить @Видео1 на 15 секунд. 1–5 секунд: свет и тени медленно скользят через жалюзи по деревянному столу и чашке.
Продлить назад на 10 с. В тёплом послеполуденном свете камера начинает с ряда навесов на углу улицы, колышущихся от лёгкого ветра.
Статичная камера, центральный объектив «рыбий глаз» смотрит вниз через круглое отверстие.
На основе предоставленных фотографий офисного здания сгенерировать 15-секундный кинематографичный документальный ролик о недвижимости в реалистичном стиле.



Ироничный диалог в «Шоу жалоб кота и собаки», требуется яркая эмоциональность в стиле стендапа.

Звучит вступление классической юйцзюй-оперы «Дело Чэнь Шимэй».

Сгенерировать 15-секундный музыкальный клип. Ключевые слова: устойчивая композиция / лёгкие наезды-отъезды / низкий ракурс с героическим ощущением / документальный, но премиальный.

Девочка в шляпе в центре кадра нежно поёт: «I'm so proud of my family!»

Статичная камера. Стоящий крепкий мужчина (капитан) сжимает кулак, взмахивает рукой и говорит по-испански: «Через три минуты — штурм!»

0–3 секунды: В начале звонит будильник, в размытом кадре появляется Изображение 1.


Обезьяна из @Изображения1 идёт к стойке кафе с чаем, камера следует за ней сзади.



В научно-популярном стиле и тоне озвучить содержание Изображения 1.
@Изображения1–5, непрерывный следящий кадр: от улицы за бегуном вверх по лестнице, через коридор на крышу, и финальная панорама города сверху.





Использовать @Изображение1 как первый кадр, камера приближается к иллюминатору самолёта.



Стиль шпионского фильма, @Изображение1 как первый кадр, камера следует спереди за женщиной-агентом в красном плаще.




Начиная с уличного кадра @Изображения1, быстрый наезд камеры от первого лица внутрь деревянного домика.




@Изображения1–5, субъективный непрерывный кадр захватывающих американских горок.





Иногда у вас уже есть видео и не хочется заново искать изображения или переделывать всё с нуля — нужно лишь подправить фрагмент движения, добавить несколько секунд или сделать персонажа ближе к вашей задумке. Теперь можно использовать существующее видео как входные данные и точечно редактировать конкретные фрагменты, движения или ритм, не затрагивая остальное.
Перевернуть сюжет @Видео1: взгляд мужчины мгновенно меняется с нежного на ледяной и безжалостный.
Перевернуть весь сюжет @Видео1. 0–3 секунды: мужчина в костюме сидит в баре.
Заменить солистку из Видео1 на солиста из Изображения1, движения полностью повторяют оригинальное видео.

Изменить причёску женщины в Видео1 на длинные рыжие волосы, из воды медленно всплывает большая белая акула из Изображения1.

Камера в Видео1 панорамирует вправо, владелец ресторана жареной курицы суетливо передаёт заказы стоящим в очереди клиентам.

Девушка на постере непрерывно меняет наряды, одежда по референсу стилей @Изображения1 и @Изображения2.




Изображения @1–7 синхронизируются с ключевыми кадрами из @Видео по ритму.






Пейзажные снимки @Изображений1–6 синхронизируются с ритмом кадров из @Видео.
8-секундный фрагмент боевого аниме в стиле интеллектуального противостояния на тему мести.
Женщина из @Изображения1 подходит к зеркалу, смотрит на своё отражение, задумывается на мгновение и вдруг начинает кричать в истерике.


Это реклама кухонной вытяжки. @Изображение1 как первый кадр, женщина элегантно готовит.




@Изображение1 как первый кадр, камера вращается и наезжает, персонаж внезапно поднимает голову и начинает яростно кричать.



