Multimodal input, @reference system, camera replication, creative templates, video extension, and more.
还记得从只能用文字和首/尾帧「讲故事」的那天起,我们就想做出一个真正听得懂你表达的视频模型。今天,它真的来了!
即梦Seedance 2.0 现在支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控
你可以用一张图定下画面风格,用一个视频指定角色的动作和镜头的变化,再用几秒音频带起节奏氛围……搭配提示词,让创作过程变得更自然、更高效,也更像真正的"导演"。
这次升级中,"参考能力"是最大亮点:
| 核心维度 | Seedance 2.0 |
|---|---|
| 图片输入 | ≤ 9 张 |
| 视频输入 | ≤ 3 个,总时长不超过15s(有参考视频会贵一点哦) |
| 音频输入 | 支持 MP3 上传,数量≤ 3 个,总时长不超过15s |
| 文本输入 | 自然语言 |
| 生成时长 | ≤ 15s,可自由选择4-15s |
| 声音输出 | 自带音效/配乐 |
交互限制:目前支持的混合输入总上限是 12 个文件。建议优先上传对画面或节奏影响最大的素材,合理分配不同模态的文件数量



方法1:输入"@"唤起参考调用





上传素材后,图片、视频、音频都支持悬停预览



下面是一些不同场景下的用法和玩法,帮助你更好地理解 Seedance 2.0 在生成质量上、控制能力和创意表现上的升级。如果你还不知道从哪开始,不如先看看这些例子,激发灵感~
不只是多模态,Seedance 2.0 在基础层面显著增强,物理规律更合理、动作表现更自然流畅、指令理解更精准、风格保持更稳定,不仅能稳定完成复杂动作、连续运动等高难度生成任务,也让整体视频效果更真实、更顺滑,是一次底层能力的全面进化!
女孩在优雅的晒衣服,晒完接着在桶里拿出另一件,用力抖一抖衣服。
画里面的人物心虚的表情,眼睛左右看了看探出画框,快速的将手伸出画框拿起可乐喝了一口,然后露出一脸满足的表情,这时传来脚步声,画中的人物赶紧将可乐放回原位,此时一位西部牛仔拿起杯子里的可乐走了,最后镜头前推画面慢慢变得纯黑背景只有顶光照耀的罐装可乐,画面最下方出现艺术感字幕和旁白:"宜口可乐,不可不尝!"
镜头小幅度拉远(露出街头全景)并跟随女主移动,风吹拂着女主的裙摆,女主走在19世纪的伦敦大街上;女主走着走着右边街道驶来一辆蒸汽机车,快速驶过女主身旁,风将女主的裙摆吹起,女主一脸震惊的赶忙用双手向下捂住裙摆;背景音效为走路声,人群声,汽车声等等
镜头跟随黑衣男子快速逃亡,后面一群人在追,镜头转为侧面跟拍,人物惊慌撞倒路边的水果摊爬起来继续逃,人群慌乱的声音。
Seedance 2.0 = 多模态参考能力(可参考万物) + 强创意生成 + 指令响应精准(理解力很棒)
支持上传文本、图片、视频、音频,这些素材都可以被用作使用对象或参考对象。你可以参考任何内容的动作、特效、形式、运镜、人物、场景、声音,只要提示词写得清楚,模型都能理解。
用自然语言描述你想要的画面和动作就可以啦,明确是参考,还是编辑~素材多的时候,建议你多检查一下各个 @对象有没有标清楚,别把图、视频、角色搞混了哦
有首帧/尾帧图?还想参考视频动作?
→ 提示词中写清楚,如:"@图1为首帧,参考@视频1的打斗动作"
想延长一个已有的视频?
→ 说明延长时间,如"将@视频1延长 5s",注意:此时选择的生成时长应为"新增部分"的时长
想融合多个视频?
→ 提示词中说明合成逻辑,如:"我要在@视频1和@视频2之间加一个场景,内容为xxx"
没音频素材?可以直接参考视频里的声音
想生成连续动作?
→ 可以在提示词中加入连续性描述,如:"角色从跳跃直接过渡到翻滚,保持动作连贯流畅"@图1@图2@图3...
做视频总会碰到一些让人头疼的地方:比如人脸换了、动作不像、视频延长不自然、改着改着整个节奏都变了……这次多模态能把这些"老大难"问题一口气解决了,下面就是具体的使用案例
你可能遇到过这些烦恼:画面里人物前后长得不一样、商品细节丢了、小字模糊、场景跳变、镜头风格无法统一……这些在创作中常见的一致性问题,现在在 2.0 中都能被解决。从人脸到服装,再到字体细节,整体一致性更稳、更准
男人@图片1下班后疲惫的走在走廊,脚步变缓,最后停在家门口,脸部特写镜头,男人深呼吸,调整情绪,收起了负面情绪,变得轻松,然后特写翻找出钥匙,插入门锁,进入家里后,他的小女儿和一只宠物狗,欢快的跑过来迎接拥抱,室内非常的温馨,全程自然对话
将@视频1中的女生换成戏曲花旦,场景在一个精美的舞台上,参考@视频1的运镜和转场效果,利用镜头匹配人物的动作,极致的舞台美感,增强视觉冲击力
参考 @视频1的所有转场和运镜,一镜到底,画面以棋局为起始
0-2秒画面:快速四格闪切,红、粉、紫、豹纹四款蝴蝶结依次定格

对@图片2的包包进行商业化的摄像展示,包包的侧面参考@图片1,包包的表面材质参考@图片3,要求将包包的细节均有所展示,背景音恢宏大气

把@图片1作为画面的首帧图,第一人称视角,参考@视频1的运镜效果,上方场景参考@图片2,左边场景参考@图片3,右边场景参考@图片4。
以前想让模型模仿电影里的走位、运镜或者复杂动作,要么写一堆细节提示词,要么干脆做不到。而现在,只需要上传一段参考视频,就可以了
参考@图1的男人形象,他在@图2的电梯中,完全参考@视频1的所有运镜效果还有主角的面部表情
参考@图1的男人形象,他在@图2的走廊中,完全参考@视频1的所有运镜效果




@图片1的平板电脑作为主体,运镜参考@视频1

@图片1的女星作为主体,参考@视频1的运镜方式进行有节奏的推拉摇移
参考@图1@图2长枪角色,@图3@图4双刀角色,模仿@视频1的动作,在@图5的枫叶林中打斗

参考视频1的人物动作,参考视频2的环绕运镜镜头语言,生成角色1和角色2的打斗场面


参考视频1的运镜、画面切换节奏,拿图片1的红色超跑进行复刻。
不止能生图写故事,Seedance 2.0 还支持"照着模仿"——创意转场、广告成片、电影片段、复杂剪辑,只要你有参考图或视频,模型就能识别动作节奏、镜头语言、视觉结构,并精准复刻出来。
将@视频1的人物换成@图片1,@图片1为首帧,人物带上虚拟科幻眼镜,参考@视频1的运镜

参考第一张图片里模特的五官长相。模特分别穿着第2-6张参考图里的服装凑近镜头



参考视频的广告创意,用提供的羽绒服图片,搭配广告词生成新的羽绒服广告视频。
黑白水墨风格,@图片1的人物参考@视频1的特效和动作,上演一段水墨太极功夫
将@视频1的首帧人物替换成@图片1,完全@参考视频1的特效和动作

由@图片1的天花板开始,参考@视频1的拼图破碎效果进行转场


以黑幕开场,参考视频1的粒子特效和材质,金色鎏金材质的沙砾

@图片1的人物参考@视频1中的动作和表情变化,展示吃泡面的抽象行为
将@图1以从左到右从上到下的顺序进行漫画演绎

参考@图片1的专题片的分镜头脚本,创作一段15s的关于"童年的四季"的治愈系片头

参考视频1的音频,根据图1-5为灵感,发散出一条情绪向的视频。





延长15s视频,参考@图片1、@图片2的驴骑摩托车的形象,补充一段脑洞广告

将视频延长6s,出现电吉他的激昂音乐,视频中间出现"JUST DO IT"的广告字体

将@视频1延长15秒。1-5秒:光影透过百叶窗在木桌、杯身上缓缓滑过
向前延长10s,温暖的午后光线里,镜头先从街角那排被微风掀动的遮阳篷开始
固定镜头,中央鱼眼镜头透过圆形孔洞向下窥视
根据提供的写字楼宣传照,生成一段15秒电影级写实风格的地产纪录片



在"猫狗吐槽间"里的一段吐槽对话,要求情感丰沛,符合脱口秀表演

豫剧经前桥段《铡美案》的伴奏响起

生成一个15秒的MV视频。关键词:稳重构图 / 轻推拉 / 低角度英雄感 / 纪实但高级

画面中间戴帽子的女孩温柔地唱着说"I'm so proud of my family!"

固定镜头。站着的壮汉(队长)握拳挥臂用西班牙语说着:"三分钟后突袭!"

0-3秒:开头闹钟响起来,画面朦胧中出现画面1


@图片1的猴子走向奶茶店柜台,镜头跟随在他身后



用科普风格和音色,将图片1中的内容演绎出来
@图片1-5,一镜到底的追踪镜头,从街头跟随跑步者上楼梯、穿过走廊、进入屋顶,最终俯瞰城市。





以@图片1为首帧,画面放大至飞机舷窗外



谍战片风格,@图片1作为首帧画面,镜头正面跟拍穿着红风衣的女特工




根据@图片1外景的镜头,第一人称主观视角快推镜头到木屋内




@图片1-5,主观视角一镜到底的惊险过山车的镜头





有时候你已经有了一段视频,不想从头再找图或重做一遍,只是希望调整其中一小段动作、延长几秒钟,或让角色表现更贴近你的想法。现在你可以直接用已有视频作为输入,在不改变其它内容的前提下,指定片段、动作或节奏进行定向修改。
颠覆@视频1里的剧情,男人眼神从温柔瞬间转为冰冷狠厉
颠覆@视频1的整个剧情 0–3秒画面:西装男坐在酒吧
视频1中的女主唱换成图片1的男主唱,动作完全模仿原视频

将视频1女人发型变成红色长发,图片1中的大白鲨缓缓浮出

视频1镜头右摇,炸鸡老板忙碌地将炸鸡递给排队的客户

海报中的女生在不停的换装,服装参考@图片1@图片2的样式




@图片1-7中的图片根据@视频中的画面关键帧进行卡点






@图片1-6的风光场景图,参考@视频中的画面节奏进行卡点
8秒智性博弈式战斗动漫片段,贴合复仇主题
@图片1的女子走到镜子前,看着镜子里面的自己,沉思了一会突然开始崩溃大叫


这是一个油烟机广告,@图片1作为首帧画面,女人在优雅的做饭




@图片1作为画面的首帧图,镜头旋转推近,人物突然抬头,开始大声咆哮



