マルチモーダル入力、@参照システム、カメラワーク再現、クリエイティブテンプレート、動画延長、音楽同期など。
テキストと最初/最後のフレームだけで「ストーリーを語る」ことしかできなかったあの日から、私たちはあなたの表現を本当に理解できる動画モデルを作りたいと思っていました。そして今日、ついに実現しました!
JiMeng Seedance 2.0 は画像・動画・音声・テキストの4つのモダリティ入力に対応し、表現方法がより豊かになり、生成のコントロール性も向上しました。
1枚の画像で画面のスタイルを決め、1本の動画でキャラクターの動きやカメラワークを指定し、数秒の音声でリズムや雰囲気を演出……プロンプトと組み合わせることで、制作プロセスがより自然で効率的になり、まさに本物の「監督」のような体験ができます。
今回のアップグレードで、「参照機能」が最大の目玉です:
| 核心维度 | Seedance 2.0 |
|---|---|
| 画像入力 | 9枚以下 |
| 動画入力 | 3本以下、合計再生時間15s以内(参照動画がある場合は少し高くなります) |
| 音声入力 | MP3アップロード対応、3ファイル以下、合計再生時間15s以内 |
| テキスト入力 | 自然言語 |
| 生成時間 | 15s以内、4〜15sの間で自由に選択可能 |
| 音声出力 | 効果音/BGM自動付与 |
インタラクション制限:現在サポートされている混合入力の合計上限は12ファイルです。画面やリズムに最も影響を与える素材を優先的にアップロードし、各モダリティのファイル数を適切に配分することをお勧めします。



方法1:「@」を入力して参照呼び出し





素材をアップロードすると、画像・動画・音声すべてホバープレビューに対応しています。



以下は、さまざまなシーンでの使い方や活用法です。Seedance 2.0 の生成品質・制御能力・クリエイティブ表現の進化をより深く理解するのに役立ちます。どこから始めればいいかわからない方は、まずこれらの例を見てインスピレーションを得てみてください〜
マルチモーダルだけではありません。Seedance 2.0 は基礎レベルで大幅に強化されています。物理法則がより合理的に、動作表現がより自然でスムーズに、指示理解がより正確に、スタイル維持がより安定しました。複雑な動作や連続運動などの高難度な生成タスクを安定して完了できるだけでなく、全体的な動画効果がよりリアルでスムーズになり、基盤能力の全面的な進化を遂げました!
女の子が優雅に洗濯物を干していて、干し終わったら桶からもう一枚取り出し、力強く衣服を振る。
絵の中の人物がそわそわした表情で、目を左右にキョロキョロさせてから絵のフレームから顔を覗かせ、素早く手をフレームの外に伸ばしてコーラを掴んで一口飲み、満足げな表情を浮かべる。その時足音が聞こえ、絵の中の人物は急いでコーラを元の場所に戻す。すると西部のカウボーイがやってきてカップのコーラを持って去っていく。最後にカメラが前進し、画面が徐々に真っ黒な背景になり、トップライトだけが照らす缶入りコーラが映し出され、画面下部にアート感のある字幕とナレーション:「イーコウコーラ、飲まずにはいられない!」
カメラが少しズームアウト(街並みの全景を映す)しながら主人公の女性を追い、風が彼女のスカートの裾を揺らしている。主人公は19世紀のロンドンの大通りを歩いている。歩いていると右側の通りから蒸気自動車が走ってきて、主人公のそばを素早く通り過ぎ、風でスカートの裾がめくれあがり、主人公は驚いて慌てて両手でスカートを押さえる。背景音は足音、群衆の声、車の音など。
カメラが黒い服の男を追いかけ、後ろから大勢が追いかけてくる。カメラが横からの追跡撮影に切り替わり、人物は慌てて路上のフルーツ屋台にぶつかって倒れ、起き上がって逃げ続ける。群衆の騒然とした声。
Seedance 2.0 = マルチモーダル参照機能(あらゆるものを参照可能) + 強力なクリエイティブ生成 + 正確な指示応答(理解力が優秀)
テキスト・画像・動画・音声のアップロードに対応しており、これらの素材はすべて使用対象または参照対象として利用できます。あらゆるコンテンツの動作・エフェクト・形式・カメラワーク・人物・シーン・音声を参照できます。プロンプトが明確に書かれていれば、モデルはすべて理解できます。
自然言語であなたが望む画面や動作を記述するだけでOKです。参照なのか編集なのかを明確にしてください〜素材が多い場合は、各@オブジェクトが正しくラベル付けされているか確認することをお勧めします。画像・動画・キャラクターを混同しないようにしましょう。
先頭/末尾フレーム画像がある場合、さらに参照動画のアクションも参照したい?
→ プロンプトに明確に記述してください。例:「@画像1を先頭フレームとして使用し、@動画1の格闘アクションを参照」
既存の動画を延長したい場合
→ 延長時間を明記してください。例:「@動画1を5s延長」。注意:この場合、選択する生成時間は「追加部分」の長さです。
複数の動画を融合したい場合
→ プロンプトに合成ロジックを説明してください。例:「@動画1と@動画2の間にシーンを追加したい、内容はxxxです」
音声素材がない場合、動画の音声を直接参照できます。
連続アクションを生成したい場合
→ プロンプトに連続性の記述を追加できます。例:「キャラクターがジャンプからそのまま回転に移行し、動作の連続性と滑らかさを維持」@画像1@画像2@画像3...
動画制作では頭を悩ませることがよくあります。例えば、人物の顔が変わってしまう、動きが似ていない、動画の延長が不自然、編集しているうちにリズム全体が変わってしまう……今回のマルチモーダル機能で、これらの「長年の難題」を一気に解決できます。以下が具体的な使用例です。
こんな悩みはありませんか?画面の中の人物が前後で違って見える、商品の細部が失われる、小さな文字がぼやける、シーンが急に変わる、カメラのスタイルを統一できない……こうした制作でよくある一貫性の問題が、2.0ではすべて解決されています。顔から服装、フォントの細部まで、全体的な一貫性がより安定し、より正確になりました。
男性@画像1が仕事帰りに疲れた様子で廊下を歩き、足取りが遅くなり、最後に自宅のドアの前で立ち止まる。顔のクローズアップ、男性が深呼吸して気持ちを整え、ネガティブな感情を収めてリラックスした表情になる。それからクローズアップで鍵を探し出し、鍵穴に差し込む。家に入ると、小さな娘とペットの犬が嬉しそうに駆け寄ってきて抱きつく。室内はとても温かい雰囲気で、全編自然な会話。
@動画1の中の女性を京劇の花旦に差し替え、シーンは精緻な舞台の上で、@動画1のカメラワークとトランジション効果を参照し、カメラで人物の動きに合わせ、究極の舞台美を演出し、視覚的インパクトを高める。
@動画1のすべてのトランジションとカメラワークを参照し、ワンカット撮影で、画面は将棋の対局からスタート。
0〜2秒の画面:高速4コマフラッシュカット、赤・ピンク・紫・レオパード柄の4種類のリボンが順番に静止画で表示。

@画像2のバッグを商業的な映像演出で紹介し、バッグの側面は@画像1を参照、バッグの表面素材は@画像3を参照。バッグの細部をすべて見せることが求められ、壮大で荘厳なBGM。

@画像1を画面の先頭フレームとし、一人称視点で、@動画1のカメラワーク効果を参照し、上方のシーンは@画像2を参照、左側のシーンは@画像3を参照、右側のシーンは@画像4を参照。
以前は映画のような動き・カメラワーク・複雑なアクションをモデルに模倣させようとすると、大量の詳細なプロンプトを書くか、そもそも実現不可能でした。しかし今は、参照動画を1本アップロードするだけで済みます。
@画像1の男性の外見を参照し、@画像2のエレベーターの中で、@動画1のすべてのカメラワーク効果と主人公の表情を完全に参照。
@画像1の男性の外見を参照し、@画像2の廊下の中で、@動画1のすべてのカメラワーク効果を完全に参照。




@画像1のタブレットを主体とし、カメラワークは@動画1を参照。

@画像1の女優を主体とし、@動画1のカメラワーク方式を参照してリズミカルなプッシュ・プル・パン・ドリーを行う。
@画像1@画像2の長槍キャラクター、@画像3@画像4の双刀キャラクターを参照し、@動画1の動きを模倣して、@画像5の紅葉の森の中で戦闘。

参照動画1の人物の動作を参照し、参照動画2の回り込みカメラワークの映像言語で、キャラクター1とキャラクター2の格闘シーンを生成。


動画1のカメラワーク・画面切り替えリズムを参照し、画像1の赤いスーパーカーで再現。
画像生成やストーリー作成だけではありません。Seedance 2.0 は「お手本通りに模倣する」ことにも対応しています。クリエイティブなトランジション、広告完成動画、映画のワンシーン、複雑な編集でも、参照画像や動画があれば、モデルがアクションリズム・カメラワーク・ビジュアル構造を認識し、精密に再現します。
@動画1の人物を@画像1に差し替え、@画像1を先頭フレームとし、人物にバーチャルSFゴーグルを装着させ、@動画1のカメラワークを参照。

1枚目の画像のモデルの顔立ちを参照。モデルが2〜6枚目の参照画像の衣装を着てカメラに近づく。



参照動画の広告クリエイティブを参考に、提供されたダウンジャケットの画像を使い、広告コピーを付けて新しいダウンジャケットの広告動画を生成。
白黒水墨画スタイル、@画像1の人物が@動画1のエフェクトと動作を参照し、水墨太極拳を演じる。
@動画1の先頭フレームの人物を@画像1に差し替え、@参照動画1のエフェクトと動作を完全に参照。

@画像1の天井から始まり、@動画1のパズル崩壊エフェクトを参照してトランジション。


黒い画面から始まり、動画1のパーティクルエフェクトと質感を参照し、金色の流金質感の砂粒。

@画像1の人物が@動画1の中の動作と表情変化を参照し、カップ麺を食べるシュールな行動を演出。
@画像1を左から右、上から下の順番で漫画として演出。

@画像1の番組の絵コンテを参考に、「少年時代の四季」をテーマにした15秒の癒し系オープニングを制作。

動画1の音声を参照し、画像1〜5をインスピレーションとして、感情表現を重視した映像を自由に展開。





15sに動画を延長し、@画像1・@画像2のロバがバイクに乗っている姿を参照して、ぶっ飛んだ広告を追加。

動画を6s延長し、エレキギターの熱い音楽が流れ、動画の中央に「JUST DO IT」の広告フォントが出現。

@動画1を15秒延長。1〜5秒:光と影がブラインド越しに木のテーブルやカップの表面をゆっくりと滑っていく。
前方に10s延長、温かい午後の光の中、カメラはまず街角の微風に揺れる日除けから始まる。
固定カメラ、中央の魚眼レンズで円形の穴を通して下を覗き込む。
提供されたオフィスビルのプロモーション写真を元に、15秒の映画級リアリスティックスタイルの不動産ドキュメンタリーを生成。



「犬猫ツッコミ部屋」でのツッコミ対話。感情豊かで、スタンダップコメディのパフォーマンスに合った表現が求められる。

豫劇の名場面《鍘美案》の伴奏が流れ始める。

15秒のMV動画を生成。キーワード:安定した構図 / 軽いプッシュプル / ローアングルのヒーロー感 / ドキュメンタリーだが上質

画面中央の帽子をかぶった女の子が優しく歌いながら「I'm so proud of my family!」と言う。

固定カメラ。立っている大柄な男(隊長)が拳を握り腕を振りながらスペイン語で「3分後に突入だ!」と言う。

0〜3秒:冒頭で目覚まし時計が鳴り、画面がぼんやりとした中に画面1が映し出される。


@画像1のサルがタピオカ店のカウンターに向かって歩き、カメラが背後から追従。



科学解説風のスタイルと声色で、画像1の内容を映像化。
@画像1〜5、ワンカットの追跡ショットで、街頭からランナーを追いかけて階段を上り、廊下を抜け、屋上に出て、最終的に都市を見下ろす。





@画像1を先頭フレームとし、画面が飛行機の窓の外にズームアップ。



スパイ映画風、@画像1を先頭フレーム画面とし、カメラが正面から赤いトレンチコートの女スパイを追跡撮影。




@画像1の外景のカットから、一人称主観視点でカメラが素早く前進して山小屋の中に入る。




@画像1〜5、主観視点によるワンカットのスリル満点のジェットコースターのカット。





既に動画があって、最初から画像を探したり作り直したりせずに、ある部分のアクションを調整したり、数秒延長したり、キャラクターの表現をもっと自分のイメージに近づけたいということがあるでしょう。今なら既存の動画を直接入力として使用し、他のコンテンツを変えずに、特定のセグメント・アクション・リズムをピンポイントで修正できます。
@動画1のストーリーを覆し、男性の目つきが優しさから一瞬で冷酷で凶暴なものに変わる。
@動画1のストーリー全体を覆す。0〜3秒の画面:スーツの男がバーに座っている。
動画1の女性ボーカルを画像1の男性ボーカルに差し替え、動作は完全に元の動画を模倣。

動画1の女性の髪型を赤いロングヘアに変更し、画像1の大型ホオジロザメがゆっくりと浮上。

動画1でカメラが右にパンし、フライドチキン店のオーナーが忙しそうにフライドチキンを並んでいる客に手渡す。

ポスターの女の子が次々と衣装を着替え、衣装は@画像1@画像2のスタイルを参照。




@画像1〜7の画像を@動画のキーフレームに合わせてビートシンク。






@画像1〜6の風景写真を、@動画の画面リズムに合わせてビートシンク。
8秒の知略バトル式戦闘アニメクリップ、復讐テーマにマッチさせて。
@画像1の女性が鏡の前に歩いていき、鏡の中の自分を見つめ、しばらく考え込んだ後、突然崩壊して叫び出す。


これはレンジフードの広告です。@画像1を先頭フレーム画面として、女性が優雅に料理をしている。




@画像1を画面の先頭フレームとし、カメラが回転しながらクローズアップ、人物が突然顔を上げて大声で咆哮し始める。



