Input multimodal, sistem @referensi, replikasi kamera, template kreatif, perpanjangan video, dan lainnya.
Sejak hari di mana kita hanya bisa "bercerita" dengan teks dan frame pertama/terakhir, kami ingin membuat model video yang benar-benar memahami ekspresi Anda. Hari ini, model itu akhirnya hadir!
JiMeng Seedance 2.0 kini mendukung empat jenis input modalitas: gambar, video, audio, dan teks, menawarkan cara ekspresi yang lebih kaya dan kontrol generasi yang lebih presisi.
Anda bisa menentukan gaya visual dengan satu gambar, menentukan gerakan karakter dan perubahan kamera dengan satu video, menciptakan ritme dan suasana dengan beberapa detik audio... Dikombinasikan dengan prompt, proses kreatif menjadi lebih alami, lebih efisien, dan lebih seperti pekerjaan seorang "sutradara" sejati.
Dalam pembaruan ini, "kemampuan referensi" adalah sorotan terbesar:
| 核心维度 | Seedance 2.0 |
|---|---|
| Input Gambar | Maksimal 9 gambar |
| Input Video | Maksimal 3 video, total durasi tidak lebih dari 15 detik (sedikit lebih mahal jika ada video referensi) |
| Input Audio | Mendukung upload MP3, maksimal 3 file, total durasi tidak lebih dari 15 detik |
| Input Teks | Bahasa alami |
| Durasi Generasi | Maksimal 15 detik, bebas memilih antara 4-15 detik |
| Output Suara | Efek suara/musik latar bawaan |
Batasan interaksi: Batas atas total input campuran yang didukung saat ini adalah 12 file. Disarankan untuk mengupload materi yang paling berpengaruh pada gambar atau ritme terlebih dahulu, dan mengalokasikan jumlah file untuk setiap modalitas secara seimbang.



Metode 1: Ketik "@" untuk memanggil referensi





Setelah mengupload materi, gambar, video, dan audio semuanya mendukung pratinjau saat diarahkan kursor.



Berikut adalah beberapa penggunaan dan cara bermain dalam berbagai skenario untuk membantu Anda lebih memahami peningkatan Seedance 2.0 dalam kualitas generasi, kemampuan kontrol, dan ekspresi kreatif. Jika Anda belum tahu harus mulai dari mana, lihat dulu contoh-contoh ini untuk mendapatkan inspirasi~
Bukan hanya multimodal, Seedance 2.0 juga ditingkatkan secara signifikan di level dasar. Hukum fisika lebih masuk akal, performa gerakan lebih alami dan mulus, pemahaman instruksi lebih presisi, dan konsistensi gaya lebih stabil. Tidak hanya mampu menyelesaikan tugas generasi sulit seperti gerakan kompleks dan gerakan berkelanjutan secara stabil, tetapi efek video keseluruhan juga lebih realistis dan lebih halus. Ini adalah evolusi menyeluruh dari kemampuan dasar!
Seorang gadis dengan anggun menjemur pakaian. Setelah selesai, dia mengambil pakaian lain dari ember dan mengibas-ngibaskannya dengan kuat.
Karakter dalam lukisan dengan ekspresi bersalah, matanya melirik ke kiri dan kanan lalu mengintip keluar dari bingkai lukisan. Dengan cepat menjulurkan tangannya keluar bingkai untuk mengambil cola dan menyeruputnya, lalu menunjukkan ekspresi puas. Saat itu terdengar suara langkah kaki, karakter dalam lukisan buru-buru mengembalikan cola ke tempatnya. Seorang koboi datang dan mengambil cola dari gelas. Akhirnya kamera maju dan layar perlahan menjadi latar belakang hitam dengan hanya pencahayaan atas yang menyinari kaleng cola. Di bagian bawah layar muncul subtitle artistik dan narasi: "Cola Nikmat, Wajib Dicoba!"
Kamera sedikit zoom out (menampilkan panorama jalan) dan mengikuti protagonis wanita. Angin menerbangkan roknya saat dia berjalan di jalan-jalan London abad ke-19. Saat berjalan, sebuah kereta uap muncul dari jalan kanan dan melaju cepat melewatinya, angin mengangkat roknya. Protagonis wanita terkejut dan buru-buru menahan roknya dengan kedua tangan. Efek suara latar: langkah kaki, suara kerumunan, suara kendaraan, dll.
Kamera mengikuti pria berpakaian hitam yang melarikan diri dengan cepat, sekelompok orang mengejar di belakang. Kamera beralih ke pengejaran dari samping, karakter panik menabrak kios buah di pinggir jalan lalu bangkit dan terus berlari. Suara kerumunan yang panik.
Seedance 2.0 = Kemampuan referensi multimodal (bisa mereferensi segalanya) + Generasi kreatif yang kuat + Respons instruksi yang presisi (pemahaman luar biasa)
Mendukung upload teks, gambar, video, dan audio. Materi-materi ini dapat digunakan sebagai objek penggunaan atau objek referensi. Anda bisa mereferensi gerakan, efek khusus, format, pergerakan kamera, karakter, adegan, dan suara dari konten apa pun. Selama prompt ditulis dengan jelas, model akan memahaminya.
Cukup deskripsikan gambar dan gerakan yang Anda inginkan dalam bahasa alami. Jelaskan apakah ini referensi atau pengeditan~ Ketika materi banyak, periksa kembali apakah setiap @objek sudah diberi label dengan benar. Jangan mencampuradukkan gambar, video, dan karakter.
Punya gambar frame pertama/terakhir? Ingin juga mereferensi gerakan video?
-> Tulis dengan jelas di prompt, misalnya: "@gambar1 sebagai frame pertama, referensi gerakan pertarungan @video1"
Ingin memperpanjang video yang sudah ada?
-> Tentukan durasi perpanjangan, misalnya: "Perpanjang @video1 selama 5 detik". Catatan: durasi generasi yang dipilih harus merupakan durasi "bagian yang ditambahkan"
Ingin menggabungkan beberapa video?
-> Jelaskan logika penggabungan di prompt, misalnya: "Saya ingin menambahkan adegan antara @video1 dan @video2, isinya adalah xxx"
Tidak punya materi audio? Bisa langsung mereferensi suara dari video.
Ingin menghasilkan gerakan berkelanjutan?
-> Tambahkan deskripsi kontinuitas di prompt, misalnya: "Karakter langsung beralih dari lompatan ke berguling, menjaga gerakan tetap mulus dan lancar" @gambar1@gambar2@gambar3...
Membuat video selalu ada masalah yang memusingkan: wajah berubah, gerakan tidak mirip, perpanjangan video tidak natural, saat mengedit ritme keseluruhan berubah... Pembaruan multimodal kali ini menyelesaikan semua "masalah lama" ini sekaligus. Berikut adalah contoh penggunaan konkretnya.
Anda mungkin pernah mengalami masalah ini: karakter dalam gambar terlihat berbeda antara shot, detail produk hilang, teks kecil menjadi buram, adegan berubah tiba-tiba, gaya kamera tidak bisa diseragamkan... Masalah konsistensi yang umum dalam kreasi ini sekarang bisa diselesaikan di versi 2.0. Dari wajah hingga pakaian, hingga detail tipografi, konsistensi keseluruhan lebih stabil dan lebih akurat.
Pria @gambar1 pulang kerja dengan lelah berjalan di koridor, langkahnya melambat, dan akhirnya berhenti di depan pintu rumah. Close-up wajah, pria itu menarik napas dalam, menyesuaikan emosinya, menyingkirkan perasaan negatif dan menjadi rileks. Lalu close-up mencari kunci, memasukkannya ke lubang kunci. Setelah masuk rumah, putri kecilnya dan anjing peliharaan berlari dengan gembira menyambut dan memeluk. Interior sangat hangat dan nyaman, percakapan alami sepanjang video.
Ganti wanita di @video1 menjadi peran dan opera Cina (huadan), adegan di atas panggung yang indah. Referensi pergerakan kamera dan efek transisi @video1, gunakan kamera untuk mencocokkan gerakan karakter, estetika panggung yang maksimal, dan dampak visual yang kuat.
Referensi semua transisi dan pergerakan kamera @video1, one-take, dimulai dari papan catur.
Tampilan 0-2 detik: Flash-cut cepat empat panel, empat pita merah, pink, ungu, dan motif macan tutul membeku secara berurutan.

Tampilkan tas @gambar2 dengan gaya pemotretan komersial. Sisi tas mereferensi @gambar1, tekstur permukaan mereferensi @gambar3. Semua detail tas harus ditampilkan, musik latar megah dan mengesankan.

Gunakan @gambar1 sebagai frame pertama layar, sudut pandang orang pertama, referensi efek pergerakan kamera @video1, adegan atas mereferensi @gambar2, adegan kiri mereferensi @gambar3, adegan kanan mereferensi @gambar4.
Dulu untuk membuat model meniru posisi, pergerakan kamera, atau aksi kompleks dari sebuah film, Anda harus menulis banyak detail prompt atau bahkan sama sekali tidak bisa. Sekarang, cukup upload satu video referensi.
Referensi penampilan pria di @gambar1, dia berada di lift @gambar2, referensi sepenuhnya semua efek pergerakan kamera dan ekspresi wajah protagonis di @video1.
Referensi penampilan pria di @gambar1, dia berada di koridor @gambar2, referensi sepenuhnya semua efek pergerakan kamera @video1.




Tablet @gambar1 sebagai subjek utama, pergerakan kamera mereferensi @video1.

Aktris @gambar1 sebagai subjek utama, referensi gaya pergerakan kamera @video1 untuk melakukan zoom in/out/pan/tilt berirama.
Referensi @gambar1@gambar2 untuk karakter bertombak, @gambar3@gambar4 untuk karakter berpedang ganda, tiru gerakan @video1, bertarung di hutan maple @gambar5.

Referensi gerakan karakter video1, referensi bahasa kamera berputar video2, hasilkan adegan pertarungan karakter1 dan karakter2.


Referensi pergerakan kamera dan ritme pergantian gambar video1, replikasi dengan supercar merah dari gambar1.
Bukan hanya menghasilkan gambar dan menulis cerita, Seedance 2.0 juga mendukung "meniru" - transisi kreatif, iklan jadi, cuplikan film, editing kompleks. Selama Anda memiliki gambar atau video referensi, model dapat mengidentifikasi ritme aksi, bahasa kamera, dan struktur visual, lalu mereplikasinya dengan presisi.
Ganti karakter @video1 dengan @gambar1, @gambar1 sebagai frame pertama, karakter mengenakan kacamata sci-fi virtual, referensi pergerakan kamera @video1.

Referensi fitur wajah model dari gambar pertama. Model secara berurutan mengenakan pakaian dari gambar referensi ke-2 hingga ke-6 dan mendekati kamera.



Gunakan konsep iklan dari video referensi, dengan gambar jaket bulu angsa yang disediakan dan slogan iklan untuk menghasilkan video iklan jaket bulu angsa baru.
Gaya tinta hitam-putih, karakter @gambar1 mereferensi efek khusus dan gerakan @video1, menampilkan pertunjukan tai chi bergaya tinta.
Ganti karakter frame pertama @video1 dengan @gambar1, referensi sepenuhnya efek khusus dan gerakan @video1.

Dimulai dari langit-langit @gambar1, transisi menggunakan efek pecahan puzzle @video1.


Dibuka dengan layar hitam, referensi efek partikel dan tekstur video1, butiran pasir bertekstur emas berlapis.

Karakter @gambar1 mereferensi gerakan dan perubahan ekspresi @video1, menampilkan aksi abstrak makan mie instan.
Animasikan @gambar1 sebagai komik dari kiri ke kanan, atas ke bawah.

Referensi storyboard dari @gambar1, buat pembukaan bergaya penyembuhan berdurasi 15 detik tentang "Empat Musim Masa Kecil".

Referensi audio video1, gunakan gambar 1-5 sebagai inspirasi untuk membuat video emosional secara bebas.





Perpanjang video 15 detik, referensi gambar keledai naik motor dari @gambar1 dan @gambar2, lengkapi dengan iklan kreatif.

Perpanjang video 6 detik, muncul musik gitar elektrik yang penuh semangat, di tengah video muncul teks iklan "JUST DO IT".

Perpanjang @video1 selama 15 detik. 1-5 detik: Cahaya dan bayangan perlahan bergeser melalui tirai jendela di atas meja kayu dan permukaan cangkir.
Perpanjang ke depan 10 detik, dalam cahaya sore yang hangat, kamera dimulai dari kanopi di sudut jalan yang tertiup angin sepoi.
Kamera tetap, lensa fisheye tengah melihat ke bawah melalui lubang bulat.
Berdasarkan foto promosi gedung perkantoran yang disediakan, hasilkan film dokumenter properti berdurasi 15 detik dengan gaya sinematik realistis.



Dialog roasting di "Talk Show Kucing & Anjing", harus kaya emosi dan sesuai dengan pertunjukan stand-up comedy.

Iringan musik adegan klasik Opera Yu "Kasus Zha Mei" mulai mengalun.

Hasilkan video MV berdurasi 15 detik. Kata kunci: komposisi stabil / zoom halus / sudut rendah heroik / dokumenter tapi mewah.

Gadis bertopi di tengah layar bernyanyi lembut "I'm so proud of my family!"

Kamera tetap. Pria kekar yang berdiri (kapten) mengepalkan tinju dan mengayunkan lengannya sambil berkata dalam bahasa Spanyol: "Serangan dalam tiga menit!"

0-3 detik: Di awal jam alarm berbunyi, gambar1 muncul dalam tampilan kabur.


Monyet @gambar1 berjalan menuju konter kedai teh susu, kamera mengikuti dari belakang.



Dengan gaya dan nada sains populer, tampilkan konten dari gambar1.
@gambar1-5, kamera pelacakan one-take, mengikuti pelari dari jalan naik tangga, melewati koridor, mencapai atap, dan akhirnya memandangi kota dari atas.





Dengan @gambar1 sebagai frame pertama, gambar melebar ke pemandangan di luar jendela pesawat.



Gaya film mata-mata, @gambar1 sebagai frame pertama, kamera mengikuti dari depan agen wanita berjas hujan merah.




Dari kamera pemandangan luar @gambar1, sudut pandang orang pertama dengan zoom cepat ke dalam pondok kayu.




@gambar1-5, sudut pandang subjektif one-take roller coaster yang menegangkan.





Terkadang Anda sudah memiliki video dan tidak ingin mencari gambar dari awal atau membuat ulang semuanya. Anda hanya ingin menyesuaikan sebagian kecil gerakan, memperpanjang beberapa detik, atau membuat penampilan karakter lebih sesuai keinginan. Sekarang Anda bisa langsung menggunakan video yang sudah ada sebagai input, dan melakukan modifikasi tertarget pada segmen, gerakan, atau ritme tertentu tanpa mengubah konten lainnya.
Balikkan alur cerita @video1, tatapan pria berubah dari lembut menjadi dingin dan kejam dalam sekejap.
Balikkan seluruh alur cerita @video1. Tampilan 0-3 detik: Pria berjas duduk di bar.
Ganti vokalis wanita di video1 dengan vokalis pria di gambar1, gerakan sepenuhnya meniru video asli.

Ubah gaya rambut wanita di video1 menjadi rambut panjang merah, hiu putih besar dari gambar1 perlahan muncul dari air.

Kamera video1 pan ke kanan, pemilik kedai ayam goreng sibuk menyerahkan ayam goreng kepada pelanggan yang mengantri.

Gadis di poster terus-menerus berganti pakaian, pakaian mereferensi gaya @gambar1 dan @gambar2.




Gambar @gambar1-7 disinkronkan dengan keyframe dari @video.






Gambar pemandangan @gambar1-6 disinkronkan dengan ritme visual @video.
Cuplikan anime pertarungan strategi intelektual 8 detik, sesuai dengan tema balas dendam.
Wanita @gambar1 berjalan ke depan cermin, memandangi dirinya di cermin, merenungkan sejenak lalu tiba-tiba runtuh dan berteriak.


Ini adalah iklan cooker hood. @gambar1 sebagai frame pertama, wanita memasak dengan anggun.




@gambar1 sebagai frame pertama, kamera berputar dan zoom in, karakter tiba-tiba mendongakkan kepala dan mulai mengaum keras.



