Alibaba Luncurkan Model AI Wan 2.1-VACE, Sederhanakan Pembuatan Video

Alibaba hari ini di Jakarta menyampaikan telah meluncurkan model AI (artificial intelligence) open source terbaru, Wan 2.1-VACE (Video All-in-one Creation and Editing), sebuah inovasi dalam pembuatan dan penyuntingan video. Inovasi ini mengintegrasikan berbagai fungsi pemrosesan video ke dalam satu model, bertujuan untuk menyederhanakan proses pembuatan video sehingga bisa meningkatkan efisiensi dan produktivitas.

Wan 2.1-VACE merupakan bagian dari large model pembuat video milik Alibaba, serta menjadi model open-source pertama di industri yang menawarkan solusi terpadu untuk berbagai tugas pembuatan dan penyuntingan video. Dukungan masukan multi-modal, termasuk teks, gambar, dan video, membebaskan para kreator untuk menggunakan beragam jenis data sebagai masukan dalam berkreasi.

Wan 2.1-VACE juga menyediakan kemampuan penyuntingan video yang lengkap bagi para kreator. Fitur penyuntingan ini mencakup penggunaan referensi gambar atau frame, video repainting, modifikasi area tertentu dalam video, dan perluasan spasial-temporal. Semua kemampuan ini memungkinkan para kreator untuk menggabungkan keluaran secara fleksibel untuk menghasilkan karya yang lebih kreatif.

Seorang kreator bisa memanfaatkan Wan 2.1-VACE untuk menghasilkan video yang menampilkan subjek-subjek yang berinteraksi, hanya dengan contoh gambar. Gambar diam (tidak bergerak) juga bisa “dihidupkan” dengan menambahkan efek gerakan alami. Terdapat fitur lanjutan yang memungkinkan penggantian pose, pengaturan gerakan, pengaturan kedalaman gambar, serta pengubahan warna pada video.

Model AI ini mendukung penambahan, modifikasi, atau penghapusan pada area tertentu dalam video tanpa memengaruhi bagian di sekitarnya. Suatu kreator juga bisa memperluas batas video dan Wan 2.1-VACE akan otomatis mengisi konten tambahan secara cerdas untuk memperkaya pengalaman visual.

Sebagai model AI video yang all-in-one, Alibaba menegaskan Wan 2.1-VACE menawarkan fleksibilitas luar biasa. Wan 2.1-VACE memungkinkan para kreator menggabungkan berbagai fungsi secara mulus dan membuka ide-ide kreatif baru.

Wan 2.1-VACE memakai aneka teknologi inovatif yang bisa memenuhi beragam kebutuhan dalam penyuntingan video. Model AI ini memiliki antarmuka terpadu yang disebut VCU (Video Condition Unit) yang bisa memproses berbagai jenis masukan secara bersamaan. Dengan struktur Context Adapter yang menyisipkan berbagai konsep tugas melalui representasi formal dari dimensi waktu (temporal) dan ruang (spasial), Wan 2.1-VACE bisa mengatur berbagai jenis tugas pembuatan video dengan lebih fleksibel dan efisien.

Alibaba menyediakan model AI open source Wan 2.1-VACE dalam dua versi, yakni dengan parameter 14 miliar dan dengan parameter 1,3 miliar. Kedua model ini bisa diunduh secara gratis melalui Hugging Face dan GitHub. Keduanya juga bisa diunduh secara gratis dari komunitas open source Alibaba Cloud, ModelScope. Dengan demikian, lebih banyak pihak seperti para bisnis bisa memanfaatkan AI untuk menciptakan konten visual berkualitas tinggi dengan cepat dan hemat biaya.