Digambarkan di sini adalah klip yang dihasilkan AI dari situs Vidu. Alat ini dapat membuat video dari teks atau gambar.
Evelyn Cheng | CNBC
BEIJING — Shengshu Technology yang berbasis di Beijing pada hari Rabu mengatakan bahwa alat teks-ke-video yang didukung kecerdasan buatan, Vidu, sekarang akan dapat menghasilkan video dengan menggabungkan beberapa gambar.
Vidu sudah memungkinkan pengguna di seluruh dunia untuk membuat klip berdurasi 8 detik berdasarkan perintah tertulis. Sementara OpenAI — pembuat ChatGPT — pada bulan Februari mengungkapkan bahwa model AI-nya Sora dapat menghasilkan video berdurasi satu menit dari teks, namun belum dirilis ke publik.
Fitur AI baru Vidu dapat menggabungkan tiga gambar – seperti kemeja, orang, dan sepeda motor – menjadi video orang yang mengenakan kemeja tersebut dan mengemudikan sepeda motor tersebut melalui sebuah adegan, kata Shengshu.
Platform lain mengklaim mereka dapat mengubah teks atau gambar menjadi video menggunakan AI, tetapi kualitas keluarannya bervariasi. Terobosan yang diklaim Shengshu adalah kemampuan mengambil tiga gambar unik dan mengintegrasikannya dengan konsistensi visual ke dalam video yang dihasilkan AI.
“Sejak awal kami menunjukkan (konsistensi visual) sebagai masalahnya, dan ingin menyelesaikannya dengan baik,” kata Fan Bao, chief technology officer di Shengshu, dalam bahasa Mandarin, yang diterjemahkan oleh CNBC.
Vidu diluncurkan pada bulan April dan kemampuannya untuk mengubah dua foto profil menjadi video orang berpelukan menjadi viral di TikTok.
Generator video AI telah menghasilkan uang dari pengiklan, animator, dan bisnis lainnya, kata salah satu pendiri dan CEO Shengshu, Jiayu Tang dalam bahasa Mandarin, menurut terjemahan CNBC. Dia mengatakan tarif penggunaan bulanan per pelanggan dapat berkisar dari 100.000 yuan hingga 1 juta yuan ($13.871 hingga $138.711).
Untuk mengatasi masalah hak cipta, Tang mengatakan sebuah perusahaan mungkin menandatangani kesepakatan dengan seniman yang memungkinkan AI meniru gaya lukisan seniman tersebut untuk sebuah iklan. Dia mengatakan dia belum melihat kasus hukum yang signifikan seputar penggunaan gambar oleh konsumen.
Tang menambahkan bahwa Vidu tidak mengizinkan publik membuat konten menggunakan gambar selebriti atau individu yang “sensitif”. Dia mengatakan alat AI juga melarang gambar telanjang dan kekerasan. Mengenai foto pribadi, Tang mengatakan Vidu menghancurkan data sesuai dengan peraturan perlindungan data umum – sebuah tolok ukur global.
Shengshu didirikan tahun lalu dengan pendukung termasuk Baidu Ventures, Ant Group yang berafiliasi dengan Alibaba, startup Tiongkok Zhipu AI, Qiming Venture Partners, dan kota Beijing, menurut PitchBook.
Tang mengatakan AI Vidu menjalankan server cloud sewaan di Tiongkok dan luar negeri.